作者:eygle
国产数据库正处在一个百花齐放的历史期间,据悉国内各类数据库产品曾经超过了 300 个,排在墨天轮国产数据库风行度排行榜上的数据库产品曾经超过了 160 个。
那么国产数据库到底面临了哪些挑战,该当如何破局才可能减速倒退,成长出当先国内的数据库产品呢?
通过咱们收集的事实,做出的剖析思考,心愿以一个系列的文章,谈一谈咱们对于国产数据库的倒退倡议。以下的探讨仅仅就关系型数据库做出探讨。
更多数据库行业改革,欢迎光临 2021 数据技术嘉年华:https://www.modb.pro/dtc2021
墨天轮排行数据库剖析
依据不齐全统计,墨天轮榜单中,关系型数据库占据了 88 个席位,是最重要的产品品类,分布式数据库有 22 个产品上榜,是第二大品类,图数据库以 17 个产品身处第三大品类。由此能够看到,在国产数据库畛域,关系型数据库是支流,图数据库是最热门的 NoSQL 数据库品类。
依据 2021 年 11 月墨天轮数据库风行度排行榜,目前榜单前 10 中,阿里系数据库占据三个席位,别离是 OceanBase、PolarDB、AnalyticDB,华为系占据两个席位,别离是 openGauss 和 GaussDB,腾讯一席,是 TDSQL,此外四个独立品牌别离是 TiDB、达梦、GBase 和人大金仓。
2021 数据技术嘉年华大会,曾经邀请到阿里云 PolarDB 掌门人李飞飞、华为云 GaussDB 掌门人 苏光牛、TiDB 联结创始人 黄东旭、OceanBase 技术总监 杨传辉、腾讯云数据库副总经理 王义成、云和恩墨 MogDB for openGauss 掌门人张皖川。2021 年 12 月 23~24 日,精彩不容错过。
Oracle 的研发人员规模
那么开发一个国内一流的数据库产品,到底须要多少人呢?
咱们尝试以 Oracle 数据库为例,讨论一下这个问题。
目前,在 Oracle 公司外部,负责外围数据库研发的,次要有两大团队,别离处于 Andrew Mendelson 和 Juan Loaiza 两位执行副总裁(EVP)的领导之下,他们间接向 Oracle 公司创始人 Larry Ellison 汇报,这两个团队是 Oracle 数据库的外围部队,据说共计约有 4,000 人的规模,这里的人员规模不蕴含服务团队,在 Oracle 公司服务反对团队不归属研发序列。
Andy Mendelsohn 主持数据库服务器技术部门(database server technologies),Juan Loaiza 主持要害数据库技术部门(mission-critical database technologies)。以前,Juan Loaiza 在 Andy Mendelsohn 的治理之下,前几年被擢升。
Andy Mendelsohn 毕业于普林斯顿大学,自 1984 年开始在 Oracle 工作,至今曾经 37 年,被称为是 Oracle 数据库的掌门人,他当初依然负责包含 Oracle 数据库、大数据、自治云、开发工具、测试等外围团队,是 Oracle 研发的次要产出部门,在疫情之前,每年 Andy Mendelsohn 都会到访中国,和社区用户开展探讨。
Juan Loaiza 于 1988 年毕业于 MIT,始终在 Oracle 公司工作,至今 33 年,他负责领导私有云和公有部署中事务处理和工程零碎技术(Exadata)的产品策略、产品开发和产品治理,是公认的数据库技术创新者。Oracle 的高可用技术(HA)研发也在他的团队中,常常到访中国的 Wei Hu 学生就是 HA 团队的负责人。
思考到 Oracle 数据库产品组织涵盖的周边十分庞杂,例如大数据一体机、数据库一体机、开发工具(如 APEX)、Database Cloud、NoSQL、In-Memory、测试团队等均在其中,咱们预计其 Oracle Database 内核相干的开发人员该当在 50% 左右(也就是约 2000 人)。
以上是 Oracle 的研发状况一瞥。也由此可见,开发一个根底软件,规模化投入是如许的重要!
开源商业发行版 EDB 的人员规模
基于一个开源数据库的商业版本须要多少人?
EDB 是一个能够参考的例子,EDB 的全称是 EnterpriseDB,是基于 PostgreSQL 的一个定制分支。
EDB 在 PostgreSQL 根底上,针对企业级利用进行了专门的优化,减少了一系列如动静性能调优(DynaTune)、EDB Loader、高效批量 SQL 解决等高级个性。EnterpriseDB 高度兼容了 Oracle 数据库,在数据库迁徙上具备便利性。
在几年前的一个剖析报告上,咱们看到 EDB 领有大概 300~400 名员工,在 2016 年度实现了大概 3100 万美元的支出。
当然明天 EDB 的规模在一直壮大,明天的预计人数在 500 人左右,实现年度 4500 万美元支出。
下表还展现了 NoSQL 公司 MongoDB 领有 1200 名员工。
同时咱们留神到,Cockroach Labs 大概有 200 人。
openGauss 的研发团队规模
openGauss 作为华为的开源数据库,晚期是基于 PostgreSQL 9.2 进行的迭代研发,那么 openGauss 的官网研发团队就和 EDB 很有可比性了。
早前,EDB 在 PostgreSQL 社区外围团队仅有一名核心成员,以及 4 位次要贡献者;目前 openGauss 社区技术委员会成员如下,主席是田文罡,成员包含李国良、李士福、胡正策、任阳、黄凯耀、周平低等,次要成员来自华为、清华大学,华为处于主导地位,openGauss 要打造根社区,成员规模还在不断扩大中。
此外,尽管没有明确的数据,然而据悉 openGauss 的研发团队规模远超 200 人。云和恩墨的 MogDB 作为 openGauss 认证的次要商业发行版之一,同样投入了近百人的团队参加社区建设,openGauss 的开源搭档打算,正在汇聚越来越多的规模化团队,促成国内数据库根生态的蓬勃发展。
国内数据库企业人员规模
那么国产数据库企业当初的团队规模是怎么的呢?
依据信通院公布的报告,我国数据库企业人员均匀人数约为 184 人,最高为 1200 人左右规模,最低为 10 人左右规模。其中 21-50 人左右规模企业占比最高,数量 34 个,比例达到 43%,人数在 51-100 人左右规模次之,数量为 12 个,占比 15%。
依据公开数据显示,武汉达梦数据库公司加入社保人数为 336 人,此外,上海达梦约 100 人,北京达梦约 150 人,加上其余人员,共计人数约在 700 人左右。这是独立数据库企业中的佼佼者,能够作为国内数据库企业的参考:
另据统计数据,达梦公司中,技术人员占比约为 50%,其余为财务、行政、销售、市场等。
人大金仓的社保人数约为 430 人,也处于国产数据库企业的前列地位。
依据智研征询和兴业证券的钻研数据,人大金仓的技术人员占比拟低,约为 20% 左右:
在 2021 年腾讯全数字生态大会上,腾讯投了了一个数据,TDSQL“整个过程投入了 600 多人,保持了十四年”,这里的 600 人 应该是个多年累计的概数,然而腾讯的数据库研发团队规模在行业该当是名落孙山的。
综合以上的公开数据分析,咱们认为,在一家独立的数据库企业中,技术研发人员占比为 50% 左右是一个正当的数字。
在信通院的人员散布统计数据中,国产数据库厂商中排在前几位的就该当是几家出名的巨头企业,如华为、阿里、腾讯等,这些厂商的研发有大规模人力投入在各类云数据库中,繁多数据库(如华为 openGauss) 的人员规模也应该在数百人左右,也就是和达梦、金仓等公司的投入规模相当。
策一:数据库企业应减速规模化
咱们能够推断,一家独立的数据库公司,开发繁多的外围数据库产品,人数在 200 人左右是一个中等规模的配置,500 人左右规模能够排在前列,而 1000 人左右的规模将能够进入前三甲的地位。依照 50w/ 人的人均年薪计算,这三个量级的年人力老本大概在 1 亿、2.5 亿和 5 亿元左右。
在关系型数据库的倒退路线上,独立的数据库企业该当至多成长为 1000 人左右的规模,才可能在寰球数据库畛域挑战要害场景、外围业务,引领行业倒退。在中国数据库畛域,率先达到这一规模的企业,将具备无可争议的当先劣势。
依据统计数据,2020 年,中国数据库市场规模约为 241 亿元,其中传统部署模式占比为 55%,云上占比为 45%。依据 Gartner 预测:2021 年云数据库在整个数据库市场中的占比将首次达到 50%。预计到 2025 年,中国数据库市场总规模将达到 688 亿元,市场年复合增长率为 23.4%。
如果到 2025 年,国产数据库在总体数据库市场占比达到 33%(2017 年国产数据库占有率为 14.26%),那么将是 227 亿的规模。
目前,国内厂商正处于百花齐放、人员扩散的守业初期,在接下来的疾速倒退阶段,应该走向整合集中,造成规模劣势,构建衰弱的产业链生态,才可能实现国产数据库在要害畛域的冲破,承载广大的市场需求,服务更多的企业级客户。
也冀望有越来越多的从业者,一直退出国产数据库的营垒,保持以恒,国产数据库产业必将取得冲破和胜利!
参考文献
1. 信通院:2021 年数据库倒退钻研报告(https://www.modb.pro/doc/38220)
2. 兴业证券:2020 数据库钻研报告(https://www.modb.pro/doc/4452)