乐趣区

关于数据库:刘亚琼-How-To-Build-TiDB-Community

演讲者:刘亚琼

起源:中国开源云联盟

2020 年 12 月 29 日至 30 日,由中国电子技术标准化研究院(以下简称电子规范院)主办,中国开源云联盟、木兰开源社区、全国信标委云计算规范工作组、云计算规范与利用工业和信息化部重点实验室承办的“第十届中国云计算规范和利用大会”在京隆重召开。本次大会以“规范聚力 开源共赢”为主题。

首先感激大会的邀请,其实 PingCAP 之所以始终在所谓媒体上低调,是因为之前的倒退真的是也都很波折,因为毕竟是开源的我的项目,开源在中国的倒退路线大家应该都懂,其实还是挺波折艰巨的。

我首先想感谢蒋总,因为我能走入技术畛域走入开源其实是在 CSDN。

我介绍三方面:第一介绍一下 TiDB,第二介绍一下咱们为什么抉择开源,第三介绍咱们目前治理的一些办法。

TiDB 是一款开源的分布式的关系型数据库,这是往年到 10 月份为止的一个数量,1500 多家,左边这个是在 GitHub 上代码的奉献量是 1200 多个,咱们本人外部的工程师大略有不到两百,更多的是一些来自于内部和海内的代码的贡献者。

这张图是咱们选的一些比拟有代表性的用户,他们代表银行、美团、三星、Zoom、UCloud 这种的,目前在全国的用户部署了一些 TiDB 的我的项目。

咱们为什么抉择开源?对于一个做数据库的公司来说,曾经有了 Oracle 这样的巨头在后面,其实你想做一个胜利的数据库的公司是很难的。简略拆分了一下,如果要做一个可能是比拟胜利的公司须要什么?比拟成熟的市场,高价值的场景或者说古代的一种商业模型。咱们看了一下,这些如同 Oracle 或者其余的友商,做数据库的都有这些货色,咱们从中国想做一个这种货色,咱们须要跟他们搞一些不一样的中央。不一样的是什么?也就是首先咱们从中国起步,咱们在中国的市场能失去什么?

方才蒋总也说了咱们下一波红利是中国的工程师。包含咱们家孩子当初 4 岁了,也在上一些编程的课。所以能够必定的说,中国接下来十年、二十年是领有全世界最厉害的工程师,同时中国自从互联网或者说挪动互联网开始倒退之后,它有了全世界最令人羡慕的场景或者利用,不论是泛在还是业务的倒退都特地迅速。在中国市场可能给咱们带来第一个是优质的场景,第二是足够厉害的工程师。因为仅靠 PingCAP,首先是它的本人的钱不可能说齐全去雇佣方才咱们说的一千两百位工程师去帮忙咱们写代码,这种在目前来看或者接下来五年来看应该都是不可能的,咱们怎么样可能让这些工程师奉献到咱们代码里,让这些场景被咱们所应用。

开源如同是惟一的方法。

因为我之前是做 2B 的,2B 和社区的玩法有些不一样,因为之前传统 Marketing 模式在 2B 外面基于漏斗模型,但在社区外面基于传统的漏斗模型会导致一些价值的散失,所以咱们会抉择用 2C 的形式去做 2B,就是用社群的形式去真正做社区 Marketing,咱们抉择的路线是传统 Marketing 变成经营,经营反对社区。之所以说漏斗模型在社群或者开源社区经营外面导致价值的散失,是因为传统的漏斗模型是基于不确定的因素,而后通过一直的去迭代,去往下漏,漏到一些要害的指标,而后给它要害的信息,让用户转化为付费或者他的外围用户场景。

开源是绝对涣散的组织,根底就是自在,能够随时来随时走,没有特定的权力或者任务,再用传统漏斗模型因为不确定性太大了,所以这个不太实用。

这是咱们目前在做的一个模型。咱们从 BCP 三点剖析:C 端大家能够了解为社区的开发者,社区的 DBA、社区的用户、社区的人才,咱们通过一直的去培养人才,去挖掘人才,通过人才去建设一个护城河,通过他们一直的应用给社区一些性能做一些欠缺,通过他们去反馈给 B 端;B 端就是咱们的用户,咱们用户如果须要应用 TiDB,咱们给对应的人做一些培训、赋能,帮忙用户独特胜利;不论是 C 端还是 B 端都会给咱们的产品(P 端)带来更好的打磨,帮忙咱们产品进化,同时给咱们带来更多的解决方案,在产品不断完善的同时又能够去帮 B 端做业务胜利。

通过开发者去赋能咱们的产品,通过产品促成咱们的 User Base,再扩充咱们用户数量和用户应用深度。

很多人好奇 TiDB 目前社区的我的项目到底在做什么,有什么职责,他们怎么跟外部进行划分的,我这儿简略写了一下。

咱们当初更偏差于用社区的形式,比如说 SIG 就是一个小组,不论是 Stack 还是 PR 都会以 SIG 为单位去做,把雷同感兴趣的人放到一个 SIG 里,对 SIG 活跃度做监控,比方 issue,这个 PR 是不是被合并了,PR 是不是期待 review 的工作。同时咱们有一些挑战赛,月度的月会或者博客等等,做对外品牌的曝光。最初做一些比拟根底的,大家更多的交互在 GitHub 上,咱们有时候也会揭示他可能有哪些 PR 须要核了,有哪些 issue 须要去跟,这些通过 BOT 形式去实现。

TiDB 的社区经营重点,第一个扩充漏斗,除了对外输入的用户场景和一些案例,之后有各种流动的布道,这种目前集中在开发者圈子里。同时咱们做的比拟重要的一点就是人才,对于人才当初分几块,包含咱们对于最终用户的应用,外面可能会包含一些 DBA,包含数据库的开发者,还有专门重做开发的。咱们给他们做一些培训,他们到 TiDB 生态外面的企业能够做针对于 TiDB 的一些开发。这是扩充漏斗。

第二块晋升向下的转化效率,其实很多人给咱们反馈,大家看到 TiDB 的社区,来到之后发现很难。对于很多刚进来的人而言看到 TiDB 的代码感觉在看奥数,咱们其实在做升高门槛,比方对于 issue 模板标准化或者对于 PR 的形式,对于抛出探讨的货色,都在一直的去做,就是为了升高开发者进入的门槛。

咱们同时在思考一个问题如何更高效的扩充漏斗的第一层,激发人们的二次流传,其实跟咱们最近思考社区自治是一个情理,但当初如同没有一个特地好的解决方案。

开源我的项目个别常见的治理架构会分为这三种:比如说善良的独裁者,这是 TiDB 目前在用的。或者说精英制,沉闷的我的项目贡献者决策,决定通常会基于投票,Apache 基金会提出。

咱们基于善良的独裁者进行组织架构,进行对外公开做一些事件,有 PMC、开发者组织等等,他刚进来是 Committer,对开发者层级做了更细的拆分,大家会感觉 TiDB 社区做的挺好,会有不论国外或者大厂开发者来奉献,大家感觉做的很好,但其实在咱们外部来看,咱们当初做的所谓的这个组织架构真的有用吗?

不见得,因为咱们如果做一个开源社区它的治理,咱们心愿最终的货色叫自治,咱们当初有做到自治吗?整个 PMC,目前在社区写代码的这些人可能不晓得 PMC 外面有谁,咱们本人外部人看一下 PMC 外面都是谁,根本都是 PingCAP 的人,这些人会对目前的状况做反馈吗?不会,这个货色没有起到真正的作用,所以咱们最近在做的一项措施就是把目前的整个社区的治理架构废掉,从新去做,找那些真正去关怀 TiDB,真正违心参加到 TiDB 我的项目的人进来,让他们去做这个社区的治理。

起初咱们从新设立了新的架构,下面是一些 Committee,上面有 TOC、LoCo、Marketing 和 Publicity,咱们通过 TOC 形式去做,之前并不是真正的社区组织,当初咱们做 TOC 的时候特意标注了这一点,咱们心愿 TOC 是什么样的?

咱们心愿它是协调跨公司跨组织的,就是不仅仅是 PingCAP,不仅仅是 PingCAP 的用户,比方知乎、伴鱼、360 等等,而是能够协调各家组织各个我的项目,可能对立调动资源,做社区外面对立攻关的货色,这是这个 TOC 的目标,TOC 必定不是属于 PingCAP 的,而是说 PingCAP 只是 TOC 外面的一环。

咱们初步投票 TOC 主席,TiDB、Tools 等我的项目代表须要提拔,由 CNCF 孵化的 TiKV、Chaos Mesh 的我的项目代表各一名,组织建设倒退,PingCAP 代表一名,外围企业单干代表,他们可能独特决策社区接下来整个我的项目产品倒退路线是怎么的,就是说 PingCAP 只是社区外面惟一一家可能说目前惟一一家商业公司在对外提供服务而已。

这是做完 TOC 建设之后给 TOC 制订的一些 Meeting 简略的工作流程,在这些流动之前咱们须要去向各方面的 Meber 收集他们须要探讨的货色,因为 TOC 外面更多的是非 PingCAP 的一些人,大家的工夫又很贵重,所以要把这些流程提前规定好,这个能够包含 TOC 更快更轻量的去做。

这是在流动之中大家怎么提本人的我的项目,提本人的布局等等。基本上都是在之前要去做好。

目前 TOC 算是基本上建设完了。下一步要做整个开发者上面的 SIG,之前各个 SIG,大家感觉 TiDB 当初做挺好,但目前你们更多的人是说 PingCAP 人一直的推,一直的去做的,咱们心愿有更多来自社区的人退出进来,咱们接下来会去找一些比拟违心比拟踊跃的开发者进来,选取一些 SIG 的 Leader 作为试点,选取一些 SIG,让他们真正有自沉闷自治在外面产生。

另外对于开发者和用户进行分层经营,因为开源这种货色,我感觉你首先吸引大家进来,你的经验和荣誉感必须始终随同他一生的,所以这块咱们会进行一些加强,这也是咱们明年到 3 月底次要要做的一个事件。

视频直播回看请点击 “传送门”

退出移动版