关于数据库:干货来了神州数码-CIO-沈旸揭秘-Hackathon-背后的-TiDB-生态丨TiDB-Hackathon-评委访谈

7次阅读

共计 4732 个字符,预计需要花费 12 分钟才能阅读完成。

你多久没仅为 Have fun 去写一段代码?
你多久没为实现一个天马行空的 idea 而兴奋不已?
你又多久没为和团队一起 Coding 而干劲十足了?
来 TiDB Hackathon 吧,这些体验都能找到!

TiDB Hackathon 2021 已于 12 月 9 日起正式开启报名,咱们曾经收到了许多新老朋友的组队报名。本届 Hackathon 主题为「Explore the Sky」,将在 2022.1.8 – 9 两个较量日进行,线上线下联动。大赛邀请了数据库畛域出名专家、社区技术大咖、顶级投资人代表等超强阵容担当评委,对我的项目进行全方位点评领导,为赛事体验保驾护航。

在期待最终较量日的这段时间,TiDB 社区对评委、选手进行了系列访谈,请他们分享本人对于开源、Hackathon 的教训,并分享对 Hackathon 参赛选手的倡议。这次咱们请来了本届 Hackathon 特邀评委 —— 神州数码团体 CIO 沈旸,一起看看他眼中的开源和 Hackathon 吧~

采访对象简介

神州数码团体副总裁兼 CIO 沈旸,曾在 SAP 工作 10 年,为寰球客户做数字化转型。2017 年退出神州数码,负责神州数码的数字化转型工作。在过来 2 年参加了包含 TiDB 在内的多个开源我的项目建设。

以下为访谈记录:

Q1:最早接触到开源在什么时候?

沈旸:我接触开源比拟早,像 Linux 等开源我的项目都接触过。接触比拟深的是在 SAP 里一个叫 ABAP 的开发平台,它尽管不是 100% 开源,然而它的代码对所有客户和合作伙伴都是凋谢的,其实有一点点开源的滋味。

因为凋谢,平台里的所有 BUG、问题都能够让客户或合作伙伴本人去找到并解决,这样就把咱们找 BUG 和解决 BUG 的老本降得非常低,ABAP 里大部分的问题可能都不是 SAP 本人找到的。这是我最后对开源比拟粗浅的领会,也能够把它当做一个相似于社区,或相似于生态的了解。这个生态是很难破的,如果是齐全闭源的软件,呈现问题只能由厂商本人来解决,解决老本会十分高,而且这十分取决于厂商外部的效率和流程。略微有一个流程出问题,可能都会对客户造成很大的影响。

对于开源,我本人用三个关键词总结:

  • 连贯:用开源能够最快接触到更多客户、合作伙伴、社区参与者;
  • 凋谢:开源不仅仅是代码凋谢,还须要更凋谢的心态。我在 TiDB 社区外面,常常会有很多人问“你们是不是要做本人的版本?对 TiDB 有什么影响?”其实,TiDB 始终是十分凋谢的心态;
  • 平安:凋谢和连贯之外,平安也很重要。尤其在企业级的数据库产品中,如何保障安全性至关重要。因为开源所有的代码都是凋谢的,岂但对客户凋谢,对潜在攻击者也是凋谢的。比方最近出的阿帕奇(Apache)Log4j2 安全漏洞问题,其影响是十分微小的。将来,咱们须要把平安做得更好,让客户在开源代码环境下也可能取得最好的平安爱护。

Q2:中国企业级用户对开源的态度产生了什么样的转变?

沈旸:神州数码就经验了一个蛮大的转变。咱们本身是一家很大的企业,和中国很多企业相似,各种各样的开源组件、产品都会去应用。以前国内的企业,往往对社区的反馈并不是特地多,本人去做开源产品的就更少。当然,这也是因为做一个顶级的开源我的项目其实是特地难的,你可能要有顶级的工程师,但工程师须要没有太多生存的压力,能力静下心来想些久远的事件。所以长久以来,国内尽管开源用得多,然而奉献却比拟少。

这几年随着国内互联网大厂外部有足够的能量去做开源我的项目,开源开始衰亡。但更难能可贵的是,除了这些互联网大厂外,还有很多新兴的企业也开始做开源,比方 TiDB、Apache DolphinScheduler。他们不是一个互联网大厂的团队,而是从小团队开始做起,也做出了顶级的开源我的项目。我感觉这些开源我的项目的衰亡在中国真正关上了一种新模式,开源不是简略地靠金钱,靠团队规模,靠技术实力堆上去就能造成的产物,而是找到了一个很好的土壤,让开源团队哪怕只是一颗小种子也可能生根发芽。

我感觉这样的模式在中国曾经齐全造成,而且中国的市场规模足够大,只有你的开源产品满足了中国客户的一些需要,它就能迅速地被接收,可能几年工夫就能把市场霸占。所以,我也心愿中国的企业,哪怕是作为甲方也好,将来都能参加到开源建设中,甚至可能有本人的开源我的项目,造成更好的中国开源生态体系。

Q3:您是什么时候接触到 TiDB 的?

沈旸:咱们在 2017 年左右就开始接触到 TiDB。记得有一次“双十一”期间,咱们有一个业务零碎和物流无关,它的零碎数据量、访问量比平时都会多很多倍。这种场景与 TiDB 的弹性伸缩场景十分相似,保障长期扩节点零碎不挂掉。过后,有一些比方硬盘的故障,导致系统长期没法用,如果再去做故障修复、数据恢复会花很多工夫。

咱们最初在 2017 年底就部署了 TiDB 集群,这个零碎到当初从没挂过。甚至有一次,这个零碎有一台物理机挂掉了,咱们过几天才发现,然而它并没有影响业务零碎。这件事让咱们对分布式架构有了更直观的意识,它的治理老本不须要那么高,它不是很精细的仪器,须要精心地保护 / 颐养,它就是一个十分实用的工具。

起初,咱们也尝试在社区外面做奉献。比方加入 TiDB Hackathon,在知乎上发表大量对于 TiDB 的文章(TiDB 源码解析),TiDB for PostgreSQL 方向的我的项目等等……

Q4:开发「TiDB for PostgreSQL」我的项目的初衷?

沈旸:我原来的背景是在 SAP 里做数字化转型,面临的体系与一些互联网公司不太一样。TiDB 的初期客户大部分是互联网公司,互联网公司的业务其实弹性十分大,比方一下子碰到几千万 / 上亿的用户,霎时数据量扩得特地大。这类用户谋求的是弹性、伸缩性,当然还有零碎的高可用性。

但在企业级客户里,企业外部的各种利用零碎,有一个很重要的诉求就是复杂度。比方 PG 的数据库与 MySQL 比拟起来,在多表关联、简单查问上,会做得更好一些。而在企业级畛域里,一个企业大了,天生会有很多的烟囱。这个烟囱不是大家成心造成的,而是因为法律或其余方面的因素。

例如,法律规定企业的财务数据是不能提前披露的,财报之前可能只有几个人晓得,到了财报的时候才要对所有的人公开。在此之前,财务的数据就只能把握在局部的部门手里。人力资源的数据也一样,公司的数据不可能所有人都晓得,企业里所有货色都是由业余的部门来解决。在数据上,天生就是由很多数据表组成的,然而它的数据量不可能达到互联网的级别,它的简单就体现在外部的权限以及多表的关联上。PG 在这方面做得十分好,咱们一开始有一些外部的利用心愿能做在 TiDB 上,但因为 MySQL 的天生局限,适配起来比拟艰难。

咱们过后也看过其余的,更可能适配 PG 的数据库,比方像 CockroachDB、YugabyteDB,但没有一个是百分之百可能适配 PG 的。因为 PG 的语法等各方面是非常复杂的,我置信不可能做到百分之百,所以这个畛域是有空间能够做的。在很长时间内,没有一个所谓的相对第一名,这个时候你就有心愿。第二我感觉在国内基于 PG 的分布式数据库,尤其是开源畛域,在市面上非常少,简直没有很强的成熟的竞争对手。

所以在这个畛域如果能做起来,第一方面是可能补救 TiDB 的一个短板,当将来有很多基于 PG 数据库的客户零碎,想迁徙到 TiDB 上,就不必做大量利用的革新。利用这个货色有简单的利用有简略的利用,简单的利用改起来可能不比革新一个数据库更容易。第二方面,咱们可能看到这会造成一个新的方向。

Q5:对其余也想参加到 TiDB 社区中的企业有什么倡议?

沈旸:无论是客户还是合作伙伴,大家在应用产品的时候都会进行比拟,网上很多文章有说好的,也有批评的。其实没有哪个产品是没有毛病的,我记得 TiDB 以前很早的一个版本连乐观锁都没有。但这恰好是用户或合作伙伴的机会,比如说你本人是一个银行客户,刚开始应用 TiDB,发现没有乐观锁,如果你投入本人的团队,可能只有略微做一点点工作,去把这个乐观锁做进去,就能为社区多建设一点。甚至你也能梳理一个本人的分支进去,把整个生态建设得更好,这是一个双赢的过程。

我感觉在开源的生态里,大家就是得想得更透彻更凋谢一点。TiDB 不仅仅是一个公司的产品,它将来能够是一个很多公司产品的合集,这个合集能够造成一个更大的产品群。也可能外面某一个小的产品或小的性能,和任何公司都没有任何关系,是百分之百由社区的人齐全奉献的。所以,我感觉大家要踊跃地去摸索这些可能性,如果晚了可能好摘的水果都被摘完了,前面想奉献就更难做了。

Q6:对 TiDB 社区的期待?

沈旸:对于社区的话,我感觉 TiDB 的社区在国内做得其实曾经十分好了,你们能够去帮全国甚至全世界做开源的团队和企业。将来,中国会有很多很多新的开源产品,然而很多人一开始真的只是纯正工程师的思维,就只是会写代码。开源不仅仅是把代码放到 GitHub 上就行了,在社区经营方面,我置信很多工程师基本不晓得怎么做。

咱们第一个开源我的项目是叫 DrawDocker 的一个我的项目,在 GitHub 上只有 8 个 Star,它就不足这种社区的力量。然而另外一个咱们做的 TiDB for PG,TiDB 社区帮忙咱们做了很多的工作,当初曾经有了 300 个 Star。社区内有很多客户、搭档也盯着这个方向,他们很感兴趣,始终在问什么时候能做得进去。所以我十分心愿 TiDB 社区的能力,将来可能也开源凋谢进去。

Q7:是否会加入本届 Hackathon?

沈旸:咱们还在探讨中,往年如果参赛的话,方向应该和去年比拟相似,还是在 TiDB for PG 这个方向上有所突破。咱们外部其实最近在做一个比拟大的利用,在咱们的产品上做适配。咱们会评估这个我的项目最近是否会有一些很大的产出,评估咱们的工作量,看是否会加入往年的 Hackathon。

Q8:对本届 Hackathon 有什么期待?对参赛者有什么倡议?

沈旸:对于这次 Hackathon,我十分期待能有一些有翻新冲破畛域的选手进去。我心愿 Hackathon 里大家不仅仅是解决一些小的问题,更心愿解决的这个问题将来可能孵化出更有创意的产品,比方像 Chaos Mesh 这样的产品。一开始可能只是一个理念或者是一个小工具,然而起初不仅对 TiDB 有很大的奉献,也能够用在其余所有云原生的畛域里。

我心愿这次 Hackathon 可能在中国的开源界,做成一个由趣味驱动、指标驱动的顶级流动。也心愿往年可能诞生出一些对将来的软件行业,对将来的开源行业,在基础架构方面有一些奉献的我的项目,或者说一些冲破。尽管短期内做产品可能还是很难,然而哪怕短时间内只是一个 demo,或是简略的演示也好,心愿大家的 idea 尽量往更大的方向去想。

TiDB Hackathon 2021

本届 Hackathon 主题为「Explore the Sky」,将在 2022.1.8 – 9 两个较量日进行开发,线上线下联动。从 Ti 星球到宇宙天穹,咱们用 Hacking 连贯更宽泛的生态,给予参赛者纵情施展的设想空间。本届 Hackathon 咱们对赛道进行了全面降级,开拓出内核、工具、生态、「∞」四大赛道,参赛者不论是数据库开发者,数据库上下游生态,还是数据库的使用者,都能够找到适宜的畛域,围绕 TiDB 摸索有限可能。

TiDB Hackathon 2021 自 12 月 9 日起正式开启报名,选手能够自行组成 1 – 4 人的参赛队伍,在参赛周期内实现作品,优胜团队将取得奖金、技术和资源上的反对。大赛邀请了数据库畛域出名专家、社区技术大咖、顶级投资人代表等超强阵容担当评委,对我的项目进行全方位点评领导,排除常识盲点,为赛事体验保驾护航。此外,还有顶级投资人全程坐镇,让你的实力被更多人看到。

理解更多详情:Explore the Sky 丨来 TiDB Hackathon 2021 摸索有限可能

正文完
 0