关于tidb:破解数据库内核人才困局PingCAP-的思考与尝试丨Talent-Plan-专访

36次阅读

共计 3929 个字符,预计需要花费 10 分钟才能阅读完成。

数据库最早能够追溯到上世纪 60 年代,和当代电子计算机属于同一时代的产物。从问世那一天起,数据库就承当着向上撑持应用软件,向下调动系统资源的性能,在 IT 架构中处于外围地位,被誉为“软件行业皇冠上的明珠”。但国内数据库畛域研发人才紧缺,重大影响着数据库产业倒退。

那么,数据库人才到底为什么会短缺?又该如何解决数据库人才面临的挑战?带着这些问题,咱们采访了 PingCAP 高校关系与人才生态负责人王岩广老师,请他分享 PingCAP 在数据库人才畛域的思考与尝试。

数据库的人才挑战

以国内的人才需求情况为例,高校毕业科班出身并投身于分布式数据库的开发者,每年只有 6000 — 7000 人。但对应到数据库行业,对人才的需求量到底有多大呢?王岩广老师给出了一个数字—— 10 倍,也就是每年须要 60000 — 70000 人。这个缺口不容小觑,如果不加以器重的话,数据库开发者就会面临新鲜血液短缺,甚至不足继续能源,面临“后继无人”的地步。
目前,国内高校中对于数据库的课程设置,还是以数据库应用及基于 SQL Server、MySQL 或 Oracle 等数据库做利用开发为主。从课程角度看,以关系型数据库为例,次要分为三类:一类是对于数据库表、数据的组织形式,如集合论、关系代数、关系范式、SQL 语言;一类是对于 DBMS 实现的课程;还有一类是工业界数据库的治理运维课程。
然而,在近十几年中,中国互联网经济带来的对于数据管理复杂度的需要,曾经催生了对更简单 DBMS 内核实现人才的需要。但社会需要传导回高校教育尚需工夫。
可能有人会问,除高校外,社会中也存在各种各样的的数据库技术培训机构,他们为什么不能填补这个人才空缺呢?这次要是因为绝对于数据库内核开发岗位而言,对数据库应用或治理运维的岗位需要总量更大,社会培训机构广泛瞄准的必定是更大空间的数据库运维市场,而对于 DBMS 开发这样常识门路很深,且须要把握编译原理、操作系统、分布式系统等基础知识,同时从整体人才需求量而言又不像前者这样大的课程不足投入能源。

PingCAP Talent Plan 的缘起

2018 年,PingCAP 创始人团队的刘奇和崔秋一起去美国湾区,加入了一个数据库行业会议。他们留神到一个令其印象粗浅的景象,那个会议里有很多讲师是从教育界和学术界来的,包含一些传授、讲师甚至博士生。他们发现,这些人的实践程度、科研程度、工程程度都很厉害,这件事件对他们触动很大,于是回国后他们敏锐地决定要与高校开启一些科研单干。
这就是 Talent Plan 的缘起。为了解决数据库内核人才挑战,PingCAP 推出了开源数据库开发课程 ——Talent Plan。通过联结优良高校和企业,面向全国各高校数据库开发人才培养打造最佳实际平台,通过结业考核的学员还将取得官网认证的结业证书。
“分布式数据库和分布式系统都是比拟新的畛域,回想起当年刚学习这些内容时最大的艰难就是没有零碎的实践 + 循序渐进的实际联合的平台和课程,只能一边看零散的材料一边在工作中摸索,于是就有了做 Talent Plan 的想法,很快乐看到过后的初心当初变成了事实。”
—— PingCAP 联结创始人兼 CTO 黄东旭
与高校进行科研单干,须要学生可能了解工业界产品,Talent Plan 就成为将学术界与工业界连接起来的那座桥梁。与 PingCAP 有单干关系的学校学生都能通过 Talent Plan 疾速地理解 TiDB 等产品。
2018 年,一个迷你的 Talent Plan 0.1 版本开设起来了。从 0.1、0.2 到 1.0、2.0,Talent Plan 的门路模块、资料一直减少,一直迭代降级,目前学员曾经累计超过 2000 多名。

Talent plan 课程体系特点

在学习过程中,很多学员会将 Talent Plan 与 MIT 6.824 这样的偏重分布式实践的课程相比拟。实际上,Talent Plan 是一个比 MIT 6.824 大得多的课程体系。MIT 6.824 严格意义并不是个数据库课程体系,它次要讲的是分布式系统,在 Talent Plan 中,PingCAP 为了致敬,用 Rust 语言从新实现了一遍 MIT 6.824,将其作为一个课程组件。
据王岩广介绍,Talent Plan 的课程体系中包含了 GitHub 如何用、开源怎么合作,甚至还有 Rust 和 Go 语言的基本功训练。为了帮忙了解 TiDB,Talent Plan 课程中还提供了 TinyKV 和 TiDB Server 的教学版本 TinySQL。
对于学员而言,Talent Plan 的课程具备很高的难度。例如,如果想要全面了解像 TinyKV 这样的模块大略要用两个月工夫,每天须要花四到五个小时,是十分挑战的一门课。所以有些学生在学 Talent Plan 前,就会先去学 MIT 6.824,对 Raft 协定有一个根本的意识后,才会着手去学习 TinyKV。因为 TinyKV 外面除了 Raft 还有 Multi Raft、MVCC 以及分布式事务模块,光这一个模块就比 MIT 6.824 要多很多货色,学习的工作量很大,能够说真的是一个“小火焰山”。

如何保障学习体验?

为了让更多学员不会对体系宏大、内容艰深的 Talent Plan 课程望而生畏,或是大功告成,
平缓。
第一,举办学习营。

春节前,王岩广老师的团队刚刚举办了一期 Talent Plan 学习营。学习营以线上自学为主,加入学习分享讲座为辅,PingCAP 会邀请往届毕业的学员做导师,将本人学习过程中遇到的坑和必要的知识点分享给其余学员,帮忙学员们将工夫用在真正要害的学习上。学习营规模每期大略在 100-200 名学员,春节前这期参加人数甚至达到 400 人。
第二,Talent Plan 课程体系演进。

PingCAP 目前正在进行 Talentplan 3.0 的迭代。指标也是为使学员学习课程更加平缓,减少一些必要的基础知识信息。同时也会办一些短期培训,比方和中国计算机学会单干,在 VLDB 夏令营上就做过为期 6 天的集中短训。
另外,PingCAP 还会通过举办一些较量,吸引一些在数据库的开发和运维方面比拟优良,有学习数据库开发潜质的学员。同时,课程相干的文档也在一直积攒。然而学习当然是密度较大的、常态化的,也是须要始终跟进“打卡”。
将来,PingCAP 还会将 Talent Plan 变成一个学习社区,这就不仅仅是 PingCAP 一家公司来主导了,外面的所有参与者都是利益相干方,资深的成员会很天然地造成帮带制度,高分学员还能够成为导师,来自一线工业界的工程师也能够进来领导开发教训。大家共同努力,独特享受,建设一个全新的、凋谢的、共享的、共治的,以开源模式引领的一种学习社区。
第三,通过学习社区共创一本 Talent Plan 的书。

之前,Talent Plan 尽管也有电子文档、论文、材料、PPT、实操课等,但始终没有一本实体的书。国内学生的习惯还是心愿能有一本比拟零碎的书,
从概念到实操到作业,像是教材一样。有了这样的主线,学习体验也会更好一些。

拥抱开源的课程

作为 PingCAP 出手的我的项目,最重要的特点当然是开源。Talent Plan 所有课程从 0.1 起就是开源的,课程做进去当前,PingCAP 立即将其放在 GitHub 下面。目前,它在 Github 上的赞星数高达 7000 余,在数据库课程畛域外面可能是最高的一个。
图片
起初的倒退,齐全超出了 PingCAP 的预期。Talent Plan 学员来源于 200 多所学校,其中包含约 50 所境外学校。因为课程是英文的,逐步地,与 PingCAP 还没建设单干关系的国内学校,包含 MIT、CMU,以及日本和欧洲的一些学校也都来了。
图片
Talent Plan 的胜利,不仅仅是解决了 PingCAP 的问题,更大的能源是因为它解决的是行业问题。在人才这个困局背后,PingCAP 所有的行业竞争对手都变成友商,大家面临的问题是一样的,这是一个无利行业、有利于国家社会的事件,所以 PingCAP 会始终继续地投入上来。

对 Talent Plan 学员们的倡议

王岩广老师对学员们的第一条倡议就是“拥抱开源”。在分布式数据库畛域,互联网、GitHub 里的学习材料其实有很多,如果不去拥抱开源,可能就很难进入这个畛域。再者,学员们将来如果从事分布式数据库畛域开发工作,工作的形式很可能还是围绕着开源形式开展,拥抱开源是大势所趋。他认为,新时代学生求职时的简历不再是一页纸,很可能会是他的 GitHub ID。他做过哪些开源我的项目,提过哪些 issue,是哪些项目的 Contributor,从 GitHub 上高深莫测,它比传统一页纸的简历更加真实可信。
同时,开源我的项目往往都不仅仅是指开源产品自身,而是更大的开源生态领域。如 TiDB 生态中蕴含着泛滥周边工具,大数据工具,甚至还有其余企业做的发行版。这些生态都须要开发人才,如果你对生态中的外围产品很熟,会成为生态中十分受欢迎的人才,待业空间也会很大。
第二条学习倡议是学习门路。因为 Talent Plan 整个课程体系难度较大,学员们能够先从单机数据库课程开始学习,比方 Andy Pavlo 的 15445 课程、MIT 6.824 课程,这些都能够作为前序基础知识。

Talent Plan 的意义

目前,数据库人才需求的挑战还很大,然而 Talent Plan,以及整个 PingCAP Education 都在不懈努力,让每一个有志学生都可能很快地通过一个开源的学习通道,进入开源分布式数据库的开发生态里。
PingCAP 用开源消融了工程界和学术界之间的界线,并扭转了教学模式,老师和学生之间不再是传统的授课关系,而是变成学习社区里独特学研的平等关系。欢送更多小伙伴们退出 Talent Plan 中,通过学习最终踏上分布式数据库“高阶玩家”的平台,也欢送大家提供倡议、奉献智慧,一起打造“共建共享”的学习社区!

正文完
 0