乐趣区

关于oceanbase:新数据库时代DBA-发展之路该如何选择

近些年,数据库在技术畛域已倒退成熟,诸多类别趋于细分,焕发新的生机。泛滥新生数据库诞生并以迅猛之势关上市场,同时很多数据库也以开源凋谢的模式布局国内外市场。

对于全新阶段的数据库时代,一些新型数据库对 DBA 在产品学习和业务场景体验上面临新的挑战,到底将来该如何选型新数据库产品,DBA 的倒退该如何抉择?

《对话 ACE》第二期流动便以“新数据库时代,DBA 倒退之路该如何抉择”为背景,邀请到 OceanBase 解决方案部总经理师文汇,dbaplus 社群联结发起人、竞技世界资深 DBA、Oracle ACE 杨建荣,独特摸索“DBA 将来倒退之路”。以此推动国产数据库技术、人才及生态建设的倒退。(* 戳下方视频看残缺精彩回放~)

直播干货满满没工夫看视频没关系!小编对直播的内容也进行了汇总分享欢送大家浏览、珍藏!

Q: 您认为 DBA 更应该参加哪方面的工作(比方内核开发,调优,交付等)?

A 师文汇:大略分几个群体。对于刚毕业的学生,激励大家多做内核或者技术相干的开发工作,会有好的技术积淀。数据库其实是处在整个业务的最外围的环节,既能做深层次技术的积攒,也能够将技术和业务更好地联合。无论学习内核,还是学习业务,对 DBA 都是有十分大的帮忙和成长。

对于一些资深的 DBA,倡议大家多理解行业或业务知识。比如说金融、运营商畛域,如何应用数据库,在业务场景下的外围痛点。对于 DBA 的倒退,能够去做对外的商业化解决方案类,也能够架构师方面的工作。

数据库开发方向,后期能够理解一些常见的开源数据库,比方 OceanBase,其实是很好地学习数据库的动手我的项目。能够基于其社区版做一些凋谢的 project,通过这样一些实际,疾速的进入到社区一起交流学习。

对于传统数据库的开发者,例如 MySQL 或者 PostgreSQL,如果投入到 OceanBase 分布式的学习,人造是有很多劣势,比方在事务上的了解。OceanBase 是一个分布式关系数据库,通过学习,在分布式、一致性协定等畛域,是可能帮忙大家疾速成长去实现自我晋升的。大家如果违心入手花工夫去学习和实际,比方简略的一些代码批改和编译,通过这些实际,会有新的播种。

Q: 大家都在谈内卷和躺平,对于这两方面,是否给 DBA 们一些倡议?

A 师文汇:我同时也在负责蚂蚁数据库和存储团队,我感觉一方面从业务角度看,很多事件能够去做甚至能够做到更好。比如说单 TB 存储老本,每天在蚂蚁都有上千 G 的这种业务须要公布,咱们如何能做到效率更高。当你去认真学习业务或者去了解零碎的时候,总是能发现还有很多问题能够去欠缺。

什么是内卷,以前大家常常说,做事件要去突破边界,互相补位,其实从这个角度去做事件,就是真正的为了一个独特的指标,在大家都能承受的正当空间,去做一些跨畛域或者跨边界的事件。这样的话可能对本人包含最终的业务后果都有很大的帮忙。

另一个方面,对于本身成长来说,我感觉是不能躺平的。大家能够看到,整个社会和业务倒退有多迅速。在 2014 年的时候,没有这么多的分布式数据库和国产数据库,然而在过来的几年里,不光从数据库,TP 或 AP,包含计算、算法,AI 畛域,其实都涌现了很多新的技术和产品。这个时代其实在用很快的速度后退,咱们必须保障本人的成长和竞争力。

Q: 面对不同类型的 DBA 倒退方向(参谋、技术支持、运维)将来如何正确抉择?

A 师文汇:我感觉 DBA 是一个十分有竞争力的职业或者角色。我意识的很多 DBA 都去做守业了,而且倒退都很好。那么这些人是如何倒退的这么好?因为他十分懂业务和数据库,面向最终的用户,理解用户的明确需要。所以可能去帮忙用户做一些设计,积淀,行为,想法。还有的 DBA 抉择去做商业化解决方案或者交付,同样能够做的很好,因为他们能够帮助业务把解决方案帮忙到例如传统银行外围零碎的迁徙的我的项目上。

对于 DBA 这个角色,上游是根底技术,上游是业务,两头是数据。所以这个角色其实是有能力成为任何一个类型的人才。当你把根底技术做扎实积攒后,在职业上的抉择是十分多的。DBA 想成长应该做什么,学习业务和技术,又要懂数据。最终的倒退方向取决于本人想去做什么,而后做好这些方向的积攒。

Q: 国产数据库的迅猛发展,产品泛滥,对于 DBA,应该如何抉择才有利于集体职业倒退?

A 杨建荣:国产数据库其实在行业内会打一些标签,目前有几个类别。

第一类是学院派数据库,比方达梦,人大金仓等,偏军工等传统行业,绝对利用比拟宽泛

第二类是互联网派数据库。基于互联网场景的技术积淀,比方 OceanBase、PolarDB、TDSQL 等,有互联网原生的业务场景,可能疾速地孵化,有更多的技术积淀。

第三类是守业派数据库。比方像 TIDB、偶数等 NewSQL。创始人有海归背景的技术专家去推动这样的一些事件。

第四类是企业派数据库。比方华为 GaussDB、中兴的 GoldDB 等等。这些企业之前就有一些大量的客户群体。而后在客户群体内能去孵化和把产品推到整个产品线。所以国产数据库近几年,会比以前的风行度和布局度更有落地性。

Github 上有一句话,就是说技术在某种程度上也有国界,或者说从做 DBA、做技术的角度来说,须要有一个护城河的概念,因为有技术壁垒,须要去提前布局思考。

Q:DBA 要做什么能力做到像您这么优良, 相似 ACE 这样的身份?

A 杨建荣:第一个就是常识的积攒。好忘性不如烂笔头。我最早做 DBA 的时候是跨国企业,会有大量的数据库问题,Oracle 这个方向,每天会集中处理很多异样、报警、报错这种问题,相对来说很具体。然而会碰到一个困惑,尽管花很多工夫解决了问题,然而最终解决的过程没有通过思考,只是把问题解决了而已。所以在这个过程中,我发现能够在问题解决的过程积淀下来,积淀成一个比拟晦涩的记录。在各类问题解决的过程中,会把潜在的因素都可能很好地联合起来。

第二个就是笔记的规范。有利于常识积攒,一方面节俭本人的工夫,另一方面就是让过程更晦涩。把整个操作的过程可能通过相似博客文章的模式推送下来。

第三个场景化利用。很多知识点是碎片化的,不成体系的。这里倡议梳理成常识树或常识体系。通过梳理的过程,会发现一些潜在因素。

第四个就是有针对性的分享。比如说所在公司比拟小不足更多的场景。这种其实能够换一种思路,就是去帮别人解决问题,通过社区平台,甚至能够通过本人的博客等形式去帮忙他人去解决问题。这个过程中,对集体的成长和播种来说,是十分大的。

分享其实是先利己后利人的一个过程。一开始是为了不便本人,当积攒一定量之后,对他人也有很大的帮忙。之后在某些问题上会有一些共鸣,或者提供给他人一些帮忙后,会有一种莫名的成就感等等。所以我感觉 ACE 这样的头衔或者身份,其实不是一个最外围的。是对于本人成长过程的一个标记。而且 ACE 的掂量的一个重要指标,就是对于整个技术社区的贡献度。

Q: 国内的 DBA 应该如何正确面对开源?

A 杨建荣:我会分为三个视角。第一个视角是对于像 OceanBase 这样的国产数据库厂商,包含技术贡献者。国内在晚期造成的一种技术气氛,就是缄默的大多数。大家可能拿来去用一些数据库,然而很难失去一些更无效的反馈。

所以近些年来会有比拟大的变动。在数据库的开源,包含在开源反对的态度上,从原来的被动承受或者拿来主义的模式到当初会去从各个角度去奉献本人一些力量。这个维度从文档 bug 或者社区合作上,都会有不同水平的体现。

开源重在生态的建设。生态建设是须要肯定的工夫,而且在品质上是不能打折扣的。另一方面原来聊开源可能就是收费开源,相对来说是比拟中肯或者现实的一个状态。然而当初去聊开源,他须要去做长期的筹备,技术栈布局。整个技术栈对于开源来说,会从原来齐全凋谢的一种状态,转为一种就是长期布局的过程。第三点是当初的私有云,对于 DBA 的倒退方向也会有比拟大的冲击。因为私有云的实质是资源的池化,是一个去服务化的过程。对于很多企业随着规模的倒退,很多是须要公有云,或者说在性能、架构、对业务的服务反对上,须要有一些更有针对性的反对。

所以公有云方向上,我的倡议是预留 60% 到 70% 比拟成熟稳固的开源技术栈。预留 30% 到 40%,去做前瞻技术栈的布局。在这个过程中,须要有深刻的技术积淀,对业务来说更平滑。然而私有云的方向,可能绝对是更泛化的一个过程。因为基于私有云的云原生数据库,对于传统数据库方向上都会有一些挑战。

我对开源的布局是 28 准则,就是大部分的数据库的选型或者应用,基于 RDS 为主根底上,在业务成长相对来说比拟成熟稳固的,或者有一些增长,跨域拜访等或更短暂的布局上,可能 20% 的比例去思考云原生数据库。

Q:DBA 如何通过开源数据库产品享受这一波红利?

A 杨建荣:我感觉能够提炼三点。

第一点是通过开源数据库,包含分布式数据库。在某种宏观水平上,在面向高可用的难题上是可能迎刃而解。或者说是一种辅助,包含在宏观数据库方向上,其实会有一些 HA 的工具等等。然而在原生分布式数据库中,这种问题可能就不复存在了。在这个方向上,会进步服务的高可用能力。

第二点是抉择开源数据库更多是数据库的开源共存状态,实质上会做很多场景的互补。比方方才提到的,比方在 AP 畛域,原来是做 TP 的方向上,可能在 AP 上须要做流转或额定的一些流程。然而当初可能是做了一体化的形式,会有一种 HTAP 的场景。对于业务来说,相对来说会更容易更适配去接触业务的迭代速度。

在这个方向上举个例子,原来数据库去做简单的查问,字段也十分多,可能在 MySQL5.7 有时候就有一些简单的查问,可能须要 30 分钟。MySQL8.0 可能一分钟就能胜利。但应用 HTAP 的计划, 发现可能只须要 1-2 秒就能够解决。所以通过这种形式在应用开源数据库产品对很多研发同学来说,和应用的 MySQL 时一样没有太大的技术壁垒。所以在接触的过程中,也会逐渐信赖和积淀成为深度的客户。

第三点是开源数据库产品的品质是有保障的。然而产品用得好不好,或者在用的过程中如何去更继续更无效的迭代。在社区包含反馈机制上,可能去更好地造成一个闭环。

包含很多相似 OceanBase 的开源数据库产品,不只是开发出了一个数据库场景,让大家去应用,理论是逐步造成社区生态,在生态之下,能够让整个的数据库产品,包含性能、易用性、体验上。用户都会提出不同角度的想法。所以对于开源数据库的产品应用来说,无论是对于研发人员,包含开发数据库内核的技术人员,是一个互补双赢的状态。

Q:DBA 在面临业务变动的时候,如何疾速实现技术和业务的转型?

A 杨建荣:第一个层面属于防患未然或长期布局的过程。很多状况下,数据库计划亟待解决的时候,再去想计划的话相对来说是一个提早或者拖后的状态。这样就造成了恶性循环。在这种场景下,须要提前做一些防患未然的事件。包含技术栈,以及提前和研发去沟通业务痛点,或潜在瓶颈。在这个过程中,可能计划 A 能够满足。然而计划 A 在长期可用的状态下,会去积淀计划 B,尽可能实现平滑代替的状态,进而实现业务疾速转型,应答变动。

另外一个层面是大部分时候是基于业务场景需要去做一些设计和改良。而后业务场景的很多变动,也是逐步演进的过程,所以在后期去接触计划的时候,在一个特定的工夫,必定不是最好的计划。然而通过全盘考虑后,可能在此基础下来欠缺一个更适合的计划。

线上答疑解惑环节

Q: 分布式数据库将来会全面取代传统关系型数据库吗?分布式数据库将来状态会是 HTAP 吗?

A 师文汇:我的个人观点是比拟坚信这件事的,目前阿里、蚂蚁的外围零碎,包含网商银行,海内的局部银行和领取机构,OceanBase 曾经赋能很多这样的企业。商业化当前,目前数百 + 不同行业的客户,都抉择用散布数据库彻底取代传统的关系数据库,让企业更加可控。所以从案例实际上,我认为分布式数据库是能够取代关系型数据库的。

分布式数据库是诞生在互联网和挪动互联网这个时代的,天生有后发优势。针对这个方面做了很多设计,分布式数据库的将来状态会是 HTAP,举一个例子,比方营销零碎,通常会圈定一些人群,而后去思考这群人是不是可能产出更好的广告 ROI,于是就去做这样一个试验。传统的数据库可能要做 ETL 导数据,申请代理权限等这些会消耗掉很多工夫,但 HTAP 数据库,它其实是能够在这个数据上间接去做开掘或者剖析。就如创始人阳振坤老师分享一篇文章里说的一样,分布式数据库就像电动车特斯拉,代表着将来的发展趋势,而 HTAP 是对数据库整个行业的老本管制、效率晋升,会有十分大的改观。

Q: 面对将来的各式各样的新型数据库,应该从哪几个方面动手理解呢?

A 杨建荣:新型数据库的倒退方向是基于大数据的 4V 背景,包含数据规模大、数据变动快、数据品种杂、数据价值密度低等等。在这个背景下,新型数据库是一个绝对新鲜的技术体系。对于数据库规模大,关联的是分布式数据库管理系统等,比拟有代表的如 OceanBase,Spanner,MongoDB 等等,都属于这种新型数据库的畛域;数据变动比拟快,在这个方向上提炼进去数据库的一个分支,就是流数据库管理系统,如 Aurora 等;另外两个维度会小众一点,或者说它的后劲和价值可能是待开掘的一个状态。如依据数据的品种会延长进去两个分支,一个分支是图数据库,比方 New4J,另外一个是这个时空数据库 OceanRT,DITA 等;最初一个就是数据的价值密度比拟低的背景,提出了众包数据库,相对来说更学术,或者还是在摸索的阶段,这个方向像 CDB、Qurk 等等,绝对偏学术或者说待孵化的阶段。

**Q:DBA 的职业倒退方面,对于不会编程的 DBA,是否应该破费精力抉择一种编程语言去学习呢?对于 DBA 转型数据库产品研发有哪些认识?
**
A 杨建荣:我把两个问题合起来答复一下。第一个问题是不会编程的 DBA 他是否应该去学习一个编程语言?我的强烈建议是须要去学习的。

DBA 从职业倒退上来说,能够分为五个维度:高可用的架构的能力、分布式架构的能力、数据模型优化的能力、服务化建设的能力、资源布局和治理的能力。

通过以上几个维度,我感觉对于 DBA 来说,如果不会编程,就须要在业务或者某些方向上须要有一些积攒,至多得有一个方向是更善于的。学编程语言对于 DBA 的职业倒退上来讲属于服务化建设的能力。

因为服务化建设的能力,从研发到业务是一个间接能感触到的高效和业余的一种形式。所以须要去学习一种编程语言。另外一个视角就是当你学习一种编程语言的时候,你会从研发的视角去思考这个问题,而不是单纯的从运维 DBA 的角度去繁多的思考问题,从而更容易抓到这个问题的实质。

第二个问题是转型数据库产品研发,更偏差数据库服务化的建设能力,须要去思考一个点,就是说对数据库的这个方向上真正的技术现实或者说技术趣味点是否认可?如果只是单纯的做数据库产品研发,我感觉可能它是一个偏颇的方向。另外一个就是在业务上有很深的积攒或者数据库的反对方向上有很多的想法,再去转型做数据库的产品研发是比较顺利的。因为产品研发只是 DBA 畛域中的一个分支,更多取决于本人的趣味点。

Q: 一般中小型企业通过一段倒退之后,数据库曾经有十分大的惯性了。现阶段企业和集体怎么转型国产化呢?

A 师文汇:对于集体来说的话,学习是本人的事件,即便公司没有用这个数据库,你其实还是能够去学习的。对于企业来说的话,企业是会有很多的研发惯性,习惯用了一种货色当前,可能很难解脱去切换到另外一种产品,尤其是数据库这种外围零碎,相当于一辆车的发动机,可能更不容易。

然而我感觉从 DBA 或者是企业的视角能够去思考几个问题。

第一个是说如果想换成国产数据库,有没有比拟低的代价?假如咱们用的是 Oracle 模式,那是不是有一些国产数据库它能比拟好地去兼容 Oracle,同时又能给咱们带来一些便捷。

第二个能够从降本增效相干的一些角度去思考。是不是能够引入一种分布式数据库去解决老本效率的问题做一些尝试。很多企业都在考量 ROI,很多的新型的数据库在这方面做得都比拟好,能够思考做一些演进的尝试。围绕 8020 准则,守好次要的关口,找一些边缘的业务做翻新,当真的可能尝到技术红利当前,而后再去思考公司的整体方向去驳回一种新型数据库。

《对话 ACE》第二期通过两位老师对 DBA 职业倒退,如何更好将业务和技术相结合,包含对国产数据库和开源数据库的认知和选型,都给出了精彩的观点。

将来 OceanBase 将继续发展《对话 ACE》流动,敬请关注。

退出移动版