摘要:GaussDB 首要的工作是解决华为的业务连续性的需要,同时也是要确保应用 GaussDB 的客户的业务可能间断,所以咱们保持策略投入,保持从每一行代码,保持从生态开始来构建整个数据库体系。
本文分享自华为云社区《华为云 GaussDB:施展生态劣势,造就应用型 DBA》,作者:GaussDB 数据库。
导读:
随着 5G 互联网时代的降临,各行各业对于数据库的依赖水平也在逐步提高。因为国内在数据库行业的倒退起步较晚,数据库的市场份额长期被 Oracle,微软等美国公司所管制. 然而随同着国内 IT 技术栈的一直演进,去“IOE”曾经由一个企业的指标,变成了整个行业的指标,也就是说我国必须使信息系统数据,运行在自研零碎之上,以避免数据失落造成的一系列严重后果。而近两年从国际形势来看,去 IOE 曾经成为了国产数据库倒退的必经之路。
很快乐看到的是现在国产数据库已逐步形成了百花齐放的格局,此次邀请了华为云数据库业务负责人苏光牛学生来和网友们一起交换对于将来国产数据库的倒退。同时咱们也征集了一些与国产数据库相干的社会探讨度较高、网友较为关怀的问题,心愿从数据库产品负责人的角度给公众一些更深层次的独到见解。
华为云数据库业务负责人苏光牛
负责华为云数据库业务的策略制订与倒退,数据库云服务产品与解决方案研发、经营、运维和交付等。
—以下为采访全文—
Q:介绍下贵公司的数据库产品及劣势,以及次要的指标用户是谁?
苏光牛:华为数据库 GaussDB 首先定位是云数据库,其次,定位为分布式数据库,云和分布式的联合是数据库的将来。GaussDB 首要的工作是解决华为的业务连续性需要,能不受任何束缚地应用数据库,所以从一开始就思考如何齐全的自主可控,从每一行代码、从生态,从电信的牢靠、可用及性能等要求登程,再和云技术相结合,打造企业级分布式数据库。
在以后的局势下,GaussDB 上述定位更加合乎金融、泛政府、电信、能源、交通、医疗、物流等重要行业的需要,真正能帮忙客户实现数字化转型。
GaussDB 是一个产品系列,在整体架构设计上,体现了多模的设计理念。具体包含:
- 关系型数据库:
- 基于 openGauss 生态的分布式数据库 GaussDB(foropenGauss),是自主生态的分布式数据库
- 基于 MySQL 生态的分布式数据库 GaussDB(forMySQL),咱们 100% 兼容 MySQL,让更多的客户能够无缝迁徙上来,同时,这也是分布式数据库,不再是单机的主备的 MySQL
- 非关系型 NoSQL 数据库:
- 基于文档的分布式数据库 GaussDB(forMongo),100% 兼容 Mongo 的接口,解决了开源的协定危险,用 3 正本解决 9 正本的可靠性
- 基于时序协定的分布式数据库 GaussDB(forInflux),分布式计划解决了开源只有主备的容量问题
- 基于宽表 Cassandra 的 GaussDB(forCassandra),解决了 Java 的 GC 抖动的重大问题,数据强统一
- 基于 KV 接口的 GaussDB(forRedis), 以后 100% 兼容 Redis,将来能够兼容更多的 KV 协定,数据强统一,超大容量 10T+,解决了开源主备脱节等问题
此外,还有一些重要的组件,如:数据迁徙——DRS(DataReplicationService);利用构造的转换——UGO(DatabaseandApplicationMigrationUGO)(愚公移山);分布式数据库中间件——DDM(DistributedDatabaseMiddleware),中间件这一层齐全自主开发,让整体具备分布式 < 分库分表 > 能力,满足需要 MySQL 生态但对可信要求不高的客户的诉求。
华为云 GaussDB 全栈产品以及解决方案,目标是让客户:选型安心(自主生态,开源生态,NoSQL,分布式对立的架构,性能卓越)、迁徙释怀(从数据的在线迁徙到利用的构造转换,让迁徙的担心不复存在)、生态无忧(无论基于开源的生态,还是对自主生态的要求,都能满足)。
Q:贵司的数据库目前获得了哪些问题
苏光牛:GaussDB 汇聚寰球资源,依靠散布在寰球 7 大区域的研究所、约 2000+ 数据库 / 数据仓库 / 大数据的高级内核引擎、算法、性能等专家与专业人才,继续策略投入 10 多年:
- 市场份额:金融政企市场,GaussDB 本地部署 (也即:HCS 的计划) 获得国产数据库第一的市场份额(起源:2020 下半年 IDC 中国关系型数据库软件市场数据跟踪报告);同时,寰球 DBMS 市场份额进入了前十名(起源:GartnerMarketShareAnalysis:DatabaseManagementSystems,Worldwide,2020)
- 标杆客户:已在 1500+ 金融政企与泛互联网标杆大客户获得规模商用,以金融业为例,GaussDB 曾经和工商银行、建设银行、招商银行、邮政储蓄银行、农业银行、交通银行、中信银行、光大银行、民生银行、华夏银行、中原银行、永安保险、众惠财产互相保险社、安心保险、海通证券等大量头部银行、保险和证券客户开展宽泛单干。
- 学术研究:华为先后在 SIGMOD、VLDB、ICDE 三大顶级国内学术会议上发表数据库论文 36 篇。尤其在 AI-Native 方向,2021 年新入选 SIGMOD 国内顶级会议的《LearnedCardinalityEstimationforSimilarityQueries》翻新地提出了模型宰割和数据宰割解决办法来解决 DNN 训练难题。
- 高校生态:与教育部联结建设“智能基座”基地,GaussDB 已与 72 所国内双一流高校建设单干关系,同时在教育部“新工科”我的项目的 54 所高校中开设 GaussDB 数据库课程。在高职、专科院校,通过实际实训造就面向社会的应用型人才。开课之外,华为数据库每年定期发展师资培训,联结多所顶尖高校传授出版 GaussDB 数据库教材、教辅,继续欠缺 GaussDB 数据库的人才培养体系!
除此之外,GaussDB 数据库每年举办数据库性能挑战大赛,设置实习生打算和优才招聘打算,提供华为和行业搭档实习机会。从实践教学、入手试验、大赛历练、职业认证、人才招聘全流程反对,长期造就和输送 GaussDB 人才!
- 开发者生态:华为将 GaussDB 的外围能力奉献进去,造成 openGauss 的开源版本和 openGauss 的生态,以后有 1700+ 开发者参加 openGauss 开源我的项目,20000+ 社区用户,来自寰球 74 个国家 506 个城市的 29 万的下载量,10 家厂商发行了基于 openGauss 开源内核的自主品牌商业数据库产品,民生银行、中国电信等 43 家头部企业退出社区。
以华为云开发者社区为根底,提供 39 个 GaussDB 技术课程,公布和更新 GaussDB 高级、中级培训认证;和国内 10+ 数据库以及开发者社区建设单干关系,积极支持和参加线上线下技术流动,和业界独特凋敝数据库社区,累计赋能 15 万以上开发者。 - 合作伙伴生态:数据库产业的倒退离不开上下游生态搭档的反对,通过测试和认证,华为云 GaussDB 已和 100+ 搭档的产品造成联结解决方案,并举荐到华为云严选商城,共享市场机会,涵盖:
a)生态工具搭档:迪思杰、英方、数见、航天壹进制、鼎甲等异构数据同步工具、数据库灾备工具
b) 金融、政府等行业解决方案搭档:例如神码融信、长亮科技等
c) 咨询服务类搭档:海量数据、云和恩墨等
d)SaaS 搭档:金蝶、用友、甄云、泛微、致远互联等;
e) 基础设施搭档:如麒麟 OS 和统信 OS
Q:贵司的数据库产品将来有什么布局,或者重点冲破的方向
苏光牛:将来,华为云数据库将在以下几个方面继续投入和布局:
• 做好数据库生态:数据库要追随华为云进入千行百业,离不开数据库生态的建设。除了构建 openGauss 自主可控的生态外,咱们也踊跃拥抱并齐全兼容业界支流的如关系型的 MySQL、PostgreSQL 及非关系型的 Mongo、Redis、Cassandra 和 InfluxDB 等生态。在搭档生态建设上,认证多家 ISV 作为咱们的搭档,提供迁徙、容灾等数据库上云解决方案,为更多的客户提供服务。
• 促成联结翻新:金融行业是对数据库稳固牢靠、性能等各方面要求极为刻薄的典型行业,有上亿用户和高并发海量交易等丰盛的利用场景,华为和工行等头部客户保持长期联创,通过这些不可多得的严苛而丰盛的场景和利用,帮忙 GaussDB 数据库疾速孵化晋升能力,也帮忙这些企业实现数字化的转型等工作。
• 服务华为本身业务:华为 GaussDB 系列数据库曾经规模承载了华为终端云服务和外部流程 IT 的业务,华为这 2 个业务有着刻薄的要求。GaussDB 帮忙了华为本身这种既有传统业务又有新型业务实现了数字化转型,这是一个十分好的范本。
• 外围竞争力打造:
- 多 Region 多活:反对全球化企业数据就近拜访,寰球多活容灾,数据多点写入;
- 软硬协同:全面反对多样化算力,具备从算力到服务器、存储、操作系统、数据库的 E2E 研发能力,施展数据库软硬协同、性能调优的独特劣势;
- 企业级分布式能力:交易型的数据容量从 M 到 G,再到 T,几十 T,决定了分布式数据库是大势所趋,华为云数据库着力面向分布式场景打造极致的可靠性和扩展性;
- 数据安全与可信:随着各行各业对数据安全和隐衷爱护的器重,GaussDB 会通过全密态数据库为客户打消数据泄露的危险。
- AI-Native:上万台服务器,数据库数千个实例,100+ T 的数据,海量节点规模下的数据的高效治理是必须面对的难题。华为致力于打造具备自感知,自复原,自优化等能力的云数据库,实现高度自治,升高数据库运维老本
Q:针对数据库行业,您认同“得 DBA 者得天下”这句话?
苏光牛:实质上这句话的含意是:得生态者得天下。DBA 是能够造就的,一个好的生态更容易造就出 DBA,所以生态才是最重要的。以后的大环境局势,给了数据库及生态机会,咱们要打造一个凋谢的、易学习易上手的生态,例如:openGauss,咱们从 2020.6.30 开始开源,从每一行代码开始来打造,同时尽可能兼容一个生态,这样就让大家更容易学习。
目前国内有 10 家 ISV 曾经基于 openGauss 打造了本人的数据库,我置信越来越多企业和集体会感触到 openGauss 在生态上的劣势。
Q:对于老手来说在学习 GaussDB 数据库方面有没有什么好的学习倡议
苏光牛:GaussDB 推出了一系列学习材料,帮忙大家从零开始学习和应用 GaussDB, 次要包含:
• GaussDB 的入门:注册华为云,进入华为云学院,在“学习门路”中找到“数据库学习门路“;同时,申请 GaussDB 实例进行调测,与实战相结合,相熟云数据库方案设计与调优;
• GaussDB 精品课:进入华为云学院,在“在线课程”中找到“数据库“,这里有内核专家精心录制的视频,每期围绕 1 个主题内容,详解 1 个业务难题。
• GaussDB 慕课:登录中国大学 MOOC 网,由东北师范大学李燕翎传授团队与 GaussDB 专家团队联合开发,《数据库原理 GaussDB 云数据库》,已上线;
• 培训认证:华为云同步推出了 GaussDB 高级以及高级课程以及认证,进入华为云学院,抉择“职业认证”。
• 同时也倡议大家下载 openGauss,购买《openGauss 数据库核心技术》联合代码深刻了解数据库内核,为社区做奉献,晋升本人的影响力,成为大咖。
华为云数据库产品团队一直推出新的线上学习课程,举办数据库训练营、挑战赛等,请大家关注微信公众号“GaussDB 数据库”获取最新流动信息。
Q:目前国内外对于数据库开源都有不同的意见。一些国产数据库也逐渐进行了开源,那开源到底好不好?以及开源是否能带来直观的收益。
苏光牛:数据库是考究生态的产业,生态须要急躁继续的投入。华为积极参与和推动产业生态,2020 年 6 月 30 日,华为开源 openGauss, 与合作伙伴、高校以及开发者共建开源生态,激励有能力的合作伙伴倒退基于 openGauss 的自有品牌数据库产品,为下层利用提供更多数据库抉择,和业界独特凋敝数据库产业生态。
GaussDB(foropenGauss)是华为基于 openGauss 的生态和局部内核加强了分布式能力的商业版本,通过华为云和华为云 Stack(HCS),满足政企客户对分布式数据库的高性能、高牢靠、高平安的需要。
开源对数据库生态的帮忙,整体来讲,是正向的踊跃的。然而开源须要真的开源,须要平安的开源和合规的开源,开源波及大量第三方依赖包含专利的优化和调整,而不是代码放开就是开源;所以从这个意义上来讲,开源也要负责任,开源不是起点,更不是被迫的应答措施,开源须要帮忙更多的搭档能真正的用起来。
同时,华为也踊跃拥抱并兼容和反对业界支流的生态如 MySQL、PostgreSQL 及非关系型数据库 Mongo、Redis 等生态,咱们会把这些软件生态和华为的分布式存储、软硬件协同起来,让客户既能取得生态的益处,又能取得更高的性能、可靠性,这才是咱们认为的真正合乎客户须要的数据库产品。
Q:您认为数据库国产化目前的难点是什么,或者说国产数据库倒退的次要瓶颈有哪些?
苏光牛:以后数据库产业的外围难点之一是人才,实际上芯片、操作系统和数据库这些根技术上都不足人才,其中一个起因也是因为始终以来广泛都更加关注利用开发,例如:很多大学生次要学习 JAVA 等高级开发语言作为将来的职业的次要语言,但这些根技术广泛还是 C 语言,这些零碎级的软件须要 C 语言的精湛的把握,仅仅是这一条就让很多人不抉择零碎级的软件开发岗位;同时,这些根技术的入门台阶很高,学习了 JAVA 语言开发一个 APP 可能 24 小时就能够了,但数据库不行,特地是内核的开发可能须要半年,甚至更长的工夫,这会让更多人即便进入后也会打退堂鼓;最初,长期以来交易数据库很重要,是 IT 零碎的外围的外围,但数据库理论的营收却并不高,这外面有简单的因素,但的确让很多企业望而生畏,因为收益可能是将来的可能是隐形的,加上人才难以获得,很多企业就难以长期坚持下去。
GaussDB 从倒退初期开始,对人才培养和获取就基于寰球多个区域进行布局,同时长期保持策略投入,解决上述 2 个因素带来的不利影响。
Q:聊聊您对国产数据库将来的瞻望和寄语。
苏光牛:在以后的大环境下,给中国的数据库带来了时机,所以整体来讲,对数据库从业者来讲是一个坏事。咱们晓得数据库的大体的实践框架和架构实际上通过了 40 年的倒退,基本上是比拟成熟的,外围挑战是工程化的难度,所以这是考验耐力和恒心的时刻,长期保持策略投入是最根底的保障;同时以后的开源软件为开发数据库内核提供了原型式的范本,但这个间接拿来做一些简略的加强就心愿成为“企业级”的数据库,实际上有很大的差距,本着为客户着想,其实须要做很多的工作;最初,国产数据库做到自主可控,每个企业每个人对自主可控的了解都可能不太一样,比如说:通过某个开源软件 + 一个中间件,到底算不算自主可控,到底算不算分布式数据库,这可能仁者见仁智者见智,不过,本着为服务的企业负责任的态度,咱们要保障本人的业务间断(保持做数据库,10 年 100 年还做数据库),同时也要为客户负责,任何状况下,本人开发的软件合乎平安和合规的要求,客户的业务能力间断。
GaussDB 首要的工作是解决华为的业务连续性的需要,同时也是要确保应用 GaussDB 的客户的业务可能间断,所以咱们保持策略投入,保持从每一行代码,保持从生态开始来构建整个数据库体系。
点击关注,第一工夫理解华为云陈腐技术~