关于数据库:为云而生云原生数据库TDSQLC技术突破与演进

32次阅读

共计 3859 个字符,预计需要花费 10 分钟才能阅读完成。

“数实交融,绽开新机” 为主题,聚焦产业趋势与技术前沿,打造产业互联网顶级盛会的 2021 腾讯数字生态大会日前在武汉举办,腾讯云数据库技术负责人程彬进行了《云原生时代的数据库技术实际》的主题演讲,别离从云原生时代数据库技术何去何从,新时代下如何构建 TDSQL- C 数据库产品和 TDSQL- C 在云上实践经验等三个方面进行分享。

(以下是通过程彬现场演讲全文整顿)

时来云转

云时代的数据库应云而生、依云而建

当云计算这个词还热度未减时,云原生的时代却已悄悄而至,也因而用户应用云的形式产生了极大的变动。从之前用户会把本人的 IT 架构或业务零碎从自建的 IDC 搬迁到云上,到现在上云的用户不再间接搬迁,而是依据云上的基础设施 IaaS 或者 PaaS 的特点,进行本人 IT 架构的降级或者业务零碎的降级。用户的用云形式扭转,也对云数据库带来极大的挑战。举个例子,在云下面用户购买虚拟机和部署本人的数据库,而虚拟机提供的牢靠的存储正本数自身就是三份,而同时在数据库下层再做架构的冗余,整个数据库存储正本数就会放大很多倍。

这问题要怎么解决呢?我想先简略回顾下数据库技术演进的历程,数据库从技术的角度来讲,它是利用计算、存储、网络的能力对用户的数据进行存储和加工解决,数据库技术的演进也离不开基础设施和数据特色的变动。所以倒退到明天能够划分为 4 个阶段。

第一阶段(1970s)传统 IT 时代,以大型机和专用网络为主的商业数据库,用于国防、科研或者大型商业公司,这个阶段,无论计算机场景和用户数都不多,数据量规模也不是很大,但数据价值却十分高,催生出了以 Oracle 或者 IBM 为代表的商业级数据库。这个期间的商业级数据库的特点就是贵,但却实现了很大冲破:1)实现二维表为代表的数据模型,可能把主观数据放在数据库系统里保留下来;2)呈现 SQL 语言数据库,使得数据库产品得以宽泛的利用;3)实现了事务处理能力,让数据库能真正的利用到一些要害的业务场景里,实现数据库存储。

第二阶段(2000s)互联网时代,随着计算机和 Intel 等技术进一步的倒退,数据库全面进入了互联网时代,并催生出了以谷歌为代表的互联网企业。这时,数据库遇到一个新的挑战就是老本,互联网时代用户数据急剧增长带来的老本的挑战,次要体现在软件和硬件设施贵,解决软件老本通过开源共建形式去升高整个软件的老本,针对硬件通过集群和分布式的技术来进步零碎可用性和性能,为此以开源和分布式为根底的互联网技术体系就应运而生,同样的,互联网的数据库也是基于这个体系来去构建的。

第三阶段(2010s)云计算时代,随着互联网遍及和行业融入,互联网 + 和挪动利用拉起了云计算时代的帷幕。彼时数据库治理规模的增大非常明显,因而引发两大挑战:1)如何让云上数以万计风格各异技术公司都能很好的利用云数据库;2)大规模治理下如何进步管理效率,数据库即服务就应运而生,这个时候,大家都千方百计的通过服务的形式躲避在应用上的瓶颈,进而晋升整体资源的利用率。

第四阶段(当初)云原生时代 ,随着数字经济的遍及,这时又遇到了全新的问题,这里从腾讯云数据库看出,客户数整体持续增长,客户构造繁盛变动,业务场景也是变动万千,更多的守业企业上云,老本变得更加敏感,同时独角兽或上市公司上云等对数据库的弹性要求越来越高,此外传统线下企业(包含银行、政府等) 上云对稳定性要求更高。

基于以上起因,咱们重审了现有基于分布式跟开源架构下的数据库,发现它确有的一些先天不足,比方计算、存储资源耦合度极强,导致整个资源利用率偏低,这样也会导致老本偏高;弹性能力受限于资源的紧耦合也做不到极致等;此外,咱们还发现云下面的 IaaS、PaaS 的承受度会变得越来越高。基于种种问题,咱们扭转思路基于云下面的基础设施,尝试着去研发出一款全新的云原生数据库 TDSQL-C,应云而生,依云而建,兼具商用的性能和稳定性和开源灵便和低成本,做到云原生的极致弹性。

云上成长

腾讯云原生数据库 TDSQL- C 助力企业降本增效

首先从架构上,把单体架构降级为更可控的弹性架构。设计理念是把计算层和存储层进行解耦,做分层解决,分层过后通过池化让计算、存储的能力变得无限大,做到极致弹性;同时基于云上 IaaS 跟 PaaS 来进行从新设计,复用之前的十分成熟的数据库内核、计算等技术以及 EB 级规模存储的平台,进步数据库的稳定性。基于这样的平台,云原生数据库 TDSQL- C 打造六大外围能力。

1. 可计算存储能力,践行 log is database 设计理念,把计算节点做到无状态。

2. 超大计算 / 存储力,单个实例能够做到千核级别的计算能力,达到 PB 级的存储能力。

3. 极致弹性能力,秒级扩大。

4. 主动伸缩能力。

5.serverless 状态和多级存储,升高数据库老本。

6. 一体化服务,简化用户开发门槛,让架构变得简略,在一个数据库里尽量能解决多种场景。
7.

解决计算存储拆散的网络洪峰,极致 IO 卸载。传统共享存储架构,全量 IO,逻辑兼容,计算层无需额定适配,但会占用过多网络带宽,计算层耗费额定 CPU/ 内存在存储上,经典 BP 刷脏问题可能加剧。云原生数据库 TDSQL- C 应用 log is database 计划,把一部分数据库计算逻辑下沉到存储层实现,实现网络数据传输缩小 90%+,计算层资源更聚焦于 SQL 解决,晋升零碎性能,分布式刷脏基本上躲避 BP 刷脏的影响,放慢了系统启动速度。

用户外围零碎上云,读写压力大,业务吞吐量高;历史账单业务数据量高达 PB;挪动互联网业务快速增长,日增数据高达 TB。TDSQL- C 最大反对 15 个只读节点,物理复制升高主备提早,页面多版本满足多备机读页面的版本申请。通过批改数据库自身的外围逻辑把数据做分布式的打散,实现千核计算力和 PB 存储力。

1. 千核计算输入:单实例极致 192 核 15RO 读集群,反对千核输入,从容应对高吞吐读业务;

2.PB 存储:扩大表空间治理,可治理海量云存储数据,最大反对单集群 PB+ 存储。

在可用性上,云原生数据库 TDSQL- C 扭转了告诉用户配合降级的传统形式,通过 Zero-Downtime Patching 能力,把它做到数据库内核外面,实现秒级降级切换。事实业务中存在大量更新后查问的一致性要求,如电商的订单查问、银行转账、余额查问、游戏账户充值、生产记录查问等,TDSQL- C 关键技术反对全局一致性、会话一致性、满足业务对读一致性的要求。

云上有许多中长尾客户,一天可能就拜访几个小时,怎么进一步升高这一部分开发者的老本呢?通过 TDSQL-C Serverless 状态,当智能监控发现这个实例曾经继续肯定工夫没有进行任何的解决,数据库会把它的计算资源进行开释,通过采集理论 CPU 的使用率,突破传统固定规格产品状态:依据负载主动伸缩、按理论应用计费、不应用不计费。要做到这种能力,对技术上的挑战十分大,无论是数据库的计算层还是存储层,都要通过一系列的技术联结能力做到这一点,这是计算下面的优化。

在数据库外面,并不是所有数据库的热度、拜访都那么高,有很多数据随着工夫的变动,被拜访的频度会升高。针对这个状况,TDSQL-C 做了智能存储分层,存储分层除了通常大家做的热数据、温数据、冷数据之外,TDSQL- C 在温数据外面还通过了一个新的技术,突破了数据库存储外面通过正本的形式来保障可靠性,能够用更小的数据冗余度和正本,提供同样的可靠性来满足用户的要求,升高存储老本。

越来越多用户,特地是在新型利用上,比方直播带货,也有新的变动,一边在生产订单,同时须要依据订单的状况及时调整线上的折扣的策略,这须要对海量订单进行实时的数据分析。

TDSQL- C 提出了 HTAP 一体解决方案,次要有四个方面的技术:

1. 在存储引擎上,做行列混存,通过列存来减速查问能力。

2. 在优化器下面,把以前面向行的优化器进行优化,让它自适应可能进行剖析场景算法的调整。

3. 在执行引擎上,把繁多的串行的执行引擎调成分布式的执行引擎,加大数据的查问能力。

4. 在内存计算上,把多个节点技术联结起来做协同,通过 NVM 拓展内存,TPC—H 查问性能相比之前进步 50 倍的性能。

云上实际

最好的数据库是用进去的

腾讯云原生数据库 TDSQL-C Serverless 实现与微信生态互通,联结微信小程序云开发,发明开发者应用数据库新形态。已为靠近 50 万小程序开发者提供了一站式开发云服务。同时 TDSQL-C Serverless 也联结 Coding DevOps,无服务器函数 SCF、轻量级服务器、物联网平台等为企业和开发者提供一键部署多端运行的全套解决方案。

过来 18 个月中,TDSQL- C 实例数增长超过 24 倍,服务超过 6000+ 内部用户,落地电商、游戏、金融等场景。如团油 APP,进行云原生架构降级,撑持单日超 2.5 亿交易,累计服务车主超 4 亿;bilibili 内容平台,超百万 QPS 性能,承载人气手游;FiT 腾讯金融科技,单日新增 TB 外围数据,承载腾讯金融科技。云原生数据 TDSQL- C 同样广泛应用于腾讯外部业务,微信、腾讯视频、腾讯翻译君、财付通等。极致的弹性服务和 AI 自治服务,助力企业克服传统数据库性能、弹性及稳定性差等问题。

将来,各行各业越来越依赖大数据发展工作,数据量井喷式暴发,大并发业务繁多;5G 网络商用落地,新兴产业倒退空间有限,面临大规模利用场景挑战。腾讯云原生数据库便捷部署,为用户提供高并发集群计算能力,高速的查问效率,帮忙用户缓解业务压力,开掘数据价值,以低成本享受业余的数据库服务。技术与场景相交融,携手共创更大的商业价值。

正文完
 0