关于数据库:MySQL之父MySQL官方三大顶会齐赞凭什么

工作久了，人总会有种遗记初心的感觉。

置信每个人小时候都想过成为一名科学家，只不过到起初，连本人都忘了。

当一名科学家的确不容易，学术研究难，薪酬待遇还不高，如果不是真的酷爱，很难走上来。

但在腾讯，你能够把学术当成工作，工作就是做学术，而且两者都能够做得很好。是的，你没有听错。

明天，腾讯云两项数据库内核技术的研究成果再次入选SIGMOD和ICDE的收录论文。其中，SIGMOD、ICDE、VLDB并称为国内数据库三大顶级会议。

另外，据说在学术圈，一篇SIGMOD或者ICDE就能当副教授了？这么看的话，那咱们这至多有两个副教授了

其实腾讯云数据库也是各大顶会的常客了，之前咱们「AI调参的技术优化数据库」的研究成果被SIGMOD收录，同时，还在MySQL社区上提交各种patch，总量位列前茅，2020年，咱们荣幸举办MySQL之父本年第一次中国区见面会，失去了MySQL之父的称许，年末还收到了MariaDB社区的官网感谢信（当初都还在官网上挂着）

（看看MySQL之父怎么说）

那么，这次又是什么成绩能俘获顶会专家学者的“芳心”？咱们间接上干货：

胜利入选2021年SIGMOD 钻研类长文的论文主题为“Spitfire:A Three-Tier Buffer Manager for Volatile and Non-Volatile Memory”。

在这篇论文中，腾讯云原生数据库内核团队首次提出了多级缓冲管理器Spitfire的概念，通过一种新鲜、低代价且无效的热数据识别方法，将热数据页面放弃在DRAM缓存中，同时将暖数据保留在非易失存储NVM中，无效晋升了零碎整体性能与性价比。

Spitfire重点钻研了页面迁徙策略，这些策略决定了一个数据页面应该被搁置在哪一层，比方，一个页面应该从SSD载入NVM还是DRAM，一个DRAM层页面被驱赶进来后，应该写入NVM还是写入SSD。Spitfire引入了基于概率的页面迁徙策略框架，并囊括了所有三级缓存架构的页面迁徙策略。

论文指出，对于不同的存储硬件和工作负载，最优策略可能不一样。鉴于此，鹅厂小伙伴们提出了一种基于模拟退火的机器学习技术，用于针对任意工作负载和存储层次结构主动调整页面迁徙策略。

不仅如此, Spitfire利用了NVM按字节寻址和持久性个性，可能间接读写NVM页面数据或者包容来自DRAM层的脏页，而不须要将它们刷入SSD，可能无效升高页面刷脏的数据库复原协定代价，特地适宜写频繁的工作负载。

这项成绩目前在TDSQL-C(原CynosDB)失去了验证与实现。TDSQL-C(原CynosDB)是腾讯自研云原生关系型数据库，100%兼容MySQL和PostgreSQL，极致计算能力冲破千核，存储容量达PB级别。

SIGMOD评审委员会评估称：随着商用非易失存储NVM硬件的呈现，数据库如何治理蕴含NVM的多层级内存缓冲区成为了重要的研究课题。文中论述的Spitfire是一种在蕴含DRAM和NVM的数据库系统中治理缓冲区的翻新办法。此外，文章还进行了蕴含NVM硬件的数据库系统架构性价比方面的钻研和倡议，这些均是此前的钻研工作尚未充沛波及到的。

该项研究成果与佐治亚理工学院Joy Arulraj传授等作者共同完成，其中Joy Arulraj传授是NVM数据库钻研畛域的出名学者。

这曾经不是鹅厂第一次登上SIGMOD会议。

此前腾讯云原生数据库团队就曾与华中科技大学单干，在SIGMOD19上公布论文《An End-to-End Automatic Cloud Database Tuning System Using Deep Reinforcement Learning》，实现了基于AI技术的数据库性能调优后果首次全面超过数据库专家。

SIGMOD目前是数据库畛域具备最高学术位置的国际性学术会议，位列数据库方向顶级会议之首。

说完SIGMOD，再来说ICDE。

这次，腾讯云原生数据库团队与中国科学技术大学单干的最新研究成果也入选了数据库顶级会议ICDE2021。

入选论文题目为“TLBtree：A Read/Write-Optimized Tree Index for Non-Volatile Memory”。

此项钻研在非易失内存上翻新提出了一种读写兼优的数据结构，作为数据库内核存储引擎中的索引构造，其读写性能大幅超过前沿的等同索引构造。

目前，在NVM上应用最频繁索引构造是基于B+树的，而已有的NVM B+树索引技术都存在一个读写衡量的问题，要么是专门优化读性能，要么优化写性能，同一种技术往往无奈做到兼顾读写性能。而且因为目前NVM的硬件写带宽较低，NVM数据长久化代价较高，这种读写衡量就会越发显著。因而，设计一种在NVM上读写兼优的NVM索引构造成为重要的钻研指标。

依据树型索引的读写访问模式以及实在NVM设施个性，本文提出了两层持久性B+树架构。如上图所示，它将索引分为高低两层（读优化的下层和NVM写优化的上层），从而解耦了读写优化技术，让齐全不同的优化技术能够共存在同一个索引构造中，达到多维度优化要求。

基于此架构下，本文设计了TLBtree，一种读写优化的两层索引，并给出了其并发版本。

TLBtree的下层是一个读优化的多叉齐全树，采纳无指针构造，所有结点存储在间断数组空间中。TLBtree的上层是针对NVM设计的写优化树型构造，它可能无效地缩小对NVM的写代价，而且无需WAL即能保障持久性和解体一致性。TLBtree的并发版本采纳无阻塞读的并发机制，可能无效的缩小多过程状况下的读写抵触。

ICDE评审委员会认为，该论文对于组合多种数据结构实现读写兼优NVM索引结构设计思路十分新鲜，这一概念具备广大的前景。同时，文章对该设计进行了清晰而明确的表述，相应的试验后果也失去了充沛的验证，读者能够从文中获取到许多有价值的信息。

数据库作为和操作系统并列的三大根底软件，重要性显而易见。

腾讯云近年来加大了基础架构畛域的前沿技术钻研，通过与顶级高校和钻研机构“产学研”一体的单干形式，将技术研究成果转换为利用落地，继续输入产品和业务场景。

华中科技大学-腾讯公司智能云存储技术联结钻研核心是代表之一。该联结钻研核心于2018年成立，在数据库自治理、分布式存储技术、高性能存储引擎、业务负载预测等方面发展技术的联合攻关，冲破超大规模IaaS服务的诸多技术难题，推动智能数据库和存储技术的科技翻新及技术利用落地。

截至目前，基于联结实验室平台，单方曾经在SIGMOD、DAC、USENIX AIC等国内顶会联结发表21篇高质量论文，联结输入翻新技术专利14余项。

原有的CynosDB、TDSQL、TBase三大产品线将对立降级为“腾讯云企业级分布式数据库TDSQL”后，腾讯云数据库曾经有了涵盖云原生、分布式、剖析型等多引擎交融的残缺数据库产品体系。而在全新数据库品牌体系下，咱们也将进一步深度交融数据库技术和云计算技术，充沛开释当先技术的红利，助力客户业务倒退。

– End –

AI调参新纪元，腾讯数据库论文被SIGMOD收录

明天，咱们和人民大学一起干了件小事！

本文由博客群发一文多发等经营工具平台 OpenWrite 公布

关于数据库:MySQL之父MySQL官方三大顶会齐赞凭什么

评论

发表回复取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

关于数据库:MySQL之父MySQL官方三大顶会齐赞凭什么

评论

发表回复 取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

发表回复取消回复