近日,星环科技分布式交易型数据库Transwarp KunDB正式推出2.2版本。新版本内核带来了要害能力降级,次要包含:
●反对与星环大数据根底平台Transwarp Data Hub和分布式剖析型数据库ArgoDB间接SQL互操作,通过对立的SQL引擎可将数据间接写入KunDB,以及从KunDB做数据分析,进一步欠缺了TDH的多模型反对能力;
●分布式数据库内置了新的执行器引擎,能够解决跨Shard的数据分析和检索能力,在架构上通过列式数据结构、多协程技术算子内并行和流水线计算模式来晋升检索与剖析性能;
●查问SQL的兼容性进一步晋升,新增APPLY、CTE、两头后果物化等算子,并反对子查问去关联化,从而欠缺子查问、公共表达式、大表关联查问等SQL的反对,能够残缺运行TPC-H等基准测试;
●新增多级数据分区能力,通过DDL指定规定数据可在分片根底上进行二次分区存储,即先分片存储,再分区存储。
KunDB次要面向高并发、大数据量的交易型业务场景,随着KunDB2.2的推出,对分布式查问剖析类的SQL的反对和性能进一步晋升,实用于大数量下的数据集市业务。某头部医疗信息化公司围绕临床数据中心服务,构建围绕医院临床、科研、教育、治理服务,通过对数据的迷信、正当、无效利用反哺医教研管。在医院的CDR典型场景,采纳星环ArgoDB+KunDB造成了联结数据解决方案。临床数据中心的数据由ArgoDB对实时数据进行加工、解决,局部后果实时输入至KunDB,提供给医生进行医疗信息并发查问服务。1000并发下,多种维度数据查问申请KunDB均可毫秒级响应,无效满足医院问诊效率晋升。
上面咱们一起来揭晓新版本的全新产品体验。
全新个性加持:分布式技术创新,数据库体验更加丰盛
新个性之一:反对与星环TDH的组件关系型剖析引擎Inceptor和分布式剖析型数据库ArgoDB间接SQL互操作
星环关系型剖析引擎Inceptor和分布式剖析型数据库ArgoDB,可为用户提供PB级海量数据的高性能剖析服务。本次KunDB 2.2版本升级能够跟 TDH/ArgoDB SQL引擎互操作,为用户提供更大的便当。KunDB作为 TDH/ArgoDB另一类存储引擎,反对定义表存储类型为KunDB,反对INSERT INTO...SELECT语句主动将数据批量写入KunDB,或者通过SELECT语句把KunDB的数据拉取到计算引擎中实现分布式计算返回给业务。 通过TDH/ArgoDB对立SQL引擎与KunDB进行交互,利于TDH/ArgoDB跟KunDB组成数据仓库+高并发数据集市一站式解决方案。
该新个性的加持,TDH/ArgoDB用户能够在数据不出数据库的状况下,对TDH/ArgoDB的其它存储引擎中的数据分析后将后果转储到KunDB,应用KunDB作为高并发查问业务的数据库存储引擎。或者借助TDH/ArgoDB引擎,对KunDB中的最陈腐的业务数据间接进行简单剖析,而不须要ETL过程。对于已应用TDH/ArgoDB的用户,不须要变更业务层跟数据库交互方式,就能够兼顾简单剖析、高并发查问等业务场景的需要。
新个性之二:多级数据分区反对
KunDB 2.2版本提供了数据分区的反对,KunDB分片存储语句应用的 PARTITION BY语句,2.2 之后调整为DISTRIBUTED BY子句标识数据分片规定,同时PARTITION BY子句用于数据分区的规定。从而反对数据在多个分布式存储节点上能够分片+分区二级存储,跟存储层的表分区买通。
该个性一方面兼容了MySQL的分区表语法,另一方面数据分布的粒度反对分片和分区两级,可依据业务数据特征选择不同的字段和规定别离进行更加细粒度的治理,对数据管理的灵活性和查问性能都有晋升。
新个性之三:迭代器模式执行器
KunDB 2.2的执行器采纳了迭代器模式,将常见的计算形象成根本算子并定义各算子之间的数据接口,SQL执行合成为算子的迭代计算形式,数据以chunk模式,而非单行模式在算子间流转。迭代器架构清晰,算子性能内聚,可针对不同算子进行针对性优化解决。迭代器模式扩展性好,针对新的计算模型可形象成新的算子。在KunDB2.2中已反对Block Hash Join、Index Lookup Join、Nest Loop Join、Hash Aggr、Quick Sort、Apply、Union、Projection、Selection、Limit、Table Scan、Max1Row、CTE等算子。
在此基础上,KunDB2.2欠缺了分布式模式下对MySQL查问类SQL的兼容反对,并在性能上晋升。在上述医院高并发数据集市案例中,所有聚合查问、关联查问等简单查问类SQL均达到了毫秒级响应。
新个性之四:子查问去关联优化
通过代数实践,子查问可等价转换为关联查问,计算深度缩小,可抉择更多的关联算子,执行打算更加灵便。与传统的子查问相比,转换为关联查问的执行代价更低,并可屡次优化达到性能最优。后果上,SELECT、FROM、WHERE等子句的子查问性能均得以大幅度晋升,并反对了UPDATE、JOIN条件子句中应用子查问。TPCH 10GB数据规模的测试后果中,Q4、Q7、Q8、Q9、Q11、Q13、Q15等带有子查问的SQL均在1分钟内实现,与MySQL相比性能最高晋升了20倍。
新个性之五:反对内存列式计算
KunDB中内存中对后果集转换成列式构造缓存,反对所有数据库类型的行列转换。相比于传统的行式计算模型,列式计算引入自适应压缩,基于压缩后编码间接计算,内存耗费升高50%以上,而执行工夫不会劣化。
尤其是基于列的表达式计算,没有逐行解析的开销,节俭了大部分的函数调用。数值类型算术运算符通过内存列式计算形式,与内存行式计算相比,性能最高晋升50倍。
新个性之六:计算与存储层通信优化
在之前的版本,KunDB查问执行器与存储节点的通信采纳的gRPC形式,即SQL引擎KunGate与KunTablet服务通信,KunTablet与存储节点通信。KunDB2.2开始KunGate在SQL执行时能够采纳MySQL Protocal形式与存储节点间接通信。KunTablet只负责存储节点的状态监控,与存储层的连贯治理、执行治理都在KunGate层实现。
通信链路缩小,SQL执行的提早大幅升高,以TPCC基准测试为参考,性能晋升50%左右。
新个性之七:两头后果集物化存储
在HASH JOIN和SORT算子计算过程中,两头后果超过固定阈值(默认100万条)记录时,KunDB执行器可将两头后果以列式形式压缩落盘文件,避免消耗大量内存资源影响数据库服务的稳定性。计算后落盘文件能够主动清理,两头后果长期落盘的记录数阈值能够通过参数设置。对于亿级的表关联查问,也可保障内存不会因两头后果集过大而呈现OOM的状况。
新个性之八:优化器逻辑优化规定欠缺
KunDB2.2优化器累计实现了下推、子查问去关联化、列裁剪、表达式和条件评估、谓词下推、TopN下推、聚合下推、关联重排序、HINT等查问优化规定。基于优化规定,对于关联查问、关联排序均可不同水平的下推执行,晋升了SQL执行的并行度,并且缓解了KunGate的内存压力。以TPCH中的Q4查问SQL为例,KunDB2.2通过逻辑优化后,执行打算更加的简略高效。
以10GB TPCH为例,通过优化后的SQL执行效率较MySQL都有大幅晋升。
※其中Q17和Q20因MySQL 10分钟无后果,取10分钟作为执行工夫。
新个性之九:跨连贯的执行打算缓存
KunDB 2.2 SQL引擎革新了执行打算缓存的机制,将用户会话中执行的SQL解析后果和执行打算缓存在内存中,给其它连贯或者同一连贯后续的SQL执行做复用。其它连贯后续有雷同的 SQL 申请时,主动找到缓存的SQL与执行打算,通过缩小编译和优化的工夫,晋升 SQL 的性能。在某金融行业TP业务中,该技术对于简略查问类申请执行工夫节俭了 50%。
新个性之十:执行器反对多协程并行
传统的迭代器模型,通过算子提供的接口治理SQL执行的生命周期。大量接口调用带来了开销,算子外部采纳多线程有会频繁线程切换开销。KunDB2.2 执行器采纳了基于协程的并行执行技术,每个算子作为主协程,算子内开启多个子协程并行,应用生产者-消费者多个面模型实现了算子间的并行。内存耗费、并发切换开销、算子调用开销均大幅升高,而且算子间解耦产生更灵便的执行模型。
要害能力优化晋升:反对 10w+ 数据库对象,事务处理性能、MySQL兼容性、关联工具能力全面晋升
●元数据服务革新,重构了元数据管理组件,采纳了高并发一致性存储计划,反对至多10万以上的数据库对象且性能不会劣化。
●事务处理能力大幅晋升,以TPCC为例,较上个分布式版本tpmC晋升60%。
●MySQL兼容性继续加强,新增了CTE语法、近40个函数的反对,扩大DQL、SET、ROLE等语法的欠缺。
●关联工具能力全面加强,次要是数据导入导出、备份复原时,压缩、加密等性能的丰盛和性能晋升,其中全量数据导出工具联合存储层直方图性能晋升了2倍以上。
国产化能力降级:国产数据库生态完更加欠缺
KunDB是星环科技自主研发的国产数据库,反对支流国产化CPU(龙芯、飞腾、鲲鹏等)等自主可控的硬件平台和OS部署(UOS、中标/河汉麒麟、华为欧拉等),反对西方通、宝兰德等企业中间件,数据库同步工具迪思杰、 TapData等。确保数据信息的平安,在用户认证、自主访问控制(DAC)、链路与数据加密、操作与SQL审计等方面提供数据库的多维度平安爱护,严格保证数据和业务的安全性和完整性。继KunDB Server和导入导出工具之后,KunDB的备份还原工具KunDR也反对了国产SM4加密算法,所有KunDB存储相干的组件都反对国产加密算法。
目前,KunDB凭借杰出的产品实力通过了中国人民银行分布式数据库合乎性认证测试,进行了337检测我的项目的验证,笼罩了数据库性能、平安、劫难复原、性能等方面,曾经在政府、医疗等多个行业中落地,其中与星环科技分布式剖析型数据库ArgoDB造成的联结医疗解决方案曾经在全国范畴内多家三甲医院落地施行。