2021年10月18日,录信数软创始人兼CTO母延年在2021中国数据库技术大会上分享了“PostgreSQL在OLAP场景实战演练,撑持单节点百亿规模多维检索与统计”的主题演讲,这也是录信数软第二次加入DTCC数据库大会,同时录信数软重点打造的新一代轻量级检索剖析型数据库LXDB首次公开亮相技术论坛。上面,咱们一起回顾下本次分享内容。

本次DTCC大会以“数造将来”为主题,这也是录信数软第二次加入DTCC中国数据库技术大会,在2020年,咱们带来了万亿实时数仓LSQL产品实际的主题分享,而在往年的大会中,咱们带来了全新打造的新一代轻量级检索剖析型数据库LXDB的实际分享。

在分享的最后,母延年首先介绍了录信产品布局的心路历程,从解决万亿数据的LSQL开始,录信始终致力于解决大数据场景下多套组件混搭的问题,尽可量在升高零碎复杂性的同时晋升数据库自身的检索剖析性能。然而基于Hadoop的LSQL配置简单,造成了前期运维老本的高启。基于此,录信的第二代产品HSQL采纳了Hadoop+Hbase+Spark的架构,母延年称这一技术架构堪称心中最终版的全栈数据库。然而因为HSQL架构上相比于LSQL多了Hbase,这使得在解决现场问题时难度更大,并且同时精通Hadoop、Hbase、Spark的技术人员稀缺,也正是因为这些问题限度了第二代产品HSQL的倒退。基于这些因素,在录信的第三代产品LXDB的打造上,抉择了轻量级的产品架构,做到了单机1分钟,集群5分钟的超短部署工夫。在保障性能齐备性的同时采纳了规范SQL接口,也使得运维和应用老本大幅升高,研发人员能够更加专一于索引层的开发。

在随后的分享中,母延年论述了为何抉择PG作为新产品实际的底层根底,母延年将PG的劣势概括为:“成熟稳固、生态敌对、插件多,同时以公司目前的技术教训,能无效晋升PG在即席场景的性能”,在对PG进行深度优化之后,基于PG实现了数据的极速入库,在点查问、全文检索、统计分析上也实现了冲破。

之后针对于新产品LXDB的架构、装置部署和集群模式进行了简略介绍,展现了新产品LXDB的一些特定,例如对于零碎架构、硬件配合、部署形式的灵便抉择,以及在性能上对于内存表、向量检索和地理位置检索的反对和性能参数等。

而后对于LXDB的一些特定的技术实现办法进行了介绍,并且对于LXDB的性能进行了展现:

在分享的最初,母延年总结了一下LXDB将来的研发方向,根本能够演绎为“内存计算、多表关联与图数据库、基于KD-TREE的空间划分和二进制搜寻”,在将来的研发中要在进一步拓宽产品的利用场景的同时,晋升产品的性能体现。

在主题演讲之后,咱们的展台也迎来了许多心愿征询和试用产品的同学,针对于大家比拟关注的为什么数据格式没有抉择Clickhouse以及LXDB所提供的全文检索能力相比于PG自带的ES插件有何不等同问题进行了解答。前者次要是因为产品开发过程中对于技术教训的积攒不同造成的,自身Clickhouse也是十分优良的产品。而后者则是因为PG中的ES插件集成度较低,同时性能欠缺,不论是性能还是性能,都无奈满足用户的多样化检索需要。

本次为期三天的数据库大会让咱们可能接触到了以后中国数据库行业最为优良的厂商,也进一步理解了以后数据库倒退的技术趋势。在咱们的下一步布局中,将会围绕着本次带来的新产品LXDB,进一步丰盛产品的利用场景和使用性能,争取在明年的DTCC上分享更多技术实际干货!