乐趣区

关于云原生:解锁云原生虚拟数仓-PieCloudDB-Database-『第一期』

拓数派旗下旗舰产品 PieCloudDB,采纳当先的数仓虚拟化技术,为企业构建高平安,高牢靠,高在线「坚如磐石」的云原生虚构数仓。本系列文章将为大家介绍 PieCloudDB Database 最新动静和全新性能。

相干视频:链接
产品试用:https://app.pieclouddb.com

随着计算资源和网络资源的丰盛,计算平台经验了从大型机年代,PC 机年代,到现在的云时代的三代平台变更。在第三次改革中,服务器虚拟化技术的冲破引领了云计算时代的到来。

三代计算平台变更 

为了充分利用云带来的红利,拓数派打造了一款全新的云时代的数据库治理平台:PieCloudDB。 PieCloudDB 将用户数据,元数据和计算引擎三个逻辑外围组件进行拆解并在云上重组。这种存储和计算拆散的架构带来了云上的高弹性,并具备了软硬拆散的高容错和高在线能力。用户能够依据本身需要,按需进行存储或计算资源的弹性扩大。

数仓云原生虚拟化技术冲破引领数据计算时代到来 

自 2022 年 10 月 24 日以来,拓数派陆续公布了 PieCloudDB 社区版和企业版,以及一体机版本。在 3 月 14 日 πDay,拓数派公布 PieCloudDB 全新版本:云上云版。至此,PieCloudDB 实现了对裸硬件,公有云,和私有云三种部署形式的全面反对

PieCloudDB 的多种部署形式 

在新版本中,PieCloudDB 全面实现数据仓库上云虚拟化。云原生数仓虚拟化冲破了传统 MPP 数据库的泛滥瓶颈,实现了云上 eMPP 全新架构,做到多个云原生虚构数仓并发执行。从而取得云上新架构提供的泛滥红利,包含突破数据孤岛,秒级扩缩容,动静调配资源,按需付费等。
   

PieCloudDB 实现云上 eMPP 架构  

新的版本实现了泛滥全新性能,带来了性能和稳固全方位的晋升,让 PieCloudDB 做到了真正的「unbreakable」坚如磐石,包含:
 

  • 汇集下推性能失去加强 

在数据库的剖析型场景下往往存在大量的汇集运算。PieCloudDB 实现的汇集下推性能通过把汇集操作下推到连贯操作之前去执行,能够大大减少链接操作须要解决的数据量,让查问性能显著晋升。

经测试,汇集下辞让 PieCloudDB 在某些简单查问的利用场景下失去了近百倍甚至千倍的晋升

汇集下推性能 

  • Block File Skipping 优化

PieCloudDB 的用户数据以行列混存的数据格式被存储在对象存储中。同时,PieCloudDB 以 block 文件为存储单位。Block 文件按列存储,从而取得高效的压缩,节俭存储空间;PieCloudDB 在全新版本中实现的 Block File Skipping 的优化机制  在数据库运行查问语句时,通过预计算每个 block 文件中列汇集信息,在执行期间跳过非必要的数据块,从而缩小数据读取量,进步查问性能。

PieCloudDB 行列混存 

  • 实现极速 Analyze

“Analyze”操作能够剖析数据库表的内容,收集无关每个表的每一列中值散布的统计信息。数据库查问引擎会利用这些统计信息生成最佳查问打算。

对于大部分的数据库系统,Analyze 往往是手动执行,或由 AUTO VACUUM 主动执行,对于数据量较大的大表的查问,工夫过长。

在全新版本中,PieCloudDB 实现极速 Analyze,能够在数据发生变化时主动实现 Analyze,及时生成更为精确的查问布局统计信息。

  • 全新的缓存机制

针对元数据,PieCloudDB 实现了元数据层全新的缓存机制,无效缩小了拜访元数据服务器带来的网络通信开销和元数据服务器的负载,进步元数据拜访的速度。

  • 反对疾速 ETL/ELT、和内部数据源的查问

PieCloudDB 在全新版本中,原生反对 Kafka 流数据导入。copy 操作由原先的单节点优化至整个集群,性能失去大幅晋升,与集群尺寸成正比。

此外,在全新版本中,PieCloudDB 反对 foreign-data wrapper 模块,使用户能够拜访包含但不限于 HDFS、MySQL 等数据源。同时 PieCloudDB 反对用户自行开发模块来拜访新的存储数据源。

除了这五项重大优化,PieCloudDB 全新版本内核还实现了

  • 可观测性加强
  • Vacuum 优化
  • 在 HDFS/NAS 零碎上反对原生存储格局
  • 对 开源优化器 Orca 的反对
  • 对开源机器学习库 Madlib 的反对
  • 反对超大数据量字段
    ….
    等多项优化。

PieCloudDB 打造了全新的存储引擎简墨(JANM)。简墨出自”竹简墨书”,形象的形容了 PieCloudDB 行列混存的存储模式。

在 PieCloudDB 的全新版本中,存储引擎 JANM 实现了:

  • JANM 分布式解决的加强
  • JANM 动态分配读取文件,加强 dispatch 性能
  • JANM 异样解决的优化
    ….
    等多个性能。

PieCloudDB 云原生管控平台实现了包含:

  • 用户权限优化
  • 注册选项减少
  • 数据洞察优化
  • 数据导入优化
  • 内部接入反对更多类型
    ….
    等多项优化。

PieCloudDB 将一直迭代,持续前行,欢送大家返回 https://app.pieclouddb.com 试用云上云版本。也期待大家扫码退出咱们的技术社区,与咱们携手共进!


退出移动版