关于后端:Flink-Table-Store-独立孵化启动-Apache-Paimon-诞生

2023 年 3 月 12 日，Flink Table Store 我的项目顺利通过投票，正式进入 Apache 软件基金会 (ASF) 的孵化器，改名为 Apache Paimon (incubating)。

随着 Apache Flink 技术社区的一直成熟和倒退，越来越多企业开始利用 Flink 进行流式数据处理，从而晋升数据时效性价值，获取业务实时化成果。与此同时，在大数据畛域数据湖架构也日益成为新的技术趋势，越来越多企业开始采纳 Lakehouse 架构，基于 DataLake 构建新一代 Data Warehouse。因而，Flink 社区心愿可能将 Flink 的 Streaming 实时计算能力和 Lakehouse 新架构劣势进一步联合，推出新一代的 Streaming Lakehouse 技术，促成数据在数据湖上真正实时流动起来，并为用户提供实时离线一体化的开发体验。

但目前业界支流数据湖存储格局我的项目都是面向 Batch 场景设计的，在数据更新解决时效性上无奈满足 Streaming Lakehouse 的需要，因而 Flink 社区在一年多前外部孵化了 Flink Table Store （简称 FTS ）子项目，一个真正面向 Streaming 以及 Realtime 的数据湖存储我的项目，截止目前曾经公布了 3 个版本，并失去了大量用户的踊跃反馈和多家公司的踊跃奉献。为了让 Flink Table Store 可能有更大的倒退空间和生态体系，Flink PMC 通过探讨决定将其捐献 ASF 进行独立孵化。

截止目前，包含阿里云，字节跳动、Confluent、同程旅行、Bilibili 等多家公司参加到 Apache Paimon 的奉献，将来心愿可能有更多对新一代流式数据湖存储感兴趣的开发者退出 Paimon 社区，一起打造新一代的流式湖仓新架构。

什么是 Apache Paimon

Apache Paimon (incubating) 是一项流式数据湖存储技术，能够为用户提供高吞吐、低提早的数据摄入、流式订阅以及实时查问能力。Paimon 采纳凋谢的数据格式和技术理念，能够与 Apache Flink / Spark / Trino 等诸多业界支流计算引擎进行对接，独特推动 Streaming Lakehouse 架构的遍及和倒退。

凋谢的数据格式

Paimon 以湖存储的形式基于分布式文件系统治理元数据，并采纳凋谢的 ORC、Parquet、Avro 文件格式，反对各大支流计算引擎，包含 Flink、Spark、Hive、Trino、Presto。将来会对接更多引擎，包含 Doris 和 Starrocks。

大规模实时更新

得益于 LSM 数据结构的追加写能力，Paimon 在大规模的更新数据输出的场景中提供了杰出的性能。

Paimon 翻新的联合了湖存储 + LSM + 列式格局 (ORC, Parquet)，为湖存储带来大规模实时更新能力，Paimon 的 LSM 的文件组织构造如下：

高性能更新：LSM 的 Minor Compaction，保障写入的性能和稳定性
高性能合并：LSM 的有序合并效率十分高
高性能查问：LSM 的根本有序性，保障查问能够基于主键做文件的 Skipping

在最新的版本中，Paimon 集成了 Flink CDC，通过 Flink DataStream 提供了两个外围能力：

实时同步 Mysql 单表到 Paimon 表，并且实时将上游 Mysql 表构造（Schema）的变更同步到上游的 Paimon 表中。
实时同步 Mysql 整库级别的表构造和数据到 Paimon 中，同时反对表构造变更的同步，并且在同步过程中复用资源，只用大量资源，就能够同步大量的表。

通过与 Flink CDC 的整合，Paimon 能够让的业务数据简略高效的流入数据湖中。

数据表部分更新

在数据仓库的业务场景下，常常会用到宽表数据模型，宽表模型通常是指将业务主体相干的指标、维表、属性关联在一起的模型表，也能够泛指将多个事实表和多个维度表相关联到一起造成的宽表。

Paimon 的 Partial-Update 合并引擎能够依据雷同的主键实时合并多条流，造成 Paimon 的一张大宽表，依附 LSM 的提早 Compaction 机制，以较低的老本实现合并。合并后的表能够提供批读和流读：

批读：在批读时，读时合并依然能够实现 Projection Pushdown，提供高性能的查问。
流读：上游能够看到残缺的、合并后的数据，而不是局部列。

流批一体数据读写

Paimon 作为一个流批一体的数据湖存储，提供流写流读、批写批读，你应用 Paimon 来构建 Streaming Pipeline，并且数据积淀到存储中。

在 Flink Streaming 作业实时更新的同时，能够 OLAP 查问各个 Paimon 表的历史和实时数据，并且也能够通过 Batch SQL，对之前的分区 Backfill，批读批写。

不论输出如何更新，或者业务要求如何合并 (比方 partial-update)，应用 Paimon 的 Changelog 生成性能，总是可能在流读时获取完全正确的变更日志。

当面对主键表时，为什么你须要残缺的 Changelog：

你的输出并不是残缺的 changelog，比方失落了 UPDATE_BEFORE (-U)，比方同个主键有多条 INSERT 数据，这就会导致上游的流读聚合有问题，同个主键的多条数据应该被认为是更新，而不是反复计算。
当你的表是 Partial Update，上游须要看到残缺的、合并后的数据，才能够正确的流解决。

你能够应用 Lookup 来实时生成 Changelog：

如果你感觉老本过大，你也能够解耦 Commit 和 Changelog 生成，通过 Full-Compaction 和对应较大的时延，以非常低的老本生成 Changelog。

版本公布

Flink Table Store 曾经公布了三个版本，咱们打算在 4 月份公布 Paimon 0.4 版本，请您放弃对 Paimon 的关注。

Paimon 将长期投入实时性、生态和数仓完整性的研发上，构建更好的 Streaming LakeHouse。

如果您有其余需要，请分割咱们。

致谢

感激 Apache Flink 的搭档们，有你们的反对，才有 Flink Table Store 的诞生
感激我的项目孵化 Champion 李钰老师，也感激其余 Mentors: 秦江杰, Robert Metzger, Stephan Ewen
感激来自阿里巴巴，字节跳动、Confluent、同程旅行、Bilibili 的各位开发者

退出咱们

官方网站： https://paimon.apache.org/
Github 我的项目： https://github.com/apache/incubator-paimon (欢送大家 star&fork 反对)
钉钉交换群：10880001919 Apache Paimon 交换群

作者简介：

王峰 (莫问) Apache Flink 中文社区发起人、阿里巴巴开源大数据平台负责人，PPMC Member of Apache Paimon

李劲松 (之信) 阿里巴巴开源大数据表存储负责人，Founder of Apache Paimon, PMC Member of Apache Flink

点击查看更多技术内容

关于后端:Flink-Table-Store-独立孵化启动-Apache-Paimon-诞生

什么是 Apache Paimon

凋谢的数据格式

大规模实时更新

数据表部分更新

流批一体数据读写

版本公布

致谢

退出咱们

更多内容

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于后端:Flink-Table-Store-独立孵化启动-Apache-Paimon-诞生

什么是 Apache Paimon

凋谢的数据格式

大规模实时更新

数据表部分更新

流批一体数据读写

版本公布

致谢

退出咱们

更多内容

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复