关于腾讯云:使用-Iceberg-on-Kubernetes-打造新一代云原生数据湖

大数据倒退至今，依照 Google 2003 年公布的《The Google File System》第一篇论文算起，已走过 17 个年头。惋惜的是 Google 过后并没有开源其技术，“仅仅”是发表了三篇技术论文。所以回头看，只能算是揭开了大数据时代的帷幕。随着 Hadoop 的诞生，大数据进入了高速倒退的时代，大数据的红利及商业价值也一直被开释。现今大数据存储和解决需要越来越多样化，在后 Hadoop 时代，如何构建一个对立的数据湖存储，并在其上进行多种形式的数据分析，成了企业构建大数据生态的一个重要方向。怎么疾速、统一、原子性地在数据湖存储上构建起 Data Pipeline，成了亟待解决的问题。并且随同云原生时代到来，云原生天生具备的自动化部署和交付能力也正催化这一过程。本文就次要介绍如何利用 Iceberg 与 Kubernetes 打造新一代云原生数据湖。

Apache Iceberg is an open table format for huge analytic datasets. Iceberg adds tables to Presto and Spark that use a high-performance format that works just like a SQL table.

Apache Iceberg 是由 Netflix 开发开源的，其于 2018 年 11 月 16 日进入 Apache 孵化器，是 Netflix 公司数据仓库根底。Iceberg 实质上是一种专为海量剖析设计的表格局规范，可为支流计算引擎如 Presto、Spark 等提供高性能的读写和元数据管理能力。Iceberg 不关注底层存储（如 HDFS）与表构造（业务定义），它为两者之间提供了一个形象层，将数据与元数据组织了起来。

Iceberg 次要个性包含：

ACID：具备 ACID 能力，反对 row level update/delete；反对 serializable isolation 与 multiple concurrent writers
Table Evolution：反对 inplace table evolution（schema & partition），可像 SQL 一样操作 table schema；反对 hidden partitioning，用户无需显示指定
接口通用化：为下层数据处理引擎提供丰盛的表操作接口；屏蔽底层数据存储格局差别，提供对 Parquet、ORC 和 Avro 格局反对

依赖以上个性，Iceberg 可帮忙用户低成本的实现 T+0 级数据湖。

传统形式下，用户在部署和运维大数据平台时通常采纳手动或半自动化形式，这往往耗费大量人力，稳定性也无奈保障。Kubernetes 的呈现，变革了这一过程。Kubernetes 提供了利用部署和运维标准化能力，用户业务在施行 Kubernetes 化革新后，可运行在其余所有规范 Kubernetes 集群中。在大数据畛域，这种能力可帮忙用户疾速部署和交付大数据平台（大数据组件部署尤为简单）。尤其在大数据计算存储拆散的架构中，Kubernetes 集群提供的 Serverless 能力，可帮忙用户即拿即用的运行计算工作。并且再配合离在线混部计划，除了可做到资源对立管控升高复杂度和危险外，集群利用率也会进一步晋升，大幅降低成本。

咱们可基于 Kubernetes 构建 Hadoop 大数据平台：

在近几年大热的数据湖畛域，通过传统 Hadoop 生态构建实时数据湖，受制于组件定位与设计，较为简单与艰难。Iceberg 的呈现使得依赖开源技术疾速构建实时数据湖成为可能，这也是大数据将来倒退方向 – 实时剖析、仓湖一体与云原生。引入 Iceberg 后，整体架构变为：

Kubernetes 负责利用自动化部署与资源管理调度，为下层屏蔽了底层环境复杂性。Iceberg + Hive MetaStore + HDFS 实现了基于 Hadoop 生态的实时数据湖，为大数据利用提供数据拜访及存储。Spark、Flink 等计算引擎以 native 的形式运行在 Kubernetes 集群中，资源即拿即用。与在线业务混部后，更能大幅晋升集群资源利用率。

资源层：Kubernetes 提供资源管控能力
数据层：Iceberg 提供 ACID、table 等数据集拜访操作能力
存储层：HDFS 提供数据存储能力，Hive MetaStore 治理 Iceberg 表元数据，Postgresql 作为 Hive MetaStore 存储后端
计算层：Spark native on Kubernetes，提供流批计算能力

首先通过官网二进制或自动化部署工具部署 Kubernetes 集群，如 kubeadm，举荐应用腾讯云创立 TKE 集群。

举荐配置为：3 台 S2.2XLARGE16（8 核 16G）实例

可通过开源 Helm 插件或自定义镜像在 Kubernetes 上部署 Hadoop 集群，次要部署 HDFS、Hive MetaStore 组件。在腾讯云 TKE 中举荐应用 k8s-big-data-suite 大数据利用自动化部署 Hadoop 集群。

k8s-big-data-suite 是咱们基于生产教训开发的大数据套件，可反对支流的大数据组件在 Kubernetes 上一键部署。部署之前请先依照要求做集群初始化：

# 标识存储节点，至多三个
$ kubectl label node xxx storage=true

部署胜利后，连入 TKE 集群查看组件状态：

$ kubectl  get po
NAME                                                   READY   STATUS      RESTARTS   AGE
alertmanager-tkbs-prometheus-operator-alertmanager-0   2/2     Running     0          6d23h
cert-job-kv5tm                                         0/1     Completed   0          6d23h
elasticsearch-master-0                                 1/1     Running     0          6d23h
elasticsearch-master-1                                 1/1     Running     0          6d23h
flink-operator-controller-manager-9485b8f4c-75zvb      2/2     Running     0          6d23h
kudu-master-0                                          2/2     Running     2034       6d23h
kudu-master-1                                          2/2     Running     0          6d23h
kudu-master-2                                          2/2     Running     0          6d23h
kudu-tserver-0                                         1/1     Running     0          6d23h
kudu-tserver-1                                         1/1     Running     0          6d23h
kudu-tserver-2                                         1/1     Running     0          6d23h
prometheus-tkbs-prometheus-operator-prometheus-0       3/3     Running     0          6d23h
superset-init-db-g6nz2                                 0/1     Completed   0          6d23h
thrift-jdbcodbc-server-1603699044755-exec-1            1/1     Running     0          6d23h
tkbs-admission-5559c4cddf-w7wtf                        1/1     Running     0          6d23h
tkbs-admission-init-x8sqd                              0/1     Completed   0          6d23h
tkbs-airflow-scheduler-5d44f5bf66-5hd8k                1/1     Running     2          6d23h
tkbs-airflow-web-84579bc4cd-6dftv                      1/1     Running     2          6d23h
tkbs-client-844559f5d7-r86rb                           1/1     Running     6          6d23h
tkbs-controllers-6b9b95d768-vr7t5                      1/1     Running     0          6d23h
tkbs-cp-kafka-0                                        3/3     Running     2          6d23h
tkbs-cp-kafka-1                                        3/3     Running     2          6d23h
tkbs-cp-kafka-2                                        3/3     Running     2          6d23h
tkbs-cp-kafka-connect-657bdff584-g9f2r                 2/2     Running     2          6d23h
tkbs-cp-schema-registry-84cd7cbdbc-d28jk               2/2     Running     4          6d23h
tkbs-grafana-68586d8f97-zbc2m                          2/2     Running     0          6d23h
tkbs-hadoop-hdfs-dn-6jng4                              2/2     Running     0          6d23h
tkbs-hadoop-hdfs-dn-rn8z9                              2/2     Running     0          6d23h
tkbs-hadoop-hdfs-dn-t68zq                              2/2     Running     0          6d23h
tkbs-hadoop-hdfs-jn-0                                  2/2     Running     0          6d23h
tkbs-hadoop-hdfs-jn-1                                  2/2     Running     0          6d23h
tkbs-hadoop-hdfs-jn-2                                  2/2     Running     0          6d23h
tkbs-hadoop-hdfs-nn-0                                  2/2     Running     5          6d23h
tkbs-hadoop-hdfs-nn-1                                  2/2     Running     0          6d23h
tkbs-hbase-master-0                                    1/1     Running     3          6d23h
tkbs-hbase-master-1                                    1/1     Running     0          6d23h
tkbs-hbase-rs-0                                        1/1     Running     3          6d23h
tkbs-hbase-rs-1                                        1/1     Running     0          6d23h
tkbs-hbase-rs-2                                        1/1     Running     0          6d23h
tkbs-hive-metastore-0                                  2/2     Running     0          6d23h
tkbs-hive-metastore-1                                  2/2     Running     0          6d23h
tkbs-hive-server-8649cb7446-jq426                      2/2     Running     1          6d23h
tkbs-impala-catalogd-6f46fd97c6-b6j7b                  1/1     Running     0          6d23h
tkbs-impala-coord-exec-0                               1/1     Running     7          6d23h
tkbs-impala-coord-exec-1                               1/1     Running     7          6d23h
tkbs-impala-coord-exec-2                               1/1     Running     7          6d23h
tkbs-impala-shell-844796695-fgsjt                      1/1     Running     0          6d23h
tkbs-impala-statestored-798d44765f-ffp82               1/1     Running     0          6d23h
tkbs-kibana-7994978d8f-5fbcx                           1/1     Running     0          6d23h
tkbs-kube-state-metrics-57ff4b79cb-lmsxp               1/1     Running     0          6d23h
tkbs-loki-0                                            1/1     Running     0          6d23h
tkbs-mist-d88b8bc67-s8pxx                              1/1     Running     0          6d23h
tkbs-nginx-ingress-controller-87b7fb9bb-mpgtj          1/1     Running     0          6d23h
tkbs-nginx-ingress-default-backend-6857b58896-rgc5c    1/1     Running     0          6d23h
tkbs-nginx-proxy-64964c4c79-7xqx6                      1/1     Running     6          6d23h
tkbs-postgresql-5b9ddc464c-xc5nn                       1/1     Running     1          6d23h
tkbs-postgresql-ha-pgpool-5cbf85d847-v5dsr             1/1     Running     1          6d23h
tkbs-postgresql-ha-postgresql-0                        2/2     Running     0          6d23h
tkbs-postgresql-ha-postgresql-1                        2/2     Running     0          6d23h
tkbs-prometheus-node-exporter-bdp9v                    1/1     Running     0          6d23h
tkbs-prometheus-node-exporter-cdrqr                    1/1     Running     0          6d23h
tkbs-prometheus-node-exporter-cv767                    1/1     Running     0          6d23h
tkbs-prometheus-node-exporter-l82wp                    1/1     Running     0          6d23h
tkbs-prometheus-node-exporter-nb4pk                    1/1     Running     0          6d23h
tkbs-prometheus-operator-operator-f74dd4f6f-lnscv      2/2     Running     0          6d23h
tkbs-promtail-d6r9r                                    1/1     Running     0          6d23h
tkbs-promtail-gd5nz                                    1/1     Running     0          6d23h
tkbs-promtail-l9kjw                                    1/1     Running     0          6d23h
tkbs-promtail-llwvh                                    1/1     Running     0          6d23h
tkbs-promtail-prgt9                                    1/1     Running     0          6d23h
tkbs-scheduler-74f5777c5d-hr88l                        1/1     Running     0          6d23h
tkbs-spark-history-7d78cf8b56-82xg7                    1/1     Running     4          6d23h
tkbs-spark-thirftserver-5757f9588d-gdnzz               1/1     Running     4          6d23h
tkbs-sparkoperator-f9fc5b8bf-8s4m2                     1/1     Running     0          6d23h
tkbs-sparkoperator-f9fc5b8bf-m9pjk                     1/1     Running     0          6d23h
tkbs-sparkoperator-webhook-init-m6fn5                  0/1     Completed   0          6d23h
tkbs-superset-54d587c867-b99kw                         1/1     Running     0          6d23h
tkbs-zeppelin-controller-65c454cfb9-m4snp              1/1     Running     0          6d23h
tkbs-zookeeper-0                                       3/3     Running     0          6d23h
tkbs-zookeeper-1                                       3/3     Running     0          6d23h
tkbs-zookeeper-2                                       3/3     Running     0          6d23h

以后 TKE k8s-big-data-suite 1.0.3 在初始化 Postgresql 时，短少对 Hive transaction 的反对，从而导致 Iceberg 表创立失败。请先执行以下命令手动修复：

$ kubectl  get pod | grep postgresql
tkbs-postgresql-5b9ddc464c-xc5nn                       1/1     Running            1          7d18h
$ kubectl exec tkbs-postgresql-5b9ddc464c-xc5nn -- psql -c "UPDATE pg_database SET datallowconn ='false'WHERE datname ='metastore';SELECT pg_terminate_backend(pid) FROM pg_stat_activity WHERE datname ='metastore'"; kubectl exec tkbs-postgresql-5b9ddc464c-xc5nn -- psql -c"drop database metastore"; kubectl exec tkbs-postgresql-5b9ddc464c-xc5nn -- psql -c"create database metastore"
$ kubectl get pod | grep client
tkbs-client-844559f5d7-r86rb                           1/1     Running     7          7d18h
$ kubectl exec tkbs-client-844559f5d7-r86rb -- schematool -dbType postgres -initSchema

以后 Iceberg 对 Spark 3.0 有较好反对，比照 Spark 2.4 有以下劣势：

所以咱们默认采纳 Spark 3.0 作为计算引擎。Spark 集成 Iceberg，首先需引入 Iceberg jar 依赖。用户可在提交工作阶段手动指定，或将 jar 包间接引入 Spark 装置目录。为了便于应用，咱们抉择后者。笔者已打包 Spark 3.0.1 的镜像，供用户测试应用：ccr.ccs.tencentyun.com/timxbxu/spark:v3.0.1。

咱们应用 Hive MetaStore 治理 Iceberg 表信息，通过 Spark Catalog 拜访和应用 Iceberg 表。在 Spark 中做如下配置：

spark.sql.catalog.hive_prod = org.apache.iceberg.spark.SparkCatalog
spark.sql.catalog.hive_prod.type = hive
spark.sql.catalog.hive_prod.uri = thrift://metastore-host:port

若应用 TKE k8s-big-data-suite 套件部署 Hadoop 集群，可通过 Hive Service 拜访 Hive MetaStore：

$ kubectl  get svc | grep hive-metastore
tkbs-hive-metastore                                 ClusterIP      172.22.255.104   <none>           9083/TCP,8008/TCP                                             6d23h

Spark 配置变更为：

spark.sql.catalog.hive_prod = org.apache.iceberg.spark.SparkCatalog
spark.sql.catalog.hive_prod.type = hive
spark.sql.catalog.hive_prod.uri = thrift://tkbs-hive-metastore

执行 spark-sql 进行验证：

$ spark-sql --master k8s://{k8s-apiserver} --conf spark.kubernetes.container.image=ccr.ccs.tencentyun.com/timxbxu/spark:v3.0.1 --conf spark.sql.catalog.hive_prod=org.apache.iceberg.spaparkCatalog --conf spark.sql.catalog.hive_prod.type=hive --conf spark.sql.catalog.hive_prod.uri=thrift://tkbs-hive-metastore --conf spark.sql.warehouse.dir=hdfs://tkbs-hadoop-hdfs-nn/iceberg

各参数含意如下：

–master k8s://{k8s-apiserver}：Kubernetes 集群地址
–conf spark.kubernetes.container.image=ccr.ccs.tencentyun.com/timxbxu/spark:v3.0.1：Spark Iceberg 镜像
–conf spark.sql.catalog.hive_prod.type=hive：Spark Catalog 类型
–conf spark.sql.catalog.hive_prod.uri=thrift://tkbs-hive-metastore：Hive MetaStore 地址
–conf spark.sql.warehouse.dir=hdfs://tkbs-hadoop-hdfs-nn/iceberg：Spark 数据地址

创立 Iceberg 表：

spark-sql> CREATE TABLE hive_prod.db.table (id bigint, data string) USING iceberg;

查看是否创立胜利：

spark-sql> desc hive_prod.db.table;
20/11/02 20:43:43 INFO BaseMetastoreTableOperations: Refreshing table metadata from new version: hdfs://10.0.1.129/iceberg/db.db/table/metadata/00000-1306e87a-16cb-4a6b-8ca0-0e1846cf1837.metadata.json
20/11/02 20:43:43 INFO CodeGenerator: Code generated in 21.35536 ms
20/11/02 20:43:43 INFO CodeGenerator: Code generated in 13.058698 ms
id    bigint
data    string
# Partitioning
Not partitioned
Time taken: 0.537 seconds, Fetched 5 row(s)
20/11/02 20:43:43 INFO SparkSQLCLIDriver: Time taken: 0.537 seconds, Fetched 5 row(s)

查看 HDFS 是否存在表信息：

$ hdfs dfs -ls /iceberg/db.db
Found 5 items
drwxr-xr-x   - root supergroup          0 2020-11-02 16:37 /iceberg/db.db/table

查看 Postgresql 是否存在表元数据信息：

$ kubectl get pod | grep postgresql
tkbs-postgresql-5b9ddc464c-xc5nn                       1/1     Running     1          7d19h$ kubectl exec tkbs-postgresql-5b9ddc464c-xc5nn -- psql -d metastore -c 'select * from"TBLS"'

向 Iceberg 表插入数据：

spark-sql> INSERT INTO hive_prod.db.table VALUES (1, 'a'), (2, 'b');

查看是否插入胜利：

spark-sql> select * from hive_prod.db.table;
...
1    a
2    b
Time taken: 0.854 seconds, Fetched 2 row(s)
20/11/02 20:49:43 INFO SparkSQLCLIDriver: Time taken: 0.854 seconds, Fetched 2 row(s)

查看 Kubernetes 集群 Spark 工作运行状态：

$ kubectl get pod | grep spark
sparksql10-0-1-64-ed8e6f758900de0c-exec-1              1/1     Running            0          86s
sparksql10-0-1-64-ed8e6f758900de0c-exec-2              1/1     Running            0          85s

Iceberg Spark 反对的更多操作可见：https://iceberg.apache.org/sp…

通过以上步骤，咱们即可在 Kubernetes 上疾速部署生产可用的实时数据湖平台。

在这个数据量爆炸的时代，传统数仓已较难很好满足数据多样性需要。数据湖凭借凋谢、低成本等劣势，逐步居于主导地位。并且用户和业务也不再满足于滞后的剖析后果，对数据实时性提成了更多要求。以 Iceberg、Hudi、Delta Lake 为代表的开源数据湖技术，填补了这部分市场空白，为用户提供了疾速搭建实用于实时 OLAP 的数据湖平台能力。另外云原生时代的到来，更是大大减速了这一过程。大数据毋庸置疑正朝着实时剖析、计算存储拆散、云原生，乃至于湖仓一体的方向倒退。大数据基础设施也正因为 Kubernetes、容器等云原生技术的引入，正产生微小改革。将来大数据会更好的“长于云上”，Bigdata as a Service 的时代，置信很快会到来。

https://iceberg.apache.org/
https://github.com/apache/ice…
https://cloud.tencent.com/pro…
https://github.com/tkestack/c…
基于 Apache Iceberg 打造 T + 0 实时数仓

【腾讯云原生】云说新品、云研新术、云游新活、云赏资讯，扫码关注同名公众号，及时获取更多干货！！

关于腾讯云:使用-Iceberg-on-Kubernetes-打造新一代云原生数据湖

背景

何为 Iceberg

Iceberg on Kubernetes

如何构建云原生实时数据湖

架构图

创立 Kubernetes 集群

部署 Hadoop 集群

留神

集成 Iceberg

创立和应用 Iceberg 表

总结

参考资料