关于数据库:一张图读懂TuGraph-Analytics开源技术架构

作者：范志东

TuGraph Analytics（外部我的项目名GeaFlow）是蚂蚁团体开源的分布式实时图计算引擎，即流式图计算。通过SQL+GQL交融剖析语言对表模型和图模型进行对立解决，实现了流、批、图一体化计算，并反对了Exactly Once语义、高可用以及一站式图研发平台等生产化能力。

开源我的项目代码目前托管在GitHub，欢送业界同仁、大数据/图计算技术爱好者关注咱们的我的项目并参加共建。

我的项目地址：https://github.com/TuGraph-family/tugraph-analytics

GeaFlow论文【SIGMOD 2023】：GeaFlow: A Graph Extended and Accelerated Dataflow System

概览

本文心愿通过一张图形容分明TuGraph Analytics的整体架构脉络和要害设计思路，以帮忙大家疾速对TuGraph Analytics我的项目的轮廓有个整体的意识。闲言少叙，间接上图。

TuGraph Analytics开源技术架构一共分为五个局部：

DSL层：即语言层。TuGraph Analytics设计了SQL+GQL的交融剖析语言，反对对表模型和图模型对立解决。
Framework层：即框架层。TuGraph Analytics设计了面向Graph和Stream的两套API反对流、批、图交融计算，并实现了基于Cycle的对立散布式调度模型。
State层：即存储层。TuGraph Analytics设计了面向Graph和KV的两套API反对表数据和图数据的混合存储，整体采纳了Sharing Nothing的设计，并反对将数据长久化到近程存储。
Console平台：TuGraph Analytics提供了一站式图研发平台，实现了图数据的建模、加工、剖析能力，并提供了图作业的运维管控反对。
执行环境：TuGraph Analytics能够运行在多种异构执行环境，如K8S、Ray以及本地模式。

DSL层

DSL层是一个典型的编译器技术架构，即语法分析、语义剖析、两头代码生成(IR)、代码优化、指标代码生成（OBJ）的流程。

语言设计：TuGraph Analytics设计了SQL+GQL的交融语法，解决了图+表一体化剖析的诉求。具体语法设计能够参考文章：DSL语法文档
语法分析：通过扩大Calcite的SqlNode和SqlOperator，实现SQL+GQL的语法解析器，生成对立的语法树信息。
语义剖析：通过扩大Calcite的Scope和Namespace，实现自定义Validator，对语法树进行束缚语义查看。
两头代码生成：通过扩大Calcite的RelNode，实现图上的Logical RelNode，用于GQL语法的两头示意。
代码优化：优化器实现了大量的优化规定（RBO）用于晋升执行性能，将来也会引入CBO。
指标代码生成：代码生成器Converter负责将Logical RelNode转换为Physical RelNode，即指标代码。Physical RelNode能够间接翻译为Graph/Table上的API调用。
自定义函数: TuGraph Analytics提供了大量的内置零碎函数，用户也能够依据须要注册自定义函数。
自定义插件: TuGraph Analytics容许用户扩大本人的Connector类型，以反对不同的数据源和数据格式。

Framework层

Framework层设计与Flink/Spark等同类大数据计算引擎有肯定的相似性，即提供了类FlumeJava（FlumeJava: Easy, Efficient Data-Parallel Pipelines）的对立高阶API（简称HLA），用户调用高阶API的过程会被转换为逻辑执行打算，逻辑执行打算执行肯定的优化（如ChainCombine、UnionPushUp等）后，被转换为物理执行打算，物理执行打算会被调度器散发到分布式Worker上执行，最终Worker会回调用户传递的高阶API函数逻辑，实现整个分布式计算链路的执行。

高阶API：TuGraph Analytics通过Environment接口适配异构的分布式执行环境（K8S、Ray、Local），应用Pipeline封装了用户的数据处理流程，应用Window形象对立了流解决（无界Window）和批处理（有界Window）。Graph接口提供了动态图和动态图（流图）上的计算API，如append/snapshot/compute/traversal等，Stream接口提供了对立流批处理API，如map/reduce/join/keyBy等。
逻辑执行打算：逻辑执行打算信息对立封装在PipelineGraph对象内，将高阶API对应的算子（Operator）组织在DAG中，算子一共分为5大类：SourceOperator对应数据源加载、OneInputOperator/TwoInputOperator对应传统的数据处理、IteratorOperator对应动态/动态图计算。DAG中的点（PipelineVertex）记录了算子（Operator）的要害信息，如类型、并发度、算子函数等信息，边（PipelineEdge）则记录了数据shuffle的要害信息，如Partition规定（forward/broadcast/key等）、编解码器等。
物理执行打算：物理执行打算信息对立封装在ExecutionGraph对象内，并反对二级嵌套构造，以尽可能将能够流水线执行的子图（ExecutionVertexGroup）构造对立调度。图中示例的物理执行打算DAG被划分为三部分子图构造别离执行。
调度器：TuGraph Analytics设计了基于Cycle的调度器（CycleScheduler）实现对流、批、图的对立调度，调度过程通过事件驱动模型触发。物理执行打算中的每部分子图都会被转换为一个ExecutionCycle对象，调度器会向Cycle的头结点（Head）发送Event，并接管Cycle尾结点（Tail）的发回的Event，造成一个残缺的调度闭环。对于流解决，每一轮Cycle调度会实现一个Window的数据的解决，并会始终不停地执行上来。对于批处理，整个Cycle调度仅执行一轮。对于图解决，每一轮Cycle调度会实现一次图计算迭代。
运行时组件：TuGraph Analytics运行时会拉起Client、Master、Driver、Container组件。当Client提交Pipeline给Driver后，会触发执行打算构建、调配Task（ResourceManagement提供资源）和调度。每个Container内能够运行多个Worker组件，不同Worker组件之间通过Shuffle模块替换数据，所有的Worker都须要定期向Master上报心跳（HeartbeatManagement），并向时序数据库上报运行时指标信息。另外TuGraph Analytics运行时也提供了故障容忍机制（FailOver），以便在异样/中断后能继续执行。

State层

State层设计相比于传统的大数据计算引擎，除了提供面向表数据的KV存储形象，也反对了面向图数据的Graph存储形象，以更好地反对面向图模型的IO性能优化。

State API：提供了面向KV存储API，如get/put/delete等。以及面向图存储的API，如V/E/VE，以及点/边的add/update/delete等。
State执行层：通过KeyGroup的设计实现数据的Sharding和扩缩容能力，Accessor提供了面向不同读写策略和数据模型的IO形象，StateOperator形象了存储层SPI，如finish（刷盘）、archive（Checkpoint）、compact（压缩）、recover（复原）等。另外，State提供了多种PushDown优化以减速IO拜访效率。通过自定义内存治理和面向属性的二级索引也会提供大量的存储拜访优化伎俩。
Store层：TuGraph Analytics反对了多种存储系统类型，并通过StoreContext封装了Schema、序列化器，以及数据版本信息。
长久化层：State的数据反对长久化到近程存储系统，如HDFS、OSS、S3等。

Console平台

Console平台提供了一站式图研发、运维的平台能力，同时为引擎运行时提供元数据（Catalog）服务。

标准化API：平台提供了标准化的RESTful API和认证机制，同时反对了页面端和利用端的对立API服务能力。
工作研发：平台反对“关系-实体-属性”的图数据建模。基于字段映射配置，能够定义图数据传输工作，包含数据集成（Import）和数据散发（Export）。基于图表模型的图数据加工工作反对多样化的计算场景，如Traversal、Compute、Mining等。基于数据加速器的图数据服务，提供了多协定的实时剖析能力，反对BI、可视化剖析工具的接入集成。
构建提交：平台通过工作和作业的独立形象，实现研发态与运维态的拆散。工作开发实现后执行公布动作，会主动触发构建流水线（Release Builder），生成公布版本。工作提交器（Task Submitter）负责将公布版本的内容提交到执行环境，生成计算作业。
作业运维：作业属于工作的运行态，平台提供了作业的操纵（启停、重置）、监控（指标、告警、审计）、调优（诊断、伸缩、调参）、调度等运维能力。作业的运行时资源会由资源池统一分配和治理。
元数据服务：平台同时承载了引擎运行时的元数据服务能力，以实现研发与运维的自动化。元数据以实例维度进行隔离，实例内的研发资源能够依据名字间接拜访，如点、边、图、表、视图、函数等。
系统管理：平台提供了多租户隔离机制、细粒度用户权限管制，以及系统资源的治理能力。

执行环境

TuGraph Analytics反对多种异构环境执行，以常见的K8S部署环境为例，其物理部署架构如下：

在TuGraph Analytics作业的全生命周期过程中，波及的要害数据流程有：

研发阶段：Console平台提供了实例下所有的研发资源的治理，用户能够在创立工作前，提前准备所需的研发资源信息，并存储在Catalog。
构建阶段：工作创立实现后，通过公布动作触发构建流水线，用户的JAR包、工作的ZIP包等会上传到RemoteFileStore。
提交阶段：作业提交时，Console会依据作业的参数配置、运行时环境信息，以及近程文件地址等创立KubernetesJobClient，既而会拉起Client Pod，Client会拉起Master Pod，Master会拉起Container Pods和Driver Pod。所有的Pod拉起后，Client会把作业的Pipeline发送给Driver执行，Driver最终通过Cycle调度的Events与Containers交互。所有的Pod启动时都会从RemoteFileStore下载版本JAR包、用户JAR包、作业ZIP包等信息。Driver对DSL代码编译时，也须要通过Console提供的Catalog API操作Schema信息。
运行阶段：作业运行时，各个组件会上报不同的数据和信息。Master会上报作业的心跳汇总信息，Driver会上报作业的Pipeline/Cycle指标以及错误信息，Container会上报作业的Offset、指标定义以及错误信息等。RuntimeMetaStore存储作业的Pipeline/Cycle指标、Offset、心跳汇总、谬误等信息。HAMetaStore存储各个运行组件的地址信息。DataStore存储State数据和作业FailOver时所需的元数据信息。MetricStore存储运行时指标信息。
监控阶段：Console会次要查问RuntimeMetaStore和MetricStore存储的信息用于作业的运行时监控。
清理阶段：作业重置/删除时，Console会对作业的RuntimeMeta、HAMeta以及局部Data做清理操作。

总结

心愿通过以上的介绍，能够让大家对TuGraph Analytics开源技术架构有个比拟清晰的理解，咱们十分欢送开源社区的技术爱好者参加到我的项目的建设中来。

如果您对TuGraph Analytics我的项目比拟感兴趣，欢送动动手指扫码中转GitHub仓库，为咱们的我的项目加一颗Star。【网络不畅能够尝试应用VPN拜访】

如果您对该项目标倒退有好的倡议和意见，欢送大家提交Issue到开源社区，或者通过邮箱/钉钉群与咱们间接分割。

邮箱：tugraph@service.alipay.com

钉钉群：TuGraph Analytics探讨群

关于数据库:一张图读懂TuGraph-Analytics开源技术架构

概览

DSL层

Framework层

State层

Console平台

执行环境

总结

评论

发表回复取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

关于数据库:一张图读懂TuGraph-Analytics开源技术架构

概览

DSL层

Framework层

State层

Console平台

执行环境

总结

评论

发表回复 取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

发表回复取消回复