乐趣区

关于数据库:信也科技发布Plink实时计算平台助力构建企业级实时数仓新篇章

近日,信也科技推出新一代实时数据开发一站式平台 Plink(下称“Plink 平台”)。该平台基于 Apache Flink 我的项目自主研发,通过近年来的技术演进,现已具备高可用、高吞吐、灵便扩大等特点。Plink 平台整合了 Kafka、Hadoop 和传统 MPP 数据库,以行业内多个业务的技术痛点为出发点,深度赋能业务零碎,在实时风控、实时营销、实时剖析等场景上广泛应用,场景覆盖率超过 80%,解决效率进步近 100%。

三大零碎层级 搭建实时计算平台架构
Plink 平台交融泛滥开源的大数据基础架构,并在迭代中保障了对历史技术栈兼容,依照性能个性次要分为引擎层、平台层、应用层三大层级。

1. 引擎层:满足多业务场景下的技术兼容
Plink 平台以 Kafka、Hadoop、Hive 等罕用的大数据组件作为根底,并集成 Hudi 数据湖技术,构建了古代实时数仓的基础架构,同时也提供了对 Mongo、Starrocks、Influxdb 等组件的反对,充沛满足了多种业务场景下的技术兼容。除此之外,零碎还引入了图数据库用于撑持计算作业的血缘关系存储与剖析须要。

2. 平台层:真正意义上反对 Flink 流批一体
平台层是该零碎自研的外围,外部交融了项目管理、作业开发与治理、UDF 治理、数仓设计、元数据管理、数据血统等相干性能,在多个方面集成了企业外部的开发标准与上线流程,保障开发人员平安标准操作。同时零碎也反对了多种 Flink 作业开发以及流批运行模式,从真正意义上反对了 Flink 流批一体。

3. 应用层:显著进步开发效率与规范性
在 Plink 平台的基础架构之上,平台集成了 Flink CDC、指标零碎、OLAP 数据库等组件,对企业外部的各大业务场景做了深度定制,在理论业务场景开发过程中,大大降低了开发人员的技术门槛和开发周期,显著进步开发效率和规范性。

四大外围特色 保障平台作业衰弱安稳运行
Plink 平台基于全场景的数仓设计思维,制订了一套集成化的作业开发公布流程,并买通了全链路数仓血统图谱,同时也构建了欠缺的作业指标监控体系,独特保障作业标准、安稳、衰弱运行。

1. 全场景的数仓设计与治理
Plink 平台在设计之初,就充分考虑到向数仓建设方向迈进,并基于数仓设计思维,内置了数仓设计模块与元数据管理性能,反对对离线数仓和实时数仓元数据的对立治理,极大进步了作业开发便利性,升高了数仓设计与作业开发成本。

2. 集成化的作业开发公布流程
平台交融了 Git 代码管理系统和 CICD 标准,具备较强的作业开发治理能力,并提供对多环境、多版本的作业开发反对,同时也交融了信也科技外部项目管理与上线流程,具备“开发 - 测试 - 预发 - 生产”的一站式公布能力,极大进步了作业开发与上线标准水平。

3. 全链路的数仓血统剖析能力
自研 Jar 包作业的血统解析和 Flink SQL 血统解析模块,并采集传统离线作业的血统数据,基于图数据库买通了实时数仓和离线数仓的血统视图,构建数仓级别的全链路血统剖析,极大地提高了数据分析与问题解决能力。

4. 欠缺的监控运维保障体系
平台基于 Flink Metrics 和时序数据库,构建了欠缺的作业指标监控体系,对作业运行状态、资源占用等进行全面监控,并落实衰弱度评分机制,针对不同的作业等级,反对多种形式的作业异样预警能力,大大保障了作业的衰弱安稳运行。

将来,信也科技将交融已有的传统数仓平台,并踊跃引进数据湖、混合架构等最新前沿技术成绩,推动实时数仓平台建设,同时也将增强行业交换,分享最新研究成果,被动参加到社区开源我的项目建设中,更多地为团体业务零碎赋能,助力行业向实时化、智能化高质量倒退。

退出移动版