共计 1285 个字符,预计需要花费 4 分钟才能阅读完成。
作者介绍:TJ,唐建法,Tapdata 钛铂数据 CTO,MongoDB 中文社区主席,原 MongoDB 大中华区首席架构师,极客工夫 MongoDB 视频课程讲师。
数据中台定义:
以买通部门或数据孤岛的对立数据平台为根底,构建对立数据资产体系,并以 API 服务形式为全渠道业务(剖析 + 利用)提供即时交付能力的企业级数据架构。
– 首先,对立数据平台。
数据中台也是一个数据对立的平台,它不会取代原来的零碎,而是把原来组织中扩散在各零碎中的数据实时地汇聚到对立平台之中。
– 其次,数据资产体系建设。
与数仓及其它大数据平台不同的是,汇聚对立之后,做数据资产体系布局。对数据打标签,组织目录和构造,便于发现和应用。
– 最初,提供数据服务。
以 API 的标准接口形式向前端的业务场景,或剖析场景提供服务。而不是通过传统的 SQL,或者是 dump 的形式来导出数据。咱们称之为 DaaS(Data as a Service),数据即服务。
构建企业数据中台,所撑持的场景不仅仅是剖析(如可视化剖析,数据发现,数据报表等等),也包含满足各种前端业务利用对数据的需要,如 CRM、BPM、SCM、MES 等。所以这里提供的数据服务是全渠道业务,而不是传统数仓做的 BI 相似的工作。更多前端业务利用如掌上商城、手机银行、保单治理、客户 360、对立订单、销售大屏等。汇聚在中台的数据能够间接推到手机、App 等各类前端,并且是实时的,交互的数据。
这些都是传统数仓这样的平台所无法比拟的。
以下是金融企业的数据中台架构参考(银行业):
- 最低下蓝色是 EDW、Hadoop、DB2、Oracle 等是已有的各类零碎的数据源。
- 通过 CDC、批量导入、API 集成等形式把数据汇聚到中台。
- 在中台外面进行材料的建模和分类,比方依照客户、账户、交易等纬度。
- 而后以 API 形式交付到他们的各个业务核心。
- 最初做成各种业务开发,如金融商城,手机 App,社交零碎等。
在没有数据中台的时候。实现这些前端场景须要各个业务核心找每一个须要用到的数据中心去协商,前端业务间接连到后盾的外围零碎。因而而产生两个问题:
一是,当数据量上来时,如做促销流动,外围零碎 DB2,Oracle 等跟不上。
二是,当有业务核心有新的需要产生,对数据模型要扭转的时候,外围零碎很难撑持。
当企业有了能够灵便组织新的业务模型的数据中台,才可能真正疾速地响应前端的业务须要。
在上图的右上角,能够看到数据中台仍旧能够反对一些剖析的场景。
当然,这样的数据中台必须具备数据的治理能力,如品质,编目,建模等等。
所以数据中台的次要价值在于, 数据的协同效率、复用效率和交付速度 。原各个系统中的数据不再各自为政,而协同到一起效率进步很多。同样,一份数据能够给多个业务场景应用,而不再须要 ETL 到不同的零碎,还要去保护它们的一致性,去掉反复,或避免遗失。最大的价值更在于,放慢数据的交付速度。
Tapdata 钛铂数据
- 新一代实时数据交融平台产品和解决方案提供商
- 行业当先的同异构数据库实时同步解决方案提供商
分割咱们获取企业版 Demo:team@tapdata.io
立刻体验线上异构数据库同步服务:cloud.tapdata.net