关于数据:银行数仓体系发展之路

36次阅读

共计 1278 个字符,预计需要花费 4 分钟才能阅读完成。

银行的数据仓库往往汇聚了银行次要零碎的客户、业务、财务等数据,为银行的日常经营剖析、市场营销、危险管制、财务剖析、外部审计、监管报送提供数据反对和服务。银行的数字化实际必须建设好数仓体系。

数据仓库是一个面向主题的、集成的、绝对稳固的、反映历史变动的数据汇合,用于反对管理决策。数据仓库之父比尔在著述《Building the Data Warehouse》中提出数据仓库的特色:

(1)面向主题的

(2)集成的

(3)保留历史的

(4)面向决策反对的

(5)面向全企业的

(6)最明细的数据存储

(7)数据快照式的数据获取

数据集市和数据中台,是与数据仓库无关的两个概念。

数据集市是数据仓库的一个子集,用于从数据仓库获取相干的数据加工后提供给用户。数据集市通常面向特定的业务或者团队,如市场部门有对应的营销数据集市,经营部门有经营数据集市。

银行的数据集市包含财务、营销、危险集市等。这些集市为对应的数据系统提供数据加工,此外也为各业务部门数据分析人员提供剖析集市,在数据仓库提供相干数据后,由业务人员自行进行数据摸索剖析。通常咱们认为,银行的数据仓库体系个别包含了数据集市,数据集市其实是作为数据仓库体系的一部分。

另一个概念则是数据中台。

现在数据利用到业务场景里的需要大幅减少,须要和利用零碎买通,并把数据利用于业务剖析。这也要求数据仓库有数据中台的概念。但因为原来数据仓库的架构都打得很松软,因而假使想调整架构去撑持业务,很难从底层到顶层的实现对技术改造的工作。

同时,因为银行业组织构造异样简单,外面数据的利用、零碎的买通不是一个部门的人或一个层面的人去推动和反对能够实现的。所以说,在银行实际数据中台的时候其实都是要独立于数据仓库去做。

上图列举了银行的业务特色。对银行来说,它们业务层面次要是交易类的,次要分为两条线,包含渠道和业务。

渠道是指银行相干的各种平台,如手机银行、ATM 机、网上银行等,这些都是它们采集数据的重要渠道,也是它们外围业务的渠道。

业务是银行的重心,如理财、个贷等。这些跟它们自有的业务特色密切相关。

如上图所示,这是一个比拟常见的数据仓库的架构。它的层级非常清晰:从数据源的采集到 ODS 那一层,再到数据应用层。最下面的那一层就是应用层,比方报表展现、即席查问、数据分析等。

如上图所示,这些是银行数仓的常见主题模型,一共是十个:当事人、资产、财务管理

区域地位、营销流动、协定、事件、外部机构、产品和渠道。

将来,银行数仓体系会如何倒退?

就整体趋势而言,数据会越来越扩散,这里的扩散是指数据源获取的扩散。随着利用多样化,数据源变多,数据量暴增,服务器资源永远都不够用。

因而银行数据畛域如果真的想实现数据驱动的话,还须要走较长的路。

易观作为国内当先的数据服务公司,对数据仓库提出了本人思考:基于用户行为数据中台的解决方案。

因为银行业的复杂性,会接入十分多的数据源,因而这一解决方案次要针对下层进行整合。易观技术服务团队通过在接口层面凋谢权限治理和项目管理,银行工作人员便能够通过本人的管理权限界面在咱们接口,保障了不同模块在权限治理层面的对立。我的项目同样如此。

正文完
 0