关于数据:什么是数据治理

41次阅读

共计 2008 个字符,预计需要花费 6 分钟才能阅读完成。

大数据治理定义:大数据治是狭义信息化治理打算的一部分,即制订与大数据无关的治理优化、数据保护、数据变现的政策。

它的发动背景少数是因为公司策略政策和业务日益变大的数据需要和要求所产生的。
说了数据治理产生的背景,我再来谈下数据治理的对象。它包含数据、开发流程、治理流程、制度、组织。我认为只有和指标相关联的,都能够算作治理的对象,数据治理就是将关联方通过一套残缺的治理行为,造成有序的工作以达成指标。

数据治理我的项目的范畴

元数据从数据的角度能够分为三类:业务元数据 技术元数据 治理元数据

业务元数据: 是从业务的视角去形容数据,让不懂数据的人能够疾速读懂数据,例如:表名称、表的血缘关系、表的字段阐明、指标的统计口径等多种业务形容;
技术元数据: 天然就是从技术的角度去形容数据,例如:表的 sql、字段长度、字段类型等多种技术形容;
治理元数据: 是蕴含数据管理的信息在外面,例如:表的业务属主、表的技术负责人。
元数据的治理通常蕴含:血统剖析、数据生命周期。

血统剖析:对元数据的上下游进行剖析,依照数据存储的数据库将血统剖析分为了两类:

  1. 存在 Hadoop 平台的血统剖析,可用通过脚本解析出到字段级的上下游关系;
  2. 建表有主外键的,可通过主外键建设血缘关系。
    数据生命周期:数据都存在生命周期,当元数据访问量变低,数据价值不存在的时候,可将它下线革除,开释存储空间。

    数据安全

    数据安全次要是对数据的平安脱敏管控和安全检查,脱敏机制有两种计划:

1)在数据仓库的接入和输入进行脱敏管控:数据接入辨认敏感信息,通过脱敏工具进行脱敏解决,产生脱敏表和敏感表两张表(脱敏表与敏感表之间要有映射关系),敏感数据不对中间层凋谢,对于数仓中间层则只有脱敏表,开发和测试的时候也只能应用脱敏表,在数据输入层,首先应用层的开发先对敏感数据进行申请,申请通过后失去敏感表的使用权,开发通过映射关系将敏感表的脱敏数据进行关联解决。

这种计划的益处:平安易管控,脱敏过程少,但会减少开发的工作量。

2)针对用户进行脱敏治理,数据仓库的每一层都须要对敏感数据进行脱敏解决,对于敏感数据申请权限的用户能够查看敏感信息,没有权限的用户只能查看脱敏表。这种脱敏机制益处在于对开发没什么影响,但加大平安治理的复杂度,须要全域扫描敏感信息,脱敏工作大。

数据品质

数据安全次要是对数据的平安脱敏管控和安全检查,脱敏机制有两种计划:

1)在数据仓库的接入和输入进行脱敏管控:数据接入辨认敏感信息,通过脱敏工具进行脱敏解决,产生脱敏表和敏感表两张表(脱敏表与敏感表之间要有映射关系),敏感数据不对中间层凋谢,对于数仓中间层则只有脱敏表,开发和测试的时候也只能应用脱敏表,在数据输入层,首先应用层的开发先对敏感数据进行申请,申请通过后失去敏感表的使用权,开发通过映射关系将敏感表的脱敏数据进行关联解决。

这种计划的益处:平安易管控,脱敏过程少,但会减少开发的工作量。

2)针对用户进行脱敏治理,数据仓库的每一层都须要对敏感数据进行脱敏解决,对于敏感数据申请权限的用户能够查看敏感信息,没有权限的用户只能查看脱敏表。这种脱敏机制益处在于对开发没什么影响,但加大平安治理的复杂度,须要全域扫描敏感信息,脱敏工作大。

数据价值

数据治理最重要的产出物,通过数据治理能为业务带来的业务价值。如我所在的公司,数据价值体现在数据资产可视化。对于不同看数据角色定义不同的价值,对于数据业务剖析人员,通过数据标准化治理和平台搭建,让不懂数据的业务可能疾速把握数据,并能够本人进行数据挖掘、数据分析等工作。

对于高层领导,将公司的业务数据以报告的模式,让领导疾速理解数据的老本及散布状况。当然不同的公司偏重的价值会不一样,数据治理同时也能无效的控制数据老本,缩小因为数据带来的摩擦,晋升数据品质和平安。

数据开发

对数据开发进行规范的流程治理是数据治理外围的一部分,首先依据公司理论状况剖析、制订可落地的数据开发治理标准。过于简单的数据开发标准保护老本高,同时也减轻开发工作量,导致难以执行。过于简略的标准又无奈很好的治理开发流程。最次要的还是定制完标准后拉各关联方进行评审,大家对可落地,可治理的角度是评估标准。

当标准制订好后,就是依照标准进行落地执行。通常数据开发标准蕴含:数据建模、数据设计、数据我的项目部署和施行。

数据建模是一种剖析和设计办法,用于:

  1. 定义和剖析数据需要;
  2. 设计满足需要的数据结构。

组织建设

数据组织是保障数据治理可能长期有效的重要伎俩之一,通常数据组织都是能够跨职责的,组织的职能和分类如下:

1)数据治理委员会,在公司外部领有数据的最高决策权,代表了企业的高层视角

2)数据管理领导委员会,为数据委员会提供反对,针对一些具体数据管理措施起草相干政策和规范,提供委员会评审和批准

3)数据管理制度团队,在某个业务畛域内,帮助实现数据制度治理的数据管理专员小组,数据管理制度团队来着不同的部门和跨业务畛域的数据专家

正文完
 0