数据规范是数据治理体系中的外围因素之一。
一方面,对立的数据规范能够在简单的业务场景下,帮忙团队对齐数据口径,晋升数据在剖析、诊断等场景的品质与效率;另一方面,数仓团队与分析师团队也须要积淀一套麻利、可控的数据规范指标治理流程,以便后续在指标口径的减少、批改、下线等方向更规范、高效。
但数据规范建设并不是一个简略的过程。在同一个企业外部,也存在对规范认知不统一的问题。以银行业举例,对于“客户”的定义,客户部认为“办了银行的卡的人即为客户”,而网银部则认为“银行网站注册过、或者通过银行转账的人都属于客户”,这即是对同一个概念存在认知偏差。
另外,在理论数据开发过程中,也存在开发人员对同一个字段采纳不同的命名,或者存在同义不同名的元数据字段,导致沟通成本增加,甚至最终影响数据品质。
近期,火山引擎大数据治理研发套件 DataLeap 上线的「数据规范」模块瞄准这一问题,心愿为数据从业提供一套数据规范的治理能力。据介绍,该模块已提供数据规范、规范代码、命名词典治理的性能,还反对对各类数据源的库表进行扫描,并进行智能举荐对标。对于企业整体的数据规范状况,DataLeap 则提供可视化的统计大盘,帮忙数据团队疾速理解规范的新建状况和应用状况。
火山引擎 DataLeap 数据规范产品页面
用户仅仅只须要操作 3 个关键步骤,即可实现数据规范对立:
- 规范建设:通过在规范域治理事后定义好字段类型配置,实现版本资产映射治理,反对批量导入,实现数据规范代码对立、命名词典批量导出。
- 规范治理:查看版本历史,帮忙用户订阅规范并查看变更日志记录。
- 规范映射:可将数据规范与多种数据源字段倡议映射,可查看数据规范评估后果,或依据映射通过状况纠正。
在应用场景上,用户基于 DataLeap 实现对立数据规范建设,打消数据不一致性,推动数仓标准数据建设,还能够与指标服务买通,对接数据地图资产,进一步达到数据治理的目标。
除了数据规范治理之外,火山引擎 DataLeap 还提供数据集成、开发、运维、治理、资产、平安等能力,帮忙用户晋升数据研发效率、升高治理老本,减速推动企业的数字化转型,目前曾经利用于泛互联网、制作、新批发、汽车等畛域。
立刻跳转火山引擎 DataLeap 官网理解更多