关于数据:什么是数据质量管理

49次阅读

共计 1781 个字符,预计需要花费 5 分钟才能阅读完成。

世界正处于在数据时代。这意味着明天产生的数据比人类历史上过来 5000 年的数据还要多——每天大概产生 2.5 万亿字节的数据。每次有人发送电子邮件或文本、下载应用程序、发送任何数量看似微不足道的事件时,都会创立数据,而数百万人的这些交互的复合数量造成了数据的爆炸式增长。企业能够须要数据驱动,而不是被数据吞没。数据驱动型企业的一个独特特色是,他们都制订了数据品质治理打算,以确保应用最优质的数据源。

一、为什么企业须要数据品质治理

企业开始意识到数据品质治理的重要性。推动数据品质需要的共同点有:将新数据源,尤其是非结构化数据与现有系统集成;利用所有可用的企业数据所需的财务投资和竞争压力:以及从数据所在的孤岛中提取数据的难度等。哈佛商学院公布一项钻研显示,47% 的新创建数据记录至多蕴含一个严重错误。麻省理工学院斯隆进行的一项惊人钻研指出,不良数据的解决老本可能高达总收入的 15-25%,且是长期的无用老本损耗。一个牢靠的数据品质治理打算将确保数据的高度完整性,并且任何须要它的人都能够以平安和受监管的形式随时取得数据。数据品质治理就是找到正确的组合,让适合的人员依照正确的办法装备正确的工具。

二、人员:通向数据品质的合作门路

数据品质治理打算不应该依赖于一个小型 IT 团队或几个摇滚明星数据人员来执行。数据是一项团队静止;从 IT 到数据科学家,从应用程序集成商到业务分析师,每个人都应该可能参加并从继续可用的高质量数据中提取有价值的见解。

在开始施行数据品质治理打算时,作为一个团队解决数据很重要,否则您可能会被验证可信数据所需的工作量压得喘不过气来。通过引入一种相似于维基百科的办法,任何人都能够在数据管理方面进行潜在的合作,有机会让企业参加到将原始数据转化为可信赖、记录和筹备共享的内容的过程中。

IT 和其余反对企业(例如 CDO 办公室)须要制订规定,并在须要时(例如出于合规性或数据隐衷)提供权威的治理办法。

您须要同时建设一种更具协作性的办法,以便您的业务用户中常识最渊博的人能够成为内容提供者和策展人。通过利用具备嵌入式数据品质剖析管制的智能和工作流驱动的自助服务工具,您能够施行可扩大的信赖零碎。

三、工具:对立的数据品质治理平台

有很多数据筹备和管理工具能够提供多种益处来反抗不良数据。但其中只有多数涵盖了所有人的数据品质。这些专门的、独立的数据品质管理工具通常具备简单的用户界面,须要深厚的专业知识能力胜利部署。当然,这些工具可能很弱小,但如果团队只有短期的数据品质解决优先级,那么我的项目的进度将大打折扣。

另一方面,您可能会发现简略且通常弱小的应用程序可能过于孤立,无奈注入到全面的数据品质流程中。即便他们通过简略的 UI 胜利地专一服务业务人员,他们也会错过重要的局部——合作数据管理。而这正是挑战所在。胜利不仅取决于工具和能力自身,还取决于他们互相交换的能力。因而,您须要一个基于平台的解决方案来共享、操作和传输数据、操作和模型。

企业将面临多个用例,其中一个人或团队无奈胜利治理您的数据。与业务用户单干并在数据生命周期中赋予他们势力,将使您和您的团队克服传统阻碍,例如清理、协调、匹配或解决您的数据。以下是数据品质工具能够反对您的数据驱动型企业的形式:

· 剖析您的数据环境 :数据分析——掂量整个企业中以各种模式存储的数据的特色和情况的过程——通常被认为是取得对企业数据的控制权的重要第一步。

· 平安共享品质数据 :应用本地或基于云的应用程序有选择地共享生产品质数据,而不会将个人身份信息 (PII) 裸露给未经受权的人员。

· 治理数据生命周期 :数据管理是定义和保护数据模型、记录数据、清理数据以及定义其规定和策略的过程。它反对施行定义明确的数据治理流程,涵盖多项流动,包含监控、协调、优化、反复数据删除、清理和聚合,以帮忙向应用程序和最终用户提供高质量的数据。

· 疾速筹备和共享数据 :太多人依然破费太多工夫在 Excel 中解决数据或冀望他们的共事代表他们这样做。数据筹备工具可能容许任何人拜访数据集,而后清理、标准化、转换或丰盛数据——这种共享所有权最终推动了业务和 IT 之间的合作。

不良数据品质的可能造成市场竞争能力的降落、谬误的决策以及寻找、清理和纠正不良谬误所需的工夫、人力、资源、经济老本。亿信华辰提供数据品质治理平台工具来帮忙您实现数据品质指标并帮忙您的企业真正实现数据驱动。

正文完
 0