乐趣区

关于数据库:企业如何两步实现数据资产化

企业实现建设数据存储和算力根底平台后,再将数据资源归集,下一步就须要将数据资源转化为数据资产。那么什么样的数据资源是数据资产?企业数据管理者须要晋升数据品质、打消数据孤岛,并逐渐积攒数据价值?本篇将从数据平台建设和团队建设两个角度来介绍如何实现数据资产化。

— 数据资产化的挑战 —

企业实现建设数据存储和算力根底平台后,再将数据资源归集,下一步就须要将数据资源转化为数据资产。有业务语义和业务价值的数据资源才是数据资产,因而企业数据管理者须要将数据与业务衔接起来,梳理出哪些数据能够服务哪些业务,同时建设好数据连接通道并做好数据安全治理。这个阶段的次要指标是提供给业务方能够间接应用的数据资产。

企业在数据资产化的阶段会遇到各种各样的挑战,尤其是在起步阶段,常常会遇以下几个问题:

  • 如何能辨认出企业的全量数据资产
  • 如何能精确且疾速的晋升以后的数据品质
  • 如何能跨业务跨畛域的买通企业数据,打消“数据孤岛”
  • 以后数据的流转过程是否符合国家相干的法律法规的要求
  • 企业怎样才能逐渐的挖掘出数据资产的价值并量化它
  • 相干人才的造就,管理手段的降级,思维模式的翻新

对于大多数企业,这一系列挑战在很长一段时间里,都深深困扰着数据管理人员,尤其是引领企业数字化转型的管理层。
然而办法总是比艰难多,相干问题的解决并非欲速不达,须要一套残缺的技术平台和管理体系,并落实到具体的业务单位,有打算、分步骤、可量化的继续推动各项服务流动的发展与落地。在这个阶段,企业数据管理者须要实现两个方面的工作,一个是平台性能的建设,一个是团队能力的建设。

— 平台性能建设 —

平台建设的重点次要包含能帮忙企业做数据资源的治理和业务化转换的数据开发与治理平台,以及随着数据安全类三法(《网络安全法》《数据安全法》《个人信息保护法》)强制推广后要落地的数据安全治理平台。

上图是一个整体的,从数据开发到资产价值的总体流程的概要示意图,不同企业的布局和落地,按照企业的理论状况会存在肯定的差别,不过总体过程大同小异,在资产化阶段,对于平台工具的性能要求,咱们将其总结为以下几点:

  • 元数据管理与数据资源注销
    可能对立治理来自不同数据源的数据资源是数据资源化的第一步,次要包含数据源治理、元数据管理、数据资源盘点等性能。数据源治理要可能反对不同的数据库或平台,平台工具须要可能配置数据源、定义数据资源等。元数据管理要可能反对不同源数据的自动化采集,依照一些对立的规范做元数据定版治理,甚至笼罩数据血统的对立收集和治理。数据资源盘点须要包含一个资源门户和资源管理标准,能够将不同数据库的差异化数据格式采纳对立的数据格式进行盘点和规范化形容,再挂载到对立的资源目录上,便于数据管理和用户发现数据。
  • 数据模型与标准设计
    数据模型是数据平台内归集的多样化数据,是对立品质晋升和业务化晋升的要害。数据模型包含逻辑模型与物理模型,其中逻辑模型次要负责映射业务需要和数据表构造关系,物理模型负责将业务层的数据表构造转换为数据平台底层数据库的理论 DDL 等。数据规范是数据平台内元数据和数据品质的对立定义,是后续数据资产化过程的参考根据。平台工具须要可能提供逻辑模型注销和物理模型设计的性能,要可能设计数据规范、保护规范映射和执行落标查看,从而能够建设企业外部对立的数据标准和建设规范数据。
  • 自动化的数据品质晋升
    数据品质晋升是一个工程量十分庞杂的工作,平台工具须要可能进步这个工作的自动化水平从而晋升效率。平台工具须要提供的能力包含梳理品质模板、编写品质规定、查看品质报告、解决品质问题等。一些自动化和智能化的性能是十分要害的增值技术能力,通过一些基于数据类似度的举荐算法,让机器主动的给数据表关联品质规定和落实数据规范工作,能够将人力从反复的工作中解放出来,从而减速欠缺数据品质的过程。
  • 数据资产治理与服务能力
    通过企业内大量数据管理人员的工作积攒,外部将逐渐积攒起大量的可被各个业务应用的数据资产,此时企业就须要将这些潜在价值很大的数据资产治理起来,并提供多样化的服务形式能够让不同业务部门应用起来。企业个别要建设一个企业的数据资产目录或门户,反对数据管理者来挂载数据资产;而业务用户可能基于资产目录来做检索,更好的发现数据,理解数据分布以及数据信息溯源。

除了功能性要求以外,数据治理类软件自身也是要害的根底软件,企业对其天然也有体系化的架构要求,次要包含如下几点:

  • 稳定性与可靠性:相干软件会产生大量的无人驻守的计算工作,因而在架构上须要保障相干数据计算工作的稳定性和可靠性。
  • 用户自服务能力:数据治理软件和资产门户等相干软件是须要凋谢给所有数据管理人员、平安管理人员以及各个业务部门外部的数据人员来应用的,因而须要提供比拟强的自服务能力,这包含独立的工作空间、体系化的权限隔离机制,以及较低的开发启动老本。譬如企业数据管理部门对立制订数据规范,能够分发给各个业务组织或部门,由各个部门再联合本身的业务数据做进一步的欠缺,而无需从 0 开始,两头过程能够通过一些要害的数据管理流程来管制。
  • 非结构化数据的资产化:数据资产平台须要对非结构化数据提供治理能力,或者提供插件化的形式,让各个业务团队能够基于肯定的形式来做定制化的开发,最终可能无效的治理起业务积攒的这部分数据资产。
  • 数据安全:数据的凋谢在数据流通过程中,也带来了平安危险,依照法律法规的要求企业必须欠缺数据内容平安和流通平安,而不仅仅是软件层面的认证、权限和审计。数据安全治理平台须要可能提供基于数据内容的分类分级,生成细粒度的安全策略,反对动静脱敏、动态脱敏、数据水印等能力,能够让平安管理人员灵便的配置,从而落实相干合规性要求。
  • 国产软硬件生态反对:数据资产平台软件须要可能开发和治理国产数据库内的资产,此外平台本身也须要满足国产化的相干要求。

 — 团队能力建设 —
团队能力建设绝对比较复杂,在技术层面上团队须要把握数据资产盘点技术、数据品质治理能力、数据安全分类分级与细粒度平安治理等技术,还须要拓宽视线,从整体的角度考量如何从数据推动业务效率的晋升。这部分内容比拟形象,咱们将其形象为全局、求实、平安、资产四个关键点:

  • 全局观:以通过数据来扩充企业业务视线和治理视线为指标,以盘点和拉通企业各畛域数据为度量,促成企业全面的辨认和展现出所领有的数据资源量,数据资产量。
  • 求实观:以晋升数据品质、满足数据需要为指标,从组织、技术、治理、人员等多方面多角度、多因素动手深挖数据品质问题根因,长效晋升数据品质。
  • 安全观:以在满足日益完善的法律法规要求为前提,保证数据资产平安,爱护隐衷信息不泄露。
  • 资产观:以做好资源配置,管制好老本和收益为指标,对数据收集、存储、整合、利用、共享、凋谢,再到价值的评估量化全链路建设体系化的资产治理保障。

具体到细分的技术能力上,咱们将这部分能力分为四个域,包含开发能力、管控能力、服务能力和经营能力,咱们一一对其开展论述:

  • 数据资产开发能力域
    企业针对数据资产的开发不仅包含数据的采集、存储、加工,也包含剖析、建模、数字产品;而数据资产开发的治理指标则是蕴含了对这些方面的接入、协同、管控的全流程治理。数据开发团队须要把握对多模数据源的对接,脚本开发、测试执行、作业调度、ETL 配置等根底能力,可联合业务语义剖析提供罕用语法、罕用关联等智能举荐,联合标签画像、指标体系等能力,疾速买通数据开发畛域的各种问题。
  • 数据资产管控能力域
    咱们晓得将生产资料转化为产品时,最重要的就是品质保障,而数据管控就是对数据产品的各个治理畛域的性能组合,须要为数据订立架构与标准,建设数据品质的管理机制继续监管及解决品质问题,同时建立起数据共享与爱护的意识。企业数据管理团队须要构建数据规范模块以定义标准,通过落标查看来监督标准的执行;通过数据品质模块来定义质量检查规定并执行,统计和剖析品质后果,提出问题并处理解决;通过数据安全的分类分级对数据进行安全级别定义,构筑数据保护的根底;通过数据模型将规范落实到数据产品的设计工艺上;以元数据模块进行技术元数据的采集、数据加工血统门路的采集,实现差异性剖析、血统剖析、特征分析等;通过数据模型管理软件来对立治理企业外部的各种业务数据模型定义和落实模型校验,欠缺外部的数据管理要求。
  • 数据资产服务能力域
    产品生产进去了,并且成为了品质过硬的好产品,这时最须要的是将产品销售进来,投入到替换、应用的环节中,而数据资产服务能力域就是对数据的替换、共享、利用输入等服务能力的综合治理,须要将标签画像、指标体系、自助剖析、建模预测等业务模式,通过人 - 机的联机查问拜访、机 - 机的零碎调用接口、平台外部实验区数据验证等不同接口模式注册为服务,以对立治理的形式对服务进行注册、公布、监控、停用的治理,同时,可利用常识图谱等模式对应用状况、业务模型进行常识演绎和共享,并将安全等级定义落实到数据的共享治理中,确保权限的正确调配、实现确权和审计要求。平台须要提供数据商城模块实现数据集的注册、公布,并实现 API 拜访、下载等接口的凋谢。数据的共享流转流程成熟后,再对服务层进一步优化常识共享、平台衍化、数据重组等。
  • 数据资产经营能力域
    既然企业已将数据因素定位为重要资产之一,那数据资产经营将会像企业经营一样重要。数据资产经营以数据资产治理为主线将数据资产开发、管控、服务三大能力域串联起来,形象出最根本的引入、上架、经营、下架四个阶段对数据资产进行治理。平台须要提供基于元数据的数据集类资产引入、逻辑资产编目模组、对其余类型数据资产的治理和注册等能力。数据管理人员可通过资产导览的形式或全局搜寻的形式查找心愿援用的资产,买通资产到数据商城的关联,将来将通过数据需要,能够连通数据的开发、管控、服务的各治理接入点,通过智能化的资产打标、评估算法等性能以晋升管理效率。

通过四个能力域的性能模组的不断完善,帮忙企业造就起从个别职员到决策者都能基于数字化能力实现企业日常经营的思维模式,只有数据的应用便当、数据的内容详实,数据的论断精确、数据的利用全面,能力将改革成为习惯,这才是企业数字化转型胜利的外围必要条件。

— 小结—
本篇从数据平台建设和团队能力建设两方面,分析了数据资产化建设所需的根底功能性能力和数据团队应具备的技术能力、思维模式等软实力。实现了数据资产化治理,曾经实现了数字化转型的根底布局,那么如何实现数据共享与剖析?如何实现数据产品对内的业务经营和对外的价值发明?下一篇为你揭秘。

退出移动版