关于大数据:Data-Vault-20方法论简介

3次阅读

共计 753 个字符,预计需要花费 2 分钟才能阅读完成。

Data Vault 2.0 方法论

Data Vault 2.0规范为我的项目执行提供了一个 最佳实际 ,称为“Data Vault 2.0 方法论”。它来源于外围软件工程规范,并对这些规范进行了调整,以用于数据仓库。图 3.1 显示了影响Data Vault 2.0 方法论 的规范。

图 3.1 Data Vault 2.0 方法论的规范

通过联合这些规范,Data Vault 2.0 方法论 成为 数据仓库 中项目管理的最佳规范。Scrum用于团队合作,并利用于我的项目的日常工作。在两到三周的 Scrum 迭 代(sprint 冲刺)中,团队执行一个基于 软件开发生命周期 (SDLC) 的小型瀑布。指标是在此迭代之后实现可交付的内容,这些内容能够投入到生产中。

PMI 项目管理常识体系 (PMBOK) 是项目管理业余人员 (PMP) 认可的项目管理技术,用于定义和执行我的项目的物理层面的我的项目打算。能力成熟度模型集成 (CMMI) 用于全面治理和我的项目监督,并利用于评审和改良会议。

在闭环办法中应用 全面品质治理 (TQM) 对流程和根底数据进行继续改良。当业务用户波及到调整跨源的数据集和纠正源零碎中的谬误时,他们会遵循咱们将在后续文章探讨的 TQM 准则,这须要比只关注数据品质 (DQ) 的罕用办法更多的流动。

六西格玛 规定和准则的利用是为了在构建和施行 Data Vault 2.0 格调的 数据仓库 打算的过程中实现敏捷性的最大优化。这个过程依赖于测量(预计 vs 理论),或者要害性能指标(kpi),在后续文章中介绍。

Data Vault 2.0方法论包含三种次要的流动,在这些流动中利用了图 3.1 所示的办法:

  1. 我的项目打算,包含对我的项目的治理、定义和评估;
  2. 我的项目执行,包含 sprint 定义、团队组织和工件组织的技术编号;
  3. 评审和改良,包含评审和改良流动。

后续文章再详细描述了这些流动和办法的利用。

正文完
 0