关于数据仓库:数仓建模建模工具PdMan

8次阅读

共计 2572 个字符,预计需要花费 7 分钟才能阅读完成。

数据仓库系列文章 (继续更新)

  1. 数仓架构发展史
  2. 数仓建模方法论
  3. 数仓建模分层实践
  4. 数仓建模—宽表的设计
  5. 数仓建模—指标体系
  6. 数据仓库之拉链表
  7. 数仓—数据集成
  8. 数仓—数据集市
  9. 数仓—商业智能零碎
  10. 数仓—埋点设计与治理
  11. 数仓—ID Mapping
  12. 数仓—OneID
  13. 数仓—AARRR 海盗模型
  14. 数仓—总线矩阵
  15. 数仓—数据安全
  16. 数仓—数据品质
  17. 数仓—数仓建模和业务建模

工欲善其事,必先利其器,所以开始数仓建模之前咱们还是要抉择一个适合的建模工具,江湖上混怎么能没有一个嘹亮的名号和趁手的武器呢,PDMan 就是咱们要介绍的工具。前面咱们还会介绍其余建模工具,你抉择一个适合的就行。

PDMan 是一款开源收费的数据库模型建模工具,反对 Windows,Mac,Linux 等操作系统,是 PowerDesigner 之外,更好的收费的代替计划。他具备颜值高,应用简略的特点。蕴含数据库建模,灵便主动的主动生成代码模板,主动生成文档等多种开发人员实用的性能。

PDMan 已全面降级至 CHINER

开始之前咱们开始先介绍一下这个工具自身,前面再看怎么应用它以及它的个性, 其实 CHINER 就是 PDMan 的降级版本,咱们能够先看一下界面

这是 PDMan 的项目管理界面,咱们看到也是分项目管理的,能够抉择关上已有的我的项目

我的项目关上后的界面,其实性能还是比较简单的,次要就是模型的设计,蕴含两块

  1. 表设计
  2. 关系设计

名称由来

  1. 第一个(公开发行名称):PDMan: Physical Data Model Manager(物理模型治理)
  2. 第二个(外部应用名称):SINOPER: SINO Popular Entity Relation(中国最风行的实体关系图工具),目前该软件发行版,底层很多代码为该词前缀。
  3. 第三个(公开发行名称):CHINER: CHINESE Entity Relation(国产实体关系图工具),为不便国内遍及,中文名称为: 元数建模 ,也作:”CHINER[元数建模]“ 公开应用。

CHINER 的特点

  1. 体系结构从新设计,构造颠覆,然而对原 PDMan 做到高度兼容。
  2. 精密的界面布局及操作优化,更好看,更简略,更好用。
  3. 减少实用新性能 (如导入 PowerDesigner 等),性能更弱小,生态兼容性更好。

性能介绍

因为 CHINER 是 PDMan 的降级版本,所以咱们这里间接介绍 CHINER

自带入门参考案例

首页自带两个典型参考案例,不便用户疾速理解软件反对的性能以及个性。

治理对象

数据表及字段

提供简洁直观的数据表以及字段治理及操作,左侧列表反对拖动排序,数据表更多设置反对减少表备注,扩大属性列表,例如提供对 Hive 的反对,如下图:

多表关联的视图

视图由多个表联合而成,反对多表以及字段的抉择,如下图:

视图及起源数据表,如下图:

可定制的数据类型及数据域

可扩大的数据类型,并且反对多种数据库方言的适配 ,如下图:

这个次要是解决拓展性的,也就是咱们能够依据扩大不同的数据库进来

数据域,用于设置同一类具备特定业务含意的数据类型 ,其实这个是很重要的,咱们在做数仓建模的过程中是须要对立字段命名和字段类型,如下图:

数据规范(字段库)

规范字段库用于解决常用字段记录,不便用户建设数据表时,可能从常用字段库里间接拖入数据表中。规范字段库能够用户自行添加,也能够从现有数据表中移到规范字段库中,其实这个是很重要的,咱们在做数仓建模的过程中是须要对立字段命名和字段类型

如下图所示:

规范字段库反对导出 JSON 文件,也反对从 JSON 文件中导入,以解决共享交换问题。

数据字典(代码映射表)

减少了数据字典反对,用于解决对字段元数据更清晰的解析论述,如下图:

数据表字段能够间接关联数据字典,如下图所示:

我的项目组织模式 (多模块模式以及不分模块模式)

简略我的项目,不须要分模块,间接分为数据表,视图,关系图,数据字典即可,简单我的项目须要折分为一个一个独立的模块,系统对这两种模式均给予反对。简略模式,如下图:

分模块模式,如下图:

### 关系图

其实以后版本的关系图的可视化相比 PDMan 就难看很多了,而且还反对了折线

ER 关联关系图

数据实体关联关系图,该关联关系图须要人工手动保护,如下图所示:

简略的概念模型图

反对简略的概念模型图,概念模型图实体只保留在关系图上,不放弃实体对象,如下图所示:

概念模型图,次要用于疾速勾画零碎的要害业务对象关系图,用于疾速整体了解数据模型

同一模块多张关系图

同一个模块,能够反对多张多种形式的关系图:

画布设计界面

分组框及以备注框

分组框,用于对数据表或者实体进行分类,可能更清晰的理解数据表的层次结构,如下图:

文字以及背景色彩设置

备注框,为一般矩形框,用于对数据表或者业务场景进行解释阐明,如下图:

代码模板

不同数据库方言的 DDL

通过代码模板引擎,实现可扩大的数据库方言反对,如下图:

MySQL

ORACLE

SQLServer

扩大属性反对相似 Hive

JavaBean 代码生成

可定制化可编辑的代码模板引擎

代码模板引擎基于 doT.js 构建,如下图:

提供代码预览编辑,以便可能及时预览代码模板的成果,如下图:

生态对接 - 导入

数据库逆向

连贯数据库,逆向解析数据库,反对数据库中文正文的解析。连贯数据库,如下图:

解析数据列表清单,如下图:

解析数据表后果,如下图:

导入 PDMan 文件

反对 PDMan 的导入,反对数据表,关系图,数据域的高度还原。导入列表抉择,如下图:

导入后后果,如下图:

PDMan 原始状况,如下图:

导入 PowerDesigner 文件

导入 PowerDesigner,反对数据表,数据域的高度还原(不反对关系图还原),如下图:

数据表抉择,如下图:

最终导入后后果,如下图:

生态对接 - 导出

导出 DDL

导出 DDL,用于解决一次性导出指定数据表,针对指定数据库方言的导出,如下图:

导出 WORD 文档及模板可定制

将以后数据表,关系图,数据字典导出至 WORD 文档,如下图:

导出后果,如下图:

关系图导出图片

实现将以后画布的关系图,导出为 PNG 图片。

全局搜寻及定位

字段及关键字,数据字典等的全局搜寻,如下图:

更多个性

多语言

中文,如下图:

英文,如下图:

语言设置,如下图:

新建表默认初始化字段

表编辑一次性设置多个数据域

总结

  1. PDMan(CHINER) 是一款优良的国产开源软件,能满足咱们在建模过程中 80% 的需要;
  2. PDMan 自身上手简略,学习成本低;
  3. 下一节咱们从头开始应用 PDMan 设计一个模型;
正文完
 0