共计 2572 个字符,预计需要花费 7 分钟才能阅读完成。
数据仓库系列文章 (继续更新)
- 数仓架构发展史
- 数仓建模方法论
- 数仓建模分层实践
- 数仓建模—宽表的设计
- 数仓建模—指标体系
- 数据仓库之拉链表
- 数仓—数据集成
- 数仓—数据集市
- 数仓—商业智能零碎
- 数仓—埋点设计与治理
- 数仓—ID Mapping
- 数仓—OneID
- 数仓—AARRR 海盗模型
- 数仓—总线矩阵
- 数仓—数据安全
- 数仓—数据品质
- 数仓—数仓建模和业务建模
工欲善其事,必先利其器,所以开始数仓建模之前咱们还是要抉择一个适合的建模工具,江湖上混怎么能没有一个嘹亮的名号和趁手的武器呢,PDMan 就是咱们要介绍的工具。前面咱们还会介绍其余建模工具,你抉择一个适合的就行。
PDMan 是一款开源收费的数据库模型建模工具,反对 Windows,Mac,Linux 等操作系统,是 PowerDesigner 之外,更好的收费的代替计划。他具备颜值高,应用简略的特点。蕴含数据库建模,灵便主动的主动生成代码模板,主动生成文档等多种开发人员实用的性能。
PDMan 已全面降级至 CHINER
开始之前咱们开始先介绍一下这个工具自身,前面再看怎么应用它以及它的个性, 其实 CHINER 就是 PDMan 的降级版本,咱们能够先看一下界面
这是 PDMan 的项目管理界面,咱们看到也是分项目管理的,能够抉择关上已有的我的项目
我的项目关上后的界面,其实性能还是比较简单的,次要就是模型的设计,蕴含两块
- 表设计
- 关系设计
名称由来
- 第一个(公开发行名称):PDMan: Physical Data Model Manager(物理模型治理)
- 第二个(外部应用名称):SINOPER: SINO Popular Entity Relation(中国最风行的实体关系图工具),目前该软件发行版,底层很多代码为该词前缀。
- 第三个(公开发行名称):CHINER: CHINESE Entity Relation(国产实体关系图工具),为不便国内遍及,中文名称为: 元数建模 ,也作:”CHINER[元数建模]“ 公开应用。
CHINER 的特点
- 体系结构从新设计,构造颠覆,然而对原 PDMan 做到高度兼容。
- 精密的界面布局及操作优化,更好看,更简略,更好用。
- 减少实用新性能 (如导入 PowerDesigner 等),性能更弱小,生态兼容性更好。
性能介绍
因为 CHINER 是 PDMan 的降级版本,所以咱们这里间接介绍 CHINER
自带入门参考案例
首页自带两个典型参考案例,不便用户疾速理解软件反对的性能以及个性。
治理对象
数据表及字段
提供简洁直观的数据表以及字段治理及操作,左侧列表反对拖动排序,数据表更多设置反对减少表备注,扩大属性列表,例如提供对 Hive 的反对,如下图:
多表关联的视图
视图由多个表联合而成,反对多表以及字段的抉择,如下图:
视图及起源数据表,如下图:
可定制的数据类型及数据域
可扩大的数据类型,并且反对多种数据库方言的适配 ,如下图:
这个次要是解决拓展性的,也就是咱们能够依据扩大不同的数据库进来
数据域,用于设置同一类具备特定业务含意的数据类型 ,其实这个是很重要的,咱们在做数仓建模的过程中是须要对立字段命名和字段类型,如下图:
数据规范(字段库)
规范字段库用于解决常用字段记录,不便用户建设数据表时,可能从常用字段库里间接拖入数据表中。规范字段库能够用户自行添加,也能够从现有数据表中移到规范字段库中,其实这个是很重要的,咱们在做数仓建模的过程中是须要对立字段命名和字段类型
如下图所示:
规范字段库反对导出 JSON 文件,也反对从 JSON 文件中导入,以解决共享交换问题。
数据字典(代码映射表)
减少了数据字典反对,用于解决对字段元数据更清晰的解析论述,如下图:
数据表字段能够间接关联数据字典,如下图所示:
我的项目组织模式 (多模块模式以及不分模块模式)
简略我的项目,不须要分模块,间接分为数据表,视图,关系图,数据字典即可,简单我的项目须要折分为一个一个独立的模块,系统对这两种模式均给予反对。简略模式,如下图:
分模块模式,如下图:
### 关系图
其实以后版本的关系图的可视化相比 PDMan 就难看很多了,而且还反对了折线
ER 关联关系图
数据实体关联关系图,该关联关系图须要人工手动保护,如下图所示:
简略的概念模型图
反对简略的概念模型图,概念模型图实体只保留在关系图上,不放弃实体对象,如下图所示:
概念模型图,次要用于疾速勾画零碎的要害业务对象关系图,用于疾速整体了解数据模型 。
同一模块多张关系图
同一个模块,能够反对多张多种形式的关系图:
画布设计界面
分组框及以备注框
分组框,用于对数据表或者实体进行分类,可能更清晰的理解数据表的层次结构,如下图:
文字以及背景色彩设置
备注框,为一般矩形框,用于对数据表或者业务场景进行解释阐明,如下图:
代码模板
不同数据库方言的 DDL
通过代码模板引擎,实现可扩大的数据库方言反对,如下图:
MySQL
ORACLE
SQLServer
扩大属性反对相似 Hive
JavaBean 代码生成
可定制化可编辑的代码模板引擎
代码模板引擎基于 doT.js 构建,如下图:
提供代码预览编辑,以便可能及时预览代码模板的成果,如下图:
生态对接 - 导入
数据库逆向
连贯数据库,逆向解析数据库,反对数据库中文正文的解析。连贯数据库,如下图:
解析数据列表清单,如下图:
解析数据表后果,如下图:
导入 PDMan 文件
反对 PDMan 的导入,反对数据表,关系图,数据域的高度还原。导入列表抉择,如下图:
导入后后果,如下图:
PDMan 原始状况,如下图:
导入 PowerDesigner 文件
导入 PowerDesigner,反对数据表,数据域的高度还原(不反对关系图还原),如下图:
数据表抉择,如下图:
最终导入后后果,如下图:
生态对接 - 导出
导出 DDL
导出 DDL,用于解决一次性导出指定数据表,针对指定数据库方言的导出,如下图:
导出 WORD 文档及模板可定制
将以后数据表,关系图,数据字典导出至 WORD 文档,如下图:
导出后果,如下图:
关系图导出图片
实现将以后画布的关系图,导出为 PNG 图片。
全局搜寻及定位
字段及关键字,数据字典等的全局搜寻,如下图:
更多个性
多语言
中文,如下图:
英文,如下图:
语言设置,如下图:
新建表默认初始化字段
表编辑一次性设置多个数据域
总结
- PDMan(CHINER) 是一款优良的国产开源软件,能满足咱们在建模过程中 80% 的需要;
- PDMan 自身上手简略,学习成本低;
- 下一节咱们从头开始应用 PDMan 设计一个模型;