关于数据建模:数据仓库之三大事实表

34次阅读

共计 1203 个字符,预计需要花费 4 分钟才能阅读完成。

前言

事实表次要分为事务事实表与周期快照事实表,累计快照事实表。然而它们在形容业务事实方面是有着十分大的差别的。

1. 事务事实表(Transaction fact table)

保留的是最原子的数据,也称“ 原子事实表 ”。事务事实表中的数据在事务事件产生后产生,数据的粒度通常是每个事务一条记录。一旦事务被提交,事实表数据被插入,数据就不再进行更改,其更新形式为增量更新。

事务事实表的日期维度记录的是事实产生日期,它记录的事实是事务流动的内容。用户能够通过事务事实表对事务行为进行特地具体的剖析。

通过事务事实表,还能够建设汇集事实表,为用户提供高性能的剖析。

举例:

比方,地产行业外面的排卡,订购,签约,回款这些都是一个特定的业务动作。蕴含有具体业务的产生工夫,以及业务产生时的相干渠道,组织,人力,产品以及客户。这样在 kimball 外面咱们对维度进行抽离不落入事实表外面。这个造成了一个典型的 star 模型。两头的事实表就是一个交易事实表也称为事务事实记录表。

2. 周期快照事实表(Periodic snapshot fact table)

周期快照事实表以具备规律性的,可预感的工夫距离来记录事实,工夫距离如每天,每月,每年等等。 典型的例子如销售日快照表,库存日快照表等。

周期快照事实表的粒度是每个时间段一条记录,通常比事务事实表的粒度要粗,是在事务事实表之上建设的汇集表。周期快照事实表的维度个数比事务事实表要少,然而记录的事实要比事务事实表多。

周期快照事实表的日期维度通常是记录时间段的终止日,记录的事实是这个时间段内一些汇集事实值。事实表的数据一旦插入即不能更改,其更新形式为增量更新。

举例:

如生产制作企业外面的产品仓库存储。某工厂每天生产的 plm 件都会进行寰球发货。仓库每天会定时进行数据快照,用以统计目前仓库的货物存量记录。该类表可称之为周期快照事实表,次要标记事务在固定周期的变动。工夫为数据快照周期。

3. 累计快照事实表(Accumulating snapshpt fact table)

累计快照事实表和周期快照事实表有些相似之处,它们存储的都是事务数据的快照信息。然而它们之间也有着很大的不同, 周期快照事实表记录的确定的周期数据。而累计快照事实表记录的不确定的周期数据

累计快照事实表代表的是齐全笼罩一个事务或产品的生命周期的时间跨度,它通常具备多个日期字段,用来记录整个生命周期中的要害工夫点。另外,它还会有一个用于批示最初更新工夫的附加日期字段。因为事实表中许多日期在首次加载时是不晓得的,所以必须应用代理关键字来解决未定义的日期,而且这类事实表在数据加载完后,是能够对它进行更新的,来补充随后晓得的日期信息。

举例:

电商类网购,在客户实现购物业务动作之后会产生一条订购单,同时也会生成一条快递跟踪信息。快递动静跟踪信息表记录的模式就是累计快照事实表。次要记录事务在次要里程碑节点的状态变动,用于事务的全生命周期治理。

正文完
 0