共计 930 个字符,预计需要花费 3 分钟才能阅读完成。
当业务体量到了肯定水平,业务模型有了肯定的稳定度,数据模型的构建就显得尤为重要。数据模型是保证数据口径对立、晋升数据品质的外围,是后续疾速高效迭代反对更简单数据利用场景的基石。
那么,应该如何构建数据模型呢?
01 确定模型主题
业务由很多场景组合而成,数据模型的构建需依据业务场景进行主题分类,所以如何确定主题分类呢,可参考如下几个准则:
每个主题都是最底层的原始主题,即衍生的指标都是基于这些主题域的数据计算得来的;
企业经营的业务组成模块可作为参考;
主题之间有肯定的穿插连接关联,然而呢,又需各领风骚,各自独立;
主题之间有附丽关系,有些主题是基于更根底的主题衍生得来的。
02 基于确定的主题,梳理需要
需要梳理是外围,做好需要的梳理是很要害的,要做到以下几点:
曾经产生的数据需要场景需全副囊括,记住是全副哦
将来可能会有哪些场景产生呢,亦需囊括。
那咱们如何能够做好呢?能够参考以下几种做法:
罕用报表,整顿曾经产生过的所有报表需要;
长期数据,整顿曾经产生过的所有长期需要;
SOP 流程,SOP 流程是梳理需要的灵魂,把握这个,是所有工作的外围,但如何把这个利用好呢,有个小技巧,把流程中每个环节可能须要看数据的度量值、维度全都穷举进去。
基于以上三步,整顿出全副须要看数据的场景,再进行残缺的系统性的梳理。
03 数据计算规定
这个环节是最最最须要仔细和急躁的,一旦谬误,整个数据模型就大打折扣
要做好,有几个难点须要特地留神:
杂:业务零碎简单多源,比方有营销零碎、库存零碎、结算零碎等等;
多:数据起源表很多很多;
像:同一个指标,如损耗,在 A 零碎和 B 零碎都有,听起来貌似都是咱们要的,那咱们到底应该用哪个呢?他们有何不同?
04 数据验证
数据品质是数据利用的外围根底,数据验证是十分重要的一环,若品质把控不够严格,后续所有的行为都可能有偏差甚至谬误,所以做好数据验证很要害。
下面介绍了数据模型的构建思路,那么咱们要怎么落地呢?其实当初有的 BI 产品就曾经能够构建数据模型了,并不需要依赖数据仓库。例如由广州思迈特软件推出的 Smartbi V10 就集成了数据模型性能,它使剖析人员具备数据再加工的能力,自在调配“数据原料”,并由里及外,以点带面,极大晋升了数据分析的灵活性,像艺术创作一样自在剖析。