关于分析:多维分析的本质计算是什么能做什么又不能做什么

37次阅读

共计 1174 个字符,预计需要花费 3 分钟才能阅读完成。

多维分析次要面向业务用户提供数据查问剖析服务,因为业务人员不懂 SQL,也无奈实现多表关联(有意义的查问常常是基于多表的),所以在多维分析建模阶段须要将多表转换成单表,也就是 CUBE。这样用户就能够很不便地通过基于一个后果集(CUBE)进行拖拽查问,从不同的角度(维度)察看数据(测度)。

在多维分析中次要的计算就是依照某一个或一些维度汇总测度,如按地区汇总销售额,按年和产品汇总销量等。从运算角度来看,多维分析的实质计算就是:

基于一个表的分组汇总

如果用 SQL 来表白,多维分析的实质就是:

SELECT D,…, SUM(M), … FROM C WHERE D’=d’AND … GROUP BY D,…

即对数据立方体按某些维度分组汇总某些测度。其中 C 是数据立方体,D,…是选出维度,M,…是聚合测度,聚合函数也能够不是 SUM。D’是切片维度,切块时条件为 D IN (d,…),WHERE 中还能够减少针对某些测度的条件,个别也就是选出某个区间内的值。

针对一个后果集(CUBE),多维分析能够进行切片 / 切块、旋转、钻取 / 上卷等操作。

1. 切片
切片是指针对 CUBE,抉择维中固定值进行剖析,比方固定工夫维度剖析地区和产品的销量状况。

2. 旋转
旋转也称行列变换,是指维度从行到列或者从列到行,旋转是为了满足用户察看数据的不同习惯。

3. 钻取
钻取是从粗粒度到细粒度察看数据的过程,比方咱们发现某个汇总值出现异常,就能够通过钻取查看明细数据,找到异样起因。钻取能够从汇总到明细,从下级到上级…

从多维分析的实质及其操作来看,多维分析只能实现简略的分组汇总、过滤计算,这在理论业务中还远远不够。常见的固定报表业务,一些报表很难通过简略的分组聚合来实现,常常要编写上千行的 SQL 或存储过程,而且固定报表的表格款式可能很简单,这些都是多维分析无奈实现的。

这种报表数据处理逻辑简单,每个格子可能对应不同的数据起源,计算逻辑也不一样,在款式方面则会呈现表头凌乱,大格套小格,动静区域和动态区域混合的状况。

这里列举了简单报表的特点:传说中的中国简单报表都长什么样?有什么特点?这些类型的报表都无奈通过多维分析拖拽进去。

事实上,固定报表和自助报表(多维分析)面向的需要场景很不一样,而在 BI 零碎中往往会蕴含三局部内容,固定报表、多维分析和可视化,其中可视化能够由前两局部实现,但固定报表和多维分析往往是不可或缺的,二者相互配合,优势互补。认清了多维分析的能量圈,能力在 BI 零碎建设中对症下药,防止踩坑。

对多维分析和 BI 技术感兴趣的同学还能够搜寻“乾学院”,下面有整套的收费“商业智能”技术课程, 或者间接拜访上面链接:
http://www.raqsoft.com.cn/wx/course-Business-Intelligence.html

[](http://www.raqsoft.com.cn/wx/…

正文完
 0