关于大数据:大数据内容摘要

44次阅读

共计 389 个字符,预计需要花费 1 分钟才能阅读完成。

1、数据仓库始于 20 世纪 80 年代中期。由数据仓库之父 W.H Inmon 在 1991 年出版的“Building the Data Warehouse”(《数据仓库》)一书中提出了精确而又宽泛被大家承受的定义。数仓是面向主题的、集成的、绝对稳固的、随工夫变动的用于反对管理决策的数据汇合。
维度建模的一些基础知识,次要包含事实表、维度表、切片、钻取等
事实表是指其中保留了大量业务度量数据的表,是数仓最外围的表。
维度表是用户来剖析数据的窗口,比方工夫、地区、用户等。
粒度是指数据仓库的数据单位中,保留数据的细化水平的级别。
切片:从多维数组中选定一个二维子集,切出一个“立体”。
切块:从多维数组中选定一个三维子集,切出一个“立方体”。
旋转:扭转一个报告(页面)显示的维方向。
依据维档次,扭转数据分析的粒度,就是钻取剖析,次要包含上钻(也叫上卷)和下钻。其实 Excel 中的数据透视就是各种上卷和下钻。

正文完
 0