关于数据仓库:数据分析师必备的数据仓库相关知识Smartbi

8次阅读

共计 1052 个字符,预计需要花费 3 分钟才能阅读完成。

一、数据仓库是什么?

数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据反对的策略汇合。它是单个数据存储,出于剖析性报告和决策反对目标而创立。为须要业务智能的企业,提供领导业务流程改良、监督工夫、老本、品质以及管制。

二、数据仓库有哪些特点?

1、效率高

数据仓库的剖析数据个别分为日、周、月、季、年等,能够看出,日为周期的数据要求的效率最高,要求 24 小时甚至 12 小时内,客户能看到昨天的数据分析。

2、扩展性

之所以有的大型数据仓库零碎架构设计简单,是因为思考到了将来 3 - 5 年的扩展性,这样的话,将来不必太快花钱去重建数据仓库零碎,就能很稳固运行。次要体现在数据建模的合理性,数据仓库计划中多出一些中间层,使海量数据流有足够的缓冲,不至于数据量大很多,就运行不起来了。

3、面向主题

操作型数据库的数据组织面向事务处理工作,各个业务零碎之间各自拆散,而数据仓库中的数据是依照肯定的主题域进行组织的。主题是与传统数据库的面向利用绝对应的,是一个抽象概念,是在较高层次上将企业信息系统中的数据综合、归类并进行剖析利用的形象。每一个主题对应一个宏观的剖析畛域。数据仓库排除对于决策无用的数据,提供特定主题的扼要视图。

4、集成性

面向事务处理的操作型数据库通常与某些特定的利用相干,数据库之间互相独立,并且往往是异构的。而数据仓库中的数据是在对原有扩散的数据库数据抽取、清理的根底上通过零碎加工、汇总和整顿失去的,必须打消源数据中的不一致性,以保障数据仓库内的信息是对于整个企业的统一的全局信息。

5、反映变动

操作型数据库次要关怀以后某一个时间段内的数据,而数据仓库中的数据通常蕴含历史信息,零碎记录了企业从过来某一时点(如开始利用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,能够对企业的倒退历程和将来趋势做出定量分析和预测。

三、数据仓库的一些常见意识误区

1、数据仓库的建设是一次性工程。数据仓库实际上须要每年、每月、每周甚至每日都要进行更新,不是说一次性录入了历史的数据就能够实现的工作。

2、数据仓库是一个很大的仓库。其实掂量一个数据仓库的品质如何,并不是用数据量来掂量的,有一些优质的数据仓库我的项目,数据量并不是很大。

3、只有数据仓库建设和应用了,问题就解决了。

4、聚焦于外部的档案型数据,而漠视了内部数据以及图象、音频和视频文件的潜在价值。

5、数据仓库是将所有的业务数据存在一起的。数据仓库的一个指标是将扩散的业务整合在一起的,但它往往是有目的地按剖析需去施行的,并不是将全副的业务数据通通都集成在一起。

正文完
 0