共计 716 个字符,预计需要花费 2 分钟才能阅读完成。
一、概念上的不同
数据库,简而言之,能够把它看作电子化的文件柜,用来存储电子文件的中央,用户能够对文件中的数据进行新增、截取、更新、删除等操作。
数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据反对的策略汇合。它是单个数据存储,出于剖析性报告和决策反对目标而创立。业务流程改良、监督工夫、老本、品质以及管制。
二、技术上的不同
1、风行的数据库:MySQL、Oracle、SqlServer 等
2、风行的数据仓库:Hive、Impala、Greenplum 等
三、贮存内容上的不同
数据库贮存在线交易数据,而数据仓库次要贮存历史数据。
四、性能上的不同
数据库次要用于捕捉数据,数据仓库次要用于剖析数据。
数据库属于操作型零碎,数据仓库属于剖析性零碎。操作性零碎(数据库)的用户群体是大量客户,每次操作批改的数据量十分小,对工夫敏感度十分高。剖析性零碎(数据仓库)的用户是决策人员,他们不批改数据然而会剖析大量数据,而且他们对得出后果的工夫不敏感。
打个比方。
微博每天有上千万用户在发微博、批改个人资料,每个人都只批改属于本人的那几条数据,同时心愿批改后立即能够用。而为数不多的决策者心愿通过微博进行开掘,他们不可能批改用户数据,然而他们会拜访大量数据。最初他们对工夫不敏感,等到一个后果跑 5 分钟到 1 小时都能够的。
数据库与数据仓库虽有区别,但二者的关系是相辅相成、密不可分的。
数据仓库的实质依然是数据库,只是为了 BI 建设和剖析的目标在底层表与表的关系建模设计上和传统基于业务零碎的数据库建模设计上有很大的差别。传统数据库多增删改,数据仓库多查问剖析。传统数据库服务于业务流程,通过业务软件来拜访;数据仓库服务于 BI 剖析,通过 BI 剖析软件来拜访。