共计 1510 个字符,预计需要花费 4 分钟才能阅读完成。
数据仓库 (DW) 是从多个起源收集和治理数据的过程,目标是使企业具备有价值的业务洞察力。数据仓库最罕用于集成和剖析来自不同起源的公司数据。数据仓库是为数据处理和报告而设计的 BI 零碎的外围。
许多公司正在将他们的数据仓库转移到云端,因为本地数据仓库容易呈现存储容量不灵便、技术问题以及因为硬件保护需要而导致的低廉经营费用。
云数据仓库是在公共云上运行的托管数据库,用于剖析、可扩展性和易用性。
应用基于云的数据仓库已成为常态,企业当初能够拜访简直有限的计算能力和存储空间。
1、为什么应用云数据仓库
基于云的数据仓库使商业智能团队可能通过改良的拜访、可扩展性和速度提供更快、更好的洞察力,使他们可能专一于经营业务,而不是治理大量的计算机。
1)平安
传统上,本地数据仓库被认为比云数据仓库更平安。然而,企业当初意识到云数据更平安且保护老本更低。
云数据不会散布在多个服务器上。因而,云平安专家能够创立和迭代准确的数据保护措施。此外,多因素认证等云加密技术使区域和资源之间的数据传输十分平安。最初,大多数云数据仓库都包含虚构专用网络 (VPN),这进一步限度了数据泄露的危险。
2)数据拜访
通过将数据存储在云上,企业能够为分析师提供来自各种起源的实时数据,使他们可能更快地进行最佳的剖析成果。
3)可扩展性
扩大云数据仓库比扩大本地零碎更快且老本更低,因为它不须要企业购买新硬件(并且可能会供给过多或有余),并且能够依据须要主动实现。
4)性能
与典型的本地数据仓库相比,在云数据仓库中能够更快地执行查问,从而降低成本。
5)老本
随着公司数据收集的增长,本地数据仓库变得更加低廉。扩大业务智能程序会大大增加费用,因为本地计算和存储不能独自获取。
另一方面,数据仓库团队能够应用云数据仓库购买他们须要的计算能力和存储空间。此外,云数据仓库不须要网络、服务器机房或任何其余基础设施。
2、云数据仓库的能力
每个大型公共云提供商都有本人的云数据仓库版本:BigQuery 由 Google 提供,Redshift 由 Amazon 提供,Azure SQL 数据仓库由 Microsoft 提供。
例如,Snowflake 有一个云选项,它通过在公共云上运行但独立保护的服务提供雷同的性能。云供应商或数据仓库提供商为这些服务中的每一项提供以下开箱即用的性能:
- 数据管理和存储:数据保留在基于云的文件系统中
- 这个世界上没有“版本”或“软件更新”之类的货色
- 容量治理:扩大(或膨胀)企业的数据脚印很简略
3、抉择云数据仓库服务的因素
1)体系结构
云数据仓库设计分为两组。许多传统的部署架构都是基于集群的,例如 Amazon Redshift 和 Azure SQL 数据仓库。集群云数据仓库通常是集群化的 Postgres 衍生产品,通过调整后能够作为云服务运行。
另一种无服务器设计是最近才呈现的。Google BigQuery 和 Snowflake 就是很好的例子。相比之下,无服务器云数据仓库使数据库集群“不可见”或在多个客户之间共享。每种架构都有其长处和毛病。
2)云定价
在每种状况下,企业都须要依据其保留的数据量领取肯定的费用。然而,计算的定价是不同的。
例如,Google BigQuery 和 Snowflake 依据扫描的数据量或耗费的计算工夫提供按需定价。Amazon Redshift 和 Azure SQL 数据仓库都依据集群中节点的数量或类型对资源免费。
两种定价策略各有利弊。按需模型只对企业应用的内容免费,这样的形式使估算存在问题,因为无奈预测用户数量以及他们将执行的查问的数量。
4、总结
云数据仓库是游戏规则的扭转者,也是数据仓库的标志性事件。如果应用切当,云数据仓库可能会大大降低企业的经营费用,并使得企业随时掌握业务需要。