关于数据存储:数据湖已成为海量数据存储与分析的重要承载方式

45次阅读

共计 1024 个字符,预计需要花费 3 分钟才能阅读完成。

简介: 在云计算和大数据时代,基于数据发展生产、经营、决策成为常态,依据 Gartner 报道,2019 年数据基建方面的洽购费用飙升到 660 亿美元,占据基础架构类软件费用的 24%。数据的存储及利用体系是企业生态运行的中枢神经,数据湖曾经成为海量数据存储与剖析的重要承载形式。

在汹涌而至的信息化浪潮下,大数据技术不断更新迭代,数据管理工具失去飞速发展,相干概念也随之而生。数据湖(Data Lake)概念自 2011 年被推出后,其概念定位、架构设计和相干技术都失去了飞速发展和泛滥实际,数据湖也从繁多数据存储池概念演进为撑持高效、平安、稳固企业级数据利用的下一代根底数据平台。

此次公布的《数据湖利用实际白皮书》涵盖了数据湖的定义与架构、数据湖外围组件与计划介绍、数据湖构建计划、利用实际等内容,心愿为用户提供新的洞察。

通过浏览本书,包含开发者、IT 运维人员、企业数字化管理者等能够全面理解阿里云基于云原生技术的企业级数据湖解决方案和相干产品,也能清晰传统数据仓库和数据湖的差别。

在云计算和大数据时代,基于数据发展生产、经营、决策成为常态,依据 Gartner 报道,2019 年数据基建方面的洽购费用飙升到 660 亿美元,占据基础架构类软件费用的 24%。数据的存储及利用体系是企业生态运行的中枢神经,数据湖曾经成为海量数据存储与剖析的重要承载形式。

市场调研机构 Research and Markets 公布的报告显示,2020 年,寰球数据湖市场的价值为 37.4 亿美元,预计到 2026 年将达到 176 亿美元,在 2021 年至 2026 年的预测期间的复合年增长率为 29.9%。

云原生时代的到来,引领数据湖进入了“云湖共生”新的阶段。在此背景下,阿里云推出基于云原生技术的企业级数据湖解决方案,该计划采纳了存储计算拆散架构,存储层基于阿里云对象存储 OSS 构建,并与阿里云数据湖剖析 (Data Lake Analytics 简称 DLA)、数据湖构建(Data Lake Formation 简称 DLF)、E-MapReduce(简称 EMR)、DataWorks(简称 DW) 等计算引擎无缝对接,且兼容丰盛的开源计算引擎生态。

十年形迹十年心,联合先进的数据迷信与机器学习技术,数据湖还能为企业提供预测剖析,帮忙企业构建、优化训练模型等。心愿这本白皮书能够为企业和组织的数字化转型实际提供指引,为相干畛域的业务决策者与实践者提供面向行业利用场景的重要参考。

原文链接
本文为阿里云原创内容,未经容许不得转载。

正文完
 0