共计 983 个字符,预计需要花费 3 分钟才能阅读完成。
简介: 本书从技术根底介绍到场景利用实际,帮忙读者入门数据湖 Lakehouse 以及局部 spark 相干利用。
家喻户晓,Databricks 主导着开源大数据社区 Apache Spark、Delta Lake 以及 ML Flow 等泛滥热门技术,而 Delta Lake 作为数据湖外围存储引擎计划给企业带来诸多的劣势。
本书从技术根底介绍到场景利用实际,帮忙读者入门数据湖 Lakehouse 以及局部 spark 相干利用。
根底篇
从大数据平台架构的演进、Delta Lake 要害个性、实现原理,以及数据仓库、数据湖的优劣势,湖仓一体架构的利用等多方面解析 Lakehouse 架构和 Delta Lake 的利用劣势。并介绍社区版 Delta Lake 的外围个性,Lakehouse 搜索引擎的设计思维,探讨其如何达到优越的解决性能。
利用篇
针对流批一体数据仓库,实时数据入湖和剖析,零售业需求预测,营销成果归因剖析,机器学习模型训练和部署等场景实际,具体解说如何将 Delta Lake、spark、MLflow 利用到理论应用场景,产生业务价值。
点击收费下载
《Databricks 数据洞察:从入门到实际》
精彩领先看:
根底篇
1、Databricks 数据洞察——企业级全托管 Spark 大数据分析平台
2、Delta Lake 的演进历程和现状劣势
3、深度解析数据湖存储计划 Lakehouse 架构
4、Delta Lake 数据湖根底介绍(开源版)
5、Delta Lake 数据湖根底介绍(商业版)
利用篇
6、如何应用 Delta Lake 构建批流一体数据仓库
7、应用 DDI+Confluent 进行实时数据采集入湖和剖析
8、应用 Databricks 进行零售业需求预测的利用实际
9、应用 Databricks 进行营销成果归因剖析的利用实际
10、应用 Databricks 和 MLflow 进行机器学习模型训练和部署的利用实际
产品技术咨询
https://survey.aliyun.com/apps/zhiliao/VArMPrZOR
退出技术交换群
版权申明: 本文内容由阿里云实名注册用户自发奉献,版权归原作者所有,阿里云开发者社区不领有其著作权,亦不承当相应法律责任。具体规定请查看《阿里云开发者社区用户服务协定》和《阿里云开发者社区知识产权爱护指引》。如果您发现本社区中有涉嫌剽窃的内容,填写侵权投诉表单进行举报,一经查实,本社区将立即删除涉嫌侵权内容。