作者:韩信子@ShowMeAI
教程地址:http://www.showmeai.tech/tutorials/84
申明:版权所有,转载请分割平台与作者并注明出处

引言

本篇是ShowMeAI组织的「图解大数据处理与开发系列教程」入口,本教程以大数据技术为根基,给大家解说大数据开发与数据处理剖析的相干常识与技能,并配以相干的实战案例帮忙大家学习了解。

内容笼罩:Hadoop,Map-Reduce,Hive, HBase,Spark,流式数据处理,Spark Streaming,大数据机器学习,GraphFrames,图数据挖掘

教程地址

点击查看残缺教程学习门路

内容章节

1.导论:大数据生态与利用

2.分布式平台:Hadoop与Map-reduce详解

3.实操案例:Hadoop零碎搭建与环境配置

4.实操案例:利用map-reduce进行大数据统计

5.实操案例:Hive搭建与利用案例

6.海量数据库与查问:Hive与HBase详解

7.大数据分析开掘框架:Spark初步

8.Spark操作:基于RDD的大数据处理剖析

9.Spark操作:基于Dataframe与SQL的大数据处理剖析

10.综合案例:应用spark剖析美国新冠肺炎疫情数据

11.综合案例:应用Spark剖析开掘批发交易数据

12.综合案例:应用Spark剖析开掘音乐专辑数据

13.流式数据处理:Spark Streaming

14.Spark机器学习(上)-工作流与特色工程

15.Spark机器学习(下)-分类回归聚类建模与超参调优

16.Spark GraphFrames:基于图的数据分析挖

ShowMeAI速查表下载

  • Spark SQL 速查表
  • Spark RDD 速查表

ShowMeAI系列教程举荐

  • 图解Python编程:从入门到精通系列教程
  • 图解数据分析:从入门到精通系列教程
  • 图解AI数学根底:从入门到精通系列教程
  • 图解大数据技术:从入门到精通系列教程