乐趣区

大数据学习路线图-让你精准掌握大数据技术学习

大数据指不用随机分析法这样捷径,而采用所有数据进行分析处理的方法。互联网时代每个企业每天都要产生庞大的数据,对数据进行储存,对有效的数据进行挖掘分析并应用需要依赖于大数据开发,大数据开发课程采用真实商业数据源并融合云计算 + 机器学习,让学员有实力入职一线互联网企业。

今天小编的技术分享详细学习大数据的精准路线图,学好大数据就还得靠专业的工具。

阶段一、Java 语言基础

Java 开发介绍、熟悉 Eclipse 开发工具、Java 语言基础、Java 流程控制、Java 字符串、Java 数组与类和对象、数字处理类与核心技术、I/ O 与反射、多线程、Swing 程序与集合类

如果你想要学好大数据最好加入一个好的学习环境,可以来这个 Q 群 251956502 这样大家学习的话就比较方便,还能够共同交流和分享资料

阶段二、HTML、CSS 与 Java

PC 端网站布局、HTML5+CSS3 基础、WebApp 页面布局、原生 Java 交互功能开发、Ajax 异步交互、jQuery 应用

阶段三、JavaWeb 和数据库

数据库、JavaWeb 开发核心、JavaWeb 开发内幕

阶段四、LinuxHadoopt 体系

Linux 体系、Hadoop 离线计算大纲、分布式数据库 Hbase、数据仓库 Hive、数据迁移工具 Sqoop、Flume 分布式日志框架

阶段五、实战 (一线公司真实项目)

数据获取、数据处理、数据分析、数据展现、数据应用

阶段六、Spark 生态体系

Python 编程语言、Scala 编程语言、Spark 大数据处理、Spark—Streaming 大数据处理、Spark—Mlib 机器学习、Spark—GraphX 图计算、实战一:基于 Spark 的推荐系统 (某一线公司真实项目)、实战二:新浪网 (www.sina.com.cn)

阶段七、Storm 生态体系

storm 技术架构体系、Storm 原理与基础、消息队列 kafka、Redis 工具、zookeeper 详解、实战一:日志告警系统项目、实战二:猜你喜欢推荐系统实战

阶段八、大数据分析 —AI(人工智能)

Data Analyze 工作环境准备数据分析基础、数据可视化、Python 机器学习

1、Python 机器学习 2、图像识别神经网络、自然语言处理社交网络处理、实战项目:户外设备识别分析

大数据真的是一门神奇的学科,似乎学好大数据就能踏遍互联网的大部分领域。就像当下很火的区块链、人工智能等等都是跟大数据技术息息相关。每一个想学习大数据的小伙伴,都是未来不可多得的人才,快用技术征服世界吧。

一、Hadoop 入门,了解什么是 Hadoop

1、Hadoop 产生背景

2、Hadoop 在大数据、云计算中的位置和关系

3、国内外 Hadoop 应用案例介绍

4、国内 Hadoop 的就业情况分析及课程大纲介绍

5、分布式系统概述

6、Hadoop 生态圈以及各组成部分的简介

7、Hadoop 核心 MapReduce 例子说明

二、分布式文件系统 HDFS,是数据库管理员的基础课程

1、分布式文件系统 HDFS 简介

2、HDFS 的系统组成介绍

3、HDFS 的组成部分详解

4、副本存放策略及路由规则

5、NameNode Federation

6、命令行接口

7、Java 接口

8、客户端与 HDFS 的数据流讲解

9、HDFS 的可用性(HA)

三、初级 MapReduce,成为 Hadoop 开发人员的基础课程

1、如何理解 map、reduce 计算模型

2、剖析伪分布式下 MapReduce 作业的执行过程

3、Yarn 模型

4、序列化

5、MapReduce 的类型与格式

6、MapReduce 开发环境搭建

7、MapReduce 应用开发

8、更多示例讲解,熟悉 MapReduce 算法原理

四、高级 MapReduce,高级 Hadoop 开发人员的关键课程

1、使用压缩分隔减少输入规模

2、利用 Combiner 减少中间数据

3、编写 Partitioner 优化负载均衡

4、如何自定义排序规则

5、如何自定义分组规则

6、MapReduce 优化

7、编程实战

五、Hadoop 集群与管理,是数据库管理员的高级课程

1、Hadoop 集群的搭建

2、Hadoop 集群的监控

3、Hadoop 集群的管理

4、集群下运行 MapReduce 程序

六、ZooKeeper 基础知识,构建分布式系统的基础框架

1、ZooKeeper 体现结构

2、ZooKeeper 集群的安装

3、操作 ZooKeeper

七、HBase 基础知识,面向列的实时分布式数据库

1、HBase 定义

2、HBase 与 RDBMS 的对比

3、数据模型

4、系统架构

5、HBase 上的 MapReduce

6、表的设计

八、HBase 集群及其管理

1、集群的搭建过程讲解

2、集群的监控

3、集群的管理

九、HBase 客户端

1、HBase Shell 以及演示

2、Java 客户端以及代码演示

十、Pig 基础知识,进行 Hadoop 计算的另一种框架

1、Pig 概述

2、安装 Pig

3、使用 Pig 完成手机流量统计业务

十一、Hive,使用 SQL 进行计算的 Hadoop 框架

1、数据仓库基础知识

2、Hive 定义

3、Hive 体系结构简介

4、Hive 集群

5、客户端简介

6、HiveQL 定义

7、HiveQL 与 SQL 的比较

8、数据类型

9、表与表分区概念

10、表的操作与 CLI 客户端演示

11、数据导入与 CLI 客户端演示

12、查询数据与 CLI 客户端演示

13、数据的连接与 CLI 客户端演示

14、用户自定义函数(UDF)的开发与演示

十二、Sqoop,Hadoop 与 rdbms 进行数据转换的框架

1、配置 Sqoop

2、使用 Sqoop 把数据从 MySQL 导入到 HDFS 中

3、使用 Sqoop 把数据从 HDFS 导出到 MySQL 中

十三、Storm

1、Storm 基础知识:包括 Storm 的基本概念和 Storm 应用

场景,体系结构与基本原理,Storm 和 Hadoop 的对比

2、Storm 集群搭建:详细讲述 Storm 集群的安装和安装时常见问题

3、Storm 组件介绍: spout、bolt、stream groupings 等

4、Storm 消息可靠性:消息失败的重发

5、Hadoop 2.0 和 Storm 的整合:Storm on YARN

6、Storm 编程实战

退出移动版