-
Hadoop3 大数据分析
- 零、前言
- 一、Hadoop 简介
- 二、大数据分析概述
- 三、MapReduce 大数据处理
- 四、基于 Python 和 Hadoop 的科学计算和大数据分析
- 五、基于 R 和 Hadoop 的统计大数据计算
- 六、Apache Spark 批处理剖析
- 七、Apache Spark 实时剖析
- 八、Apache Flink 批处理剖析
- 九、Apache Flink 流解决
- 十、可视化大数据
- 十一、云计算简介
- 十二、应用亚马逊网络服务
-
Hadoop 和 R 大数据分析
- 零、前言
- 一、筹备应用 R 和 Hadoop
- 二、编写 Hadoop MapReduce 程序
- 三、集成 R 和 Hadoop
- 四、应用 Hadoop 流
- 五、应用 R 和 Hadoop 学习数据分析
- 六、应用机器学习了解大数据分析
- 七、从各种数据库导入和导出数据
- 八、附录 a:参考文献
-
Hadoop 深度学习
- 零、前言
- 一、深度学习导论
- 二、大规模数据的分布式深度学习
- 三、卷积神经网络
- 四、循环神经网络
- 五、受限玻尔兹曼机
- 六、自编码器
- 七、应用 Hadoop 的其余深度学习操作
- 八、附录 1:参考文献
-
Hadoop 集群部署手册
- 零、前言
- 一、设置 Hadoop 集群——从硬件到发行版
- 二、装置和配置 Hadoop
- 三、配置 Hadoop 生态系统
- 四、爱护 Hadoop 装置
- 五、监控 Hadoop 集群
- 六、将 Hadoop 部署到云
-
Hadoop 基础知识
- 零、前言
- 一、大数据和 Hadoop 简介
- 二、Hadoop 生态系统
- 三、Hadoop 的支柱——HDFS、MapReduce 和 Yarn
- 四、数据拜访组件——Hive 和 PIG
- 五、存储组件——HBase
- 六、Hadoop 中的数据摄取——SQOOP 和 Flume
- 七、流和实时剖析–Storm 和 Spark
-
Hadoop 古代大数据处理
- 零、前言
- 一、企业数据架构准则
- 二、Hadoop 生命周期治理
- 三、Hadoop 设计思考
- 四、数据挪动技术
- 五、Hadoop 中的数据建模
- 六、设计实时流数据管道
- 七、大规模数据处理框架
- 八、构建企业搜寻平台
- 九、设计数据可视化解决方案
- 十、应用云开发利用
- 十一、面向生产的 Hadoop 集群部署
-
Hadoop 和 Flume 分布式日志收集
- 零、前言
- 一、概述和架构
- 二、Flume 疾速入门
- 三、通道
- 四、Flume 和 Flume 处理器
- 五、信号源和通道选择器
- 六、拦截器、ETL 和路由
- 七、监控 Flume
- 八、实时分布式数据采集的理论状况
-
Hadoop 初学者指南
- 零、前言
- 一、阐明这所有是怎么回事
- 二、启动和运行 Hadoop
- 三、理解 MapReduce
- 四、开发 MapReduce 程序
- 五、高级 MapReduce 技术
- 六、当事件解体时
- 七、放弃运行
- 八、Hive 数据关系视图
- 九、应用关系数据库
- 十、应用 Flume 收集数据
- 十一、下一步要去哪里
- 十二、附录 A:答案
-
Hadoop MapReduce v2 秘籍
- 零、前言
- 一、Hadoop v2 入门
- 二、云部署——在云环境中应用 Hadoop Yarn
- 三、Hadoop 基础知识——配置、单元测试和其余 API
- 四、开发简单的 Hadoop MapReduce 利用
- 五、剖析
- 六、Hadoop 生态系统——ApacheHive
- 七、Hadoop 生态系统 II——Pig、HBase、Mahout 和 Sqoop
- 八、搜寻和索引
- 九、分类、举荐和查找关系
- 十、海量文本数据处理
-
Hadoop 操作与集群治理秘籍
- 零、前言
- 一、大数据和 Hadoop
- 二、筹备装置 Hadoop
- 三、配置 Hadoop 集群
- 四、治理 Hadoop 集群
- 五、加强 Hadoop 集群
- 六、监控 Hadoop 集群
- 七、调整 Hadoop 集群来获得最佳性能
- 八、应用 Amazon EC2 和 S3 构建 Hadoop 集群
-
HBase 治理秘籍
- 零、前言
- 一、配置 HBase 集群
- 二、数据迁徙
- 三、应用管理工具
- 四、备份和复原 HBase 数据
- 五、监控与诊断
- 六、设施保护和平安
- 七、故障排除
- 八、根本性能调整
- 九、高级配置和调整
-
Hive 基础知识
- 零、前言
- 一、大数据和 Hive 概述
- 二、设置 Hive 环境
- 三、数据定义和形容
- 四、数据关联和范畴
- 五、数据操作
- 六、数据汇总和采样
- 七、性能注意事项
- 八、可扩展性注意事项
- 九、平安思考
- 十、应用其余工具
-
Hadoop2 学习手册
- 零、前言
- 一、引言
- 二、存储
- 三、数据处理——MapReduce 及当前
- 四、应用 Samza 的实时计算
- 五、应用 Spark 的迭代计算
- 六、应用 Apache Pig 的数据分析
- 七、Hadoop 和 SQL
- 八、数据生命周期治理
- 九、让开发变得更容易
- 十、运行 Hadoop 集群
- 十一、下一步要去哪里
-
微软 SQLServer 2012 和 Hadoop
- 零、前言
- 一、大数据和 Hadoop 简介
- 二、应用 Sqoop——SQL Server Hadoop 连接器
- 三、应用配置单元 ODBC 驱动
- 四、应用 SQL Server Analysis Services 创立数据模型
- 五、应用微软的自助式商业智能工具
-
Hadoop MapReduce 优化指南
- 零、前言
- 一、理解 Hadoop MapReduce
- 二、Hadoop 参数概述
- 三、检测零碎瓶颈
- 四、辨认资源弱点
- 五、加强映射和归约工作
- 六、优化映射归约工作
- 七、最佳实际和倡议
-
PIG 设计模式
- 零、前言
- 一、为 PIG 的设计模式设定背景
- 二、数据接管和输入模式
- 三、数据分析模式
- 四、数据验证和清理模式
- 五、数据转换模式
- 六、了解数据简化模式
- 七、高级模式和将来工作
下载
Docker
docker pull apachecn0/apachecn-bigdata-zh
docker run -tid -p <port>:80 apachecn0/apachecn-bigdata-zh
# 拜访 http://localhost:{port}
PYPI
pip install apachecn-bigdata-zh
apachecn-bigdata-zh <port>
# 拜访 http://localhost:{port}
NPM
npm install -g apachecn-bigdata-zh
apachecn-bigdata-zh <port>
# 拜访 http://localhost:{port}
奉献指南
本我的项目须要校对,欢送大家提交 Pull Request。
请您怯懦地去翻译和改良翻译。尽管咱们谋求卓越,但咱们并不要求您做到美中不足,因而请不要放心因为翻译上犯错——在大部分状况下,咱们的服务器曾经记录所有的翻译,因而您不用放心会因为您的失误受到无法挽回的毁坏。(改编自维基百科)
组织介绍
拜访咱们的主页。
资助咱们
通过平台自带的打赏性能,或点击这里。