分类: hadoop
-
Hadoop-YARN调度性能优化实践
美团的YARN以社区2.7.1版本为基础构建分支。目前在YARN上支撑离线业务、实时业务以及机器学习业务。
-
MapReduce设计模式之连接模式
通过外键将多个数据集连接起来。包括内连接,左外连接,右外连接,全外连接,反外连接(全外连接-内连接)。
-
mapreduce连接不上hdfs
配置环境hadoop环境真的是要命,随时都可以出现意向不到的问题,比如 {代码…} 很奇诡啊的问题,所有配…
-
hadoop伪分布式安装记录
最近想接触一些大数据相关的技术,所以有了这篇文章,其实就是记录一下自己学习hadoop的过程,如果文章中有啥写…
-
MapReduce设计模式之数据组织模式
分层结构模式 应用场景 将基于行的数据转化成分层格式,如JSON。可以用在文章和评论的关系上等等。 代码实现 …
-
MapReduce设计模式之过滤模式
在Mapper阶段,用正则表达式对值进行过滤。在Ruducer阶段,生成double类型的随机数,判断是否小于…
-
Hadoop-HA集群搭建
在hadoop2.0中通常由两个NameNode组成,一个处于active状态,另一个处于standby状态。…
-
MapReduce设计模式之概要设计模式
什么是概要设计模式 概要分析师将相似数据分组到一起并执行类似统计计算、索引生成或简单计数等后续的分析操作。 概…
-
0基础大数据学习路线及各阶段学习书籍推荐
要学习大数据,你至少应该知道大数据是什么,大数据将被用在什么领域。通过对大数据的一般理解,你可以了解你是否对大…