分类: hadoop
-
基于Hadoop不同版本搭建hive集群附配置文件
本教程采用了两种方案 一种是hive-1.21版本,hadoop版本为hadoop2.6.5 还有一种是主要讲…
-
猫头鹰的深夜翻译日志每个开发者需要了解的实时数据聚合
我在大约六年前的一个较为巧合的时机加入了领英。当时我们正面临着单机应用,集中式数据库带来的挑战,并开始将其迁移…
-
贾扬清达摩院OceanBase都会到场分享的大会一场中国互联网技术人的盛宴
2019年UBDC全域大数据峰会—数据技术分会场,将由来自各前沿领域的专家们,围绕存储、数据与科学计算前沿…
-
可视化越做越丑这五个高级图表效果能瞬间抬升你的逼格
今天我们来说一说数据可视化,想必很多人在入门数据分析之后,就会经常进行可视化的工作,所谓一图胜千言,图表用的好…
-
报表选型除了看开发难易还要看运维省不省心
比如说,企业大了,业务种类就多了,这时候就不能依靠手工统计报表,企业就会采购或者开发报表系统,然而在选型时却发…
-
Zookeeper工作过程详解
分布式和集中式系统相比,有很多优势,比如更强的计算能力,存储能力,避免单点故障等问题。但是由于在分布式部署的方…
-
大数据-客户端服务端日志采集和处理
客户端日志通常由客户端记录并上报到服务端,随着用户规模的增长,客户端日志会占用相当大的空间,查询起来也是不便;
-
MapReduce与Yarn-的详细工作流程分析
MapReduce详细工作流程之Map阶段 如上图所示 首先有一个200M的待处理文件 切片:在客户端提交之前…
-
MapReduce之Job提交流程源码和切片源码分析
hadoop2.7.2 MapReduce Job提交源码及切片源码分析 首先从waitForCompleti…
-
浅谈HDFS三之DataNote
一个数据块在DataNode上以文件形式存储在磁盘上,包括两个文件,一个是数据本身,一个是元数据包括数据块的长…