分类: hadoop
-
关于hadoop:Hadoop-入门笔记九-HDFS-数据迁移和安全模式
数据迁徙指的是一种大规模量级的数据转移,转移的过程中往往会跨机房、跨集群 ,数据迁徙规模的不同会导致整个数据迁…
-
关于hadoop:Hadoop-入门笔记七-Hadoop-文件压缩格式
在Hadoop中,个别存储着十分大的文件,以及在存储HDFS块或运行MapReduce工作时,Hadoop集群…
-
关于hadoop:Hadoop-入门笔记六-Hadoop常用文件存储格式
在Windows有很多种文件格式,例如:JPEG文件用来存储图片、MP3文件用来存储音乐、DOC文件用来存储W…
-
关于hadoop:Hadoop-入门笔记四-分布式文件HDFS
HDFS(Hadoop Distributed File System)是 Apache Hadoop 我的项…
-
关于hadoop:Hadoop入门三-Hadoop集群搭建
HADOOP集群具体来说蕴含两个集群:HDFS集群和YARN集群,两者逻辑上拆散,但物理上在一起。HDFS集群…
-
关于hadoop:Hadoop入门二-Hadoop-编译
因为appache给出的hadoop的安装包没有提供带C程序拜访的接口,所以咱们在应用本地库(本地库能够用来做…
-
关于hadoop:hadoop入门一-hadoop介绍
Apache Hadoop是一款反对数据密集型分布式应用程序并以Apache 2.0许可协定公布的开源软件框架…
-
关于hadoop:Hadoop-系统入门核心精讲
import java.util.ArrayList;import java.util.Collections…
-
关于hadoop:教你用Python-编写-Hadoop-MapReduce-程序
随着数字媒体、物联网等倒退的呈现,每天产生的数字数据量呈指数级增长。这种状况给创立下一代工具和技术来存储和操作…
-
关于hadoop:Apache-Hudi-在-B-站构建实时数据湖的实践
简介: B 站抉择 Flink + Hudi 的数据湖技术计划,以及针对其做出的优化。本文作者喻兆靖,介绍了为…