共计 23381 个字符,预计需要花费 59 分钟才能阅读完成。
Hadoop 实战篇(2)
作者 | WenasWei
前言
在上一篇的 Hadoop 实战篇介绍过了 Hadoop- 离线批处理技术的本地模式和伪集群模式装置,接下来持续学习 Hadoop 集群模式装置; 将从以下几点介绍:
- Linux 主机部署布局
- Zookeeper 注册核心装置
- 集群模式装置
- Hadoop 的目录构造阐明和命令帮忙文档
- 集群动静减少和删除节点
一 Linux 环境的配置与装置 Hadoop
Hadoop 集群部署布局:
Hadoop 须要应用到 Linux 环境上的一些根本的配置须要,Hadoop 用户组和用户增加,免密登录操作,JDK 装置
1.1 VMWare 中 Ubuntu 网络配置
在应用 VMWare 装置 Ubuntu18.04-Linux 操作系统下时产生系统配置问题能够通过分享的博文进行配置,CSDN 跳转链接: VMWare 中 Ubuntu 网络配置
其中蕴含了以下几个重要操作步骤:
- Ubuntu 零碎信息与批改主机名
- Windows 设置 VMWare 的 NAT 网络
- Linux 网关设置与配置动态 IP
- Linux 批改 hosts 文件
- Linux 免明码登录
1.2 Hadoop 用户组和用户增加
1.2.1 增加 Hadoop 用户组和用户
以 root 用户登录 Linux-Ubuntu 18.04 虚拟机,执行命令:
$ groupadd hadoop
$ useradd -r -g hadoop hadoop
1.2.2 赋予 Hadoop 用户目录权限
将 /usr/local
目录权限赋予 Hadoop 用户,命令如下:
$ chown -R hadoop.hadoop /usr/local/
$ chown -R hadoop.hadoop /tmp/
$ chown -R hadoop.hadoop /home/
1.2.3 赋予 Hadoop 用户 sodu 权限
编辑 /etc/sudoers
文件,在 root ALL=(ALL:ALL) ALL
下增加hadoop ALL=(ALL:ALL) ALL
$ vi /etc/sudoers
Defaults env_reset
Defaults mail_badpass
Defaults secure_path="/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/snap/bin"
root ALL=(ALL:ALL) ALL
hadoop ALL=(ALL:ALL) ALL
%admin ALL=(ALL) ALL
%sudo ALL=(ALL:ALL) ALL
1.2.4 赋予 Hadoop 用户登录明码
$ passwd hadoop
Enter new UNIX password: 输出新密码
Retype new UNIX password: 确认新密码
passwd: password updated successfully
1.3 JDK 装置
Linux 装置 JDK 能够参照分享的博文《Logstash- 数据流引擎》-< 第三节:Logstash 装置 >–(第二大节: 3.2 Linux 装置 JDK 进行)装置配置到每一台主机上,CSDN 跳转链接: Logstash- 数据流引擎
1.4 Hadoop 官网下载
官网下载:https://hadoop.apache.org/rel… Binary download
- 应用 wget 命名下载(下载目录是当前目录):
例如:version3.3.0 https://mirrors.bfsu.edu.cn/a…
$ wget https://mirrors.bfsu.edu.cn/apache/hadoop/common/hadoop-3.3.0/hadoop-3.3.0.tar.gz
- 解压、挪动到你想要搁置的文件夹:
/usr/local
$ mv ./hadoop-3.3.0.tar.gz /usr/local
$ cd /usr/local
$ tar -zvxf hadoop-3.3.0.tar.gz
1.5 配置 Hadoop 环境
- 批改配置文件
/etc/profile
:
$ vi /etc/profile
# 类同 JDK 配置增加
export JAVA_HOME=/usr/local/java/jdk1.8.0_152
export JRE_HOME=/usr/local/java/jdk1.8.0_152/jre
export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib:$JAVA_HOME/jre/lib
export HADOOP_HOME=/usr/local/hadoop-3.3.0
export PATH=$JAVA_HOME/bin:$JAVA_HOME/jre/bin:$PATH:$HOME/bin:$HADOOP_HOME/sbin:$HADOOP_HOME/bin
- 使配置文件失效
$ source /etc/profile
- 查看 Hadoop 配置是否胜利
$ hadoop version
Hadoop 3.3.0
Source code repository https://gitbox.apache.org/repos/asf/hadoop.git -r aa96f1871bfd858f9bac59cf2a81ec470da649af
Compiled by brahma on 2020-07-06T18:44Z
Compiled with protoc 3.7.1
From source with checksum 5dc29b802d6ccd77b262ef9d04d19c4
This command was run using /usr/local/hadoop-3.3.0/share/hadoop/common/hadoop-common-3.3.0.jar
从后果能够看出,Hadoop 版本为 Hadoop 3.3.0
, 阐明 Hadoop 环境装置并配置胜利。
二 Zookeeper 注册核心
Zookeeper 注册核心章节次要介绍如下:
- Zookeeper 介绍
- Zookeeper 下载安装
- Zookeeper 配置文件
- 启动 zookeeper 集群验证
Zookeeper 集群主机布局:
- hadoop1
- hadoop2
- hadoop3
2.1 Zookeeper 介绍
ZooKeeper 是一个分布式的,开放源码的分布式应用程序协调服务,是 Google 的 Chubby 一个开源的实现,是 Hadoop 和 Hbase 的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的性能包含:配置保护、域名服务、分布式同步、组服务等。
ZooKeeper 的指标就是封装好简单易出错的要害服务,将简略易用的接口和性能高效、性能稳固的零碎提供给用户,其中蕴含一个简略的原语集, 提供 Java 和 C 的接口,ZooKeeper 代码版本中,提供了分布式独享锁、选举、队列的接口。其中散布锁和队列有 Java 和 C 两个版本,选举只有 Java 版本。
Zookeeper 负责服务的协调调度, 当客户端发动申请时, 返回正确的服务器地址。
2.2 Zookeeper 下载安装
Linux(执行主机 -hadoop1) 下载 apache-zookeeper-3.5.9-bin 版本包, 挪动到装置目录: /usr/local/
,解压并重命名为: zookeeper-3.5.9
:
$ wget https://mirrors.tuna.tsinghua.edu.cn/apache/zookeeper/zookeeper-3.5.9/apache-zookeeper-3.5.9-bin.tar.gz
$ mv apache-zookeeper-3.5.9-bin.tar.gz /usr/local/
$ cd /usr/local/
$ tar -zxvf apache-zookeeper-3.5.9-bin.tar.gz
$ mv apache-zookeeper-3.5.9-bin zookeeper-3.5.9
离线装置能够到指定官网下载版本包上传装置, 官网地址: http://zookeeper.apache.org/r…
如图所示:
2.3 Zookeeper 配置文件
2.3.1 配置 Zookeeper 环境变量
配置 Zookeeper 环境变量,须要在 /etc/profile
配置文件中批改增加,具体配置如下:
export JAVA_HOME=/usr/local/java/jdk1.8.0_152
export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib:$JAVA_HOME/jre/lib
export ZOOKEEPER_HOME=/usr/local/zookeeper-3.5.9
export PATH=$JAVA_HOME/bin:$JAVA_HOME/jre/bin:$PATH:$HOME/bin:$ZOOKEEPER_HOME
批改实现后刷新环境变量配置文件:
$ source /etc/profile
其中曾经蕴含装置了 JDK 配置,如无装置 JDK 能够查看 Hadoop 实战篇 (1) 中的装置
2.3.2 Zookeeper 配置文件
- 在 zookeeper 根目录
/usr/local/zookeeper-3.5.9
下创立文件夹:data
和dataLog
$ cd /usr/local/zookeeper-3.5.9
$ mkdir data
$ mkdir dataLog
切换到新建的 data 目录下,创立 myid 文件,增加具体内容为数字 1,如下所示:
$ cd /usr/local/zookeeper-3.5.9/data
$ vi myid
# 增加内容数字 1
1
$ cat myid
1
- 进入 conf 目录中批改配置文件
复制配置文件 zoo_sample.cfg
并且批改名称为 zoo.cfg
:
$ cp zoo_sample.cfg zoo.cfg
批改 zoo.cfg 文件,批改内容如下:
tickTime=2000
initLimit=10
syncLimit=5
dataDir=/usr/local/zookeeper-3.5.9/data
dataLogDir=/usr/local/zookeeper-3.5.9/dataLog
clientPort=2181
server.1=hadoop1:2888:3888
server.2=hadoop2:2888:3888
server.3=hadoop3:2888:3888
2.3.3 将 Zookeeper 和零碎环境变量拷贝到其余服务器
- 依据对服务器的布局,将 Zookeeper 和配置文件
/etc/profile
拷贝到 hadoop2 和 hadoop3 主机上:
$ scp -r zookeeper-3.5.9/ root@hadoop2:/usr/local/
$ scp -r zookeeper-3.5.9/ root@hadoop3:/usr/local/
$ scp /etc/profile root@hadoop2:/etc/
$ scp /etc/profile root@hadoop3:/etc/
- 登陆到 hadoop2 和 hadoop3
别离批改 hadoop2 主机和 hadoop3 主机上的配置文件内容:/usr/local/zookeeper-3.5.9/data/myid
为 2 和 3
并刷新环境变量配置文件:
$ source /etc/profile
2.4 启动 zookeeper 集群
在 hadoop1、hadoop2 和 hadoop3 三台服务器上别离启动 Zookeeper 服务器并查看 Zookeeper 运行状态
- hadoop1 主机:
$ cd /usr/local/zookeeper-3.5.9/bin/
$ ./zkServer.sh start
$ ./zkServer.sh status
ZooKeeper JMX enabled by default
Using config: /usr/local/zookeeper-3.5.9/bin/../conf/zoo.cfg
Client port found: 2181. Client address: localhost. Client SSL: false.
Mode: follower
阐明 hadoop1 主机上 zookeeper 的运行状态是 follower
- hadoop2 主机:
$ cd /usr/local/zookeeper-3.5.9/bin/
$ ./zkServer.sh start
$ ./zkServer.sh status
ZooKeeper JMX enabled by default
Using config: /usr/local/zookeeper-3.5.9/bin/../conf/zoo.cfg
Client port found: 2181. Client address: localhost. Client SSL: false.
Mode: leader
阐明 hadoop2 主机上 zookeeper 的运行状态是 leader
- hadoop3 主机:
$ cd /usr/local/zookeeper-3.5.9/bin/
$ ./zkServer.sh start
$ ./zkServer.sh status
ZooKeeper JMX enabled by default
Using config: /usr/local/zookeeper-3.5.9/bin/../conf/zoo.cfg
Client port found: 2181. Client address: localhost. Client SSL: false.
Mode: follower
阐明 hadoop3 主机上 zookeeper 的运行状态是 follower
三 集群模式装置
3.1 Hadoop 配置文件批改
3.1.1 批改配置 hadoop-env.sh
主机 hadoop1 配置 hadoop-env.sh
,在 hadoop-env.sh 文件中指定 JAVA_HOME 的装置目录: /usr/local/hadoop-3.3.0/etc/hadoop
,配置如下:
export JAVA_HOME=/usr/local/java/jdk1.8.0_152
# 配置容许应用 root 账户权限
export HDFS_DATANODE_USER=root
export HADOOP_SECURE_USER=root
export HDFS_NAMENODE_USER=root
export HDFS_SECONDARYNAMENODE_USER=root
export YARN_RESOURCEMANAGER_USER=root
export YARN_NODEMANAGER_USER=root
export HADOOP_SHELL_EXECNAME=root
export HDFS_JOURNALNODE_USER=root
export HDFS_ZKFC_USER=root
3.1.2 批改配置 core-site.xml
主机 hadoop1 配置 core-site.xml
,在 core-site.xml
文件中指定 Zookeeper 的集群节点 /usr/local/hadoop-3.3.0/etc/hadoop
,配置如下:
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://ns/</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/usr/local/hadoop-3.3.0/tmp</value>
<description>Abase for other temporary directories.</description>
</property>
<property>
<name>ha.zookeeper.quorum</name>
<value>hadoop1:2181,hadoop2:2181,hadoop3:2181</value>
</property>
</configuration>
3.1.3 批改配置 hdfs-site.xml
主机 hadoop1 配置 hdfs-site.xml
,在 hdfs-site.xml
文件中指定 namenodes 节点,/usr/local/hadoop-3.3.0/etc/hadoop
,配置如下:
<configuration>
<property>
<name>dfs.nameservices</name>
<value>ns</value>
</property>
<property>
<name>dfs.ha.namenodes.ns</name>
<value>nn1,nn2</value>
</property>
<!-- nn1 的 RPC 通信地址,nn1 所在地址 -->
<property>
<name>dfs.namenode.rpc-address.ns.nn1</name>
<value>hadoop1:9000</value>
</property>
<!-- nn1 的 http 通信地址,内部拜访地址 -->
<property>
<name>dfs.namenode.http-address.ns.nn1</name>
<value>hadoop1:9870</value>
</property>
<!-- nn2 的 RPC 通信地址,nn2 所在地址 -->
<property>
<name>dfs.namenode.rpc-address.ns.nn2</name>
<value>hadoop2:9000</value>
</property>
<!-- nn2 的 http 通信地址,内部拜访地址 -->
<property>
<name>dfs.namenode.http-address.ns.nn2</name>
<value>hadoop2:9870</value>
</property>
<!-- 指定 NameNode 的元数据在 JournalNode 日志上的寄存地位(个别和 zookeeper 部署在一起) -->
<property>
<name>dfs.namenode.shared.edits.dir</name>
<value>qjournal://hadoop5:8485;hadoop6:8485;hadoop7:8485/ns</value>
</property>
<!-- 指定 JournalNode 在本地磁盘存放数据的地位 -->
<property>
<name>dfs.journalnode.edits.dir</name>
<value>/usr/local/hadoop-3.3.0/data/journal</value>
</property>
<!-- 客户端通过代理拜访 namenode,拜访文件系统,HDFS 客户端与 Active 节点通信的 Java 类,应用其确定 Active 节点是否沉闷 -->
<property>
<name>dfs.client.failover.proxy.provider.ns</name>
<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
</property>
<!-- 这是配置主动切换的办法,有多种应用办法,具体能够看官网,这里是近程登录杀死的办法 -->
<property>
<name>dfs.ha.fencing.methods</name>
<!-- 这个参数的值能够有多种,你也能够换成 shell(/bin/true)试试,也是能够的,这个脚本 do nothing 返回 0 -->
<value>sshfence</value>
</property>
<!-- 这个是应用 sshfence 隔离机制时才须要配置 ssh 免登陆 -->
<property>
<name>dfs.ha.fencing.ssh.private-key-files</name>
<value>/root/.ssh/id_rsa</value>
</property>
<!-- 配置 sshfence 隔离机制超时工夫,这个属性同上,如果你是用脚本的办法切换,这个应该是能够不配置的 -->
<property>
<name>dfs.ha.fencing.ssh.connect-timeout</name>
<value>30000</value>
</property>
<!-- 这个是开启主动故障转移,如果你没有主动故障转移,这个能够先不配 -->
<property>
<name>dfs.ha.automatic-failover.enabled</name>
<value>true</value>
</property>
</configuration>
3.1.4 批改配置 mapred-site.xml
主机 hadoop1 配置 mapred-site.xml
,在 mapred-site.xml
文件中指定 mapreduce 信息,/usr/local/hadoop-3.3.0/etc/hadoop
,配置如下:
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
<property>
<name>yarn.app.mapreduce.am.env</name>
<value>HADOOP_MAPRED_HOME=${HADOOP_HOME}</value>
</property>
<property>
<name>mapreduce.map.env</name>
<value>HADOOP_MAPRED_HOME=${HADOOP_HOME}</value>
</property>
<property>
<name>mapreduce.reduce.env</name>
<value>HADOOP_MAPRED_HOME=${HADOOP_HOME}</value>
</property>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
<property>
<name>mapreduce.jobhistory.address</name>
<value>hadoop1:10020</value>
</property>
<property>
<name>mapreduce.jobhistory.webapp.address</name>
<value>hadoop1:19888</value>
</property>
3.1.5 批改配置 yarn-site.xml
主机 hadoop1 配置 yarn-site.xml
,在 yarn-site.xml
文件中指定 ResourceManaeger 节点,/usr/local/hadoop-3.3.0/etc/hadoop
,配置如下:
<configuration>
<property>
<name>yarn.resourcemanager.ha.enabled</name>
<value>true</value>
</property>
<property>
<name>yarn.resourcemanager.cluster-id</name>
<value>yrc</value>
</property>
<property>
<name>yarn.resourcemanager.ha.rm-ids</name>
<value>rm1,rm2</value>
</property>
<property>
<name>yarn.resourcemanager.hostname.rm1</name>
<value>hadoop3</value>
</property>
<property>
<name>yarn.resourcemanager.hostname.rm2</name>
<value>hadoop4</value>
</property>
<property>
<name>yarn.resourcemanager.address.rm1</name>
<value>hadoop3:8032</value>
</property>
<property>
<name>yarn.resourcemanager.scheduler.address.rm1</name>
<value>hadoop3:8030</value>
</property>
<property>
<name>yarn.resourcemanager.webapp.address.rm1</name>
<value>hadoop3:8088</value>
</property>
<property>
<name>yarn.resourcemanager.resource-tracker.address.rm1</name>
<value>hadoop3:8031</value>
</property>
<property>
<name>yarn.resourcemanager.admin.address.rm1</name>
<value>hadoop3:8033</value>
</property>
<property>
<name>yarn.resourcemanager.ha.admin.address.rm1</name>
<value>hadoop3:23142</value>
</property>
<property>
<name>yarn.resourcemanager.address.rm2</name>
<value>hadoop4:8032</value>
</property>
<property>
<name>yarn.resourcemanager.scheduler.address.rm2</name>
<value>hadoop4:8030</value>
</property>
<property>
<name>yarn.resourcemanager.webapp.address.rm2</name>
<value>hadoop4:8088</value>
</property>
<property>
<name>yarn.resourcemanager.resource-tracker.address.rm2</name>
<value>hadoop4:8031</value>
</property>
<property>
<name>yarn.resourcemanager.admin.address.rm2</name>
<value>hadoop4:8033</value>
</property>
<property>
<name>yarn.resourcemanager.ha.admin.address.rm2</name>
<value>hadoop4:23142</value>
</property>
<property>
<name>yarn.resourcemanager.zk-address</name>
<value>hadoop1:2181,hadoop2:2181,hadoop3:2181</value>
</property>
<!-- 资源调度模型 -->
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<!-- 开启 mapreduce 两头过程压缩 -->
<property>
<name>mapreduce.map.output.compress</name>
<value>true</value>
</property>
</configuration>
3.1.6 批改 workers 文件
主机 hadoop1 配置 workers
,在 workers
文件中指定 DataNode 节点,/usr/local/hadoop-3.3.0/etc/hadoop
,配置如下:
hadoop5
hadoop6
hadoop7
3.2 Hadoop 节点拷贝配置
3.2.1 将配置好的 Hadoop 复制到其余节点
将在 hadoop1 上装置并配置好的 Hadoop 复制到其余服务器上,操作如下所示:
scp -r /usr/local/hadoop-3.3.0/ hadoop2:/usr/local/
scp -r /usr/local/hadoop-3.3.0/ hadoop3:/usr/local/
scp -r /usr/local/hadoop-3.3.0/ hadoop4:/usr/local/
scp -r /usr/local/hadoop-3.3.0/ hadoop5:/usr/local/
scp -r /usr/local/hadoop-3.3.0/ hadoop6:/usr/local/
scp -r /usr/local/hadoop-3.3.0/ hadoop7:/usr/local/
3.2.2 复制 hadoop1 上的零碎环境变量
将在 hadoop1 上装置并配置好的零碎环境变量复制到其余服务器上,操作如下所示:
sudo scp /etc/profile hadoop2:/etc/
sudo scp /etc/profile hadoop3:/etc/
sudo scp /etc/profile hadoop4:/etc/
sudo scp /etc/profile hadoop5:/etc/
sudo scp /etc/profile hadoop6:/etc/
sudo scp /etc/profile hadoop7:/etc/
使零碎环境变量失效
source /etc/profile
hadoop version
3.3 启动 hadoop 集群(1)
启动 hadoop 集群步骤分为:
- 启动并验证 journalnode 过程
- 格式化 HDFS
- 格式化 ZKFC
- 启动并验证 NameNode 过程
- 同步元数据信息
- 启动并验证备用 NameNode 过程
- 启动并验证 DataNode 过程
- 启动并验证 YARN
- 启动并验证 ZKFC
- 查看每台服务器上运行的运行信息
3.3.1 启动并验证 journalnode 过程
(1)启动 journalnode 过程,在 hadoop1 服务器上执行如下命令,启动 journalnode 过程:
hdfs --workers --daemon start journalnode
(2)验证 journalnode 过程是否启动胜利,别离在 hadoop5、hadoop6 和 hadoop7 三台服务器上别离执行 jps
命令,执行后果如下
- hadoop5 服务器:
root@hadoop5:~# jps
17322 Jps
14939 JournalNode
- hadoop6 服务器:
root@hadoop6:~# jps
13577 JournalNode
15407 Jps
- hadoop7 服务器:
root@hadoop7:~# jps
13412 JournalNode
15212 Jps
3.3.2 格式化 HDFS
- 在 hadoop1 服务器上执行如下命令,格式化 HDFS:
hdfs namenode -format
- 执行后,命令行会输入胜利信息:
common.Storage: Storage directory /usr/local/hadoop-3.3.0/tmp/dfs/name has been successfully formatted.
3.3.3 格式化 ZKFC
- 在 hadoop1 服务器上执行如下命令,格式化 ZKFC :
hdfs zkfc -formatZK
- 执行后,命令行会输入胜利信息:
ha.ActiveStandbyElector: Successfuly created /hadoop-ha/ns in ZK.
3.3.4 启动并验证 NameNode 过程
- 启动 NameNode 过程,在 hadoop1 服务器上执行
hdfs --daemon start namenode
- 验证 NameNode 过程启动胜利,
# jps
26721 NameNode
50317 Jps
3.3.5 同步元数据信息
- 在 hadoop2 服务器上执行如下命令,进行元数据信息的同步操作:
hdfs namenode -bootstrapStandby
- 执行后,命令行胜利信息:
common.Storage: Storage directory /usr/local/hadoop-3.3.0/tmp/dfs/name has been successfully formatted.
3.3.6 启动并验证备用 NameNode 过程
- 在 hadoop2 服务器上执行如下命令,启动备用 NameNode 过程:
hdfs --daemon start namenode
- 验证备用的 NameNode 过程
# jps
21482 NameNode
50317 Jps
3.3.7 启动并验证 DataNode 过程
- 在 hadoop1 服务器上执行如下命令,启动 DataNode 过程
hdfs --workers --daemon start datanode
- 验证 DataNode 过程在 hadoop5、hadoop6 和 hadoop7 服务器上执行:
hadoop5 服务器:
# jps
31713 Jps
16435 DataNode
14939 JournalNode
15406 NodeManager
hadoop6 服务器:
# jps
13744 NodeManager
13577 JournalNode
29806 Jps
14526 DataNode
hadoop7 服务器:
# jps
29188 Jps
14324 DataNode
13412 JournalNode
13580 NodeManager
3.3.8 启动并验证 YARN
- 在 hadoop1 服务器上执行如下命令,启动 YARN
start-yarn.sh
- 在 hadoop3、hadoop4 服务器上执行 jps 命令,验证 YARN 启动胜利
hadoop3 服务器:
# jps
21937 Jps
8070 ResourceManager
7430 QuorumPeerMain
hadoop4 服务器:
# jps
6000 ResourceManager
20183 Jps
3.3.9 启动并验证 ZKFC
- 在 hadoop1 服务器上执行如下命令,启动 ZKFC:
hdfs --workers daemon start zkfc
- 在 hadoop1 和 hadoop2 上执行 jps 命令,验证 DFSZKFailoveController 过程启动胜利
hadoop1 服务器:
# jps
26721 NameNode
14851 QuorumPeerMain
50563 Jps
27336 DFSZKFailoverController
hadoop2 服务器:
# jps
21825 DFSZKFailoverController
39399 Jps
15832 QuorumPeerMain
21482 NameNode
3.3.10 查看每台服务器上运行的运行信息
- hadoop1 服务器:
# jps
26721 NameNode
14851 QuorumPeerMain
50563 Jps
27336 DFSZKFailoverController
- hadoop2 服务器:
# jps
21825 DFSZKFailoverController
39399 Jps
15832 QuorumPeerMain
21482 NameNode
- hadoop3 服务器:
# jps
8070 ResourceManager
7430 QuorumPeerMain
21950 Jps
- hadoop4 服务器:
# jps
6000 ResourceManager
20197 Jps
- hadoop5 服务器:
# jps
16435 DataNode
31735 Jps
14939 JournalNode
15406 NodeManager
- hadoop6 服务器:
# jps
13744 NodeManager
13577 JournalNode
29833 Jps
14526 DataNode
- hadoop7 服务器:
# jps
14324 DataNode
13412 JournalNode
29211 Jps
13580 NodeManager
3.4 启动 hadoop 集群(2)
- 格式化 HDFS
- 复制元数据信息
- 格式化 ZKFC
- 启动 HDFS
- 启动 YARN
- 查看每台服务器上运行的运行信息
3.4.1 格式化 HDFS
在 hadoop1 服务器上格式化 HDFS,如下所示:
hdfs namenode -format
3.4.2 复制元数据信息
将 hadoop1 服务器上的 /usr/local/hadoop-3.3.0/tmp
目录复制到 hadoop2 服务器上 /usr/local/hadoop-3.3.0
目录下,在 hadoop1 服务器上执行如下命令:
scp -r /usr/local/hadoop-3.3.0/tmp hadoop2:/usr/local/hadoop-3.3.0/
3.4.3 格式化 ZKFC
在 hadoop1 服务器上格式化 ZKFC,如下所示:
hdfs zkfc -formatZK
3.4.4 启动 HDFS
在 hadoop1 服务器上通过启动脚本启动 HDFS,如下所示:
start-dfs.sh
3.4.5 启动 YARN
在 hadoop1 服务器上通过启动脚本启动 YARN,如下所示:
start-yarn.sh
3.4.6 查看每台服务器上运行的运行信息
- hadoop1 服务器:
# jps
26721 NameNode
14851 QuorumPeerMain
50563 Jps
27336 DFSZKFailoverController
- hadoop2 服务器:
# jps
21825 DFSZKFailoverController
39399 Jps
15832 QuorumPeerMain
21482 NameNode
- hadoop3 服务器:
# jps
8070 ResourceManager
7430 QuorumPeerMain
21950 Jps
- hadoop4 服务器:
# jps
6000 ResourceManager
20197 Jps
- hadoop5 服务器:
# jps
16435 DataNode
31735 Jps
14939 JournalNode
15406 NodeManager
- hadoop6 服务器:
# jps
13744 NodeManager
13577 JournalNode
29833 Jps
14526 DataNode
- hadoop7 服务器:
# jps
14324 DataNode
13412 JournalNode
29211 Jps
13580 NodeManager
四 Hadoop 的目录构造阐明和命令帮忙文档
4.1 Hadoop 的目录构造阐明
应用命令“ls”查看 Hadoop 3.3.0 上面的目录,如下所示:
-bash-4.1$ ls
bin etc include lib libexec LICENSE.txt NOTICE.txt README.txt sbin share
上面就简略介绍下每个目录的作用:
- bin:bin 目录是 Hadoop 最根本的治理脚本和应用脚本所在的目录,这些脚本是 sbin 目录下治理脚本的根底实现,用户能够间接应用这些脚本治理和应用 Hadoop
- etc:Hadoop 配置文件所在的目录,包含:core-site.xml、hdfs-site.xml、mapred-site.xml 和 yarn-site.xml 等配置文件。
- include:对外提供的编程库头文件(具体的动静库和动态库在 lib 目录中),这些文件都是用 C ++ 定义的,通常用于 C ++ 程序拜访 HDFS 或者编写 MapReduce 程序。
- lib:蕴含了 Hadoop 对外提供的编程动静库和动态库,与 include 目录中的头文件联合应用。
- libexec:各个服务对应的 shell 配置文件所在的目录,可用于配置日志输入目录、启动参数(比方 JVM 参数)等根本信息。
- sbin:Hadoop 治理脚本所在目录,次要蕴含 HDFS 和 YARN 中各类服务启动 / 敞开的脚本。
- share:Hadoop 各个模块编译后的 Jar 包所在目录,这个目录中也蕴含了 Hadoop 文档。
4.2 Hadoop 命令帮忙文档
- 1、查看指定目录下内容
hdfs dfs –ls [文件目录]
hdfs dfs -ls -R / // 显式目录构造
eg: hdfs dfs –ls /user/wangkai.pt
- 2、关上某个已存在文件
hdfs dfs –cat [file_path]
eg:hdfs dfs -cat /user/wangkai.pt/data.txt
- 3、将本地文件存储至 hadoop
hdfs dfs –put [本地地址] [hadoop 目录]
hdfs dfs –put /home/t/file.txt /user/t
- 4、将本地文件夹存储至 hadoop
hdfs dfs –put [本地目录] [hadoop 目录]
hdfs dfs –put /home/t/dir_name /user/t
(dir_name 是文件夹名)
- 5、将 hadoop 上某个文件 down 至本地已有目录下
hadoop dfs -get [文件目录] [本地目录]
hadoop dfs –get /user/t/ok.txt /home/t
- 6、删除 hadoop 上指定文件
hdfs dfs –rm [文件地址]
hdfs dfs –rm /user/t/ok.txt
- 7、删除 hadoop 上指定文件夹(蕴含子目录等)
hdfs dfs –rm [目录地址]
hdfs dfs –rmr /user/t
- 8、在 hadoop 指定目录内创立新目录
hdfs dfs –mkdir /user/t
hdfs dfs -mkdir - p /user/centos/hadoop
- 9、在 hadoop 指定目录下新建一个空文件
应用 touchz 命令:
hdfs dfs -touchz /user/new.txt
- 10、将 hadoop 上某个文件重命名
应用 mv 命令:
hdfs dfs –mv /user/test.txt /user/ok.txt(将 test.txt 重命名为 ok.txt)
- 11、将 hadoop 指定目录下所有内容保留为一个文件,同时 down 至本地
hdfs dfs –getmerge /user /home/t
- 12、将正在运行的 hadoop 作业 kill 掉
hadoop job –kill [job-id]
- 13. 查看帮忙
hdfs dfs -help
五 集群动静减少和删除节点
5.1 动静增加 DataNode 和 NodeManager
5.1.1 查看集群的状态
- 在 hadoop1 服务器上查看 HDFS 各节点状态,如下所示:
# hdfs dfsadmin -report
Configured Capacity: 60028796928 (55.91 GB)
Present Capacity: 45182173184 (42.08 GB)
DFS Remaining: 45178265600 (42.08 GB)
DFS Used: 3907584 (3.73 MB)
DFS Used%: 0.01%
Replicated Blocks:
Under replicated blocks: 0
Blocks with corrupt replicas: 0
Missing blocks: 0
Missing blocks (with replication factor 1): 0
Low redundancy blocks with highest priority to recover: 0
Pending deletion blocks: 0
Erasure Coded Block Groups:
Low redundancy block groups: 0
Block groups with corrupt internal blocks: 0
Missing block groups: 0
Low redundancy blocks with highest priority to recover: 0
Pending deletion blocks: 0
-------------------------------------------------
Live datanodes (3):
Name: 192.168.254.134:9866 (hadoop5)
Hostname: hadoop5
Decommission Status : Normal
Configured Capacity: 20009598976 (18.64 GB)
DFS Used: 1302528 (1.24 MB)
Non DFS Used: 4072615936 (3.79 GB)
DFS Remaining: 15060099072 (14.03 GB)
DFS Used%: 0.01%
DFS Remaining%: 75.26%
Configured Cache Capacity: 0 (0 B)
Cache Used: 0 (0 B)
Cache Remaining: 0 (0 B)
Cache Used%: 100.00%
Cache Remaining%: 0.00%
Xceivers: 1
Last contact: Thu Nov 18 14:23:05 CST 2021
Last Block Report: Thu Nov 18 13:42:32 CST 2021
Num of Blocks: 16
Name: 192.168.254.135:9866 (hadoop6)
Hostname: hadoop6
Decommission Status : Normal
Configured Capacity: 20009598976 (18.64 GB)
DFS Used: 1302528 (1.24 MB)
Non DFS Used: 4082216960 (3.80 GB)
DFS Remaining: 15050498048 (14.02 GB)
DFS Used%: 0.01%
DFS Remaining%: 75.22%
Configured Cache Capacity: 0 (0 B)
Cache Used: 0 (0 B)
Cache Remaining: 0 (0 B)
Cache Used%: 100.00%
Cache Remaining%: 0.00%
Xceivers: 1
Last contact: Thu Nov 18 14:23:06 CST 2021
Last Block Report: Thu Nov 18 08:58:22 CST 2021
Num of Blocks: 16
Name: 192.168.254.136:9866 (hadoop7)
Hostname: hadoop7
Decommission Status : Normal
Configured Capacity: 20009598976 (18.64 GB)
DFS Used: 1302528 (1.24 MB)
Non DFS Used: 4065046528 (3.79 GB)
DFS Remaining: 15067668480 (14.03 GB)
DFS Used%: 0.01%
DFS Remaining%: 75.30%
Configured Cache Capacity: 0 (0 B)
Cache Used: 0 (0 B)
Cache Remaining: 0 (0 B)
Cache Used%: 100.00%
Cache Remaining%: 0.00%
Xceivers: 1
Last contact: Thu Nov 18 14:23:05 CST 2021
Last Block Report: Thu Nov 18 14:09:59 CST 2021
Num of Blocks: 16
能够看到,增加 DataNode 之前,DataNode 总共有 3 个,别离在 hadoop5、hadoop6 和 hadoop7 服务器上
- 查看 YARN 各节点的状态
# yarn node -list
Total Nodes:3
Node-Id Node-State Node-Http-Address Number-of-Running-Containers
hadoop5:34211 RUNNING hadoop5:8042 0
hadoop7:43419 RUNNING hadoop7:8042 0
hadoop6:36501 RUNNING hadoop6:8042 0
能够看到,增加 NodeManager 之前,NodeManger 过程运行在 hadoop5、hadoop6 和 hadoop7 服务器上
5.1.2 动静增加 DataNode 和 NodeManager
- 在 hadoop 集群所有节点中的 workers 文件中新增 hadoop4 节点,以后批改主机 hadoop1:
# vi /usr/local/hadoop-3.3.0/etc/hadoop/workers
hadoop4
hadoop5
hadoop6
hadoop7
- 将批改的文件拷贝到其余节点上
# scp /usr/local/hadoop-3.3.0/etc/hadoop/workers hadoop2:/usr/local/hadoop-3.3.0/etc/hadoop/
# scp /usr/local/hadoop-3.3.0/etc/hadoop/workers hadoop3:/usr/local/hadoop-3.3.0/etc/hadoop/
# scp /usr/local/hadoop-3.3.0/etc/hadoop/workers hadoop4:/usr/local/hadoop-3.3.0/etc/hadoop/
# scp /usr/local/hadoop-3.3.0/etc/hadoop/workers hadoop5:/usr/local/hadoop-3.3.0/etc/hadoop/
# scp /usr/local/hadoop-3.3.0/etc/hadoop/workers hadoop6:/usr/local/hadoop-3.3.0/etc/hadoop/
# scp /usr/local/hadoop-3.3.0/etc/hadoop/workers hadoop7:/usr/local/hadoop-3.3.0/etc/hadoop/
- 启动 hadoop4 服务器上 DataNode 和 NodeManager,如下所示:
# hdfs --daemon start datanode
# yarn --daemin start nodemanager
- 刷新节点,在 hadoop1 服务器上执行如下命令,刷新 Hadoop 集群节点:
# hdfs dfsadmin -refreshNodes
# start-balancer.sh
- 查看 hadoop4 节点上的运行过程:
# jps
20768 NodeManager
6000 ResourceManager
20465 DataNode
20910 Jps
5.1.3 再次查看集群的状态
- 在 hadoop1 服务器上查看 HDFS 各节点状态,如下所示:
# hdfs dfsadmin -report
Configured Capacity: 80038395904 (74.54 GB)
Present Capacity: 60257288192 (56.12 GB)
DFS Remaining: 60253356032 (56.12 GB)
DFS Used: 3932160 (3.75 MB)
DFS Used%: 0.01%
Replicated Blocks:
Under replicated blocks: 0
Blocks with corrupt replicas: 0
Missing blocks: 0
Missing blocks (with replication factor 1): 0
Low redundancy blocks with highest priority to recover: 0
Pending deletion blocks: 0
Erasure Coded Block Groups:
Low redundancy block groups: 0
Block groups with corrupt internal blocks: 0
Missing block groups: 0
Low redundancy blocks with highest priority to recover: 0
Pending deletion blocks: 0
-------------------------------------------------
Live datanodes (4):
Name: 192.168.254.133:9866 (hadoop4)
Hostname: hadoop4
Decommission Status : Normal
Configured Capacity: 20009598976 (18.64 GB)
DFS Used: 24576 (24 KB)
Non DFS Used: 4058525696 (3.78 GB)
DFS Remaining: 15075467264 (14.04 GB)
DFS Used%: 0.00%
DFS Remaining%: 75.34%
Configured Cache Capacity: 0 (0 B)
Cache Used: 0 (0 B)
Cache Remaining: 0 (0 B)
Cache Used%: 100.00%
Cache Remaining%: 0.00%
Xceivers: 1
Last contact: Thu Nov 18 15:12:30 CST 2021
Last Block Report: Thu Nov 18 15:10:49 CST 2021
Num of Blocks: 0
Name: 192.168.254.134:9866 (hadoop5)
Hostname: hadoop5
Decommission Status : Normal
Configured Capacity: 20009598976 (18.64 GB)
DFS Used: 1302528 (1.24 MB)
Non DFS Used: 4072738816 (3.79 GB)
DFS Remaining: 15059976192 (14.03 GB)
DFS Used%: 0.01%
DFS Remaining%: 75.26%
Configured Cache Capacity: 0 (0 B)
Cache Used: 0 (0 B)
Cache Remaining: 0 (0 B)
Cache Used%: 100.00%
Cache Remaining%: 0.00%
Xceivers: 1
Last contact: Thu Nov 18 15:12:33 CST 2021
Last Block Report: Thu Nov 18 13:42:32 CST 2021
Num of Blocks: 16
Name: 192.168.254.135:9866 (hadoop6)
Hostname: hadoop6
Decommission Status : Normal
Configured Capacity: 20009598976 (18.64 GB)
DFS Used: 1302528 (1.24 MB)
Non DFS Used: 4082335744 (3.80 GB)
DFS Remaining: 15050379264 (14.02 GB)
DFS Used%: 0.01%
DFS Remaining%: 75.22%
Configured Cache Capacity: 0 (0 B)
Cache Used: 0 (0 B)
Cache Remaining: 0 (0 B)
Cache Used%: 100.00%
Cache Remaining%: 0.00%
Xceivers: 1
Last contact: Thu Nov 18 15:12:31 CST 2021
Last Block Report: Thu Nov 18 14:58:22 CST 2021
Num of Blocks: 16
Name: 192.168.254.136:9866 (hadoop7)
Hostname: hadoop7
Decommission Status : Normal
Configured Capacity: 20009598976 (18.64 GB)
DFS Used: 1302528 (1.24 MB)
Non DFS Used: 4065181696 (3.79 GB)
DFS Remaining: 15067533312 (14.03 GB)
DFS Used%: 0.01%
DFS Remaining%: 75.30%
Configured Cache Capacity: 0 (0 B)
Cache Used: 0 (0 B)
Cache Remaining: 0 (0 B)
Cache Used%: 100.00%
Cache Remaining%: 0.00%
Xceivers: 1
Last contact: Thu Nov 18 15:12:33 CST 2021
Last Block Report: Thu Nov 18 14:09:59 CST 2021
Num of Blocks: 16
能够看到,增加 DataNode 之前,DataNode 总共有 3 个,别离在 hadoop4、hadoop5、hadoop6 和 hadoop7 服务器上
- 查看 YARN 各节点的状态
# yarn node -list
Total Nodes:4
Node-Id Node-State Node-Http-Address Number-of-Running-Containers
hadoop5:34211 RUNNING hadoop5:8042 0
hadoop4:36431 RUNNING hadoop4:8042 0
hadoop7:43419 RUNNING hadoop7:8042 0
hadoop6:36501 RUNNING hadoop6:8042 0
5.2 动静删除 DataNode 和 NodeManager
##### 5.2.1 删除 DataNode 和 NodeManager
- 进行 hadoop4 下面的 DataNode 和 NodeManager 过程,在 hadoop4 上执行
# hdfs --daemon stop datanode
# yarn --daemon stop nodemanager
- 删除 hadoop 集群每台主机的 workers 文件中的 hadoop4 配置信息
# vi /usr/local/hadoop-3.3.0/etc/hadoop/workers
hadoop5
hadoop6
hadoop7
- 刷新节点,在 hadoop1 服务器上执行如下命令,刷新 hadoop 集群节点:
# hdfs dfsadmin -refreshNodes # start-balancer.sh
参考文档:
- [1] 逸非羽.CSDN: https://www.cnblogs.com/yifei… ,2019-06-18.
- [2] Hadoop 官网: https://hadoop.apache.org/
- [3] 冰河. 海量数据处理与大数据技术实站 [M]. 第 1 版. 北京: 北京大学出版社,2020-09