关于hadoop:Hadoop实战篇集群版2

作者 | WenasWei

在上一篇的 Hadoop 实战篇介绍过了 Hadoop- 离线批处理技术的本地模式和伪集群模式装置，接下来持续学习 Hadoop 集群模式装置; 将从以下几点介绍:

Linux 主机部署布局
Zookeeper 注册核心装置
集群模式装置
Hadoop 的目录构造阐明和命令帮忙文档
集群动静减少和删除节点

Hadoop 集群部署布局:

Hadoop 须要应用到 Linux 环境上的一些根本的配置须要，Hadoop 用户组和用户增加，免密登录操作，JDK 装置

在应用 VMWare 装置 Ubuntu18.04-Linux 操作系统下时产生系统配置问题能够通过分享的博文进行配置，CSDN 跳转链接: VMWare 中 Ubuntu 网络配置

其中蕴含了以下几个重要操作步骤:

Ubuntu 零碎信息与批改主机名
Windows 设置 VMWare 的 NAT 网络
Linux 网关设置与配置动态 IP
Linux 批改 hosts 文件
Linux 免明码登录

1.2.1 增加 Hadoop 用户组和用户

以 root 用户登录 Linux-Ubuntu 18.04 虚拟机，执行命令:

$ groupadd hadoop
$ useradd -r -g hadoop hadoop

1.2.2 赋予 Hadoop 用户目录权限

将 /usr/local 目录权限赋予 Hadoop 用户，命令如下:

$ chown -R hadoop.hadoop /usr/local/
$ chown -R hadoop.hadoop /tmp/
$ chown -R hadoop.hadoop /home/

1.2.3 赋予 Hadoop 用户 sodu 权限

编辑 /etc/sudoers 文件，在 root ALL=(ALL:ALL) ALL 下增加hadoop ALL=(ALL:ALL) ALL

$ vi /etc/sudoers

Defaults        env_reset
Defaults        mail_badpass
Defaults        secure_path="/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/snap/bin"
root    ALL=(ALL:ALL) ALL
hadoop  ALL=(ALL:ALL) ALL
%admin ALL=(ALL) ALL
%sudo   ALL=(ALL:ALL) ALL

1.2.4 赋予 Hadoop 用户登录明码

$ passwd hadoop

Enter new UNIX password: 输出新密码
Retype new UNIX password: 确认新密码
passwd: password updated successfully

Linux 装置 JDK 能够参照分享的博文《Logstash- 数据流引擎》-< 第三节：Logstash 装置 >–(第二大节: 3.2 Linux 装置 JDK 进行)装置配置到每一台主机上，CSDN 跳转链接: Logstash- 数据流引擎

官网下载：https://hadoop.apache.org/rel… Binary download

应用 wget 命名下载（下载目录是当前目录）：

例如：version3.3.0 https://mirrors.bfsu.edu.cn/a…

$ wget https://mirrors.bfsu.edu.cn/apache/hadoop/common/hadoop-3.3.0/hadoop-3.3.0.tar.gz

解压、挪动到你想要搁置的文件夹: /usr/local

$ mv ./hadoop-3.3.0.tar.gz /usr/local

$ cd /usr/local

$ tar -zvxf hadoop-3.3.0.tar.gz

批改配置文件/etc/profile:

$ vi /etc/profile

# 类同 JDK 配置增加
export JAVA_HOME=/usr/local/java/jdk1.8.0_152
export JRE_HOME=/usr/local/java/jdk1.8.0_152/jre
export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib:$JAVA_HOME/jre/lib
export HADOOP_HOME=/usr/local/hadoop-3.3.0
export PATH=$JAVA_HOME/bin:$JAVA_HOME/jre/bin:$PATH:$HOME/bin:$HADOOP_HOME/sbin:$HADOOP_HOME/bin

使配置文件失效

$ source /etc/profile

查看 Hadoop 配置是否胜利

$ hadoop version

Hadoop 3.3.0
Source code repository https://gitbox.apache.org/repos/asf/hadoop.git -r aa96f1871bfd858f9bac59cf2a81ec470da649af
Compiled by brahma on 2020-07-06T18:44Z
Compiled with protoc 3.7.1
From source with checksum 5dc29b802d6ccd77b262ef9d04d19c4
This command was run using /usr/local/hadoop-3.3.0/share/hadoop/common/hadoop-common-3.3.0.jar

从后果能够看出，Hadoop 版本为 Hadoop 3.3.0, 阐明 Hadoop 环境装置并配置胜利。

Zookeeper 注册核心章节次要介绍如下:

Zookeeper 介绍
Zookeeper 下载安装
Zookeeper 配置文件
启动 zookeeper 集群验证

Zookeeper 集群主机布局:

hadoop1
hadoop2
hadoop3

ZooKeeper 是一个分布式的，开放源码的分布式应用程序协调服务，是 Google 的 Chubby 一个开源的实现，是 Hadoop 和 Hbase 的重要组件。它是一个为分布式应用提供一致性服务的软件，提供的性能包含：配置保护、域名服务、分布式同步、组服务等。

ZooKeeper 的指标就是封装好简单易出错的要害服务，将简略易用的接口和性能高效、性能稳固的零碎提供给用户，其中蕴含一个简略的原语集, 提供 Java 和 C 的接口，ZooKeeper 代码版本中，提供了分布式独享锁、选举、队列的接口。其中散布锁和队列有 Java 和 C 两个版本，选举只有 Java 版本。

Zookeeper 负责服务的协调调度, 当客户端发动申请时, 返回正确的服务器地址。

Linux(执行主机 -hadoop1) 下载 apache-zookeeper-3.5.9-bin 版本包, 挪动到装置目录: /usr/local/，解压并重命名为: zookeeper-3.5.9:

$ wget https://mirrors.tuna.tsinghua.edu.cn/apache/zookeeper/zookeeper-3.5.9/apache-zookeeper-3.5.9-bin.tar.gz

$ mv apache-zookeeper-3.5.9-bin.tar.gz /usr/local/
$ cd /usr/local/
$ tar -zxvf apache-zookeeper-3.5.9-bin.tar.gz
$ mv apache-zookeeper-3.5.9-bin zookeeper-3.5.9

离线装置能够到指定官网下载版本包上传装置, 官网地址: http://zookeeper.apache.org/r…

如图所示:

2.3.1 配置 Zookeeper 环境变量

配置 Zookeeper 环境变量，须要在 /etc/profile 配置文件中批改增加，具体配置如下:

export JAVA_HOME=/usr/local/java/jdk1.8.0_152
export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib:$JAVA_HOME/jre/lib
export ZOOKEEPER_HOME=/usr/local/zookeeper-3.5.9
export PATH=$JAVA_HOME/bin:$JAVA_HOME/jre/bin:$PATH:$HOME/bin:$ZOOKEEPER_HOME

批改实现后刷新环境变量配置文件:

$ source /etc/profile

其中曾经蕴含装置了 JDK 配置，如无装置 JDK 能够查看 Hadoop 实战篇 (1) 中的装置

2.3.2 Zookeeper 配置文件

在 zookeeper 根目录 /usr/local/zookeeper-3.5.9 下创立文件夹：data 和 dataLog

$ cd /usr/local/zookeeper-3.5.9
$ mkdir data
$ mkdir dataLog

切换到新建的 data 目录下，创立 myid 文件，增加具体内容为数字 1，如下所示:

$ cd /usr/local/zookeeper-3.5.9/data
$ vi myid
# 增加内容数字 1
1

$ cat myid
1

复制配置文件 zoo_sample.cfg 并且批改名称为 zoo.cfg:

$ cp zoo_sample.cfg zoo.cfg

批改 zoo.cfg 文件，批改内容如下:

tickTime=2000
initLimit=10
syncLimit=5
dataDir=/usr/local/zookeeper-3.5.9/data
dataLogDir=/usr/local/zookeeper-3.5.9/dataLog
clientPort=2181
server.1=hadoop1:2888:3888
server.2=hadoop2:2888:3888
server.3=hadoop3:2888:3888

2.3.3 将 Zookeeper 和零碎环境变量拷贝到其余服务器

依据对服务器的布局，将 Zookeeper 和配置文件 /etc/profile 拷贝到 hadoop2 和 hadoop3 主机上:

$ scp -r zookeeper-3.5.9/ root@hadoop2:/usr/local/
$ scp -r zookeeper-3.5.9/ root@hadoop3:/usr/local/
$ scp /etc/profile root@hadoop2:/etc/
$ scp /etc/profile root@hadoop3:/etc/

登陆到 hadoop2 和 hadoop3
别离批改 hadoop2 主机和 hadoop3 主机上的配置文件内容: /usr/local/zookeeper-3.5.9/data/myid为 2 和 3

并刷新环境变量配置文件:

$ source /etc/profile

在 hadoop1、hadoop2 和 hadoop3 三台服务器上别离启动 Zookeeper 服务器并查看 Zookeeper 运行状态

hadoop1 主机:

$ cd /usr/local/zookeeper-3.5.9/bin/
$ ./zkServer.sh start
$ ./zkServer.sh status

ZooKeeper JMX enabled by default
Using config: /usr/local/zookeeper-3.5.9/bin/../conf/zoo.cfg
Client port found: 2181. Client address: localhost. Client SSL: false.
Mode: follower

阐明 hadoop1 主机上 zookeeper 的运行状态是 follower

hadoop2 主机:

$ cd /usr/local/zookeeper-3.5.9/bin/
$ ./zkServer.sh start
$ ./zkServer.sh status

ZooKeeper JMX enabled by default
Using config: /usr/local/zookeeper-3.5.9/bin/../conf/zoo.cfg
Client port found: 2181. Client address: localhost. Client SSL: false.
Mode: leader

阐明 hadoop2 主机上 zookeeper 的运行状态是 leader

hadoop3 主机:

$ cd /usr/local/zookeeper-3.5.9/bin/
$ ./zkServer.sh start
$ ./zkServer.sh status

ZooKeeper JMX enabled by default
Using config: /usr/local/zookeeper-3.5.9/bin/../conf/zoo.cfg
Client port found: 2181. Client address: localhost. Client SSL: false.
Mode: follower

阐明 hadoop3 主机上 zookeeper 的运行状态是 follower

3.1.1 批改配置 hadoop-env.sh

主机 hadoop1 配置 hadoop-env.sh，在 hadoop-env.sh 文件中指定 JAVA_HOME 的装置目录: /usr/local/hadoop-3.3.0/etc/hadoop，配置如下:

export JAVA_HOME=/usr/local/java/jdk1.8.0_152
# 配置容许应用 root 账户权限
export HDFS_DATANODE_USER=root 
export HADOOP_SECURE_USER=root 
export HDFS_NAMENODE_USER=root 
export HDFS_SECONDARYNAMENODE_USER=root 
export YARN_RESOURCEMANAGER_USER=root 
export YARN_NODEMANAGER_USER=root
export HADOOP_SHELL_EXECNAME=root
export HDFS_JOURNALNODE_USER=root
export HDFS_ZKFC_USER=root

3.1.2 批改配置 core-site.xml

主机 hadoop1 配置 core-site.xml，在 core-site.xml 文件中指定 Zookeeper 的集群节点 /usr/local/hadoop-3.3.0/etc/hadoop，配置如下:

<configuration>
    <property>
      <name>fs.defaultFS</name>
      <value>hdfs://ns/</value>
    </property>
    <property>
      <name>hadoop.tmp.dir</name>
      <value>/usr/local/hadoop-3.3.0/tmp</value>
      <description>Abase for other temporary directories.</description>
        </property>
    <property>
      <name>ha.zookeeper.quorum</name>
      <value>hadoop1:2181,hadoop2:2181,hadoop3:2181</value>
    </property>
</configuration>

3.1.3 批改配置 hdfs-site.xml

主机 hadoop1 配置 hdfs-site.xml，在 hdfs-site.xml 文件中指定 namenodes 节点，/usr/local/hadoop-3.3.0/etc/hadoop，配置如下:

<configuration>
        <property>
          <name>dfs.nameservices</name>
          <value>ns</value>
        </property>
        <property>
          <name>dfs.ha.namenodes.ns</name>
          <value>nn1,nn2</value>
        </property>
        <!-- nn1 的 RPC 通信地址，nn1 所在地址  -->
        <property>
          <name>dfs.namenode.rpc-address.ns.nn1</name>
          <value>hadoop1:9000</value>
        </property>
        <!-- nn1 的 http 通信地址，内部拜访地址 -->
        <property>
          <name>dfs.namenode.http-address.ns.nn1</name>
          <value>hadoop1:9870</value>
        </property>
        <!-- nn2 的 RPC 通信地址，nn2 所在地址 -->
        <property>
          <name>dfs.namenode.rpc-address.ns.nn2</name>
          <value>hadoop2:9000</value>
        </property>
        <!-- nn2 的 http 通信地址，内部拜访地址 -->
        <property>
          <name>dfs.namenode.http-address.ns.nn2</name>
          <value>hadoop2:9870</value>
        </property>
        <!-- 指定 NameNode 的元数据在 JournalNode 日志上的寄存地位(个别和 zookeeper 部署在一起) -->
        <property>
          <name>dfs.namenode.shared.edits.dir</name>
          <value>qjournal://hadoop5:8485;hadoop6:8485;hadoop7:8485/ns</value>
        </property>
        <!-- 指定 JournalNode 在本地磁盘存放数据的地位 -->
        <property>
          <name>dfs.journalnode.edits.dir</name>
          <value>/usr/local/hadoop-3.3.0/data/journal</value>
        </property>
        <!-- 客户端通过代理拜访 namenode，拜访文件系统，HDFS 客户端与 Active 节点通信的 Java 类，应用其确定 Active 节点是否沉闷  -->
        <property>
          <name>dfs.client.failover.proxy.provider.ns</name>
          <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
        </property>
        <!-- 这是配置主动切换的办法，有多种应用办法，具体能够看官网，这里是近程登录杀死的办法  -->
        <property>
          <name>dfs.ha.fencing.methods</name>
          <!-- 这个参数的值能够有多种，你也能够换成 shell(/bin/true)试试，也是能够的，这个脚本 do nothing 返回 0 -->
          <value>sshfence</value>
        </property>
        <!-- 这个是应用 sshfence 隔离机制时才须要配置 ssh 免登陆 -->
        <property>
          <name>dfs.ha.fencing.ssh.private-key-files</name>
          <value>/root/.ssh/id_rsa</value>
        </property>
        <!-- 配置 sshfence 隔离机制超时工夫，这个属性同上，如果你是用脚本的办法切换，这个应该是能够不配置的 -->
        <property>
          <name>dfs.ha.fencing.ssh.connect-timeout</name>
          <value>30000</value>
        </property>
        <!-- 这个是开启主动故障转移，如果你没有主动故障转移，这个能够先不配 -->
        <property>
          <name>dfs.ha.automatic-failover.enabled</name>
          <value>true</value>
        </property>
</configuration>

3.1.4 批改配置 mapred-site.xml

主机 hadoop1 配置 mapred-site.xml，在 mapred-site.xml 文件中指定 mapreduce 信息，/usr/local/hadoop-3.3.0/etc/hadoop，配置如下:

<configuration>
   <property>
       <name>mapreduce.framework.name</name>
       <value>yarn</value>
   </property>
   <property>
       <name>yarn.app.mapreduce.am.env</name>
       <value>HADOOP_MAPRED_HOME=${HADOOP_HOME}</value>
   </property>
   <property>
       <name>mapreduce.map.env</name>
       <value>HADOOP_MAPRED_HOME=${HADOOP_HOME}</value>
   </property>
   <property>
       <name>mapreduce.reduce.env</name>
       <value>HADOOP_MAPRED_HOME=${HADOOP_HOME}</value>
   </property>
   <property>
     <name>mapreduce.framework.name</name>
     <value>yarn</value>
   </property>
   <property>
       <name>mapreduce.jobhistory.address</name>
       <value>hadoop1:10020</value>
   </property>
   <property>
       <name>mapreduce.jobhistory.webapp.address</name>
       <value>hadoop1:19888</value>
   </property>

3.1.5 批改配置 yarn-site.xml

主机 hadoop1 配置 yarn-site.xml，在 yarn-site.xml 文件中指定 ResourceManaeger 节点，/usr/local/hadoop-3.3.0/etc/hadoop，配置如下:

<configuration>
<property>
  <name>yarn.resourcemanager.ha.enabled</name>
  <value>true</value>
</property>

<property>
  <name>yarn.resourcemanager.cluster-id</name>
  <value>yrc</value>
</property>

<property>
  <name>yarn.resourcemanager.ha.rm-ids</name>
  <value>rm1,rm2</value>
</property>

<property>
  <name>yarn.resourcemanager.hostname.rm1</name>
  <value>hadoop3</value>
</property>

<property>
  <name>yarn.resourcemanager.hostname.rm2</name>
  <value>hadoop4</value>
</property>

<property>
   <name>yarn.resourcemanager.address.rm1</name>
   <value>hadoop3:8032</value>
</property>

<property>
  <name>yarn.resourcemanager.scheduler.address.rm1</name>
  <value>hadoop3:8030</value>
</property>

<property>
  <name>yarn.resourcemanager.webapp.address.rm1</name>
  <value>hadoop3:8088</value>
</property>

<property>
  <name>yarn.resourcemanager.resource-tracker.address.rm1</name>
  <value>hadoop3:8031</value>
</property>

<property>
  <name>yarn.resourcemanager.admin.address.rm1</name>
  <value>hadoop3:8033</value>
</property>

<property>
  <name>yarn.resourcemanager.ha.admin.address.rm1</name>
  <value>hadoop3:23142</value>
</property>

<property>
   <name>yarn.resourcemanager.address.rm2</name>
   <value>hadoop4:8032</value>
</property>

<property>
  <name>yarn.resourcemanager.scheduler.address.rm2</name>
  <value>hadoop4:8030</value>
</property>

<property>
  <name>yarn.resourcemanager.webapp.address.rm2</name>
  <value>hadoop4:8088</value>
</property>

<property>
  <name>yarn.resourcemanager.resource-tracker.address.rm2</name>
  <value>hadoop4:8031</value>
</property>

<property>
  <name>yarn.resourcemanager.admin.address.rm2</name>
  <value>hadoop4:8033</value>
</property>

<property>
  <name>yarn.resourcemanager.ha.admin.address.rm2</name>
  <value>hadoop4:23142</value>
</property>

<property>
  <name>yarn.resourcemanager.zk-address</name>
  <value>hadoop1:2181,hadoop2:2181,hadoop3:2181</value>
</property>

 <!-- 资源调度模型  -->
<property> 
  <name>yarn.nodemanager.aux-services</name> 
  <value>mapreduce_shuffle</value> 
</property> 

 <!-- 开启 mapreduce 两头过程压缩  -->
<property>
  <name>mapreduce.map.output.compress</name>  
  <value>true</value>
</property>
</configuration>

3.1.6 批改 workers 文件

主机 hadoop1 配置 workers，在 workers 文件中指定 DataNode 节点，/usr/local/hadoop-3.3.0/etc/hadoop，配置如下:

hadoop5
hadoop6
hadoop7

3.2.1 将配置好的 Hadoop 复制到其余节点

将在 hadoop1 上装置并配置好的 Hadoop 复制到其余服务器上，操作如下所示:

scp -r /usr/local/hadoop-3.3.0/ hadoop2:/usr/local/
scp -r /usr/local/hadoop-3.3.0/ hadoop3:/usr/local/
scp -r /usr/local/hadoop-3.3.0/ hadoop4:/usr/local/
scp -r /usr/local/hadoop-3.3.0/ hadoop5:/usr/local/
scp -r /usr/local/hadoop-3.3.0/ hadoop6:/usr/local/
scp -r /usr/local/hadoop-3.3.0/ hadoop7:/usr/local/

3.2.2 复制 hadoop1 上的零碎环境变量

将在 hadoop1 上装置并配置好的零碎环境变量复制到其余服务器上，操作如下所示:

sudo scp /etc/profile hadoop2:/etc/
sudo scp /etc/profile hadoop3:/etc/
sudo scp /etc/profile hadoop4:/etc/
sudo scp /etc/profile hadoop5:/etc/
sudo scp /etc/profile hadoop6:/etc/
sudo scp /etc/profile hadoop7:/etc/

使零碎环境变量失效

source /etc/profile
hadoop version

启动 hadoop 集群步骤分为:

启动并验证 journalnode 过程
格式化 HDFS
格式化 ZKFC
启动并验证 NameNode 过程
同步元数据信息
启动并验证备用 NameNode 过程
启动并验证 DataNode 过程
启动并验证 YARN
启动并验证 ZKFC
查看每台服务器上运行的运行信息

3.3.1 启动并验证 journalnode 过程

(1)启动 journalnode 过程，在 hadoop1 服务器上执行如下命令，启动 journalnode 过程:

hdfs --workers --daemon start journalnode

(2)验证 journalnode 过程是否启动胜利，别离在 hadoop5、hadoop6 和 hadoop7 三台服务器上别离执行 jps 命令，执行后果如下

hadoop5 服务器:

root@hadoop5:~# jps
17322 Jps
14939 JournalNode

hadoop6 服务器:

root@hadoop6:~# jps
13577 JournalNode
15407 Jps

hadoop7 服务器:

root@hadoop7:~# jps
13412 JournalNode
15212 Jps

3.3.2 格式化 HDFS

在 hadoop1 服务器上执行如下命令，格式化 HDFS：

hdfs namenode -format

执行后，命令行会输入胜利信息:

common.Storage: Storage directory /usr/local/hadoop-3.3.0/tmp/dfs/name has been successfully formatted.

3.3.3 格式化 ZKFC

在 hadoop1 服务器上执行如下命令，格式化 ZKFC :

hdfs zkfc -formatZK

执行后，命令行会输入胜利信息:

ha.ActiveStandbyElector: Successfuly created /hadoop-ha/ns in ZK.

3.3.4 启动并验证 NameNode 过程

启动 NameNode 过程，在 hadoop1 服务器上执行

hdfs --daemon start namenode

验证 NameNode 过程启动胜利,

# jps
26721 NameNode
50317 Jps

3.3.5 同步元数据信息

在 hadoop2 服务器上执行如下命令，进行元数据信息的同步操作:

hdfs namenode -bootstrapStandby

执行后，命令行胜利信息:

common.Storage: Storage directory /usr/local/hadoop-3.3.0/tmp/dfs/name has been successfully formatted.

3.3.6 启动并验证备用 NameNode 过程

在 hadoop2 服务器上执行如下命令，启动备用 NameNode 过程:

hdfs --daemon start namenode

验证备用的 NameNode 过程

# jps
21482 NameNode
50317 Jps

3.3.7 启动并验证 DataNode 过程

在 hadoop1 服务器上执行如下命令，启动 DataNode 过程

hdfs --workers --daemon start datanode

验证 DataNode 过程在 hadoop5、hadoop6 和 hadoop7 服务器上执行:

hadoop5 服务器:

# jps
31713 Jps
16435 DataNode
14939 JournalNode
15406 NodeManager

hadoop6 服务器:

# jps
13744 NodeManager
13577 JournalNode
29806 Jps
14526 DataNode

hadoop7 服务器:

# jps
29188 Jps
14324 DataNode
13412 JournalNode
13580 NodeManager

3.3.8 启动并验证 YARN

在 hadoop1 服务器上执行如下命令，启动 YARN

start-yarn.sh

在 hadoop3、hadoop4 服务器上执行 jps 命令，验证 YARN 启动胜利

hadoop3 服务器:

# jps
21937 Jps
8070 ResourceManager
7430 QuorumPeerMain

hadoop4 服务器:

# jps
6000 ResourceManager
20183 Jps

3.3.9 启动并验证 ZKFC

在 hadoop1 服务器上执行如下命令，启动 ZKFC:

hdfs --workers daemon start zkfc

在 hadoop1 和 hadoop2 上执行 jps 命令，验证 DFSZKFailoveController 过程启动胜利

hadoop1 服务器:

# jps
26721 NameNode
14851 QuorumPeerMain
50563 Jps
27336 DFSZKFailoverController

hadoop2 服务器:

# jps
21825 DFSZKFailoverController
39399 Jps
15832 QuorumPeerMain
21482 NameNode

3.3.10 查看每台服务器上运行的运行信息

hadoop1 服务器:

# jps
26721 NameNode
14851 QuorumPeerMain
50563 Jps
27336 DFSZKFailoverController

hadoop2 服务器:

# jps
21825 DFSZKFailoverController
39399 Jps
15832 QuorumPeerMain
21482 NameNode

hadoop3 服务器:

# jps
8070 ResourceManager
7430 QuorumPeerMain
21950 Jps

hadoop4 服务器:

# jps
6000 ResourceManager
20197 Jps

hadoop5 服务器:

# jps
16435 DataNode
31735 Jps
14939 JournalNode
15406 NodeManager

hadoop6 服务器:

# jps
13744 NodeManager
13577 JournalNode
29833 Jps
14526 DataNode

hadoop7 服务器:

# jps
14324 DataNode
13412 JournalNode
29211 Jps
13580 NodeManager

格式化 HDFS
复制元数据信息
格式化 ZKFC
启动 HDFS
启动 YARN
查看每台服务器上运行的运行信息

3.4.1 格式化 HDFS

在 hadoop1 服务器上格式化 HDFS，如下所示:

hdfs namenode -format

3.4.2 复制元数据信息

将 hadoop1 服务器上的 /usr/local/hadoop-3.3.0/tmp目录复制到 hadoop2 服务器上 /usr/local/hadoop-3.3.0 目录下，在 hadoop1 服务器上执行如下命令:

scp -r /usr/local/hadoop-3.3.0/tmp hadoop2:/usr/local/hadoop-3.3.0/

3.4.3 格式化 ZKFC

在 hadoop1 服务器上格式化 ZKFC，如下所示:

hdfs zkfc -formatZK

3.4.4 启动 HDFS

在 hadoop1 服务器上通过启动脚本启动 HDFS，如下所示:

start-dfs.sh

3.4.5 启动 YARN

在 hadoop1 服务器上通过启动脚本启动 YARN，如下所示:

start-yarn.sh

3.4.6 查看每台服务器上运行的运行信息

hadoop1 服务器:

# jps
26721 NameNode
14851 QuorumPeerMain
50563 Jps
27336 DFSZKFailoverController

hadoop2 服务器:

# jps
21825 DFSZKFailoverController
39399 Jps
15832 QuorumPeerMain
21482 NameNode

hadoop3 服务器:

# jps
8070 ResourceManager
7430 QuorumPeerMain
21950 Jps

hadoop4 服务器:

# jps
6000 ResourceManager
20197 Jps

hadoop5 服务器:

# jps
16435 DataNode
31735 Jps
14939 JournalNode
15406 NodeManager

hadoop6 服务器:

# jps
13744 NodeManager
13577 JournalNode
29833 Jps
14526 DataNode

hadoop7 服务器:

# jps
14324 DataNode
13412 JournalNode
29211 Jps
13580 NodeManager

应用命令“ls”查看 Hadoop 3.3.0 上面的目录，如下所示：

-bash-4.1$ ls
bin  etc  include  lib  libexec  LICENSE.txt  NOTICE.txt  README.txt  sbin  share

上面就简略介绍下每个目录的作用：

bin：bin 目录是 Hadoop 最根本的治理脚本和应用脚本所在的目录，这些脚本是 sbin 目录下治理脚本的根底实现，用户能够间接应用这些脚本治理和应用 Hadoop
etc：Hadoop 配置文件所在的目录，包含：core-site.xml、hdfs-site.xml、mapred-site.xml 和 yarn-site.xml 等配置文件。
include：对外提供的编程库头文件（具体的动静库和动态库在 lib 目录中），这些文件都是用 C ++ 定义的，通常用于 C ++ 程序拜访 HDFS 或者编写 MapReduce 程序。
lib：蕴含了 Hadoop 对外提供的编程动静库和动态库，与 include 目录中的头文件联合应用。
libexec：各个服务对应的 shell 配置文件所在的目录，可用于配置日志输入目录、启动参数（比方 JVM 参数）等根本信息。
sbin：Hadoop 治理脚本所在目录，次要蕴含 HDFS 和 YARN 中各类服务启动 / 敞开的脚本。
share：Hadoop 各个模块编译后的 Jar 包所在目录，这个目录中也蕴含了 Hadoop 文档。

hdfs dfs –ls [文件目录]
hdfs dfs -ls -R   /                   // 显式目录构造
eg: hdfs dfs –ls /user/wangkai.pt

2、关上某个已存在文件

hdfs dfs –cat [file_path]
eg:hdfs dfs -cat /user/wangkai.pt/data.txt

3、将本地文件存储至 hadoop

hdfs dfs –put [本地地址] [hadoop 目录]
hdfs dfs –put /home/t/file.txt  /user/t

4、将本地文件夹存储至 hadoop

hdfs dfs –put [本地目录] [hadoop 目录] 
hdfs dfs –put /home/t/dir_name /user/t
(dir_name 是文件夹名)

5、将 hadoop 上某个文件 down 至本地已有目录下

hadoop dfs -get [文件目录] [本地目录]
hadoop dfs –get /user/t/ok.txt /home/t

6、删除 hadoop 上指定文件

hdfs  dfs –rm [文件地址]
hdfs dfs –rm /user/t/ok.txt

7、删除 hadoop 上指定文件夹（蕴含子目录等）

hdfs dfs –rm [目录地址]
hdfs dfs –rmr /user/t

8、在 hadoop 指定目录内创立新目录

hdfs dfs –mkdir /user/t
hdfs  dfs -mkdir - p /user/centos/hadoop

9、在 hadoop 指定目录下新建一个空文件

应用 touchz 命令：

hdfs dfs  -touchz  /user/new.txt

10、将 hadoop 上某个文件重命名

应用 mv 命令：

hdfs dfs –mv  /user/test.txt  /user/ok.txt（将 test.txt 重命名为 ok.txt）

11、将 hadoop 指定目录下所有内容保留为一个文件，同时 down 至本地

hdfs dfs –getmerge /user /home/t

12、将正在运行的 hadoop 作业 kill 掉

hadoop job –kill  [job-id]

13. 查看帮忙

hdfs dfs -help

5.1.1 查看集群的状态

在 hadoop1 服务器上查看 HDFS 各节点状态，如下所示:

# hdfs dfsadmin -report
Configured Capacity: 60028796928 (55.91 GB)
Present Capacity: 45182173184 (42.08 GB)
DFS Remaining: 45178265600 (42.08 GB)
DFS Used: 3907584 (3.73 MB)
DFS Used%: 0.01%
Replicated Blocks:
    Under replicated blocks: 0
    Blocks with corrupt replicas: 0
    Missing blocks: 0
    Missing blocks (with replication factor 1): 0
    Low redundancy blocks with highest priority to recover: 0
    Pending deletion blocks: 0
Erasure Coded Block Groups: 
    Low redundancy block groups: 0
    Block groups with corrupt internal blocks: 0
    Missing block groups: 0
    Low redundancy blocks with highest priority to recover: 0
    Pending deletion blocks: 0

-------------------------------------------------
Live datanodes (3):

Name: 192.168.254.134:9866 (hadoop5)
Hostname: hadoop5
Decommission Status : Normal
Configured Capacity: 20009598976 (18.64 GB)
DFS Used: 1302528 (1.24 MB)
Non DFS Used: 4072615936 (3.79 GB)
DFS Remaining: 15060099072 (14.03 GB)
DFS Used%: 0.01%
DFS Remaining%: 75.26%
Configured Cache Capacity: 0 (0 B)
Cache Used: 0 (0 B)
Cache Remaining: 0 (0 B)
Cache Used%: 100.00%
Cache Remaining%: 0.00%
Xceivers: 1
Last contact: Thu Nov 18 14:23:05 CST 2021
Last Block Report: Thu Nov 18 13:42:32 CST 2021
Num of Blocks: 16

Name: 192.168.254.135:9866 (hadoop6)
Hostname: hadoop6
Decommission Status : Normal
Configured Capacity: 20009598976 (18.64 GB)
DFS Used: 1302528 (1.24 MB)
Non DFS Used: 4082216960 (3.80 GB)
DFS Remaining: 15050498048 (14.02 GB)
DFS Used%: 0.01%
DFS Remaining%: 75.22%
Configured Cache Capacity: 0 (0 B)
Cache Used: 0 (0 B)
Cache Remaining: 0 (0 B)
Cache Used%: 100.00%
Cache Remaining%: 0.00%
Xceivers: 1
Last contact: Thu Nov 18 14:23:06 CST 2021
Last Block Report: Thu Nov 18 08:58:22 CST 2021
Num of Blocks: 16

Name: 192.168.254.136:9866 (hadoop7)
Hostname: hadoop7
Decommission Status : Normal
Configured Capacity: 20009598976 (18.64 GB)
DFS Used: 1302528 (1.24 MB)
Non DFS Used: 4065046528 (3.79 GB)
DFS Remaining: 15067668480 (14.03 GB)
DFS Used%: 0.01%
DFS Remaining%: 75.30%
Configured Cache Capacity: 0 (0 B)
Cache Used: 0 (0 B)
Cache Remaining: 0 (0 B)
Cache Used%: 100.00%
Cache Remaining%: 0.00%
Xceivers: 1
Last contact: Thu Nov 18 14:23:05 CST 2021
Last Block Report: Thu Nov 18 14:09:59 CST 2021
Num of Blocks: 16

能够看到，增加 DataNode 之前，DataNode 总共有 3 个，别离在 hadoop5、hadoop6 和 hadoop7 服务器上

查看 YARN 各节点的状态

# yarn node -list
Total Nodes:3
         Node-Id         Node-State    Node-Http-Address    Number-of-Running-Containers
   hadoop5:34211            RUNNING         hadoop5:8042                               0
   hadoop7:43419            RUNNING         hadoop7:8042                               0
   hadoop6:36501            RUNNING         hadoop6:8042                               0

能够看到，增加 NodeManager 之前，NodeManger 过程运行在 hadoop5、hadoop6 和 hadoop7 服务器上

5.1.2 动静增加 DataNode 和 NodeManager

在 hadoop 集群所有节点中的 workers 文件中新增 hadoop4 节点，以后批改主机 hadoop1:

# vi /usr/local/hadoop-3.3.0/etc/hadoop/workers
hadoop4
hadoop5
hadoop6
hadoop7

将批改的文件拷贝到其余节点上

# scp /usr/local/hadoop-3.3.0/etc/hadoop/workers hadoop2:/usr/local/hadoop-3.3.0/etc/hadoop/
# scp /usr/local/hadoop-3.3.0/etc/hadoop/workers hadoop3:/usr/local/hadoop-3.3.0/etc/hadoop/
# scp /usr/local/hadoop-3.3.0/etc/hadoop/workers hadoop4:/usr/local/hadoop-3.3.0/etc/hadoop/
# scp /usr/local/hadoop-3.3.0/etc/hadoop/workers hadoop5:/usr/local/hadoop-3.3.0/etc/hadoop/
# scp /usr/local/hadoop-3.3.0/etc/hadoop/workers hadoop6:/usr/local/hadoop-3.3.0/etc/hadoop/
# scp /usr/local/hadoop-3.3.0/etc/hadoop/workers hadoop7:/usr/local/hadoop-3.3.0/etc/hadoop/

启动 hadoop4 服务器上 DataNode 和 NodeManager，如下所示:

# hdfs --daemon start datanode
# yarn --daemin start nodemanager

刷新节点，在 hadoop1 服务器上执行如下命令，刷新 Hadoop 集群节点:

# hdfs dfsadmin -refreshNodes
# start-balancer.sh

查看 hadoop4 节点上的运行过程:

# jps
20768 NodeManager
6000 ResourceManager
20465 DataNode
20910 Jps

5.1.3 再次查看集群的状态

在 hadoop1 服务器上查看 HDFS 各节点状态，如下所示:

# hdfs dfsadmin -report
Configured Capacity: 80038395904 (74.54 GB)
Present Capacity: 60257288192 (56.12 GB)
DFS Remaining: 60253356032 (56.12 GB)
DFS Used: 3932160 (3.75 MB)
DFS Used%: 0.01%
Replicated Blocks:
    Under replicated blocks: 0
    Blocks with corrupt replicas: 0
    Missing blocks: 0
    Missing blocks (with replication factor 1): 0
    Low redundancy blocks with highest priority to recover: 0
    Pending deletion blocks: 0
Erasure Coded Block Groups: 
    Low redundancy block groups: 0
    Block groups with corrupt internal blocks: 0
    Missing block groups: 0
    Low redundancy blocks with highest priority to recover: 0
    Pending deletion blocks: 0

-------------------------------------------------
Live datanodes (4):

Name: 192.168.254.133:9866 (hadoop4)
Hostname: hadoop4
Decommission Status : Normal
Configured Capacity: 20009598976 (18.64 GB)
DFS Used: 24576 (24 KB)
Non DFS Used: 4058525696 (3.78 GB)
DFS Remaining: 15075467264 (14.04 GB)
DFS Used%: 0.00%
DFS Remaining%: 75.34%
Configured Cache Capacity: 0 (0 B)
Cache Used: 0 (0 B)
Cache Remaining: 0 (0 B)
Cache Used%: 100.00%
Cache Remaining%: 0.00%
Xceivers: 1
Last contact: Thu Nov 18 15:12:30 CST 2021
Last Block Report: Thu Nov 18 15:10:49 CST 2021
Num of Blocks: 0

Name: 192.168.254.134:9866 (hadoop5)
Hostname: hadoop5
Decommission Status : Normal
Configured Capacity: 20009598976 (18.64 GB)
DFS Used: 1302528 (1.24 MB)
Non DFS Used: 4072738816 (3.79 GB)
DFS Remaining: 15059976192 (14.03 GB)
DFS Used%: 0.01%
DFS Remaining%: 75.26%
Configured Cache Capacity: 0 (0 B)
Cache Used: 0 (0 B)
Cache Remaining: 0 (0 B)
Cache Used%: 100.00%
Cache Remaining%: 0.00%
Xceivers: 1
Last contact: Thu Nov 18 15:12:33 CST 2021
Last Block Report: Thu Nov 18 13:42:32 CST 2021
Num of Blocks: 16

Name: 192.168.254.135:9866 (hadoop6)
Hostname: hadoop6
Decommission Status : Normal
Configured Capacity: 20009598976 (18.64 GB)
DFS Used: 1302528 (1.24 MB)
Non DFS Used: 4082335744 (3.80 GB)
DFS Remaining: 15050379264 (14.02 GB)
DFS Used%: 0.01%
DFS Remaining%: 75.22%
Configured Cache Capacity: 0 (0 B)
Cache Used: 0 (0 B)
Cache Remaining: 0 (0 B)
Cache Used%: 100.00%
Cache Remaining%: 0.00%
Xceivers: 1
Last contact: Thu Nov 18 15:12:31 CST 2021
Last Block Report: Thu Nov 18 14:58:22 CST 2021
Num of Blocks: 16

Name: 192.168.254.136:9866 (hadoop7)
Hostname: hadoop7
Decommission Status : Normal
Configured Capacity: 20009598976 (18.64 GB)
DFS Used: 1302528 (1.24 MB)
Non DFS Used: 4065181696 (3.79 GB)
DFS Remaining: 15067533312 (14.03 GB)
DFS Used%: 0.01%
DFS Remaining%: 75.30%
Configured Cache Capacity: 0 (0 B)
Cache Used: 0 (0 B)
Cache Remaining: 0 (0 B)
Cache Used%: 100.00%
Cache Remaining%: 0.00%
Xceivers: 1
Last contact: Thu Nov 18 15:12:33 CST 2021
Last Block Report: Thu Nov 18 14:09:59 CST 2021
Num of Blocks: 16

能够看到，增加 DataNode 之前，DataNode 总共有 3 个，别离在 hadoop4、hadoop5、hadoop6 和 hadoop7 服务器上

查看 YARN 各节点的状态

# yarn node -list
Total Nodes:4
         Node-Id         Node-State    Node-Http-Address    Number-of-Running-Containers
   hadoop5:34211            RUNNING         hadoop5:8042                               0
   hadoop4:36431            RUNNING         hadoop4:8042                               0
   hadoop7:43419            RUNNING         hadoop7:8042                               0
   hadoop6:36501            RUNNING         hadoop6:8042                               0

##### 5.2.1 删除 DataNode 和 NodeManager

进行 hadoop4 下面的 DataNode 和 NodeManager 过程，在 hadoop4 上执行

# hdfs --daemon stop datanode 
# yarn --daemon stop nodemanager

删除 hadoop 集群每台主机的 workers 文件中的 hadoop4 配置信息

# vi /usr/local/hadoop-3.3.0/etc/hadoop/workers
hadoop5
hadoop6
hadoop7

刷新节点，在 hadoop1 服务器上执行如下命令，刷新 hadoop 集群节点:

# hdfs dfsadmin -refreshNodes # start-balancer.sh

[1] 逸非羽.CSDN: https://www.cnblogs.com/yifei… ,2019-06-18.
[2] Hadoop 官网: https://hadoop.apache.org/
[3] 冰河. 海量数据处理与大数据技术实站 [M]. 第 1 版. 北京: 北京大学出版社,2020-09

Hadoop 实战篇（2）

前言

一 Linux 环境的配置与装置 Hadoop

1.1 VMWare 中 Ubuntu 网络配置

1.2 Hadoop 用户组和用户增加

1.2.1 增加 Hadoop 用户组和用户

1.2.2 赋予 Hadoop 用户目录权限

1.2.3 赋予 Hadoop 用户 sodu 权限

1.2.4 赋予 Hadoop 用户登录明码

1.3 JDK 装置

1.4 Hadoop 官网下载

1.5 配置 Hadoop 环境

二 Zookeeper 注册核心

2.1 Zookeeper 介绍

2.2 Zookeeper 下载安装

2.3 Zookeeper 配置文件

2.3.1 配置 Zookeeper 环境变量

2.3.2 Zookeeper 配置文件

2.3.3 将 Zookeeper 和零碎环境变量拷贝到其余服务器

2.4 启动 zookeeper 集群

三 集群模式装置

3.1 Hadoop 配置文件批改

3.1.1 批改配置 hadoop-env.sh

3.1.2 批改配置 core-site.xml

3.1.3 批改配置 hdfs-site.xml

3.1.4 批改配置 mapred-site.xml

3.1.5 批改配置 yarn-site.xml

3.1.6 批改 workers 文件

3.2 Hadoop 节点拷贝配置

3.2.1 将配置好的 Hadoop 复制到其余节点

3.2.2 复制 hadoop1 上的零碎环境变量

3.3 启动 hadoop 集群(1)

3.3.1 启动并验证 journalnode 过程

3.3.2 格式化 HDFS

3.3.3 格式化 ZKFC

3.3.4 启动并验证 NameNode 过程

3.3.5 同步元数据信息

3.3.6 启动并验证备用 NameNode 过程

3.3.7 启动并验证 DataNode 过程

3.3.8 启动并验证 YARN

3.3.9 启动并验证 ZKFC

3.3.10 查看每台服务器上运行的运行信息

3.4 启动 hadoop 集群(2)

3.4.1 格式化 HDFS

3.4.2 复制元数据信息

3.4.3 格式化 ZKFC

3.4.4 启动 HDFS

3.4.5 启动 YARN

3.4.6 查看每台服务器上运行的运行信息

四 Hadoop 的目录构造阐明和命令帮忙文档

4.1 Hadoop 的目录构造阐明

4.2 Hadoop 命令帮忙文档

五 集群动静减少和删除节点

5.1 动静增加 DataNode 和 NodeManager

5.1.1 查看集群的状态

5.1.2 动静增加 DataNode 和 NodeManager

5.1.3 再次查看集群的状态

5.2 动静删除 DataNode 和 NodeManager

参考文档:

三集群模式装置

五集群动静减少和删除节点