关于hadoop:Hadoop完整搭建过程一本地模式

本地模式是最简略的模式，所有模块都运行在一个 JVM 过程中，应用本地文件系统而不是HDFS。

本地模式次要是用于本地开发过程中的运行调试用，下载后的 Hadoop 不须要设置默认就是本地模式。

笔者喜爱把 JDK 放在 /usr/local 下，运行前请确保设置了 JAVA_HOME，留神是在etc/hadoop/hadoop-env.sh 中设置：

tar -zxvf openjdk-11+28_linux-x64_bin.tar.gz
sudo mv openjdk-11+28_linux-x64_bin /usr/local/java
sudo vim HADOOP/etc/hadoop/hadoop-env.sh # HADOOP 为 Hadoop 装置目录
# 输出
export JAVA_HOME=/usr/local/java

官网对于该模式没有太多的形容，只有一个应用默认配置文件作为输出，而后匹配正则表达式作为输入的简略例子：

# HADOOP 示意 Hadoop 装置目录
mkdir input
cp HADOOP/etc/hadoop/*.xml input
HADOOP/bin/hadoop jar HADOOP/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.0.jar grep input output 'dfs[a-z.]+'
cat output/*

从下图的 id 能够看出是以本地模式工作的：

输入文件夹 output 有两个文件：

_SUCCESS：是个空文件，示意运行胜利
part-r-00000：输入后果文件，词数统计

part-r-00000后果如上图所示。

实际上本地模式不须要特地的解决，因为默认就是本地模式。

Hadoop3.3.0 官网文档

关于hadoop:Hadoop完整搭建过程一本地模式

1 本地模式

2 筹备工作

3 应用

4 输入

5 参考