1 本地模式

本地模式是最简略的模式,所有模块都运行在一个JVM过程中,应用本地文件系统而不是HDFS

本地模式次要是用于本地开发过程中的运行调试用,下载后的Hadoop不须要设置默认就是本地模式。

2 筹备工作

笔者喜爱把JDK放在/usr/local下,运行前请确保设置了JAVA_HOME,留神是在etc/hadoop/hadoop-env.sh中设置:

tar -zxvf openjdk-11+28_linux-x64_bin.tar.gzsudo mv openjdk-11+28_linux-x64_bin /usr/local/javasudo vim HADOOP/etc/hadoop/hadoop-env.sh # HADOOP为Hadoop装置目录# 输出export JAVA_HOME=/usr/local/java

3 应用

官网对于该模式没有太多的形容,只有一个应用默认配置文件作为输出,而后匹配正则表达式作为输入的简略例子:

# HADOOP示意Hadoop装置目录mkdir inputcp HADOOP/etc/hadoop/*.xml inputHADOOP/bin/hadoop jar HADOOP/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.0.jar grep input output 'dfs[a-z.]+'cat output/*

从下图的id能够看出是以本地模式工作的:

4 输入

输入文件夹output有两个文件:

  • _SUCCESS:是个空文件,示意运行胜利
  • part-r-00000:输入后果文件,词数统计

part-r-00000后果如上图所示。

实际上本地模式不须要特地的解决,因为默认就是本地模式。

5 参考

  • Hadoop3.3.0官网文档