关于hadoop:阿里云体验实验室-教你搭建Hadoop环境

体验平台简介

面向开发者和中小企业打造的一站式、全云端的开发平台，关上浏览器就能够开发、调试、上线，所测即所得，并联合无服务器的模式，从新定义云原生时代的研发工作方法论。旨在升高开发者上手老本和中小企业的启动老本、经营老本、以及突发流量带来的运维危险。

教程介绍

本教程介绍如何在Linux实例上疾速搭建一个Hadoop伪分布式环境。

场景体验

场景内容选自阿里云体验实验室
阿里云体验实验室提供一台配置了CentOS 7.7的ECS实例（云服务器）。通过本教程的操作，您能够基于ECS实例搭建Hadoop伪分布式环境。

阿里云场景免费资源：
https://developer.aliyun.com/adc/scenario/cf48abdfe41e4187be079722b9dc15b6

背景常识

Apache Hadoop

Apache Hadoop软件库是一个框架，该框架容许应用简略的编程模型跨计算机集群对大型数据集进行分布式解决。它旨在从单个服务器扩大到数千台机器，每台机器都提供本地计算和存储。库自身不是设计用来依附硬件来提供高可用性，而是旨在检测和解决应用程序层的故障，因而能够在计算机集群的顶部提供高可用性的服务，而每台计算机都容易呈现故障。

步骤一：装置JDK

1.执行以下命令，下载JDK1.8安装包。

wget https://download.java.net/openjdk/jdk8u41/ri/openjdk-8u41-b04-linux-x64-14_jan_2020.tar.gz

2.执行以下命令，解压下载的JDK1.8安装包。

tar -zxvf openjdk-8u41-b04-linux-x64-14_jan_2020.tar.gz

3.执行以下命令，挪动并重命名JDK包。

mv java-se-8u41-ri/ /usr/java8

4.执行以下命令，配置Java环境变量。

echo 'export JAVA_HOME=/usr/java8' >> /etc/profileecho 'export PATH=$PATH:$JAVA_HOME/bin' >> /etc/profilesource /etc/profile

5.执行以下命令，查看Java是否胜利装置。

java -version

如果返回以下信息，则示意装置胜利。

步骤二：装置Hadoop

1.执行以下命令，下载Hadoop安装包。

wget https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-2.9.2/hadoop-2.9.2.tar.gz

2.执行以下命令，解压Hadoop安装包至/opt/hadoop。

tar -zxvf hadoop-2.9.2.tar.gz -C /opt/mv /opt/hadoop-2.9.2 /opt/hadoop

3.执行以下命令，配置Hadoop环境变量。

echo 'export HADOOP_HOME=/opt/hadoop/' >> /etc/profileecho 'export PATH=$PATH:$HADOOP_HOME/bin' >> /etc/profileecho 'export PATH=$PATH:$HADOOP_HOME/sbin' >> /etc/profilesource /etc/profile

4.执行以下命令，批改配置文件yarn-env.sh和hadoop-env.sh。

echo "export JAVA_HOME=/usr/java8" >> /opt/hadoop/etc/hadoop/yarn-env.shecho "export JAVA_HOME=/usr/java8" >> /opt/hadoop/etc/hadoop/hadoop-env.sh

5.执行以下命令，测试Hadoop是否装置胜利。

hadoop version

如果返回以下信息，则示意装置胜利。

步骤三：配置Hadoop

1.批改Hadoop配置文件core-site.xml。

a.执行以下命令开始进入编辑页面。

vim /opt/hadoop/etc/hadoop/core-site.xml

b.输出i进入编辑模式。 c.在<configuration></configuration>节点内插入如下内容。

    <property>        <name>hadoop.tmp.dir</name>        <value>file:/opt/hadoop/tmp</value>        <description>location to store temporary files</description>    </property>    <property>        <name>fs.defaultFS</name>        <value>hdfs://localhost:9000</value>    </property>

d.按Esc键退出编辑模式，输出:wq保留退出。

2.批改Hadoop配置文件hdfs-site.xml。
a.执行以下命令开始进入编辑页面。

vim /opt/hadoop/etc/hadoop/hdfs-site.xml

b.输出i进入编辑模式。
c.在<configuration></configuration>节点内插入如下内容。

    <property>        <name>dfs.replication</name>        <value>1</value>    </property>    <property>        <name>dfs.namenode.name.dir</name>        <value>file:/opt/hadoop/tmp/dfs/name</value>    </property>    <property>        <name>dfs.datanode.data.dir</name>        <value>file:/opt/hadoop/tmp/dfs/data</value>    </property>

d.按Esc键退出编辑模式，输出:wq保留退出。

步骤四：配置SSH免密登录

1.执行以下命令，创立公钥和私钥。

ssh-keygen -t rsa

2.执行以下命令，将公钥增加到authorized_keys文件中。

cd .sshcat id_rsa.pub >> authorized_keys

步骤五：启动Hadoop

1.执行以下命令，初始化namenode 。

hadoop namenode -format

2.顺次执行以下命令，启动Hadoop。

顺次执行以下命令，启动Hadoop。

start-yarn.sh

3.启动胜利后，执行以下命令，查看已胜利启动的过程。

jps

4.关上浏览器拜访http://<ECS公网IP>:8088和http://<ECS公网IP>:50070，显示如下界面则示意Hadoop伪分布式环境搭建实现。

以上就是【搭建Hadoop环境】的所有教程了

更多体验场景请至开发者实验室：https://developer.aliyun.com/adc/labs/