windows调试hadoop-mapreduce任务踩坑记录（使用idea）

首先准备Hadoop连接驱动，放到任意一个文件夹中，并将其bin目录写入path环境环境变量，另取其中的hadoop.dll文件放入c盘System32文件夹中。创建空maven项目，这是我的全部依赖
<dependencies>
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-hdfs</artifactId>
<version>2.6.0</version>
</dependency>
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-mapreduce-client-jobclient</artifactId>
<version>2.6.0</version>
</dependency>
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-common</artifactId>
<version>2.6.0</version>
</dependency>
</dependencies>
将hadoop四大配置文件放在resources根目录下，还有log4j.properties再准备你的mapreduce源码，在main函数中写入以下代码

System.setProperty(“HADOOP_USER_NAME”, “hadoop”);
Configuration conf = new Configuration();
conf.set(“fs.defaultFS”, “hdfs://10.32.6.132:9000”);//ip依照自己的集群进行定义
conf.set(“mapreduce.framework.name”, “yarn”);
conf.set(“mapreduce.app-submission.cross-platform”, “true”);//允许跨平台提交
conf.set(“mapred.jar”,”E:\\hadooptest\\target\\hadooptest-1.0-SNAPSHOT-jar-with-dependencies.jar”);

mapred.jar就写编译出来的jar包位置
idea中运行配置如下
其中输入路径一定要存在，输出路径一定要不存在，由Hadoop自行创建
此处写hadoop驱动的根目录，之后点击运行即可。
遇到的问题：1.一定要保证hadoop集群是可运行的，单机版也可以，但一定要保证是正常的。2.在本机运行过程中会调用hadoop历史服务器，采用sbin/mr-jobhistory-daemon.sh start historyserver命令启动不启动的异常为10020端口无法访问3.运行过程中出现的各种连接异常的警告可以忽视，不可忽视的是异常，端口默认访问地址是0.0.0.0是无法被其他主机访问的，所以任何连接被异常中断时请检查是否在配置文件中显式指定了套接字。

windows调试hadoop-mapreduce任务踩坑记录（使用idea）

评论

发表回复取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

windows调试hadoop-mapreduce任务踩坑记录（使用idea）

评论

发表回复 取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

发表回复取消回复