乐趣区

Hadoop-MapReduce-Spark-配置项

适用范围

本文涉及到的配置项主要针对 Hadoop 2.x,Spark 2.x。

MapReduce

官方文档

https://hadoop.apache.org/doc…
左下角: mapred-default.xml

配置项举例

  • mapreduce.job.reduce.slowstart.completedmaps

当 Map Task 完成的比例达到该值后才会为 Reduce Task 申请资源

  • mapreduce.output.fileoutputformat.compress

MapReduce Job 的结果输出需要使用压缩

Spark

官方文档

https://spark.apache.org/docs…
最后有提到想要直接配置 Hadoop 项,在 Hadoop 配置项前加 spark.hadoop 即可。
Custom Hadoop/Hive Configuration

配置项示例

  • spark.dynamicAllocation.enabled

是否动态分配内存(Spark 原生配置项)

  • spark.hadoop.mapreduce.output.fileoutputformat.compress

Job 的结果输出是否使用压缩(Hadoop MR 配置项)

本文出自: walker snapshot

退出移动版