关于spark:Spark常见面试题

Spark常见面试题

Spark on Yarn 两种形式的区别以及工作流程
Spark 内存治理 官网优化这块查看
Spark作业资源的设置状况 excutor 个数 memory core driver
Shuffle 机制
DataFrame/DataSet 和 RDD的区别以及编程
数据歪斜
RDD的五大个性
Spark作业的执行流程:Count后续干了什么事件
Spark中的饮食转换的作用,联合Scala
Spark和MR的区别
Spark集群规模
Spark OOM如何解决
ThriftServer如何实现HA
Kafka整合Spark的时候OFFSET的治理
Spark Storm Flink 的区别
Spark应用中遇到过哪些问题,怎么解决,亮点在哪里
正当的算子抉择
Catalyst的流程

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

这个站点使用 Akismet 来减少垃圾评论。了解你的评论数据如何被处理