Spark常见面试题
Spark on Yarn 两种形式的区别以及工作流程
Spark 内存治理 官网优化这块查看
Spark作业资源的设置状况 excutor 个数 memory core driver
Shuffle 机制
DataFrame/DataSet 和 RDD的区别以及编程
数据歪斜
RDD的五大个性
Spark作业的执行流程:Count后续干了什么事件
Spark中的饮食转换的作用,联合Scala
Spark和MR的区别
Spark集群规模
Spark OOM如何解决
ThriftServer如何实现HA
Kafka整合Spark的时候OFFSET的治理
Spark Storm Flink 的区别
Spark应用中遇到过哪些问题,怎么解决,亮点在哪里
正当的算子抉择
Catalyst的流程
发表回复