OPPO面试题
学长1
OPPO -实时处理工程师。一面试官陈泉,他拿了多集体的简历,边翻边问。
1)技术局部
(1)SparkStreaming生产形式及区别,Spark读取HDFS的数据流程
(2)Kafka高性能
(3)Hive调优,数据歪斜
(4)Zookeeper怎么防止脑裂,什么是脑裂。
(5)Redis的根本类型,并介绍一下利用场景
(6)最初会问一些Linux常用命令,比方怎么查过程,查IO运行内存等。还真有人问啊
2)我的项目局部
(1)Hive的分层设计
(2)还有一些Flume和Kafka的问题,为什么要把离线和实时搞在一起,能够做成两套零碎。
学长2
(1)介绍你做的所有我的项目
(2)在我的项目中你负责什么
(3)数仓的数据量是多少
(4)MapReduce的Shuffle过程
(5)Spark与Flink的区别
(6)平时会本人去学一些技术吗
(7)你们公司的大数据组的人员配置
(8)你为什么到职
(9)工作中遇到哪些艰难
(10)怎么应用Redis实现分布式锁
(11)Zookeeper的HA原理?
(12)两个业务有关联,某个业务的数据量有可能暴增解体,怎么保障另外的业务数据不受影响?
(13)MapReduce怎么去实现Hive中的mapjoin?
(14)SparkStreaming中Kafka的offset保留到MySQL中去实现的精准一次性生产,如果业务逻辑解决完,在提交offset时程序解体,解决完的数据怎么解决?
学长3
(1)讲一讲什么是CAP法令?Zookeeper合乎了这个法令的哪两个?
(2)你们的Flink怎么提交的?应用的per-job模式吗?为什么应用Yarn-Session的模式?有什么益处?
(3)讲一讲Flink的分界线对齐原理,有什么作用?
(4)理解过Flink的两阶段提交策略吗?讲讲具体过程。如果第一阶段宕机了会怎么办?第二阶段呢?
(5)如果Spark在跑工作的途中,Driver间接挂掉了,然而Executor还在持续跑,你该如何解决这个问题?
(6)如何查看Linux中线程的内存、CPU占用、磁盘的耗费等?具体的参数讲一下
(7)讲讲HFile在HDFS中存储的具体格局
(8)讲一讲Spark和Flink的Checkpoint机制异同
关键词:大数据培训