先说一些废话
总结一下Hive面试宝典中的要点,不便读者疾速过一遍Hive面试所须要的知识点。
本文请搭配 Hive面试宝典 来食用更美味哟 ┗( ▔, ▔ )┛
不便本人系统性回顾,依据*
的数量来标记重要性
+
简略理解++
相熟把握+++
须要精通
Hive的介绍(+)
- Hive和Hadoop的关系
- Hive的特点
- Hive的毛病
- Hive常见的利用场景
- Hive和mysql的区别
- Hive的架构(+)
Hive的数据(++)
- Hive的数据模型
- Hive的底层如何存储Null值
- Hive中元数据
metadata
和元数据商店metastore
)`的作用 - Hive有哪些保留元数据
metadata
的形式 - Hive元数据存储形式中,本地模式和近程模式的区别
- Hive的数据类型
- Hive的隐式类型转换规定
- Hive数据存储所应用的文件格式
- Hive中应用的压缩算法
- 什么是数据可宰割
- 对于压缩模式阐明
Hive的装置与应用(+)
- 如何在Hive中集成HBase
- 如何通过 HiveSQL 来间接读写 HBase
Hive的分区和分桶(++)
- 什么是Hive分区
- Hive分区的长处
- Hive分区的毛病
- 什么是Hive分桶
- 对于Hive索引的阐明
- Hive分桶的长处
- Hive分桶的毛病
- Hive中动态分区和动静分区的区别
- Hive动静分区的参数设定
Hive的外部表和内部表(+)
- 什么是Hive的外部表和内部表
- Hive外部表和内部表的区别是什么
- 生产环境中为什么倡议应用内部表
Hive SQL(+++)
- Hive中的SQL如何转化成MapReduce工作的
- 什么状况下Hive不走MapReduce工作
- Hive中如何查问A表中B表不存在的数据
- Hive中有哪些连贯查问以及如何应用
- Hive中左连贯和内连贯的区别
- Hive中左连贯的底层原理
- Hive查问时候 ON 和 WHERE 有什么区别
Hive 函数(+++)
- 如何应用UDF/UDAF/UDTF
- 为什么应用UDF/UDAF/UDTF
- 你写过什么样的UDF/UDAF/UDT
- Hive自定义函数实现了什么函数什么接口
- Hive中如何去重
- Hive中排序函数的应用形式及区别
- 请阐明以下罕用函数
split
/coalesce
/collect list
/collect set
的性能 - 请形容工作中罕用的Hive罕用函数及应用场景
Hive 运维(+)
- 如何监控一个提交后的Hive状态
Hive 优化(+++)
- 请阐明你在工作中如何进行Hive优化
- HiveSQL优化 ———— Hive单表查问优化
- HiveSQL优化 ———— Hive多表查问优化
- HiveSQL优化 ———— Hive其余查问优化
- Hive数据歪斜 ———— 单表携带了 Group By 字段的查问
- Hive数据歪斜 ———— 两表或多表的 join 关联时,其中一个表较小,然而 key 集中
- Hive数据歪斜 ———— 两表或多表的 join 关联时,有 Null值 或 无意义值
- Hive数据歪斜 ———— 两表或多表的 join 关联时,数据类型不对立
- Hive数据歪斜 ———— 独自解决歪斜key
- HiveJob优化 ———— HiveMap优化计划
- HiveJob优化 ———— HiveReduce优化计划
- Hive整体优化计划
我是 fx67ll.com,如果您发现本文有什么谬误,欢送在评论区探讨斧正,感谢您的浏览!
如果您喜爱这篇文章,欢送拜访我的 本文github仓库地址,为我点一颗Star,Thanks~ :)
转发请注明参考文章地址,非常感谢!!!