先说一些废话
总结一下 Hive 面试宝典中的要点,不便读者疾速过一遍 Hive 面试所须要的知识点。
本文请搭配 Hive 面试宝典 来食用更美味哟 ┗(▔, ▔)┛
不便本人系统性回顾,依据 *
的数量来标记重要性
+
简略理解++
相熟把握+++
须要精通
-
Hive 的介绍(+)
- Hive 和 Hadoop 的关系
- Hive 的特点
- Hive 的毛病
- Hive 常见的利用场景
- Hive 和 mysql 的区别
- Hive 的架构(+)
-
Hive 的数据(++)
- Hive 的数据模型
- Hive 的底层如何存储 Null 值
- Hive 中元数据
metadata
和元数据商店metastore
)` 的作用 - Hive 有哪些保留元数据
metadata
的形式 - Hive 元数据存储形式中,本地模式和近程模式的区别
- Hive 的数据类型
- Hive 的隐式类型转换规定
- Hive 数据存储所应用的文件格式
- Hive 中应用的压缩算法
- 什么是数据可宰割
- 对于压缩模式阐明
-
Hive 的装置与应用(+)
- 如何在 Hive 中集成 HBase
- 如何通过 HiveSQL 来间接读写 HBase
-
Hive 的分区和分桶(++)
- 什么是 Hive 分区
- Hive 分区的长处
- Hive 分区的毛病
- 什么是 Hive 分桶
- 对于 Hive 索引的阐明
- Hive 分桶的长处
- Hive 分桶的毛病
- Hive 中动态分区和动静分区的区别
- Hive 动静分区的参数设定
-
Hive 的外部表和内部表(+)
- 什么是 Hive 的外部表和内部表
- Hive 外部表和内部表的区别是什么
- 生产环境中为什么倡议应用内部表
-
Hive SQL(+++)
- Hive 中的 SQL 如何转化成 MapReduce 工作的
- 什么状况下 Hive 不走 MapReduce 工作
- Hive 中如何查问 A 表中 B 表不存在的数据
- Hive 中有哪些连贯查问以及如何应用
- Hive 中左连贯和内连贯的区别
- Hive 中左连贯的底层原理
- Hive 查问时候 ON 和 WHERE 有什么区别
-
Hive 函数(+++)
- 如何应用 UDF/UDAF/UDTF
- 为什么应用 UDF/UDAF/UDTF
- 你写过什么样的 UDF/UDAF/UDT
- Hive 自定义函数实现了什么函数什么接口
- Hive 中如何去重
- Hive 中排序函数的应用形式及区别
- 请阐明以下罕用函数
split
/coalesce
/collect list
/collect set
的性能 - 请形容工作中罕用的 Hive 罕用函数及应用场景
-
Hive 运维(+)
- 如何监控一个提交后的 Hive 状态
-
Hive 优化(+++)
- 请阐明你在工作中如何进行 Hive 优化
- HiveSQL 优化 ———— Hive 单表查问优化
- HiveSQL 优化 ———— Hive 多表查问优化
- HiveSQL 优化 ———— Hive 其余查问优化
- Hive 数据歪斜 ———— 单表携带了 Group By 字段的查问
- Hive 数据歪斜 ———— 两表或多表的 join 关联时,其中一个表较小,然而 key 集中
- Hive 数据歪斜 ———— 两表或多表的 join 关联时,有 Null 值 或 无意义值
- Hive 数据歪斜 ———— 两表或多表的 join 关联时,数据类型不对立
- Hive 数据歪斜 ———— 独自解决歪斜 key
- HiveJob 优化 ———— HiveMap 优化计划
- HiveJob 优化 ———— HiveReduce 优化计划
- Hive 整体优化计划
我是 fx67ll.com,如果您发现本文有什么谬误,欢送在评论区探讨斧正,感谢您的浏览!
如果您喜爱这篇文章,欢送拜访我的 本文 github 仓库地址,为我点一颗 Star,Thanks~ :)
转发请注明参考文章地址,非常感谢!!!