先说一些废话

总结一下Hive面试宝典中的要点,不便读者疾速过一遍Hive面试所须要的知识点。
本文请搭配 Hive面试宝典 来食用更美味哟 ┗( ▔, ▔ )┛

不便本人系统性回顾,依据*的数量来标记重要性

+ 简略理解
++ 相熟把握
+++ 须要精通
  1. Hive的介绍(+)

    • Hive和Hadoop的关系
    • Hive的特点
    • Hive的毛病
    • Hive常见的利用场景
    • Hive和mysql的区别
  2. Hive的架构(+)
  3. Hive的数据(++)

    • Hive的数据模型
    • Hive的底层如何存储Null值
    • Hive中元数据metadata和元数据商店metastore)`的作用
    • Hive有哪些保留元数据metadata的形式
    • Hive元数据存储形式中,本地模式和近程模式的区别
    • Hive的数据类型
    • Hive的隐式类型转换规定
    • Hive数据存储所应用的文件格式
    • Hive中应用的压缩算法
    • 什么是数据可宰割
    • 对于压缩模式阐明
  4. Hive的装置与应用(+)

    • 如何在Hive中集成HBase
    • 如何通过 HiveSQL 来间接读写 HBase
  5. Hive的分区和分桶(++)

    • 什么是Hive分区
    • Hive分区的长处
    • Hive分区的毛病
    • 什么是Hive分桶
    • 对于Hive索引的阐明
    • Hive分桶的长处
    • Hive分桶的毛病
    • Hive中动态分区和动静分区的区别
    • Hive动静分区的参数设定
  6. Hive的外部表和内部表(+)

    • 什么是Hive的外部表和内部表
    • Hive外部表和内部表的区别是什么
    • 生产环境中为什么倡议应用内部表
  7. Hive SQL(+++)

    • Hive中的SQL如何转化成MapReduce工作的
    • 什么状况下Hive不走MapReduce工作
    • Hive中如何查问A表中B表不存在的数据
    • Hive中有哪些连贯查问以及如何应用
    • Hive中左连贯和内连贯的区别
    • Hive中左连贯的底层原理
    • Hive查问时候 ON 和 WHERE 有什么区别
  8. Hive 函数(+++)

    • 如何应用UDF/UDAF/UDTF
    • 为什么应用UDF/UDAF/UDTF
    • 你写过什么样的UDF/UDAF/UDT
    • Hive自定义函数实现了什么函数什么接口
    • Hive中如何去重
    • Hive中排序函数的应用形式及区别
    • 请阐明以下罕用函数 split / coalesce / collect list / collect set 的性能
    • 请形容工作中罕用的Hive罕用函数及应用场景
  9. Hive 运维(+)

    • 如何监控一个提交后的Hive状态
  10. Hive 优化(+++)

    • 请阐明你在工作中如何进行Hive优化
    • HiveSQL优化 ———— Hive单表查问优化
    • HiveSQL优化 ———— Hive多表查问优化
    • HiveSQL优化 ———— Hive其余查问优化
    • Hive数据歪斜 ———— 单表携带了 Group By 字段的查问
    • Hive数据歪斜 ———— 两表或多表的 join 关联时,其中一个表较小,然而 key 集中
    • Hive数据歪斜 ———— 两表或多表的 join 关联时,有 Null值 或 无意义值
    • Hive数据歪斜 ———— 两表或多表的 join 关联时,数据类型不对立
    • Hive数据歪斜 ———— 独自解决歪斜key
    • HiveJob优化 ———— HiveMap优化计划
    • HiveJob优化 ———— HiveReduce优化计划
    • Hive整体优化计划

我是 fx67ll.com,如果您发现本文有什么谬误,欢送在评论区探讨斧正,感谢您的浏览!
如果您喜爱这篇文章,欢送拜访我的 本文github仓库地址,为我点一颗Star,Thanks~ :)
转发请注明参考文章地址,非常感谢!!!