分类: hive
-
使用Spark跨集群同步Hive数据
比较常用的场景是从MySQL等RDB同步到Hive、Hbase或者将Hive、Hbase的数据导出到MySQL
-
王真催的面试题
hive中shuffle的优化 压缩压缩可以使磁盘上存储的数据量变小,通过降低I/O来提高查询速度。 对hiv…
-
hive报错Both-left-and-right-aliases-encountered-in-JOIN
错误原因:两个表join的时候,不支持两个表的字段的 非相等 操作。 解决办法:1、把不相等条件拿到where…
-
hive梳理
Hive是由Facebook开发的构建在Hadoop之上的数据仓库平台。它本身并不存储和处理数据,依赖于HDF…
-
Hive浅度学习指南
hive介绍 由Facebook开源的,用于解决海量结构化日志的数据统计的项目 本质: 将HQL转化为Ma…
-
Hive集群合并之应用端的负载均衡算法
有这么一个场景,我们有两个Hive集群,Hive集群1(后面成为1号集群)是一直专享于数据计算平台的,而Hiv…
-
hadoophive
官方:Apache Hive™数据仓库软件有助于使用SQL读取,编写和管理驻留在分布式存储中的大型数据集。可以…
-
hive小结
自动化了 MapJoin,之后我们就不需要在 query 中再写了。MapJoin 用于小表 Join 大表的…
-
hive函数中的operators, UDF, UDAF, UDTF
=, !=, <, >, IS NULL, …+, -, *, /, …AND, OR, …
-
查看hive 表在hdfs上的存储路径
1、执行hive,进入hive窗口 2、执行show databases,查看所有的database; 3、执…