分类： hive

使用Spark跨集群同步Hive数据

比较常用的场景是从MySQL等RDB同步到Hive、Hbase或者将Hive、Hbase的数据导出到MySQL

2019年6月12日
王真催的面试题

hive中shuffle的优化压缩压缩可以使磁盘上存储的数据量变小，通过降低I/O来提高查询速度。对hiv…

2019年6月8日
hive报错Both-left-and-right-aliases-encountered-in-JOIN

错误原因：两个表join的时候，不支持两个表的字段的非相等操作。解决办法：1、把不相等条件拿到where…

2019年6月4日
hive梳理

Hive是由Facebook开发的构建在Hadoop之上的数据仓库平台。它本身并不存储和处理数据，依赖于HDF…

2019年5月26日
Hive浅度学习指南

hive介绍由Facebook开源的,用于解决海量结构化日志的数据统计的项目本质: 将HQL转化为Ma…

2019年5月16日
Hive集群合并之应用端的负载均衡算法

有这么一个场景，我们有两个Hive集群，Hive集群1（后面成为1号集群）是一直专享于数据计算平台的，而Hiv…

2019年5月12日
hadoophive

官方：Apache Hive™数据仓库软件有助于使用SQL读取，编写和管理驻留在分布式存储中的大型数据集。可以…

2019年4月28日
hive小结

自动化了 MapJoin，之后我们就不需要在 query 中再写了。MapJoin 用于小表 Join 大表的…

2019年4月13日
hive函数中的operators, UDF, UDAF, UDTF

=, !=, <, >, IS NULL, …+, -, *, /, …AND, OR, …

2019年3月26日
查看hive 表在hdfs上的存储路径

1、执行hive，进入hive窗口 2、执行show databases,查看所有的database; 3、执…

2017年11月6日