分类： hive

关于hive:Hive常用函数整理

记录 hive 三类函数：取整函数、随机抽样（rand()函数)、数组蕴含函数（array_contains)…

2022年8月25日
关于hive:数据湖揭秘Delta-Lake

简介：Delta Lake 是 DataBricks 公司开源的、用于构建湖仓架构的存储框架。可能反对 Spa…

2022年5月13日
关于hive:HiveQL-进阶之以柔克刚-将简单语法运用到极致

在大数据如此风行的明天，不只是业余的数据人员，须要常常地跟 SQL 打交道，即便是产品、经营等非技术搭档，也会…

2022年5月1日
关于hive:Kafka-的存储机制以及可靠性

在大规模数据量的数据分析及建模工作中，往往针对全量数据进行开掘剖析时会非常耗时和占用集群资源，因而个别状况下只…

2022年4月25日
关于hive:Hive组件部署

1.曾经装置好Mysql，并且设置MySQL的服务是开机自启的。 {代码…} 2.MySQL连贯信息：用户…

2022年4月9日
关于hive:关于在hive任务中number-of-reducers的探讨

1．在默认状况下（set mapreduce.job.reduces=-1）,理论运行计算过程中reducer…

2022年3月30日
关于hive:Hive

数据处理大抵能够分成两大类：联机事务处理OLTP（on-line transaction processing…

2022年3月21日
关于hive:Hive实现数据抽样的三种方法

在大规模数据量的数据分析及建模工作中，往往针对全量数据进行开掘剖析时会非常耗时和占用集群资源，因而个别状况下只…

2022年2月21日
关于hive:Hive作业产生的临时数据占用HDFS空间大问题处理

Hive作业在运行时会在HDFS的长期目录产生大量的数据文件，这些数据文件会占用大量的HDFS空间。这些文件夹…

2022年2月18日
关于hive:Hive内置操作符之关系运算符

关系运算符比拟两边的后果并返回一个后果值：TRUE或FALSE值，这取决于两边的操作数之间的比拟是否无效，因为…

2022年2月16日