关于hive:HIVE-统计函数一些小技巧

58次阅读

共计 1129 个字符,预计需要花费 3 分钟才能阅读完成。

[当你有些统计需要实现不了时,能够看看这些技巧哦~]

sum 函数加 over 关键字:

 用法:sum(count(1)) over(partition by talent_account_type order by create_date rows between unbounded preceding and current row) sys_total 

形容:依据 talen_account_type 维度来分组统计总和,按 create_date 枯燥递增形式来累加

group by 的扩大妙用:

在最初减少 with CUBE 能够依据多维度几几组合维度来统计,能够统计某一个维度的所有数据。通常能够用 coalesce(create_date,'所有日期') 来解决 null 的字段,以减少可读性。

动态创建一个任意维度 + 日期值的表:

 用法:select time, talent_type
from 
(select date_add(get_date(-30),a.rk) time,1 talent_type
from(select row_number()over(order by 1) as rk from vipdw.dw_vccp_media_ds limit 30) a)
union 
(select date_add(get_date(-30),a.rk) time,2 talent_type
from(select row_number()over(order by 1) as rk from vipdw.dw_vccp_media_ds limit 30) a)

(轻易 from 一个表就行,原理大略是利用查出来 30 条数据,而后动静再拼多一个日期加维度的字段,而后只用这两个字段)

Ps:通常能够用于创立该表后,再用这个表 left join 一些数据,配合 IFNULL(xxx, 0) 函数,
能够达到统计有些日期没数据的统计表也能连着日期来展现

CONCAT 函数:

 用法:CONCAT(string A, string B…) 

形容:能够用于做字符串拼接

case when 关键字:

 用法:case when b.id IS NULL then '是' else '否' end as fans_top_is_new

形容:Case when 等于程序语言中的 if..else,能够应用到十分多的关键字或办法前面,也能够独立应用,如:
「count(case when media.quality = 3 then 1 end) as media_essence_col」等等形式,能够动静做到 select 中的筛选或赋值

row_number() 函数:

 用法:row_number()over(order by a.fans_count desc)

形容:能够用于依据某个规定去做序号展现,例如上述含意就是依据 fans_count 倒序得出排名序号

正文完
 0