分类： hive

关于hive:分享一个-hive-on-spark-模式下使用-HikariCP-数据库连接池造成的资源泄露问题

最近在针对某零碎进行性能优化时，发现了一个hive on spark 模式下应用 HikariCP 数据库连接…

2023年3月9日
关于hive:分享一个-HIVE-SQL-性能优化点使用公共表表达式-CTE-替换临时表

hive 作业的性能优化是一个永恒的话题，其优化办法也有很多，在此分享一个优化点，即编写 SQL 时应用公共表…

2023年2月1日
关于hive:利用好谓词下推提升Hive性能

谓词下推（Predicate Pushdown，简称PPD），是指尽量将SQL查问中的谓词（where条件）提…

2023年1月17日
关于hive:hive-on-spark

hive on spark就是应用hive记录元数据，以及解析sql。应用spark的rdd真正执行计算工作。…

2022年11月22日
关于hive:线上-hive-on-spark-作业执行超时问题排查案例分享

某业务零碎中，HIVE SQL 以 hive on spark 模式运行在 yarn上指定的资源队列下，在业务…

2022年11月8日
关于hive:如何更改-datax-以支持hive-的-DECIMAL-数据类型

如何更改 datax 以反对hive 的 DECIMAL 数据类型?1. JAVA 数据类型 – float/…

2022年11月1日
关于hive:线上数据问题排查案例分享因为-HMS-和底层-orc-文件中某字段的数据精度不一致造成的数据丢失问题

hive 的元数据服务 hms 和表底层的 orc 文件中都存储了表的元数据信息，两者人造是割裂的，当两者信息…

2022年10月31日
关于hive:Arctic-基于-Hive-的流批一体实践

随着大数据业务的倒退，基于 Hive 的数仓体系逐步难以满足日益增长的业务需要，一方面已有很大体量的用户，然而…

2022年10月27日
关于hive:大数据平台-CDP-中如何配置-hive-作业的-YARN-队列以确保SLA

大家晓得，在生产环境的大数据集群中，在向资源管理器YARN提交作业时，咱们个别会将作业提交到管理员指定的队列去…

2022年9月22日
关于hive:关于-group-by-和-distinct-的优化之争

始终能在网上看到很多小视频和小文章，上来就讲sql优化，要用 group by，不要用 distinct，然而…

2022年8月25日