关于存储:实时数仓入门训练营Hologres性能调优实践

简介：《实时数仓入门训练营》由阿里云研究员王峰、阿里云高级产品专家刘一鸣等实时计算 Flink 版和 Hologres 的多名技术/产品一线专家齐上阵，合力搭建此次训练营的课程体系，精心打磨课程内容，直击当下同学们所遇到的痛点问题。由浅入深全方位解析实时数仓的架构、场景、以及实操利用，7 门精品课程帮忙你 5 天工夫从小白成长为大牛！

本文整顿自直播《Hologres性能调优实际-清芬》
视频链接:https://developer.aliyun.com/learning/course/807/detail/13889

内容简要：

一、Hologres建表最佳实际
二、Hologres性能问题剖析与优化

一、Hologres建表最佳实际

（一）建表优化的必要性

为什么Hologres建表优化十分重要？

首先，对于整个的查问性能以及写入性能来讲，一个好的建表跟一个比拟差的建表，性能下面有十分大的区别。
其次，建表优化须要尽早做，是因为Hologres在改 DDL的同时，有可能须要用户反复进行一些数据导入，这种反复的工作使得咱们心愿尽早实现建表优化。
最初，一个好的建表对于用户的数据存储老本也有肯定的帮忙。如果建表做得不失当，可能导致建一些不必要的Index，而后导致数据多了一些冗余的存储，从而晋升了老本。
因而，建表优化是十分重要的，这也是把它作为本文第一局部的起因。

（二）业务建模是性能优化的前提

说完建表的重要性之后，咱们再看建表优化之前要去做整个业务建模的优化。在思考应用Hologres的同时，咱们要晓得通过Hologres可能解决什么样的业务问题，以及通过什么样的形式解决。
Hologres自身是一个HASP产品，在应用Hologres的同时就须要跟业务场景联合，咱们要晓得这个场景到底是剖析场景还是在线服务场景。如果是一个剖析型，就用Hologres的列存比拟敌对，如果是一个在线服务型场景，就用行存比拟敌对，这些是跟业务场景相干的。
第二个是要可能联合Hologres自身的产品劣势。Hologres是一个在线服务以及交互式剖析的产品，它并不适宜ETL以及海量数据拖取的场景。因而，在把业务往Hologres下面搬的时候，不能搬所有的场景，否则可能导致Hologres做一些不太适宜自身的事件，信赖就会不太好。
第三个是须要做一些取舍。为了达到预期的性能，可能须要做一些相似预计算或者数据加工的提前操作，缩小后续计算复杂度，放慢计算速度。

以上这些都跟事后数据建模以及整个业务冀望非亲非故。

（三）存储形式的抉择

做完以上筹备工作之后，咱们须要进行Hologres治理存储形式的抉择。
Hologres自身反对两种存储形式，别离是行存和列存。

行存次要的利用场景是对主键进行高QPS查问，并且当咱们表比拟宽的时候，一次查问会读取大量列，这种场景实用Hologres是非常适合的。
除此之外， Blink的维表查问必须是用行存，因为个别状况下Blink的维表是高QPS、基于Key的查问，列存没有方法扛住这么高的压力。
列存实用于简单的交互式剖析查问，比方一个查问外面，它有关联、聚合等等各种各样的简单计算。同时它笼罩的场景十分多，包含过滤、聚合等，列存是比拟通用的存储形式。
行存次要实用于在线服务类的场景，列存次要实用于剖析型的场景，这是两个存储形式的抉择区别。

（四）优化Shard数

Shard\_count: Shard实现了物理分表的成果，多个Shard并行服务查问。
减少Shard能够减少查问的分布式并行度，更多Shard不肯定查问更快，也会带来并发查问的调度开销。

说完存储形式，接下来咱们看Shard数。
Hologres在存储的时候，是把物理表分成一个个Shard存储，每个表会依照肯定的散布形式散布到所有的物理节点下面，而后每个Shard能够去并发进行查问，Shard数越多，相当于整个查问的并发度越高。然而Shard数也不是越多越好，因为它自身有一些额定的开销，所以咱们须要依据整个查表的数据量以及查问复杂度来设计每个表的Shard数。

在集群扩容的时候，比方咱们本来是128 Core的实例，扩容到256 Core之后，咱们须要对整个Shard数进行肯定的调整，这样能力享受扩容带来的性能晋升。
因为咱们整个并发度是在Shard数下面，如果实例扩容了，然而Shard数没变，那么相当于整个计算的并发度没变，这种状况会导致尽管扩容了，然而查问性能没有晋升。

个别状况下，咱们会倡议用户将Shard数设置成跟实例规格差不多的数量，比方一个64 Core的，Shard数设成40或64这种比拟贴近于实例规格的数量。当规格往上涨之后，咱们心愿Shard数也能往上涨，从而进步整个查问的并发度。

（五）优化Distribution Key

而后说完Shard数之后，咱们再看一下Hologres外面十分重要的Distribution Key，它次要是用来决定数据如何分到每个Shard下面。

Distribution\_key:平衡地散发数据到多个Shard中，令查问负载更平衡，查问时间接定位到对应Shard。
如果创立了Primary Key索引（用于数据更新），默认为distribution\_key， Distribution\_key如果为空，默认是Random，Distribution\_key需是Primary Key的子集。

一个好的Distribution Key设计，首先要求用户的数据在Distribution Key上划分比拟平均。
比方用户ID或者是商品宝贝ID，个别状况下Key只有一个，所以它是十分平均的，是用来作为Distribution Key十分好的例子。然而像年龄或者性别这种就不太适宜作为Distribution Key，因为它可能会使大量的数据Shuffle到一个节点上，导致整个数据的散布不是很平均。
Distribution Key次要的作用是缩小关联查问、聚合运算里数据的Shuffle。
如果用户没有设置Distribution Key，那么咱们默认是Random，因为咱们会保障用户的数据可能尽可能平均地散布到所有Shard下面。

接下来咱们看一下Distribution Key次要的作用。

在Hologres外面咱们会有不同的表，放到不同的TableGroup外面，对于Shard数雷同的表，都会放到一个TG上面。
假如两个表做关联，如果都依照关联的Key去设计Distribution Key，那么这两个表的关联就能够做一个Local Join，如上图右边所示。所有的数据不须要做额定的Shuffle，每个表在每个Shard下面，做完关联之后间接产生后果。
如果数据量增大，之后可能须要扩容，咱们心愿在这个TG上面所有表都会进行扩容，这样能保障数据分布的一致性，维持住整个Local Join，而不会因为扩容导致做不了Local Join。
Local Join相比于非Local Join，性能差异十分大，通常会有一个数量级左右的差别。
跟Local Join最相干的就是Distribution Key的设计，如果Distribution key设计不合理时，在Join时，可能引起大量的Data Shuffle，影响效率。

如上图所示，假如表A跟表B要做一个关联，如果不是Distribution Key的场景，那么咱们就须要把表A的数据跟B的数据都依照它的Join Key做Shuffle， Shuffle会带来十分昂扬的老本，同时影响整个查问的效率。
所以通常状况下，对于须要连贯的表，能够把Join关系设为distribution key，实现Table在同一个Shard内Local Join。

（六）优化分区表

分区表:也是物理表，具备一样的Shard能力，但多了一个依据分区键进行Table Pruning的能力。

如上图所示，假如查问的过滤条件只命中了局部的分区，那么剩下的分区表就不须要进行扫描，这可能大大节约整个查问的IO，放慢查问速度。
通常状况下，分区的Key是动态的，并且数量不会太多，最适宜做分区Key的是日期。例如有的业务方是一天一个分区，或者按小时分区，那么查问的时候也会依照某一段时间来过滤数据。
通过分区表，当用户的查问条件蕴含工夫过滤时，就能够把不必要的分区过滤掉，对查问性能有很大的的晋升。
通常将日期列等基数低（小于一万)的字段用于做分区字段，如果分区表过多，而查问时不带有分区过滤条件，性能会降落。

（七）优化Segment Key

Shard是一个逻辑数据单位，物理上是一组文件（散发到同一个Shard的多个表，以及对应的索引）。

Segment Key次要是作用于列存。
在列存下面，文件是存成一个个Segment，当查问到了某一个Shard上，因为Shard外部有一堆的文件，咱们要去找哪些文件会命中这个查问，须要进行扫描，Segment Key是用来跳过不须要查找的文件。
假如Segment设成了一个工夫，数据依照工夫写入，比方10点到11点是一个文件，11点到12点是一个文件，12点到13点是一个文件。当咱们要查问12:15~12:35区间范畴的数据，对于这种状况，通过Segment Key就能疾速找到12点到13点这个文件命中查问，所以只有关上这一个文件就能够了。通过这种形式就能够疾速跳过不必要的文件扫描，缩小IO，让整个查问更快。
上图次要是介绍了整个数据的写入流程，帮忙大家了解Segment Key到底是什么样的。
方才提到当数据写入Hologres，会写到内存表外面，内存写满了，异步Flush到文件，Append Only写入，写入效率最高。因为写入时为了性能，没有全局排序和单文件更新，文件之间存在Overlap。
这是什么意思？

Segment\_key用于文件块的边界划分，查问时基于Segment\_key能够疾速定位数据所在文件块， Segment\_key多列时，依照左对齐。

如上文提到的例子，11点到12点在一个文件是比拟现实的状况，理论状况可能是11点到12点在一个文件，11:30~12:30是在第二个文件外面，12:30 ~13:00又是一个文件，文件之间可能存在重叠。查问可能会命中多个文件，这种场景可能就会导致须要关上多个文件。
所以在设计Segment Key的时候，尽可能不要有Overlap，尽可能程序地递增。如果数据写入十分无序，比方写进来的数据，先是123，而后678，而后456，这种乱序的写入就会导致Segment Key可能在不同的文件外部有反复的数据，使得Segment Key齐全没有起到查问过滤的作用。
因而，设计Segment Key最要害的一点就是尽可能枯燥，并且没有Overlap，这样才能够让咱们可能尽可能跳过这种不必要的数据扫描。
Segment Key的设计次要是用在Blink的实时写入场景，并且把Key设成工夫字段，因为它数据实时写入的工夫是递增的，并且每个值不会有很大的 Overlap，比拟适宜用Segment Key。
除此之外，其余的场景不太倡议用户本人设Segment Key。

（八）优化ClusteringKey

Clustering\_key，文件内聚簇布局，示意排序信息，和MySQL 的聚簇索引不同，Hologres用来布局数据，不是布局索引，因而批改Clustering须要从新数据导入，且只有一个 Clustering\_key，排序操作在内存中实现生成SST。

上图为一个例子，上图的右边是一个齐全无序的状况，如果依照Date作为ClusteringKey，那么会变成右上角的图。依照Date做完排序之后，当进行Date查问，比方Date大于1/1，小于1/3的数据，能够疾速查到对应的时间段。
假如没有做这个Index，咱们就须要把所有数据都扫一遍，这就是通过ClusteringKey减速查问的原理。
假如依照Class做排序，如果将Class和Date作为ClusteringKey，那么会先依照Class做排序，而后再依照Date排序，如上图右下方所示。对于这种场景，ClusteringKey的设计是依照最左匹配的准则，就是当遇到用户的查问条件，也依照最左匹配的准则来匹配。
例如，查问的Key是Class，那么可能命中ClusteringKey，如果查问条件是Class跟Date，也可能命中ClusteringKey，但如果查问条件只有Date，则无奈命中ClusteringKey。遵循的最左匹配相当于，从左往右的条件中，无论用户的查问条件有几个，最右边的条件必须匹配上才能够。
ClusteringKey次要的作用是可能减速查问的过滤，Range查问的过滤以及点查的过滤。ClusteringKey的毛病是每个表最多只能有一个ClusteringKey，只能有一种排序形式。

（九）优化字典编码

字典编码对于字符串类型能够无效压缩，特地是基数小的列。编码值能够放慢比拟操作，对于Group By，Filter有益处，Holo在0.9之后主动设置。

上图为字典编码的一个例子。
如上图右边所示，有Card No和男女性别Gender。因为男女性别只有两个值，所以非常适合于用字典编码，如果把性别编码成0跟1，就变成了图两头的形式。
当进行数据查问的时候，须要对过滤条件的编码，比方想查所有男性的Card No，过滤条件就变成了Gender 0，通过这种形式进行数字查问。
然而字典编码有一个毛病，就是对于基数列比拟大的场景，它的开销十分高。
因为咱们对数据先进行编码，编码的过程中，如果数据一共是100万行，其中有99万行不一样的值，这会导致咱们有99万个Encoded值，这种状况会造成整个编码跟查问的耗损十分高，这种状况就不太适宜做字典编码。
在Hologres0.9之后，咱们反对主动设置字典编码，用户无需本人去配置字典编码。

（十）优化位图索引

位图索引，对于等值过滤场景有显著的优化成果，多个等值过滤条件，通过向量比拟计算。

位图索引相当于把每列的数据通过位图来标识它是否存在。

如上图所示，咱们将右边表中学生的性别、班级进行位图编码，就失去了左边的图，通过这些位图信息咱们能够进行疾速过滤。
例如，咱们要查所有男性学生，能够通过“1 0”进行过滤，失去右图中PK值为1、2、5、6这四行合乎查问条件的数据。假如要过滤出三班的同学，那么咱们再构建一个位图“0 0 1”，再跟班级的数据做一个过滤，就能失去PK值为2和6的信息。
能够看到，位图索引次要的利用场景是在点查，比方查问条件是男性并且年龄等于32岁，这种场景也是非常适合用位图进行查问减速。
同样的，位图索引也有个问题，就是基数过多的列，在位图索引编码时，会造成稠密数组（列很多，值很少），对查问性能改善影响小。

（十一）物理拓扑

上文论述了几个索引以及整个存储形式，上面看一下如何区别它们，以及整个用户视角看起来它大略是什么样的形象。

如上所示，用户写了一个SQL之后，首先会依照用户分区键路由到对应要找的表下面，找对逻辑对象Table。
第二步通过Distribution Key找到对应Shard。
第三步是Segment Key，找到Shard之后要找对应Shard下面的文件，因为理论数据是存储成一个个文件，咱们通过Segment Key找到想要关上的文件。
第四步是在文件外部，数据是否有序，这是通过Clustering Key来查找的，Clustering Key帮忙咱们找对理论文件区间。
第五步是Bitmap。因为Hologres把数据依照一个个Batch存储，在一个Batch外面，咱们须要通过Bitmap疾速定位到某一行，否则须要把某一个区间范畴内所有的数据扫一遍。
图中从上往下不同的过程，越来越到文件外部，越往上是越大的范畴。

二、Hologres性能问题剖析与优化

（一）性能白皮书

用户问得最多的问题是Hologres的性能如何，咱们有一个大略的性能估计。

应用Hologres时，实时写入单Core的QPS是5000，对于离线写入的场景，比方Max Computer写入到Hologres，通常状况下单Core的QPS能到5W。对于OLAP查问，单Core解决200万数据量。对于点查场景，单Core QPS在1W左右。
用户能够依据以上信息来评估本人的查问以及业务场景须要用多少资源。

（二）实时写入与点查

对于不同的利用场景，咱们优化伎俩是不太一样。

对于实时写入与点查的场景，首先要查看建表是否适合。对于高QPS写入以及点查来说，咱们心愿Distribution Key和查问条件统一。因为Distribution Key用来找到对应的Shard，在写入的QPS很高的状况下，如果过滤条件与散布Key统一，咱们就能够疾速路由到某一个Shard下面，这个查问就不须要发到所有Shard上，对这种场景有很大的性能晋升，所以要求Distribution Key和查问条件统一。

第二个是咱们的表最好是行存表，因为行存表对实时写入以及点查在性能上十分敌对。

第三个场景是假如不是行存表而是列存表，咱们心愿Pk、Clustering Key和查问条件统一，这样能力用上Clustering Index的能力。

除了建表优化以外，还须要优化查问写入代码。因为如果写Hologres的代码设计得不合理，会带来十分昂扬的额定老本。可能用户会发现QPS如同曾经上不去了，但其实Hologres外部CPU使用率非常低，这是因为用户本人的写入代码不是特地高效。

对于这样的问题，首先咱们心愿用户尽可能通过Preparestmt的形式，它次要的益处是可能节约整个执行打算的开销。提交一个SQL之后，个别会把 SQL进行编译解析，而后生成一个执行打算，最初提交到执行引擎来执行这样的一个过程。当数据反复执行SQL的时候，应用Preparestmt就能够不必再去做生成、执行打算、解析的过程，老本大大减少，查问和写入的QPS会更高。

第二点是咱们心愿用户写入的数据尽可能凑批。比如说咱们常常会碰到一些用户，他会先写insert into values1和insert into values2，再写insert into values2和insert into values3，而后不停地发这种小的SQL进行数据插入，这会带来十分昂扬的数据RPC老本，同时整个QPS也上不去。
咱们通过凑批能够让写入性能会高很多，比方通过insert into values的形式，一个values外面就蕴含了1000个值或者1万个值，这1万个值的写入只有一次数据传输就能够了。相比于之前的形式，性能上可能存在1万倍的差别。

第三块是整个Holo Client的应用，有的用户可能不太分明如何优化代码，或者不能凑好批，Holo Client能够帮忙用户解决这些问题。

相比于传统的JDBC Client，Holo Client帮用户做了各种各样异步化的封装以及凑批的逻辑，并且它没有SQL引擎的额定开销，不须要进行一些SQL解析的操作，所以它的写入跟查问性能相比于应用JDBC的形式会好十分多。
Holo Client也是Blink Client写入的内置插件，所以它相比用户本人的工具，写入性能会更好。
还有一点是咱们连贯的时候尽可能应用VPC域名进行数据的写入跟查问。
因为间接用公网的话，网络之间的RT比拟高。如果用VPC网络，因为是在同一个网站内，机器之间的RT比拟低，可能缩小整个网络下面的开销，在很多利用场景下，它的影响十分大，也十分重要。

（二）离线写入与查问常见问题

接下来咱们看一下离线写入与查问常见的问题。
为什么把离线写入跟查问放在一起？这是因为离线写入跟查问是一样的原理，离线写入也是通过跑一个Query，跑Query形式的问题都是差不多的。

首先是统计信息缺失。
Hologres自身是一个分布式引擎，它要把用户写的SQL运行在分布式引擎上，因而须要去优化器生成一个执行打算，优化器须要统计信息来帮忙它生成一个比拟好的执行打算。当遇到用户统计信息缺失，优化器相当于丢失了输出，无奈生成执行打算，这是咱们在线上遇到最大也是最多的一个问题。
第二个很大的问题是建表不优，当遇到建表跟查问不统一的状况，就会导致整个查问的性能十分差。
除此之外，Hologres是一个自研的引擎，然而为了兼容Postgres的开源生态，所以会有一个联邦查问的机制，使得用户能在Postgres运行的Query也能在Hologres运行，然而它会带来一些额定的性能损失。

（三）查看执行打算

执行打算的好坏对于查问性能影响十分大。Hologres的查问优化器会依据 Cost抉择执行耗时最低的查问打算来执行用户的查问，不过难免会呈现一些查问打算不优的状况。用户能够通过Explain命令来查问执行打算，执行打算中个别蕴含以下算子：
1.数据扫描算子：Seq Scan、Table Scan及Index Scan等。
次要是用来进行数据拜访，Seq Scan、Table Scan及Index Scan别离对应程序扫描，表扫描以及基于Index的扫描。
2.连贯算子：Hash Join及Nested Loop。
Hash Join的意思是两个表做关联的时候，会先把一个表做成Hash Table，另外一个表通过Hash Table的Lookup进行关联查问。
Nested Loop会把两个表做成两个For循环，在表面就是一个表 For循环遍历所有的数据，另外一个表也是For循环，这就是Hash Join与Nested Loop的区别。
3.聚合算子：Hash Aggregate及Streaming Aggregate。
基于Hash查找的AGG实现及基于排序的AGG实现。
4.数据挪动算子：Redistribute Motion、Broadcast Motion及Gather Motion等。
Hologres是一个分布式的引擎，所以难免会碰到数据Shuffle的状况。Redistribute Motion次要是做数据的Shuffle，Broadcast Motion是做数据播送，Gather Motion是把数据拉到一起，这些数据挪动算子次要是用来解决分布式数据的问题。
5.其余算子：Hash、Sort、Limit及Append等。

（四）统计信息缺失

咱们在看Query性能的时候常常会碰到几个问题，其中一个是统计信息缺失，咱们如何晓得统计信息是否缺失？

上方是一个explain查问的例子。当Hologres没有统计信息，行数的默认值是1000。这里咱们能够看到，以后tmp和tmp1两个表的行数都是1000，表明这两个表目前都拿不到统计信息。
没有统计信息容易呈现的问题：

跑查问OOM
写入性能差

（五）更新统计信息

那么咱们怎么解决没有统计信息的问题？
通过Analyze命令，用户能够更新统计信息。

还是之前的例子，通过analyze tmp;和analyze tmp1，能够看到这两个表就有统计信息了，如上方所示。
从上方能够看到，tmp1有1000万行数据，它1000万数据Join 1000行数据，此时咱们发现，这个表尽管做了个Hash Join，但它的Join程序是不对的。因为在这之前tmp的数据量十分小，而temp1数据量十分大，会导致把tmp1放到了Hash Table这一侧，而后Hash Table十分大，导致整个Join性能十分差。
通过Analyze之后，能够把Join的程序调过来，把小的表tmp放在被Hash这一侧，把大的表tmp1放在关联的那一侧，造成一个比拟好的查问打算，查问性能相比之前也有一个比拟大的晋升。

（六）抉择适合的散布列

咱们须要抉择适合的散布列，也就是本文后面提到的做Local Join的状况。如果用户不设置散布列，在进行关联查问时，Hologres须要将2个表的数据依据join key shuffle到一起，保证数据的正确性。如果shuffle的数据量很大，会造成很高的查问提早。
咱们如何判断有没有做Local Join？

在上方示例中咱们能够看到，通过explain查看执行打算，Redistribute Motion示意Shuffle算子，tmp和tmp1两个表在做关联之前都通过Join条件作了Shuffle，这阐明整个关联不是一个Local Join。
解决办法是把关联Key设置成Distribution Key。

具体做法是从新建表，关联Key设成a跟b，此时咱们再去查看执行打算，就没有Redistribute Motion了，这个关联就是一个Local Join。

通过这种形式就能够让整个关联从非Local Join变成了Local Join，性能绝对之前也有一个比拟大的改善。

（七）判断是否用上Clustering Key

接下来看一下怎么通过执行打算来看咱们之前的那些建表的Index，判断是否用上Clustering Key。

如上方所示，如果咱们写了个查问：
explain select * from tmp where a > 1;
假如a字段是个Clustering Key，此时咱们在explain查问的执行打算中能够看见有一个Cluster Filter，示意咱们曾经用上Clustering Key。

（八）判断是否用上Bitmap

接下来咱们判断是否用上Bitmap。

如上图所示，咱们的查问条件是：
explain select * from tmp where c = 1;
这个c是Bitmap Key，在执行打算能够看到有Bitmap Filter:（c = 1）这样一个过滤条件，此时咱们就晓得用上Bitmap了。

（九）判断是否用上Segment Key

接下来判断是否用上Segment Key。

如上图所示，咱们的查问条件是：
explain select * from tmp where b > 1;
这个b是Segment Key，咱们在执行打算能够看到有Segment Filter:（b > 1）这样一个过滤条件，此时咱们就晓得用上Segment Key了。
通过以上几个explain查问的例子，咱们就能晓得查问是否用上之前建表的Index，如果没用上，阐明有可能建表不对，或者查问模式并没有很好地适配建表。

（十）联邦查问优化

在Hologres外部有两套计算引擎，其中一套是齐全自研的Holo计算引擎，它的性能卓越，但也是因为它是齐全自研的，所以相较于开源的Postgres计算引擎，它无奈在一开始就反对所有Postgres的性能，会有局部Postgres性能缺失。
另一套计算引擎是Postgres，它是齐全开源生态的，性能方面比自研的计算引擎稍差一些，然而它齐全兼容Postgres性能。
因而，在Hologres外面，一个查问有可能会既用到Holo计算引擎，也用到Postgres计算引擎。

（十一）优化联邦查问

判断是否应用了联邦查问，咱们能够通过explain。
Hologres自研引擎不反对not in，对于查问:
explain select * from tmp where a not in (select a from tmp1)；
如下所示：

从执行打算能够看到有External SQL（Postgres）：这样的一个算子，这就标识了查问引擎跑到了Postgres引擎下面去执行。
因为Holo计算引擎不反对not in，所以说这部分的计算是在Postgres下面执行的。当看见External SQL（Postgres）：这个算子，用户须要警觉当下用到了Holo计算引擎不反对的性能，此时最好通过查问改写，换成Holo反对的算子来执行它的Query，从而晋升查问性能。
对于下面这个例子的场景，咱们能够通过将not in 改为 not exist:
explain select * from tmp where not exists (select a from tmp1 where a = tmp.a);

当用户这个表肯定是非空，那么能够把not in间接改成not exit，之后再查看执行状况，会发现整个Query都是在Holo引擎下面，没看到方才的External SQL（Postgres）算子。
这个查问生成的执行打算相比之前在Postgres引擎上执行的打算，查问性能上可能会有数倍的差异。
通过上述所有的例子，咱们就理解了Hologres性能调优整个过程，以及其中须要留神的关键点，欢送感兴趣的同学多多关注与应用Hologres。

版权申明：本文内容由阿里云实名注册用户自发奉献，版权归原作者所有，阿里云开发者社区不领有其著作权，亦不承当相应法律责任。具体规定请查看《阿里云开发者社区用户服务协定》和《阿里云开发者社区知识产权爱护指引》。如果您发现本社区中有涉嫌剽窃的内容，填写侵权投诉表单进行举报，一经查实，本社区将立即删除涉嫌侵权内容。