关于数据库:分布式数据库SQL优化之Plan-Hint

Part 1 – 对于Hint

Hint是嵌入SQL语句的对优化器进行提醒的信息，是DBA进行SQL优化的罕用伎俩。SQL语句通过优化器(规定优化(RBO)、代价优化(CBO))，通常会抉择正确的查问门路，然而智者千虑，必有一失，有时优化器也会抉择一个很差的打算，使得该条SQL查问变得很慢，此时须要DBA人为干涉(通过给SQL语句减少一个正文)，通知优化器要抉择指定的拜访门路(full scan、index scan)或join 类型(merge、hash、lookup)，使得该条SQL语句能够高效的运行。

Part 2 – Hint的应用

通过 /+ … / 的正文模式放在 SELECT 关键字之后，多个 hint 之间用逗号隔开。

例如 select /+use_index(t, index1)/ * from t where a = 10 and b = 20;

如下图所示，通过RBO会失去如下normalized plan，而/+ use_index(t, index1)/ 将作用于scan抉择的过程，这将通知优化器在抉择表t的拜访门路(① ② ③)时，抉择②索引index1。

Part 3 – Hint在云溪数据库中的

解析和利用流程

整体流程如下图3.1所示:

图3.1 hint 解析应用流程

第一步：输出带有hint SQL语句，如下所示

第二步：parser 编译解析；

第三步：将AST中的hint信息保留在HintSet中；

第四步：Builder从AST中获取hint信息，将对应hint解析到TableHint和IndexHint构造体中；

第五步：normalized plan阶段(RBO)，通过调用buildScan为表构建ScanFlags，调用buildJoin为表构建JoinFlags；

第六步：在CBO阶段进行摸索时，依据组成员的Flags信息，通过开销大小，来阻止某些等价表达式的生成，并生成hint须要的表达式，从而减小搜寻空间；

第七步：生成hint作用之下的最优查问打算。

Part 4 – Hint 在云溪数据库中

不同阶段的表现形式

SQL语句中：显示指定要在表c上强制应用idx2，与c和o相干的join操作不容许应用NLJ算子；

通过parser后，hint信息保留在HintSet中；

在Builder中，hint信息以对象index和table为单位进行保留；

在规范化打算树和Memo构造体中，hint信息存在对应的Expr构造体中。

具体流程如下图4.1所示:

图4.1 hint在不同阶段的表现形式图

Part 5 – Hint对优化器的影响

图5.1构造解释：

图5.1 hint作用图

bestHT 存储着每个Group的代价最低的表达式。

exprHT 存储所有摸索进去的表达式。

Group为逻辑等价的关系表达式的汇合。

在云溪数据库中hint 影响打算的伎俩次要有两个，一个是摸索阶段中，缩小表达式的生成(例如指定megejoin，失常状况下会生成 merge、lookup、hash 三种连贯类型，然而指定了mergejoin，就会间接不生成其余的的表达式)，如下①；另一个是代价计算阶段中返回一个很大的代价hugeCost(例如针对t1，指定index1，而后对于其余的拜访办法，则会间接返回很大的代价)，如下③。

Hint对优化器的影响如下：

① 排除了若干操作，缩小了Memo构造体中表达式的个数，如下图X号所示；

② 决定相干Group的最优打算抉择，如下图Group 1；

③ Group 1中，#1作为规范化表达式必然存在于组中，然而，它的代价被设置为hugeCost；

③ 因为应用ForceIndex，在摸索阶段应用其它索引的表达式不会被优化器抉择；

⑤ 最终影响最优打算树的抉择。

关于数据库:分布式数据库SQL优化之Plan-Hint

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于数据库:分布式数据库SQL优化之Plan-Hint

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复