关于sql:慢sql治理经典案例分享

简介：菜鸟供应链金融慢sql治理曾经有一段时间，本人负责的利用继续很长时间没有慢sql告警，现阶段在推动组内其余成员治理利用慢sql。这里把治理过程中的一些实际拿进去分享下。

作者 | 如期
起源 | 阿里技术公众号

菜鸟供应链金融慢sql治理曾经有一段时间，本人负责的利用继续很长时间没有慢sql告警，现阶段在推动组内其余成员治理利用慢sql。这里把治理过程中的一些实际拿进去分享下。

一全表扫描

1 案例

SELECT count(*) AS tmp_count FROM ( 
SELECT * FROM `XXX_rules` WHERE 1 = 1 ORDER BY gmt_create DESC ) a

2 溯源

在分页查问治理的文章里曾经介绍过咱们零碎旧的分页查问逻辑，下面的查问sql显著就是分页查问获取总记录数，通过XXX_rules表的分页查问接口溯源，找到发动调用的页面是咱们小二后盾的一个操作商家准入的页面，页面关上后间接调用分页查问接口，除了分页参数，不传入其余任何查问参数，导致扫描全表。

3 剖析

灵魂拷问：为什么要扫描全表？全表数据展现到页面，花里胡哨的数据有用吗？

调研：和常常应用这个页面的经营聊后理解到，关上页面查问出的全表数据对经营是没有用的，他们基本不看这些数据。经营的操作习惯是拿到商家id，在页面查问框中输出商家id，查到商家数据后进行操作。

4 解决方案

由此优化计划就很清朗了：关上页面时不间接查问全量数据，等经营输出商家id后，将商家id作为参数进行查问。XXX_rules表中，商家id这一罕用查问条件设置为索引，再联合分页查问优化，全表扫描慢sql得以解决。

优化后的小二后盾页面如下：

关上页面时未查问任何数据，查问条件商家账户为必填项。

优化后的sql为:

SELECT count(*) AS tmp_count FROM ( 
   SELECT * FROM `xxx_rules` WHERE 1 = 1 AND `rule_value` = '2928597xxx' ) a

执行EXPLAIN失去后果如下：

能够看到命中了索引，扫描行数为3，查问速度明显提高。

5 思考

扫描全表治理简略来说就是退出查问条件，命中索引，去除全表扫描查问，尽管有些粗犷，但并不是没有情理。理论业务场景中，很少有要扫描全表获取全副数据的状况，限度调用上游必须传入查问条件，且该查问条件能命中索引，能很大水平上防止慢sql。

另外，再引申下，XXX_rules初始的用意是准入表，记录金融货主维度的准入状况，最多也就几千条数据，然而很多共事将这张表了解为规定表，写入很多业务相干规定，导致这个表收缩到一百多万条数据，表不clean了。这就波及到数据表的设计应用，明确表的应用标准，不乱写入数据，能给前期保护带来很大的便当。

二索引凌乱

1 示例

2 剖析

除了工夫、操作人字段，XXX_rules表就rule_name、rule_value、status、product_code四个字段，表的索引对这四个字段做各种排列组合。存在如下问题：

1、rule_name离散度不高，放在索引首位不适合；

2、前三个索引重合度很高；

显然是对索引的命中规定不够理解。XXX_rules表很多业务有定时工作对其写入删除，索引多、凌乱，对性能有很大的影响。

高性能的索引有哪些，再来回顾下：

1、独立的列：索引列不能是表达式的一部分；

2、抉择区分度高的列作为索引；

3、抉择适合的索引列程序：将选择性高的索引列放在最前列；

4、笼罩索引：查问的列均在索引中，不须要回查聚簇索引；

5、应用索引扫描来做排序;

6、在恪守最左前缀的准则下，尽量扩大索引，而不是创立索引。

凡是记得第3和6规定，也不至于把索引建成这样。

3 治理

对索引进行整合如下：

零碎中有很多工作拉取整个产品下的准入记录，而后进行解决，所以将区分度较高的product_code放在索引首位，而后增加rule_name、status字段到索引里，进一步过滤数据，缩小扫描行数，防止慢sql。针对罕用的rule_value查问条件，能够命中UK，因而不必独自建设索引。

三非必要排序

1 问题形容

很多业务逻辑中，须要拉取满足某个条件的记录列表，查问的sql语句带有order by，记录比拟多的状况，排序代价往往很大，然而查问进去的记录是否有序对业务逻辑没有影响，比方分页治理里探讨的count语句，只须要统计条数，order by对条数没有影响，再比方查出记录列表后，不依赖记录的程序遍历列表解决数据，这时候order by多此一举。

2 解决方案

查问sql无limit语句，且业务解决逻辑不依赖于order by后列表记录的程序，则去除查问sql中的order by语句。

四粗粒度查问

1 问题形容

业务中有很多定时工作，扫描某个表中某个产品下所有数据，对数据进行解决，比方：

SELECT * FROM XXX_rules
    WHERE rule_name = 'apf_distributors'
      AND status = '00'
      AND product_code = 'ADVANCE'

三个查问条件都是区分度不高的列，查出的数据有27W条，加索引意义也不大。

2 剖析

理论业务量没那么大，顶多几千条数据，表里的数据是从上游同步过去的，最好的方法是让上游精简数据，然而因为业务太长远，找上游的人保护难度太大，因而只能想其余的方法。

这个定时工作目标是拉出XXX_rules表的某些产品下的数据，和另一张表数据比照，更新有差别的数据。每天凌晨解决，对时效性没有很高的要求，因而，能不能转移工作解决的中央，不在本利用机器上实时处理那么多条数据？

3 解决方案

数据是离线工作odps同步过去的，首先想到的就是dataWork数据处理平台。

建设数据比照工作，将定时工作做的数据比照逻辑放到dataWork上用sql实现，每天差别数据最多几百条，且后果集含有区分度很高的列，将差别数据写入odps表，再将数据回流到idb。

新建定时工作，通过回流回来的差别数据中区分度高的列作为查问条件查问XXX_rules，更新XXX_rules，解决了慢sql问题。

这个办法的前提是对数据实效性要求不高，且离线产出的后果集很小。

五 OR导致索引生效

1 案例

SELECT count(*)
FROM XXX_level_report
WHERE 1 = 1
  AND EXISTS (
    SELECT 1
    FROM XXX_white_list t
    WHERE (t.biz_id = customer_id
        OR customer_id LIKE CONCAT(t.biz_id, '@%'))
      AND t.status = 1
      AND (t.start_time <= CURRENT_TIME
        OR t.start_time IS NULL)
      AND (t.end_time >= CURRENT_TIME
        OR t.end_time IS NULL)
      AND t.biz_type = 'GOODS_CONTROL_BLACKLIST'
  )

2 剖析

explain上述查问语句，失去后果如下：

XXX_white_list表有将biz_id作为索引，这里查问XXX_white_list表有传入biz_id作为查问条件，为啥explain后果里type为ALL，即扫描全表？索引生效了？索引生效有哪些状况？

索引生效场景

1、OR查问左右有未命中索引的；

2、复合索引不满足最左匹配准则；

3、Like以%结尾；

4、须要类型转换；

5、where中索引列有运算；

6、where中索引列应用了函数；

7、如果mysql感觉全表扫描更快时（数据少时）

上述查问语句第8行，customer_id为XXX_level_report表字段，未命中XXX_white_list表索引，导致索引生效。

3 解决方案

这个语句用condition、枚举、join花里胡哨的代码拼接起来的，改起来好麻烦，而且看起来“OR customer_id LIKE CONCAT(t.biz_id, ‘@%’)”这句不能间接删掉。最初重构了该局部的查问语句，去除or查问，解决了慢sql。

原文链接
本文为阿里云原创内容，未经容许不得转载。

关于sql:慢sql治理经典案例分享

一全表扫描

1 案例

2 溯源

3 剖析

4 解决方案

5 思考

二索引凌乱

1 示例

2 剖析

3 治理

三非必要排序

1 问题形容

2 解决方案

四粗粒度查问

1 问题形容

2 剖析

3 解决方案

五 OR导致索引生效

1 案例

2 剖析

3 解决方案

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于sql:慢sql治理经典案例分享

一 全表扫描

1 案例

2 溯源

3 剖析

4 解决方案

5 思考

二 索引凌乱

1 示例

2 剖析

3 治理

三 非必要排序

1 问题形容

2 解决方案

四 粗粒度查问

1 问题形容

2 剖析

3 解决方案

五 OR导致索引生效

1 案例

2 剖析

3 解决方案

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

一全表扫描

二索引凌乱

三非必要排序

四粗粒度查问

发表回复取消回复