MySQL怎样执行单表查询

2次阅读

共计 1766 个字符,预计需要花费 5 分钟才能阅读完成。

MySQL 根据 SQL 查询条件的类型,归类了几种不同的索引访问方式 (access method)

1. const: 主键索引、唯一二级索引的等值比较,结果最多只能是一条记录。1. 通过聚簇索引或唯一二级索引与常数的等值比较,来定位一条数据 (唯一二级索引比较 is NULL 时,不是 const,因为唯一二级索引不强制限制非 NULL,因此查出的结果可能是多条,所以不是 const 访问方式)
    
2. ref: 对索引列的等值比较,结果可能是多条记录。1. 普通二级索引来进行等值查询。关键点在于等值查询匹配到的结果的数量,由于查询期望的结果字段可能并不仅仅是二级索引所在的 column,因此如果匹配到的结果集数量很小,那么回表的代价和很小,如果结果数量很大,则回表的代价就很大。2. 查询二级索引列值为 NULL 的情况,因为普通或者唯一二级索引,都没有强制限制非 NULL,因此查询到的结果可能会是多条的,所以是 ref。3. 对于包含多个 column 的索引,只要查询条件是最左边的连续的索引列的等值比较,也是 ref

3. ref\_or\_null: 查询二级索引值为某个常数或者 NULL(有例外情况,如果结果太多,可能会直接全表扫描)

4. range: 利用二级索引进行区间查询。5. index: where 条件无法直接匹配任何索引,但是期望的结果集和查询条件都被某个联合索引全部覆盖到了,因此扫描了这个索引。6. all: 全表扫描

注意事项: 通常一次查询只能使用一个索引,那么当 where 侯庙有多个条件时,MySQL 如何选择索引呢?

1. 二级索引 + 回表

    1. 假定有两个条件 A 和 B,且都有对应的索引,那么先判断使用哪个索引的开销较小,加入选择了 A 条件

    2. 根据选择的索引定位记录

    3. 回表,根据 2 中定位的结果进行回表操作,从主键索引取到完整的数据记录,然后再用 B 条件对完整的数据记录进行过滤

2. 无法使用索引,例: WHERE 索引条件 OR 非索引条件

    1. SELECT * FROM single\_table WHERE key2 > 100 AND common\_field = 'abc';

        > key2 有二级索引,common\_field 没有索引

    2. 此时使用 key2 索引进行扫描,简化 SQL=> SELECT \* FROM single\_table WHERE key2 > 100 AND TRUE,范围是 (100,+∞\],再用 common\_field 进行匹配

    3. 此时使用 key2 索引进行扫描,简化 SQL=> SELECT \* FROM single\_table WHERE key2 > 100 OR TRUE,范围是 (-∞,+∞),那么此时,不如直接全表扫描

3. 非常复杂的查询条件时,如何进行分析?1. 观察 WHERE 后涉及到哪几个 column

    2. 观察有哪几个可用索引

    3. 假设选择某个索引条件,简化 SQL(注意,简化的思路就是把与被选中索引无关的查询条件全部替换为 TRUE),得到二级索引的扫描范围

    4. 将扫描二级索引的到的结果,再用其余条件进行过滤

虽然通常一次查询只会用到一个二级索引,但是在某些特定条件下,可能会用到多个索引,机索引合并

1. Intersection 合并

2. Union 合并

3. Sort-Union 合并

4. 联合索引的使用


关于联合索引的使用:~~~~
  1. 凡凡一凡凡请问一下问什么说多列索引有范围查询只能用到第一个出现的范围查询作为索引,比如:select * from t where key1 > 100 and key2 = ‘xxx’ and key3 > 20; 如果 key1,key2,key3 是个联合索引,只能用到 key1 索引,为什么不同时使用三个条件去索引中查找呢?
  2. 因为 Key1 的查询不是等值查询,查询出来的 Key1 值也不同,而只有当 Key1 值相同时,才能让 Key2 上,同理 只有所有记录中 Key2 值都相同时,才轮得到 Key3,我是这么理解
  3. 根据小册第 8 章,我的理解是“在某条件下,某列必须是有序的,该列才可能用上索引”。在这里就是 key1 > 100 时,key2 是无序的,所以无法走 key2 的索引。而如果 key1 是等值查询,则 key2 有序,可以用上 key2 的索引。

联合索引的使用,涉及到了联合索引的排序方式,它是按照索引列从左向右依次进行排序的。所以,当期望用到其中某个索引列时,该列必须是有序的,也就是说,这个列左侧的索引列,已经通过等值查询匹配过了。

正文完
 0