关于java:数据库从B树讲到索引优化听不明白你找我

一、什么是索引

在进行索引之前，咱们先提前温习一下数据库的构造

数据库索引，是数据库管理系统中一个排序的数据结构，以帮助疾速查问、更新数据库表中数据。就像咱们以前用的新华字典的目录一样，能帮忙咱们疾速查问到某一个字。

具体的来看一下

二、索引的分类

分类角度索引名称数据结构B+树，Hash索引，R-Tree等存储层面聚簇索引，非聚簇索引逻辑层面主键索引，一般索引，复合索引，惟一索引，空间索引等

这样说有点不明确？图解奉上

还不明确，没关系，这么看图的确有点形象，那咱们就来看一下实例

三、索引实例剖析(以InnoDB为例)

3.1 InnoDB下索引的构造

InnoDB下，表都是依据主键程序以索引的模式寄存的，这种数据存储形式也被称为聚簇索引，“聚簇”就是示意数据行和相邻的键值紧凑的存储在一起，也就是数据行实际上是存储在索引的叶子页中。咱们创立一张表来理论阐明下InnoDB下的索引构造，建表语句如下：

create table person(id int primary key, age int not nullindex (age)engine=InnoDB;

而后咱们插入五条数据别离为(1,15),(2,17),(6,20),(10,18),(19,21)，索引的树结构如下：

上图中展现了两局部内容，第一个图为聚簇索引（主键索引）的内容，能够看到，数据依照Id的大小排序，对应的索引会蕴含该索引的整行数据。

第二个图展现了用age做索引的索引结构图，也就是非聚簇索引（非主键索引），能够看到索引以年龄排序，然而和主键索引不同的是，年龄索引对应的却是Id，所以咱们能够晓得非主键索引记录的内容就是主键索引的值。

这里可能有同学会有疑难，如果我建表的时候没有指定主键的话，索引构造又是如何的呢？其实在InnoDB中，如果没有定义主键，那么他会抉择一个惟一的非空索引代替。如果没有这样的索引，那么他会隐式的定义一个主键来作为聚簇索引。所以无论你是否设置主键，InnoDB还是会帮你满足以上图的模式来索引数据。接下来咱们剖析下索引查问的流程。

3.2 索引查问剖析

假如咱们执行一条查问语句 select * from person where ID = 6 ,因为间接应用的是主键ID查问，所以就会用主键索引，因为主键索引间接关联了整行所有数据，所以，引擎只有执行一次就能查问出后果。

如果执行的sql语句是非主键索引

select * from person where age = 18

上述语句会走age的一般索引，索引先依据age搜寻等于18的索引记录，找到ID=10的记录，而后再到主键索引搜寻一次，而后拿出须要查问的数据。

从一般索引查出主键索引，而后查问出数据的过程叫做回表。因为回表须要多执行一次查问，这也是为什么主键索引要比一般索引要快的起因，所以，咱们要尽量应用主键查问。

3.3 笼罩索引

咱们通常创立索引的根据都是依据查问的where条件，然而这只是咱们通常的做法，咱们依据下面的剖析能够晓得，如果要想查问效率高，第一，应用主键索引，第二，防止回表，也就是尽可能的在索引中就能获取想要的数据。如果一个索引蕴含了须要查问的字段，那么咱们就叫做“笼罩索引”。

那么如何建设一个笼罩索引呢？答案是通过联结索引来实现，通过联结索引的字段来笼罩要查问的字段，从而达到索引笼罩的成果。

咱们把下面的建表语句革新下，来剖析下如何实现笼罩索引。

 CREATE TABLE `person` (  `id` int(11) NOT NULL,  `age` int(11) DEFAULT NULL,  `name` varchar(20) DEFAULT NULL,  `sex` varchar(1) DEFAULT NULL,  PRIMARY KEY (`id`),  KEY `name_age` (`name`,`age`)) ENGINE=InnoDB DEFAULT CHARSET=latin1;

下面我创立了一个name和age的联结索引，索引结构图示意如下：

咱们依据图能够晓得，联结索引是和创立索引字段程序无关的，下面这个例子就是先以name排序，而后name雷同再以age为规范排序。那么咱们建表后该如何达到笼罩索引的成果呢？置信有些同学曾经晓得了怎么写sql能够达到笼罩索引成果，sql如下：

select name,age from person where name = “Barry”

因为咱们须要查问的字段name和age，都在索引中能够间接查问到了，所以不须要查找到主键ID，而后再回表了。

看到这里，必定有同学会说，既然这样的话，我把所有须要查问的字段组合都建上联结索引不就行了吗？答案是：不行。因为索引也是须要耗费空间的，而且保护索引也是须要老本的，这一点我会在前面的优缺点中提到。那么有没有别的形式能够尽可能的实现不回表的成果呢？这里咱们就要引入MySql的最左前缀准则了。

什么叫最左前缀准则呢？就是在索引的匹配中，能够以索引的最左N个字段,也能够是字符串索引的最左N个字符。比方在上图中，要查问以A结尾的名字，查问语句就是

select name from person where name like ‘A%’

这个时候就能够满足最左前缀规定来应用索引查问了，这里就会依赖索引查问到第一个首字母是A的名字，而后向后遍历，直到不满足条件为止。

那么最左N个字段是什么意思呢？意思就是索引（name,age),能够间接利用 name来当做独自索引应用，能够只应用联结索引的局部字段，然而必须是程序统一，比方索引（a,b,c)，如果要想应用最左前缀规定，能够应用索引a,ab。

咱们也能够利用该规定来少保护一个或多个索引，比方咱们须要 a,ab,abc的查问，那就只须要(a,b,c)联结索引就满足要求了。

3.4 索引下推

在MySql 5.6版本中引入了一个新个性，叫做“索引条件推送（index condition pushdown)”，这也称为索引下推。那么索引下推是这个什么东东呢？其实从“索引条件推送”这个名字就能够表明，这个个性是能够在索引中的字段进行条件判断，而后过滤不满足条件的记录，缩小回表的次数。

比方以上图中的数据为准，sql如下：

select * from person where name like ‘A%’ and age =19;

那么如果没有索引下推的状况下，首先会依据索引查问出名字以A结尾的所有记录，而后查问出ID，而后回表去查问对应的ID记录，最初再判断age=19，返回满足条件的语句。因为满足A结尾的记录有2条，所以这种状况下，会回表2次。

在索引下推状况下，InnoDB会在索引外部直接判断age=19是否满足条件，过滤掉不满足条件的记录，所以只返回了一条，也就是只须要回表一次。从而进步了性能。

3.5 索引的长处与毛病

说了这么多对于索引的内容，咱们来谈谈索引的优缺点。

长处：

缩小服务器须要扫描的数据量
索引能够帮忙服务器防止排序和长期表
索引能够将随机IO变为程序IO

毛病

索引会占用额定的存储空间
索引的保护须要肯定的老本，插入数据后须要保障原来的索引有序，所以也会影响肯定的数据库性能。
- *

所以在优化方面，索引优化算是数据库优化中很重要的一个环节，这里因为篇幅起因我就不一一详解了，相干的内容我曾经残缺整顿成思维导图，每一个方面整顿的都很具体

须要这份优化思维导图以及下面的常识图的老铁，同步的还有相干的视频解说以及学习文档，还不快点口头
关注公众号：Java架构师联盟，每日更新技术好文

局部材料曾经上传到我的git仓库中：有须要的能够下载

https://gitee.com/biwangsheng/mxq

关于java:数据库从B树讲到索引优化听不明白你找我

一、什么是索引

二、索引的分类

三、索引实例剖析(以InnoDB为例)

3.1 InnoDB下索引的构造

3.2 索引查问剖析

3.3 笼罩索引

3.4 索引下推

3.5 索引的长处与毛病

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于java:数据库从B树讲到索引优化听不明白你找我

一、什么是索引

二、索引的分类

三、索引实例剖析(以InnoDB为例)

3.1 InnoDB下索引的构造

3.2 索引查问剖析

3.3 笼罩索引

3.4 索引下推

3.5 索引的长处与毛病

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复