共计 1366 个字符,预计需要花费 4 分钟才能阅读完成。
哈希索引基于哈希表实现,只有准确匹配索引所有列的查问才无效。
在 MySQL 中只有 Memory 引擎显示反对哈希索引,也是 memory 引擎表的默认索引类型。memory 引擎是反对非惟一哈希索引的。如果多个列的哈希值雷同,索引会以链表 的形式寄存多个记录指针道同一个哈希条目中。
举个粒子:
create table testhash(fname varchar(50) not null,
lname varchar(50) not null,
key using hash(fname)
)engine=memory;
数据库中的数据:mysql> select * from testhash;
+--------+-----------+
| fname | lname |
+--------+-----------+
| Baron | Schwartz |
| Arjen | Lentz |
| Peter | Zaitsev |
| Vadim | Tkachenko |
+--------+-----------+
4 rows in set (0.00 sec)
假如 f() 为哈希函数,f(fname) 的返回值是其哈希值,对应槽位。槽位是按顺序排列的。每个槽位上的值指向数据。
(构造能够了解为 jdk 1.7 中的 hashmap 的数据结构,一个数组和链表的模式)
ERROR 1054 (42S22): Unknown column 'lane' in 'field list'
mysql> select lname from testhash where fname ='Peter';
+---------+
| lname |
+---------+
| Zaitsev |
+---------+
1 row in set (0.00 sec)
查找的过程是是先计算 ’Peter’ 的哈希值,并应用改值寻找对应的记录指针,也就是计算 f(‘Peter’),失去其哈希值为 3468,而后在对应的槽位上找到记录指针,找到对应行上的数据,最初一步是比拟查找的值是否为 ’Peter’,以确保就是要查找的行。
哈希索引的限度
- 哈希索引值蕴含哈希值和行指针,而不存储字段值,所以不能应用索引中的值来防止读取行。
- 哈希索引数据并不是依照索引值顺序存储的,所以无奈用于排序
- 哈希索引也不反对局部索引匹配查找,因为哈希索引始终是应用索引列的全部内容来计算哈希值。例如,在数据列 (A,B)上简历哈希索引,如果查问只有数据列 A,则无奈应用该索引。
- 哈希索引只反对等值比拟查问,包含
=、IN()、<=>
, 也不反对任何范畴查找,例如 where price > 100. - 拜访哈希索引的数据十分快,除非欧很多哈希抵触。当呈现哈希抵触的时候,存储引擎必须遍历链表中的行指针,装进行比拟,直到找到所有符合条件的行。
- 如果哈希抵触很多的时候,一些索引保护操作的代价也会十分高。例如,如果在某个选择性很低(哈希抵触很多)的列上建设哈西索引,那么当从表中删除一行时,存储引擎须要遍历对应哈希值的链表中的每一行,找到并删除对应行的援用,抵触越多,代价越大。
InnoDB 引擎有一个非凡的性能叫做 ” 自适应哈希索引。当 InnoDB 留神到某些索引值被援用得十分频繁时,他会在内存中基于 B -Tree 索引智商在创立一个哈希索引,这样就让 B -Tree 索引也具备哈希索引的一些长处。这是一个齐全主动 的、外部的行为,用户无法控制或配置。不过如果有必要,齐全能够敞开该性能。
正文完