关于Hash散列的集中查重方式

14次阅读

共计 575 个字符,预计需要花费 2 分钟才能阅读完成。

这里总结一下 Hash 散列当出现不能插入位置的几种位移和计算方式,以免遗忘和出现不知道都在讲些神马;
当我们 key1 和 key2 冲突的时候,主要有三种方式进行冲突解决;
先来说两种开放定址法,所谓开放定址法就是重新计算了 hash 值;
1. 线性探查法:当我们插入 key 的位置,产生冲突之后,加 1,查看该位置是否可以使用。如果不可以使用,再次 +1,重复到找到位置,或者查完没有满足的位置,并且在这个途中,可以越过尾部,从 hash 序列头部进行枚举。但是该方法有一个缺点,就是容易造成元素扎堆;
2. 平方探查法:插入时,当 H(key)的位置被占时,将检查下列位置:H(key)+1^2,H(key)-1^2,H(key)+2^2,H(key)-2^2…。如果在这个途中 H(key)+k^2 超过了表长,则进行取模操作; 如果 H(key)-k^2<0 时,则进行 ((H(key)-k^2)%Tsize+Tsize)%Tsize, 从而保证索引为正;这两个方向的操作称为正向和负向操作,为了避免计算麻烦,往往可以采用正向操作;注意一点,寻找的次数 k 在[0,Tsize] 内,当 k 超过这个范围,必不可能插入,停止计算;
第三中时拉链法则:3. 拉链法:拉链法不计算新的 hash 值,而是在重复 Hash 值的地方构建一个单链表,从而将所有重复的节点连接起来,查询的时候遍历该链表中的所有元素;

正文完
 0