前言

本文的目的是阅读理解HashMap的源码，作为集合中重要的一个角色，平时用到十分多的一个类，深入理解它，知其所以然很重要。本文基于Jdk1.7，因为Jdk1.8改变了HashMap的数据结构，进行了优化，我们先从基础阅读，之后再阅读理解Jdk1.8的内容

HashMap的特性

1.通过key-value的形式快速的存取元素
2.允许键为Null，但只允许有一个键的值为Null
3.线程不安全
4.底层结构是Hash表，元素是无序的
5.再不考虑Hash冲突的时候，插入和查询的复杂度是可以达到O（1）的

HashMap的数据结构

底层数据结构是一个Hash表，基于数组和链表，数组里面保存着一个单向链表的头节点，单项链表保存着具有相同Hash值的不同元素，再不发生Hash冲突的情况下，链表应该只有一个元素，这是最理想的状态。

链表的数据结构代码
`

static class Entry<K, V> implements Map.Entry<K, V> {
final K key;
V value;
Entry<K, V> next;    // 下一个Entry对象的引用
int hash;    // 其实就是key的hash值  
}

HashMap的常量结构

// 默认初始化容量 16
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
 
// HashMap允许的最大容量 2^30
static final int MAXIMUM_CAPACITY = 1 << 30;
 
// 默认的负载率 75%
static final float DEFAULT_LOAD_FACTOR = 0.75f;
 
// 空的哈希表
static final Entry<?, ?>[] EMPTY_TABLE = {};
 
// 实际使用的哈希表
transient Entry<K, V>[] table = (Entry<K, V>[]) EMPTY_TABLE;
 
// HashMap的大小,即存储的key-value的数量
transient int size;
 
// 扩容的阀值，当HashMap的size达到阀值时，就开始扩容 threshold=length*threshold 
int threshold;
 
// 负载率
final float loadFactor;
 
// 修改次数, 用于fail-fast机制
transient int modCount;
 
// 替代哈希使用的默认扩容阀值
static final int ALTERNATIVE_HASHING_THRESHOLD_DEFAULT = Integer.MAX_VALUE;
 
// 随机的哈希种子, 有助于减少发生哈希碰撞的几率

transient int hashSeed = 0;

HashMap的初始化

HashMap的初始化涉及到上面的多个常量，在了解完常量的作用之后，我们就可以理解HashMap的初始化思想，首先，HashMap并不是通过构造函数来初始化的，构造函数只是初始化HashMap的初始化参数，包括DEFAULT_INITIAL_CAPACITY ，loadFactor等，再初始化参数之后，真正的调用Put方法时，会判断table 是否已经初始化，没有的话再根据参数进行初始化。

put方法的流程我们这边也要先理解：
（1）检查哈希表是否是个空表，如果是空表就调用inflateTable方法进行初始化
（2）判断key是否为null，如果为null，就调用putForNullKey方法, 将key为null的key-value存储在哈希表的第一个位置中
如果key不为null，则调用hash方法计算key的hash值
（3）根据hash值和Entry数组的长度定位到Entry数组的指定槽位
（4）判断Entry数组指定槽位的值e是否为null, 如果e不为null, 则遍历e指向的单链表, 如果传入的key在单链表中已经存在了, 就进行替换操作, 否则就新建一个Entry并添加到单链表的表头位置
（5）如果e为null, 就新建一个Entry并添加到指定槽位

下面是代码：
构造方法

public HashMap(int initialCapacity, float loadFactor) {
    // 如果初始容量小于0，则抛出异常
    if (initialCapacity < 0) {
        throw new IllegalArgumentException("Illegal initial capacity: " + initialCapacity);
    }
 
    // 如果初始容量大于容量最大值，则使用最大值作为初始容量
    if (initialCapacity > MAXIMUM_CAPACITY) { initialCapacity = MAXIMUM_CAPACITY; }
 
    // 如果负载率小于等于0或负载率不是浮点数，则抛出异常
    if (loadFactor <= 0 || Float.isNaN(loadFactor)) {
        throw new IllegalArgumentException("Illegal load factor: " + loadFactor);
    }
 
    // 设置负载率
    this.loadFactor = loadFactor;
 
    // 设置阀值为初始容量
    threshold = initialCapacity;
 
    // 空实现, 交由子类实现
    init();
}
//

初始化数组方法


private void inflateTable(int toSize) {
    // 寻找大于toSize的,最小的,2的n次方作为新的容量
    int capacity = roundUpToPowerOf2(toSize);
 
    // 阀值=容量*负载因子, 如果容量*负载因子>最大容量时, 阀值=最大容量
    threshold = (int) Math.min(capacity * loadFactor, MAXIMUM_CAPACITY + 1);
 
    // 按新的容量创建一个新的数组
    table = new Entry[capacity];
 
    // 重新初始化hashSeed
    initHashSeedAsNeeded(capacity);
}

put方法

public V put(K key, V value) {
    // 如果哈希表没有初始化就进行初始化
    if (table == EMPTY_TABLE) {
        // 初始化哈希表
        inflateTable(threshold);
    }
 
    // 当key为null时，调用putForNullKey方法，保存null于table的第一个位置中，这是HashMap允许为null的原因
    if (key == null) {
        return putForNullKey(value);
    }
 
    // 计算key的hash值
    int hash = hash(key);
    // 根据key的hash值和数组的长度定位到entry数组的指定槽位
    int i = indexFor(hash, table.length);
    // 获取存放位置上的entry，如果该entry不为空，则遍历该entry所在的链表
    for (Entry<K, V> e = table[i]; e != null; e = e.next) {
        Object k;
        // 通过key的hashCode和equals方法判断，key是否存在， 如果存在则用新的value取代旧的value，并返回旧的value
        if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
            V oldValue = e.value;
            e.value = value;
            e.recordAccess(this);
            return oldValue;
        }
    }
 
    // 修改次数增加1
    modCount++;
    // 如果找不到链表 或者 遍历完链表后，发现key不存在，则创建一个新的Entry，并添加到HashMap中
    addEntry(hash, key, value, i);
    return null;
}

 void addEntry(int hash, K key, V value, int bucketIndex) {
    //添加key到table[bucketIndex]位置，新的元素总是在table[bucketIndex]的第一个元素，原来的元素后移
    Entry<K,V> e = table[bucketIndex];
        table[bucketIndex] = new Entry<K,V>(hash, key, value, e);
    //判断元素个数是否达到了临界值，若已达到临界值则扩容，table长度翻倍
        if (size++ >= threshold)
            resize(2 * table.length);
    }

HashMap的查

当key值为Null的时候会进行特殊处理，在table[0]的链表上查找Key为null的元素，get的过程是：
（1）计算hash与table.length取模计算index值
（2）遍历table[index]上的链表，直到找到key

 void addEntry(int hash, K key, V value, int bucketIndex) {
//添加key到table[bucketIndex]位置，新的元素总是在table[bucketIndex]的第一个元素，原来的元素后移
Entry<K,V> e = table[bucketIndex];
    table[bucketIndex] = new Entry<K,V>(hash, key, value, e);
//判断元素个数是否达到了临界值，若已达到临界值则扩容，table长度翻倍
    if (size++ >= threshold)
        resize(2 * table.length);
}

#HashMap的删
remove方法同样也是，先计算hash,在计算index，遍历查找，找到之后删除节点

/**
     * 根据key删除元素
     */
    public V remove(Object key) {
        Entry<K,V> e = removeEntryForKey(key);
        return (e == null ? null : e. value);
    }

    /**
     * 根据key删除链表节点
     */
    final Entry<K,V> removeEntryForKey(Object key) {
        // 计算key的hash值
        int hash = (key == null) ? 0 : hash(key.hashCode());
        // 根据hash值计算key在数组的索引位置
        int i = indexFor(hash, table.length );
        // 找到该索引出的第一个节点
        Entry<K,V> prev = table[i];
        Entry<K,V> e = prev;

        // 遍历链表（从链表第一个节点开始next），找出相同的key，
        while (e != null) {
            Entry<K,V> next = e. next;
            Object k;
            // 如果hash值和key都相等，则认为相等
            if (e.hash == hash &&
                ((k = e. key) == key || (key != null && key.equals(k)))) {
                // 修改版本+1
                modCount++;
                // 计数器减1
                size--;
                // 如果第一个就是要删除的节点（第一个节点没有上一个节点，所以要分开判断）
                if (prev == e)
                    // 则将下一个节点放到table[i]位置（要删除的节点被覆盖）
                    table[i] = next;
                else
                 // 否则将上一个节点的next指向当要删除节点下一个（要删除节点被忽略，没有指向了）
                    prev. next = next;
                e.recordRemoval( this);
                // 返回删除的节点内容
                return e;
            }
            // 保存当前节点为下次循环的上一个节点
            prev = e;
            // 下次循环
            e = next;
        }

        return e;
}

HashMap的扩容

resize扩容是HashMap中非常重要的一个操作，在容器里的元素达到一个临界值时，HashMap会自动进行扩容，扩容的具体流程是；
1.在put的时候检查是否需要扩容，根据两个参数：初始容量和装载因子
2.创建一个容量为table.length*2的table，修改临界值
3.重新计算所有元素的hash值，并放入新的table，使用的是头插法
4.用新的table替换旧的table

 void resize(int newCapacity) {
        Entry[] oldTable = table;
        int oldCapacity = oldTable.length;
        if (oldCapacity == MAXIMUM_CAPACITY) {//最大容量为 1 << 30
            threshold = Integer.MAX_VALUE;
            return;
        }

        Entry[] newTable = new Entry[newCapacity];//新建一个新表
        boolean oldAltHashing = useAltHashing;
        useAltHashing |= sun.misc.VM.isBooted() &&
                (newCapacity >= Holder.ALTERNATIVE_HASHING_THRESHOLD);
        boolean rehash = oldAltHashing ^ useAltHashing;//是否再hash
        transfer(newTable, rehash);//完成旧表到新表的转移
        table = newTable;
        threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);
    }
--------------------- 
 void transfer(Entry[] newTable, boolean rehash) {
        int newCapacity = newTable.length;
        for (Entry<K,V> e : table) {//遍历同桶数组中的每一个桶
            while(null != e) {//顺序遍历某个桶的外挂链表
                Entry<K,V> next = e.next;//引用next
                if (rehash) {
                    e.hash = null == e.key ? 0 : hash(e.key);
                }
                int i = indexFor(e.hash, newCapacity);//找到新表的桶位置;原桶数组中的某个桶上的同一链表中的Entry此刻可能被分散到不同的桶中去了，有效的缓解了哈希冲突。
                e.next = newTable[i];//头插法插入新表中
                newTable[i] = e;
                e = next;
            }
        }
    }

扩容的整体操作如上，但是有一些十分精妙的细节十分厉害

为什么扩容的容量一定是2的幂？

这么设计当然是为了性能，而且是十分显著的性能提升，涉及到了位操作，我觉得非常有意思，会在下一篇专门讲这样计算进行提升性能的例子。

浅析HashMap源码1

前言

HashMap的特性

HashMap的数据结构

HashMap的常量结构

HashMap的初始化

HashMap的查

HashMap的扩容

为什么扩容的容量一定是2的幂？

评论

发表回复取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

浅析HashMap源码1

前言

HashMap的特性

HashMap的数据结构

HashMap的常量结构

HashMap的初始化

HashMap的查

HashMap的扩容

为什么扩容的容量一定是2的幂？

评论

发表回复 取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

发表回复取消回复