原创你真的了解HashMap吗HashMap源码分析

共计 4531 个字符，预计需要花费 12 分钟才能阅读完成。

前言

讲讲 hashMap，简单的东西你还真不一定理解，真心的觉得需要有一篇文章把它给讲明白，这样就再也不怕面试被问到了。

**HashMap 介绍
HashMap 初始化
HashMap 扩容机制
HashMap 数据结构
HashMap 哈希冲突的解决
HashMap 使用 **

一、HashMap 介绍

  他是基于哈希表的 Map 接口的实现。此实现提供所有可选的映射操作，并允许使用 null 值和 null 键。此类不保证映射的顺序，特别是它不保证该顺序恒久不变。此实现假定哈希函数将元素适当地分布在各桶之间，可为基本操作（get 和 put）提供稳定的性能。另外，HashMap 是非线程安全的，而 Hashtable 是线程安全的。HashMap 是继承了 AbstractMap 类, 实现了 Map，Cloneable, Serializable 接口.

  
public class HashMap<K,V>
    extends AbstractMap<K,V>
implements Map<K,V>, Cloneable, Serializable

二、HashMap 初始化

重要参数说明

 // 初始化的容量大小
    static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
    // 最大容量大小
    static final int MAXIMUM_CAPACITY = 1 << 30;
    // 默认负载因子
    static final float DEFAULT_LOAD_FACTOR = 0.75f;

HashMap 初始化的时候就做两件事, 初始化了容量 (比作一个桶) 的大小为 16 和负载因子为 0.75

 public HashMap() {
     // 初始化桶大小 DEFAULT_INITIAL_CAPACITY=16  
     // 负载因子 DEFAULT_LOAD_FACTOR=0.75
     this(DEFAULT_INITIAL_CAPACITY, DEFAULT_LOAD_FACTOR);
}
public HashMap(int initialCapacity, float loadFactor) {
        if (initialCapacity < 0
            throw new IllegalArgumentException("Illegal initial capacity:" +
                                               initialCapacity);
        // 如果容量超过最大的值，取最大值
        if (initialCapacity > MAXIMUM_CAPACITY)
            initialCapacity = MAXIMUM_CAPACITY;
        if (loadFactor <= 0 || Float.isNaN(loadFactor))
            throw new IllegalArgumentException("Illegal load factor:" +
                                               loadFactor);
        // 初始化负载因子 0.75
        this.loadFactor = loadFactor;
        // 初始化桶大小 16
        threshold = initialCapacity;
        init();}

三、HashMap 扩容机制

负载因子可以理解为饱满度，负载因子越大，占用的的空间越小，但是查询的效率越低。负载因子越小，占用空间越大，但是会提高查询效率。这是由数据结构决定的，下面讲。

HashMap 的实际容量就是因子 * 容量，其默认值是 16×0.75=12；这个很重要，对效率有一定影响！当存入 HashMap 的对象超过这个容量时，HashMap 就会就需要 resize（扩容 2 倍后重排）。

 private void inflateTable(int toSize) {
        // 最接近且大于 toSize 的 2 的冪数
        int capacity = roundUpToPowerOf2(toSize);
        // 定义最大的实际容量，超过这个值就需要扩容
        threshold = (int) Math.min(capacity * loadFactor, MAXIMUM_CAPACITY + 1);
        // 定义 Entry 数组，放 put 数据
        table = new Entry[capacity];
        initHashSeedAsNeeded(capacity);
  }
  // 最接近且大于 number 的 2 的冪数, 例如 number 为 3 返回结果是 4，number 为 4 返回结果为 4
   private static int roundUpToPowerOf2(int number) {
        return number >= MAXIMUM_CAPACITY
                ? MAXIMUM_CAPACITY
                : (number > 1) ? Integer.highestOneBit((number - 1) << 1) : 1;
    }
// 添加元素，并判断是否需要扩容
void addEntry(int hash, K key, V value, int bucketIndex) {
      //size 为当前数组大小，threshold 为实际最大容量, 如果大于就扩容
        if ((size >= threshold) && (null != table[bucketIndex])) {resize(2 * table.length);// 扩容
            hash = (null != key) ? hash(key) : 0;
            bucketIndex = indexFor(hash, table.length);
        }
        // 添加
        createEntry(hash, key, value, bucketIndex);
    }
    // 扩容
    void resize(int newCapacity) {Entry[] oldTable = table;
        int oldCapacity = oldTable.length;
        // 判断老的数组是否等于最大容量，如果等于不允许扩容
        if (oldCapacity == MAXIMUM_CAPACITY) {
            threshold = Integer.MAX_VALUE;
            return;
        }
        // 定义新的数据
        Entry[] newTable = new Entry[newCapacity];
        // 重新再新的数组中定义老的数据
        transfer(newTable, initHashSeedAsNeeded(newCapacity));
        table = newTable;
        threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);
    }
    // 需要重新在新的数组中计算保存位置，并保存
void transfer(Entry[] newTable, boolean rehash) {
        int newCapacity = newTable.length;
        for (Entry<K,V> e : table) {while(null != e) {
                Entry<K,V> next = e.next;
                if (rehash) {e.hash = null == e.key ? 0 : hash(e.key);
                }
                int i = indexFor(e.hash, newCapacity);
                e.next = newTable[i];
                newTable[i] = e;
                e = next;
            }
        }
    }

因为重新创建新的数据，重新计算元素的存储位置非常的影响性能，所以最好预估元素的多少，在创建 HashMap 的时候定义它的大小，最好为 2 的冪数，这样可以更好的利用空降。

四、HashMap 数据结构

    HashMap 是一个散列桶（数组和链表），它存储的内容是键值对 key-value 映射，数组和链表的数据结构，能在查询和修改方面继承了数组的线性查询和链表的寻址修改。（横排表示数组，纵排表示链表）

五、HashMap 数据碰撞的解决

    因为哈希值有哈希冲突的存在，所以不同的 key 可能有相同的哈希值。这个是后就需要通过链表结构来解决问题了。正常情况，当我们 put 存储一个 key-value 数据的时候，HashMap 会计根据 key 的哈希值计算应该在桶中保存的位置，判断该位置是否有数据，如果有数据，需要判断 hash 和 key 时候相等，如果相等，新的值替换老的值，并返回老的值。（这个不是“碰撞”，这中情况 key 是一样的）

 public V put(K key, V value) {if (table == EMPTY_TABLE) {inflateTable(threshold);
        }
        if (key == null)
            return putForNullKey(value);
        // 计算哈希
        int hash = hash(key);
        // 计算桶中的位置
        int i = indexFor(hash, table.length);
        for (Entry<K,V> e = table[i]; e != null; e = e.next) {
            Object k;
          // 判断哈希和 key 是否一样
            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {        // 一样
              // 哈希一样，key 也一样
                V oldValue = e.value;
                e.value = value;
                e.recordAccess(this);
                return oldValue;
            }
        }
        // i 位置数据为空；或者数据不为空，hash 不一样；或者哈希一样，key 不一样
        modCount++;
        // 添加
        addEntry(hash, key, value, i);
        return null;
    }

i 位置数据为空；或者数据不为空，hash 不一样；或者哈希一样（哈希碰撞），key 不一样，走下面流程：

下面源码中，bucketIndex 为新的数据在数组中的位置，如果这个位置没有数据，会保存新数据，并且它在链表中的下一数据是 null（e 为 null），如果这个位置已经有数据，会在这个位置保存新的数据，它在链表中的下一个数据是老的数据(e)。

 void createEntry(int hash, K key, V value, int bucketIndex) {
        // 获取当前位置的数据 e，有可能是 null
        Entry<K,V> e = table[bucketIndex];
        // 当前位置保存新的数据，历史数据 e 为新数据的链表相联的数据
        table[bucketIndex] = new Entry<>(hash, key, value, e);
        size++;
}

假如哈希值不一样，会产生碰撞吗？答案是肯定的.

首先我们看一下，hashMap 中数据在桶中位置计算方式

   static int indexFor(int h, int length) {// assert Integer.bitCount(length) == 1 : "length must be a non-zero power of 2";
        return h & (length-1);
    }

“与”运算扩展：

参加运算的两个数据，按二进制位进行“与”运算。

运算规则：0&0=0;0&1=0;1&0=0;1&1=1;

即：两位同时为“1”，结果才为“1”，否则为 0

** 举例说明：
1&(16-1)=1
17&(16-1)=1**

所以我们可以理解，当桶的容量是固定的时候，负载因子越大，最大实际容量就会越大，需要保存的数据就越多。“碰撞”的情况出现的情况就会更多，增加了 HashMap 中链表结构中的数据，降低查询的效率。增加了空间利用率。

相反，当负载因子越小的时候，桶的实际容量就会越小，可以存的数据越少，碰撞情况减少，减少链表数据，增加查询效率。降低了空间利用率。

六、HashMap 的简单使用

搞定~

喜欢的小伙伴记得关注一下~ 可以免费领取学习资料~


	public class HashMap<K,V>
	extends AbstractMap<K,V>
	implements Map<K,V>, Cloneable, Serializable

	// 初始化的容量大小
	static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
	// 最大容量大小
	static final int MAXIMUM_CAPACITY = 1 << 30;
	// 默认负载因子
	static final float DEFAULT_LOAD_FACTOR = 0.75f;

	public HashMap() {
	// 初始化桶大小 DEFAULT_INITIAL_CAPACITY=16
	// 负载因子 DEFAULT_LOAD_FACTOR=0.75
	this(DEFAULT_INITIAL_CAPACITY, DEFAULT_LOAD_FACTOR);
	}
	public HashMap(int initialCapacity, float loadFactor) {
	if (initialCapacity < 0
	throw new IllegalArgumentException("Illegal initial capacity:" +
	initialCapacity);
	// 如果容量超过最大的值，取最大值
	if (initialCapacity > MAXIMUM_CAPACITY)
	initialCapacity = MAXIMUM_CAPACITY;
	if (loadFactor <= 0 \|\| Float.isNaN(loadFactor))
	throw new IllegalArgumentException("Illegal load factor:" +
	loadFactor);
	// 初始化负载因子 0.75
	this.loadFactor = loadFactor;
	// 初始化桶大小 16
	threshold = initialCapacity;
	init();}

	private void inflateTable(int toSize) {
	// 最接近且大于 toSize 的 2 的冪数
	int capacity = roundUpToPowerOf2(toSize);
	// 定义最大的实际容量，超过这个值就需要扩容
	threshold = (int) Math.min(capacity * loadFactor, MAXIMUM_CAPACITY + 1);
	// 定义 Entry 数组，放 put 数据
	table = new Entry[capacity];
	initHashSeedAsNeeded(capacity);
	}
	// 最接近且大于 number 的 2 的冪数, 例如 number 为 3 返回结果是 4，number 为 4 返回结果为 4
	private static int roundUpToPowerOf2(int number) {
	return number >= MAXIMUM_CAPACITY
	? MAXIMUM_CAPACITY
	: (number > 1) ? Integer.highestOneBit((number - 1) << 1) : 1;
	}
	// 添加元素，并判断是否需要扩容
	void addEntry(int hash, K key, V value, int bucketIndex) {
	//size 为当前数组大小，threshold 为实际最大容量, 如果大于就扩容
	if ((size >= threshold) && (null != table[bucketIndex])) {resize(2 * table.length);// 扩容
	hash = (null != key) ? hash(key) : 0;
	bucketIndex = indexFor(hash, table.length);
	}
	// 添加
	createEntry(hash, key, value, bucketIndex);
	}
	// 扩容
	void resize(int newCapacity) {Entry[] oldTable = table;
	int oldCapacity = oldTable.length;
	// 判断老的数组是否等于最大容量，如果等于不允许扩容
	if (oldCapacity == MAXIMUM_CAPACITY) {
	threshold = Integer.MAX_VALUE;
	return;
	}
	// 定义新的数据
	Entry[] newTable = new Entry[newCapacity];
	// 重新再新的数组中定义老的数据
	transfer(newTable, initHashSeedAsNeeded(newCapacity));
	table = newTable;
	threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);
	}
	// 需要重新在新的数组中计算保存位置，并保存
	void transfer(Entry[] newTable, boolean rehash) {
	int newCapacity = newTable.length;
	for (Entry<K,V> e : table) {while(null != e) {
	Entry<K,V> next = e.next;
	if (rehash) {e.hash = null == e.key ? 0 : hash(e.key);
	}
	int i = indexFor(e.hash, newCapacity);
	e.next = newTable[i];
	newTable[i] = e;
	e = next;
	}
	}
	}

	public V put(K key, V value) {if (table == EMPTY_TABLE) {inflateTable(threshold);
	}
	if (key == null)
	return putForNullKey(value);
	// 计算哈希
	int hash = hash(key);
	// 计算桶中的位置
	int i = indexFor(hash, table.length);
	for (Entry<K,V> e = table[i]; e != null; e = e.next) {
	Object k;
	// 判断哈希和 key 是否一样
	if (e.hash == hash && ((k = e.key) == key \|\| key.equals(k))) { // 一样
	// 哈希一样，key 也一样
	V oldValue = e.value;
	e.value = value;
	e.recordAccess(this);
	return oldValue;
	}
	}
	// i 位置数据为空；或者数据不为空，hash 不一样；或者哈希一样，key 不一样
	modCount++;
	// 添加
	addEntry(hash, key, value, i);
	return null;
	}

	void createEntry(int hash, K key, V value, int bucketIndex) {
	// 获取当前位置的数据 e，有可能是 null
	Entry<K,V> e = table[bucketIndex];
	// 当前位置保存新的数据，历史数据 e 为新数据的链表相联的数据
	table[bucketIndex] = new Entry<>(hash, key, value, e);
	size++;
	}

	static int indexFor(int h, int length) {// assert Integer.bitCount(length) == 1 : "length must be a non-zero power of 2";
	return h & (length-1);
	}

Just My Socks（注册教程 内含优惠码）

Just My Socks（注册教程内含优惠码）