关于java:JDK17-HashMap解析

6次阅读

共计 6150 个字符,预计需要花费 16 分钟才能阅读完成。

数据结构

JDK1.7 的 HashMap 采纳数组 + 单链表的数据结构,数组和链表存储的是一个个 Entry 对象

    static class Entry<K,V> implements Map.Entry<K,V> {
        final K key;
        V value;
        Entry<K,V> next;
        int hash;
}

罕用办法

V get(Object key); // 取得指定 key 的值
V put(K key, V value);  // 增加 key-value 对
void putAll(Map<? extends K, ? extends V> m);  // 将指定 Map 中的 key-value 对复制到此 Map 中
V remove(Object key);  // 删除该 key-value

boolean containsKey(Object key); // 判断是否存在该 key 的 key-value 对;是则返回 true
boolean containsValue(Object value);  // 判断是否存在该 value 的 key-value 对;是则返回 true
 
Set<K> keySet();  // 独自抽取 key 序列,将所有 key 生成一个 Set
Collection<V> values();  // 独自 value 序列,将所有 value 生成一个 Collection

void clear(); // 革除 HashMap 中的所有 key-value 对
int size();  // 返回 HashMap 中所有 key-value 对的数量
boolean isEmpty(); // 判断 HashMap 是否为空,size == 0 时示意为空 

应用

public class HashMapTest {public static void main(String[] args) {
      /**
        * 1. 申明 1 个 HashMap 的对象
        */
        Map<String, Integer> map = new HashMap<String, Integer>();

      /**
        * 2. 向 HashMap 增加数据(放入键 - 值对)*/
        map.put("Java", 1);
        map.put("HashMap", 2);
        map.put("List",3);
        map.put("set",4);

       /**
        * 3. 获取 HashMap 的某个数据
        */
        System.out.println(""+ map.get("HashMap"));

      /**
        * 4. 遍历 HashMap 共有 3 种办法:别离针对 Entry 或 key 或 value
        * 步骤 1:取得 Entry 或 key 或 value 的汇合
        * 步骤 2:遍历,应用 for 循环或迭代器 Iterator
        */

        // 办法 1:取得 Entry 的 Set 汇合再遍历
        // 取得 Entry 的 Set 汇合
        Set<Map.Entry<String, Integer>> entrySet = map.entrySet();
        // 通过 for 循环遍历
        for(Map.Entry<String, Integer> entry : entrySet){System.out.print(entry.getKey());
            System.out.println(entry.getValue());
        }
        // 通过迭代器遍历
        // 先取得 Entry 的 Iterator,再循环遍历
        Iterator iter1 = entrySet.iterator();
        while (iter1.hasNext()) {
            // 遍历时,需先获取 entry,再别离获取 key、value
            Map.Entry entry = (Map.Entry) iter1.next();
            System.out.print((String) entry.getKey());
            System.out.println((Integer) entry.getValue());
        }


        // 办法 2:取得 key 的 Set 汇合再遍历
        Set<String> keySet = map.keySet();
        // 通过 for 循环
        for(String key : keySet){System.out.print(key);
            System.out.println(map.get(key));
        }
        // 通过迭代器遍历
        // 先取得 key 的 Iterator,再循环遍历
        Iterator iter2 = keySet.iterator();
        String key = null;
        while (iter2.hasNext()) {
            // 遍历时,需先获取 key,再获取 value
            key = (String)iter2.next();
            System.out.print(key);
            System.out.println(map.get(key));
        }


        // 办法 3:取得 value 的汇合再遍历
        Collection valueSet = map.values();
        // 取得 values 的 Iterator,再循环遍历
        Iterator iter3 = valueSet.iterator();
        while (iter3.hasNext()) {System.out.println(iter3.next());
        }

    }
}

对于遍历形式,举荐应用针对 key-value 对(Entry)的形式:效率高

  1. 对于遍历 keySet,valueSet,本质上遍历了 2 次:
    第 1 次,for/iterator 迭代器遍历;
    第 2 次 从 HashMap 中取出 key 的 value 操作
  2. 对于遍历 entrySet,本质遍历了 1 次 for/iterator 迭代器遍历,Entry 曾经存储了 key 和 value

源码剖析

次要属性

// 默认容量
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4;
// 最大容量
static final int MAXIMUM_CAPACITY = 1 << 30;
// 加载因子
static final float DEFAULT_LOAD_FACTOR = 0.75f;
// 扩容阈值 = 容量 x 加载因子,当哈希表的大小 ≥ 扩容阈值时,就会扩容哈希表
int threshold
// 存储数据的 Entry 类型数组,长度 = 2 的幂
transient Entry<K,V>[] table = (Entry<K,V>[]) EMPTY_TABLE
//HashMap 中存储的键值对的数量
transient int size

构造方法

 // 加载因子,容量可指定
 public HashMap(int initialCapacity, float loadFactor) {if (initialCapacity < 0)
            throw new IllegalArgumentException("Illegal initial capacity:" +
                                               initialCapacity);
        if (initialCapacity > MAXIMUM_CAPACITY)
            initialCapacity = MAXIMUM_CAPACITY;
        if (loadFactor <= 0 || Float.isNaN(loadFactor))
            throw new IllegalArgumentException("Illegal load factor:" +
                                               loadFactor);

        this.loadFactor = loadFactor;
        threshold = initialCapacity;
        init();}

     // 加载因子等于默认值,容量可指定   
    public HashMap(int initialCapacity) {this(initialCapacity, DEFAULT_LOAD_FACTOR);
    }

    // 默认构造函数,加载因子,容量等于默认值
    public HashMap() {this(DEFAULT_INITIAL_CAPACITY, DEFAULT_LOAD_FACTOR);
    }
  
    // 可传入一个 map 的构造函数
    public HashMap(Map<? extends K, ? extends V> m) {this(Math.max((int) (m.size() / DEFAULT_LOAD_FACTOR) + 1,
                      DEFAULT_INITIAL_CAPACITY), DEFAULT_LOAD_FACTOR);
        inflateTable(threshold);

        putAllForCreate(m);
    }

put()办法

    public V put(K key, V value) {
        //1. 若 entry 数组为空,则初始化数组
        if (table == EMPTY_TABLE) {inflateTable(threshold);
        }
        //2. 若 key == null,则将该键 - 值 寄存到 entry 数组中的第 1 个地位,即 table[0]
        if (key == null)
            return putForNullKey(value);
        //3. 若 key ≠ null,则计算寄存 entry 数组中的地位
        //3.1 依据键值 key 计算 hash 值
        int hash = hash(key);
        //3.2 依据 hash 值 最终取得 key 对应寄存的 entry 数组中地位
        int i = indexFor(hash, table.length);
        
        4. 通过遍历以该数组元素为头结点的链表, 判断该 key 值是否已存在
        for (Entry<K,V> e = table[i]; e != null; e = e.next) {
            Object k;
            4.1 若该 key 已存在,则用新 value 替换旧 value
            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
                V oldValue = e.value;
                e.value = value;
                e.recordAccess(this);
                return oldValue;
            }
        }

        modCount++;
        //4.2 若该 key 不存在,则将 key-value 增加到 entry 数组中, 这里采纳头插法
        addEntry(hash, key, value, i);
        return null;
    }

addEntry resize() transfer()

    void addEntry(int hash, K key, V value, int bucketIndex) {// 若不足够,则进行扩容(2 倍), 从新计算 Hash 值、从新计算 key 在扩容后的 entry 数组下标 
        if ((size >= threshold) && (null != table[bucketIndex])) {resize(2 * table.length);
            hash = (null != key) ? hash(key) : 0;
            bucketIndex = indexFor(hash, table.length);
        }
        // 若容量足够,则创立 1 个新的数组元素 Entry 并放入到 entry 数组中
        createEntry(hash, key, value, bucketIndex);
    }
    
        void resize(int newCapacity) {Entry[] oldTable = table;
        int oldCapacity = oldTable.length;
        if (oldCapacity == MAXIMUM_CAPACITY) {
            threshold = Integer.MAX_VALUE;
            return;
        }
        
        // 依据新容量(2 倍容量)新建 1 个 entry 数组,newtable 
        Entry[] newTable = new Entry[newCapacity];
        // 将旧 entry 数组上的 entry 数据转移到 newtable 中,从而实现扩容
        transfer(newTable, initHashSeedAsNeeded(newCapacity));
        // 新数组 table 援用到 HashMap 的 table 属性上
        table = newTable;
        threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);
    }
    
        // 旧 entry 数组上的 entry 数据转移到 newtable 中,从而实现扩容,按旧链表的正序遍历链表,在新链表的头部顺次插入,// 即扩容前 = 1->2->3,扩容后 = 3->2->1,此时若(多线程)并发执行 `put()操作,一旦呈现扩容状况,则容易呈现环形链表,从而在获取数据、遍历链表时造成死循环 Infinite Loop
        void transfer(Entry[] newTable, boolean rehash) {
        int newCapacity = newTable.length;
        for (Entry<K,V> e : table) {while(null != e) {
                Entry<K,V> next = e.next;
                if (rehash) {e.hash = null == e.key ? 0 : hash(e.key);
                }
                int i = indexFor(e.hash, newCapacity);
                e.next = newTable[i];
                newTable[i] = e;
                e = next;
            }
        }
    }

get()办法

    public V get(Object key) {// 当 key == null 时,则到以 entry 数组中的第 1 个元素(即 table[0])为头结点的链表去寻找对应 key == null 的键
        if (key == null)
            return getForNullKey();
        // 当 key ≠ null 时,去取得对应值    
        Entry<K,V> entry = getEntry(key);

        return null == entry ? null : entry.getValue();}
   
   
    final Entry<K,V> getEntry(Object key) {if (size == 0) {return null;}

        // 1. 依据 key 值,通过 hash()计算出对应的 hash 值
        // 2. 依据 hash 值计算出对应的数组下标
        // 3. 遍历以该数组下标的数组元素为头结点的链表所有节点,寻找该 key 对应的值
        int hash = (key == null) ? 0 : hash(key);
        for (Entry<K,V> e = table[indexFor(hash, table.length)];
             e != null;
             e = e.next) {
            Object k;
            if (e.hash == hash &&
                ((k = e.key) == key || (key != null && key.equals(k))))
                return e;
        }
        return null;
    }

源码总结

1.JDK1.7 的 HashMap 采纳数组 + 单链表的数据结构,数组和链表存储的是一个个 Entry 对象
2. 增加 key-value 时会依据 key 值计算出对应的 hash 值,再依据 hash 值计算出对应的数组下标,遍历这个数组中的 Entry 链表,如果存在有雷同的 key 的 Entry, 用新的 value 值替换旧的 value 值,若不存在则用头插法退出到链表中。
3. 在增加 key-value 到数组中时有扩容的判断,但 hashmap 中 Entry 的数量,或者说 key-value 的数量大于扩容阈值 = 以后容量 x 加载因子,新建一个数组,容量时是数组的 2 倍,将旧 entry 数组上的 entry 数据转移到 newtable 中,让以后的数组指向新数组,从而实现扩容。
4. 线程不平安问题:
在扩容过程中,在将旧数组上的数据转移到新数组上时,按旧链表的正序遍历链表,在新链表的采纳头插法插入,即扩容前 = 1->2->3,扩容后 = 3->2->1,此时若(多线程)并发执行 `put()操作,一旦呈现扩容状况,则容易呈现环形链表,从而在 get()办法获取数据、遍历链表时造成死循环 Infinite Loop

正文完
 0