乐趣区

关于java:面试官并发下的-HashMap-为什么会引起死循环

明天研读 Java 并发容器和框架时,看到为什么要应用 ConcurrentHashMap 时,其中有一个起因是:线程不平安的 HashMap, HashMap 在并发执行 put 操作时会引起死循环,是因为多线程会导致 HashMap 的 Entry 链表造成环形数据结构,查找时会陷入死循环。纠起起因看了其余的博客,都比拟形象,所以这里以图形的形式展现一下,心愿反对!

(1)当往 HashMap 中增加元素时,会引起 HashMap 容器的扩容,原理不再解释,间接附源代码,如下:

/** 
    * 
    * 往表中增加元素,如果插入元素之后,表长度不够,便会调用 resize 办法扩容 
    */  
   void addEntry(int hash, K key, V value, int bucketIndex) {Entry<K,V> e = table[bucketIndex];  
       table[bucketIndex] = new Entry<K,V>(hash, key, value, e);  
       if (size++ >= threshold)  
           resize(2 * table.length);  
   }  
  
   /** 
    * resize() 办法如下,重要的是 transfer 办法,把旧表中的元素增加到新表中
    */  
   void resize(int newCapacity) {Entry[] oldTable = table;  
       int oldCapacity = oldTable.length;  
       if (oldCapacity == MAXIMUM_CAPACITY) {  
           threshold = Integer.MAX_VALUE;  
           return;  
       }  
  
       Entry[] newTable = new Entry[newCapacity];  
       transfer(newTable);  
       table = newTable;  
       threshold = (int)(newCapacity * loadFactor);  
   }  

(2)参考下面的代码,便引入到了 transfer 办法,(引入重点)这就是 HashMap 并发时,会引起死循环的根本原因所在,上面联合 transfer 的源代码,阐明一下产生死循环的原理,先列 transfer 代码(这是里 JDK7 的源偌),如下:

   /**
     * Transfers all entries from current table to newTable.
     */
    void transfer(Entry[] newTable, boolean rehash) {
        int newCapacity = newTable.length;
        for (Entry<K,V> e : table) {while(null != e) {Entry<K,V> next = e.next;            ---------------------(1)
                if (rehash) {e.hash = null == e.key ? 0 : hash(e.key);
                }
                int i = indexFor(e.hash, newCapacity); 
                e.next = newTable[i];
                newTable[i] = e;
                e = next;
            } // while
 
        }
    }

(3)假如:

Map<Integer> map = new HashMap<Integer>(2);  // 只能搁置两个元素,其中的 threshold 为 1(表中只填充一个元素时),即插入元素为 1 时就扩容(由 addEntry 办法中得悉)// 搁置 2 个元素 3 和 7,若要再搁置元素 8(经 hash 映射后不等于 1)时,会引起扩容 

假如搁置后果图如下:

当初有两个线程 A 和 B,都要执行 put 操作,即向表中增加元素,即线程 A 和线程 B 都会看到下面图的状态快照

执行程序如下:

执行一:线程 A 执行到 transfer 函数中(1)处挂起(transfer 函数代码中有标注)。此时在线程 A 的栈中

e = 3
next = 7

执行二:线程 B 执行 transfer 函数中的 while 循环,即会把原来的 table 变成新一 table(线程 B 本人的栈中),再写入到内存中。如下图(假如两个元素在新的 hash 函数下也会映射到同一个地位)

执行三:线程 A 解挂,接着执行(看到的仍是旧表),即从 transfer 代码(1)处接着执行,以后的 e = 3, next = 7, 下面曾经形容。

1. 解决元素 3,将 3 放入 线程 A 本人栈的新 table 中(新 table 是处于线程 A 本人栈中,是线程公有的,不肥线程 2 的影响),解决 3 后的图如下:

2. 线程 A 再复制元素 7,以后 e = 7 , 而 next 值因为线程 B 批改了它的援用,所以 next 为 3,解决后的新表如下图

3. 因为下面取到的 next = 3, 接着 while 循环,即以后解决的结点为 3,next 就为 null,退出 while 循环,执行完 while 循环后,新表中的内容如下图:

4. 当操作实现,执行查找时,会陷入死循环!

退出移动版