关于hashmap:Java集合什么是Map

Map 用于保留具备映射关系的数据，Map 汇合里保留着两组值，一组用于保留 Map 的 Key，另一组保留着 Map 的 value。

Map 有哪些办法

HashMap 是一个采纳 哈希表 实现的键值对汇合，继承自 AbstractMap，实现了 Map 接口。

HashMap 的非凡存储构造使得在获取指定元素前须要通过哈希运算，失去指标元素在哈希表中的地位，而后再进行大量比拟即可失去元素，这使得 HashMap 的查找效率高。

当产生哈希抵触（碰撞）的时候，HashMap 采纳 拉链法 进行解决, 因而 HashMap 的底层实现是 数组 + 链表，如下图：

容许 key/value 为 null，然而 key 只能有一个 null
非线程平安，多个线程同时操作同一个 HashMap 实例所做的批改在线程间不同步
遍历时不保障任何程序，跟元素插入程序或者拜访程序无关
进行遍历时如果执行 HashMap 的 remove(Object key)或者 put(Object value)办法时会疾速失败，抛出异样 ConcurrentModificationException。遍历时删除元素只能通过 Iterator 自身的 remove()办法实现

HashMap 中有两个重要概念

因为 HashMap 扩容开销很大（须要创立新数组、从新哈希、调配等等），因而产生扩容相干的两个因素：

容量（capacity）HashMap 以后长度
负载因子（load factor）负载因子，默认值 0.75f

不利因素：容量太小扩容 rehash，导致性能升高，加载因子太大则会发生冲突，查找的效率变低.

容量即该 HashMap 可能存储的最大的 key 个数，为便于扩容，容量都是 2^n 次方。负载因子用于计算执行扩容的阈值，默认的负载因子是 0.75，该值是综合思考 HashMap 的 get/put 等多种操作时的工夫空间上的均衡，举荐应用默认值即可。如果容量时 256，负载因子是 0.75 时，当 key 的总量超过 192 个时会进行扩容，即容量变成原来的两倍 512，原有的存储的 key 会从新通过 hash 运算重新分配。

常量

// 如果不指定初值的话，列表的长度就为 16，默认加载因子为 0.75，static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16

static final int MAXIMUM_CAPACITY = 1 << 30;

static final float DEFAULT_LOAD_FACTOR = 0.75f;

static final int TREEIFY_THRESHOLD = 8;

static final int UNTREEIFY_THRESHOLD = 6;

static final int MIN_TREEIFY_CAPACITY = 64;

成员变量

// node 列表
transient Node<K,V>[] table;

// 缓存节点
transient Set<Map.Entry<K,V>> entrySet;

// 节点数量
transient int size;

// 批改的次数
transient int modCount;

// 极限值，如果节点数大于这个值就须要扩容，计算形式是 capacity * loadfactor
int threshold;

// 加载因子，节点数值大于以后总数的肯定百分比时扩容
final float loadFactor;

HashMap 的实现形式

/* ---------------- Public operations -------------- */

/**
 * Constructs an empty <tt>HashMap</tt> with the specified initial
 * capacity and load factor.
 *
 * @param  initialCapacity the initial capacity
 * @param  loadFactor      the load factor
 * @throws IllegalArgumentException if the initial capacity is negative
 *         or the load factor is nonpositive
 */
public HashMap(int initialCapacity, float loadFactor) {if (initialCapacity < 0)
        throw new IllegalArgumentException("Illegal initial capacity:" +
                                           initialCapacity);
    if (initialCapacity > MAXIMUM_CAPACITY)
        initialCapacity = MAXIMUM_CAPACITY;
    if (loadFactor <= 0 || Float.isNaN(loadFactor))
        throw new IllegalArgumentException("Illegal load factor:" +
                                           loadFactor);
    this.loadFactor = loadFactor;
    this.threshold = tableSizeFor(initialCapacity);
}

/**
 * Constructs an empty <tt>HashMap</tt> with the specified initial
 * capacity and the default load factor (0.75).
 *
 * @param  initialCapacity the initial capacity.
 * @throws IllegalArgumentException if the initial capacity is negative.
 */
public HashMap(int initialCapacity) {this(initialCapacity, DEFAULT_LOAD_FACTOR);
}

/**
 * Constructs an empty <tt>HashMap</tt> with the default initial capacity
 * (16) and the default load factor (0.75).
 */
public HashMap() {this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted}

public HashMap(Map<? extends K, ? extends V> m) {
    this.loadFactor = DEFAULT_LOAD_FACTOR;
    putMapEntries(m, false);
}
// Map 中生成一个新的 Map，属于深拷贝
final void putMapEntries(Map<? extends K, ? extends V> m, boolean evict) {int s = m.size();
    if (s > 0) {if (table == null) { // pre-size
            float ft = ((float)s / loadFactor) + 1.0F;
            int t = ((ft < (float)MAXIMUM_CAPACITY) ?
                     (int)ft : MAXIMUM_CAPACITY);
            if (t > threshold)
                threshold = tableSizeFor(t);
        }
        else if (s > threshold)
            resize();
        for (Map.Entry<? extends K, ? extends V> e : m.entrySet()) {K key = e.getKey();
            V value = e.getValue();
            putVal(hash(key), key, value, false, evict);
        }
    }
}

get 办法

public V get(Object key) {
    Node<K,V> e;
    return (e = getNode(hash(key), key)) == null ? null : e.value;
}

/**
 * Implements Map.get and related methods.
 *
 * @param hash hash for key
 * @param key the key
 * @return the node, or null if none
 */
final Node<K,V> getNode(int hash, Object key) {Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
    // 列表是否为空
    if ((tab = table) != null && (n = tab.length) > 0 &&
        (first = tab[(n - 1) & hash]) != null) {
        // 第一个是否要找的，判断条件统一且 key 统一
        if (first.hash == hash && // always check first node
            ((k = first.key) == key || (key != null && key.equals(k))))
            return first;
        if ((e = first.next) != null) {if (first instanceof TreeNode)
                return ((TreeNode<K,V>)first).getTreeNode(hash, key);
            // 依据哈希抵触解决办法，每个数据项都是一个链表，须要遍历这个链表去找到咱们须要的 key 那项
            do {
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    return e;
            } while ((e = e.next) != null);
        }
    }
    return null;
}

put 办法

put 操作时，HashMap 会先进行初始化，如果没有先进行初始化操作，初始化过程会取比用户指定容量大的最近 2 的幂次数作为数组的初始容量，如果设置扩容的阀值也进行更新，初始化实现当前持续 put 办法。

先判断有没有初始化

在判断传入的 key 是否为空就存储在 table(0)地位

key 不为空就对 key 进行 hash，hash 的后果在 & 上数组的长度就失去了地位。

如果存储地位为空就创立新节点，不为空就说存在 hash 抵触了。

解决抵触 HashMap 会遍历整个链表，如果有雷同的 value 值就更新，否则创立节点增加到链表头。

增加还要判断存储节点是否达到阈值，达到阈值要进行扩容。

扩容两倍，扩容的时候应用 Arrays.copy() 进行扩容。

扩容过后新插入的节点也要从新进行 hash 一遍能力插入。

/**
 * Implements Map.put and related methods.
 *
 * @param hash hash for key
 * @param key the key
 * @param value the value to put
 * @param onlyIfAbsent if true, don't change existing value
 * @param evict if false, the table is in creation mode.
 * @return previous value, or null if none
 */
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
               boolean evict) {Node<K,V>[] tab; Node<K,V> p; int n, i;
    // 首先还是先查看列表是否为空，为空的话就调用 reszie()
    if ((tab = table) == null || (n = tab.length) == 0)
        n = (tab = resize()).length;
    // 依据哈希办法找到列表中的地位，看看是否为空，为空就新建
    if ((p = tab[i = (n - 1) & hash]) == null)
        tab[i] = newNode(hash, key, value, null);
    else {
        Node<K,V> e; K k;
        // 如果曾经存在，查看是不是和 key 统一，如果统一把 value 替换
        if (p.hash == hash &&
            ((k = p.key) == key || (key != null && key.equals(k))))
            e = p;
        else if (p instanceof TreeNode)
            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
        else {for (int binCount = 0; ; ++binCount) {
                // 再找链表里有没有数据项和 key 统一，不统一的话就找到链表的尾部
                if ((e = p.next) == null) {
                    // 在尾部插入一个新的数据项
                    p.next = newNode(hash, key, value, null);
                    if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                        treeifyBin(tab, hash);
                    break;
                }
                // 统一先让 p 和 e 指向同一个数据项
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    break;
                p = e;
            }
        }
        // 查看 e 是否为空，不为空示意 key 所对应的数据项曾经存在了
        if (e != null) { // existing mapping for key
            V oldValue = e.value;
          // 这时候就须要判断下 onlyIfAbsent 开关，如果为 true 示意不须要更新已有数据项的值了，false 才更新
            if (!onlyIfAbsent || oldValue == null)
                e.value = value;
            afterNodeAccess(e);
            return oldValue;
        }
    }
    ++modCount;
    if (++size > threshold)
        resize();
    afterNodeInsertion(evict);
    return null;
}

如何计算失去 hash code

^ 和 >>> 这个两个运算符号
^ 这个符号叫做异或运算符，两个操作数的位中，雷同则后果为 0，不同则后果为 1
比方 2^5=7 因为 0010^0101=0111

static final int hash(Object key) {
    int h;
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

modCount 的作用

能够看到 modeCount 在 put，get，remove 这些值中被批改。而后在 AbstractSet 的几个子类 KeySet 和 Values 中的 foreach 中被用来比拟。
在循环之前先记录 modCount 的值，如果循环完结之后这个值被扭转了阐明 HashMap 内部结构产生了变动，线程不平安了，就抛出异样，实现“fast-fail”机制。

public final void forEach(Consumer<? super V> action) {Node<K,V>[] tab;
    if (action == null)
        throw new NullPointerException();
    if (size > 0 && (tab = table) != null) {
        int mc = modCount;
        for (int i = 0; i < tab.length; ++i) {for (Node<K,V> e = tab[i]; e != null; e = e.next)
                action.accept(e.value);
        }
        if (modCount != mc)
            throw new ConcurrentModificationException();}
}

hashMap 的 1.7 和 1.8 的区别？

Hash1.7 和 1.8 最大的不同在于 1.8 采纳了“数组 + 链表 + 红黑树”的数据结构，在链表长度超过 8 时，把链表转化成红黑树来解决 HashMap 因链表变长而查问变慢的问题。
1.7 的底层节点为 Entry，1.8 为 node，然而实质一样，都是 Map.Entry 的实现。
还有就是在存取数据时增加了对于树结构的遍历更新与增加操作，并采纳了尾插法来防止环形链表的产生。

HashMap 扭转头插法扭转尾插法的起因是什么？

java8 之前是头插法，就是说新来的值会取代原有的值，原有的值就顺推到链表中去，代码的作者认为起初的值被查找的可能性更大一点，晋升查找的效率。

HashMap 的扩容机制有哪些呢？

HashMap 的扩容机制，数组容量是无限的，数据屡次插入的，达到肯定数量就行扩容，也就是 resize。
举个栗子: 容量 100 的时，当要存第 76 的时候，就会判断须要进行 resize，进行扩容。

/**
 * The load factor used when none specified in constructor.
 */
static final float DEFAULT_LOAD_FACTOR = 0.75f;

HashMap 的扩容的条件是什么呢？

扩容：创立一个新的 Entry 空数组，长度是原数组的 2 倍。
ReHash：遍历原 Entry 数组，把所有的 Entry 从新 Hash 到新数组。

为什么要从新计算 Hash 呢，间接复制用不香么？

Hash 的公式 —> index = HashCode（Key）&（Length – 1）

原来长度（Length）是 8 你位运算进去的值是 2，新的长度是 16 你位运算进去的值显著不一样了

咱们当初往一个容量大小为 2 的 put 两个值，负载因子是 0.75 是不是咱们在 put 第二个的时候就会进行 resize？

2*0.75 = 1 所以插入第二个就要 resize 了

因为 resize 的赋值形式，也就是应用了 单链表的头插入方式，同一地位上新元素总会被放在链表的头部地位，在旧数组中同一条 Entry 链上的元素，通过从新计算索引地位后，有可能被放到了新数组的不同地位上。

如果这个时候去取值，呈现了“Infinite Loop”。

应用头插 会扭转链表的上的程序，然而如果 应用尾插，在扩容时会放弃链表元素本来的程序，就不会呈现链表成环的问题了。

就是说本来是 A ->B，在扩容后那个链表还是 A ->B

Java7 在多线程操作 HashMap 时可能引起死循环，起因是扩容转移后前后链表程序倒置，在转移过程中批改了原来链表中节点的援用关系。

Java8 在同样的前提下并不会引起死循环，起因是扩容转移后前后链表程序不变，放弃之前节点的援用关系。

源码看到 put/get 办法都没有加同步锁，多线程状况最容易呈现的就是：无奈保障上一秒 put 的值，下一秒 get 的时候还是原值，所以线程平安还是无奈保障。

HashMap 初始值为什么是 16？

位与运算比算数计算的效率高了很多，设置初始值 16，是为了服务将 Key 映射到 index 的算法。
因为在应用不是 2 的幂的数字的时候，Length- 1 的值是所有二进制位全为 1，这种状况下，index 的后果等同于 HashCode 后几位的值。只有输出的 HashCode 自身散布平均，Hash 算法的后果就是平均的。
这是为了 实现均匀分布。

/**
 * The default initial capacity - MUST be a power of two.
 */
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16

能用 HashMap 给我举个例子么？

java 中，所有的对象都是继承于 Object 类。Ojbect 类中有两个办法 equals，hashCode 这两个办法都是用来比拟两个对象是否相等的。
在未重写 equals 办法咱们是继承了 object 的 equals 办法，那里的 equals 是比拟两个对象的内存地址，显然咱们 new 了 2 个对象内存地址必定不一样

对于值对象，== 比拟的是两个对象的值
对于援用对象，比拟的是两个对象的地址

HashMap 是线程不平安的，其次要体现？

在 jdk1.7 中，在多线程环境下，扩容时会造成环形链或数据失落。
在 jdk1.8 中，在多线程环境下，会产生数据笼罩的状况。

HashMap 常见面试题

HashMap 的底层数据结构？
HashMap 的存取原理？
Java7 和 Java8 的区别？
为啥会线程不平安？
有什么线程平安的类代替么?
默认初始化大小是多少？为啥是这么多？为啥大小都是 2 的幂？
HashMap 的扩容形式？负载因子是多少？为什是这么多？
HashMap 的主要参数都有哪些？
HashMap 是怎么解决 hash 碰撞的？
hash 的计算规定？

实现线程平安须要用 ConcurrentHashMap
https://www.jianshu.com/p/e69…