关于java:HashMap面试题

A：哈希表构造（链表散列：数组 + 链表）实现，联合数组和链表的长处。当链表长度超过 8 时，链表转换为红黑树。

transient Node<K,V>[] table;

HashMap 底层是 hash 数组和单向链表实现，数组中的每个元素都是链表，由 Node 外部类（实现 Map.Entry 接口）实现，HashMap 通过 put & get 办法存储和获取。

存储对象时，将 K/V 键值传给 put() 办法：

①、调用 hash(K) 办法计算 K 的 hash 值，而后联合数组长度，计算得数组下标；

②、调整数组大小（当容器中的元素个数大于 capacity * loadfactor 时，容器会进行扩容 resize 为 2n）；

③、i. 如果 K 的 hash 值在 HashMap 中不存在，则执行插入，若存在，则产生碰撞；

ii. 如果 K 的 hash 值在 HashMap 中存在，且它们两者 equals 返回 true，则更新键值对；

iii. 如果 K 的 hash 值在 HashMap 中存在，且它们两者 equals 返回 false，则插入链表的尾部（尾插法）或者红黑树中（树的增加形式）。

（JDK 1.7 之前应用头插法、JDK 1.8 应用尾插法）（留神：当碰撞导致链表大于 TREEIFY_THRESHOLD = 8 时，就把链表转换成红黑树）

获取对象时，将 K 传给 get() 办法：①、调用 hash(K) 办法（计算 K 的 hash 值）从而获取该键值所在链表的数组下标；②、程序遍历链表，equals()办法查找雷同 Node 链表中 K 值对应的 V 值。

hashCode 是定位的，存储地位；equals 是定性的，比拟两者是否相等。

因为 hashCode 雷同，不肯定就是相等的（equals 办法比拟），所以两个对象所在数组的下标雷同，” 碰撞 ” 就此产生。又因为 HashMap 应用链表存储对象，这个 Node 会存储到链表中。为什么要重写 hashcode 和 equals 办法？举荐看下。

JDK 1.8 中，是通过 hashCode() 的高 16 位异或低 16 位实现的：(h = k.hashCode()) ^ (h >>> 16)，次要是从速度，效用和品质来思考的，缩小零碎的开销，也不会造成因为高位没有参加下标的计算，从而引起的碰撞。

保障了对象的 hashCode 的 32 位值只有有一位产生扭转，整个 hash() 返回值就会扭转。尽可能的缩小碰撞。

①、table 数组大小是由 capacity 这个参数确定的，默认是 16，也能够结构时传入，最大限度是 1 <<30；

②、loadFactor 是装载因子，次要目标是用来确认 table 数组是否须要动静扩大，默认值是 0.75，比方 table 数组大小为 16，装载因子为 0.75 时，threshold 就是 12，当 table 的理论大小超过 12 时，table 就须要动静扩容；

③、扩容时，调用 resize() 办法，将 table 长度变为原来的两倍（留神是 table 长度，而不是 threshold）

④、如果数据很大的状况下，扩大时将会带来性能的损失，在性能要求很高的中央，这种损失很可能很致命。

答：“调用哈希函数获取 Key 对应的 hash 值，再计算其数组下标；

如果没有呈现哈希抵触，则间接放入数组；如果呈现哈希抵触，则以链表的形式放在链表前面；

如果链表长度超过阀值(TREEIFY THRESHOLD==8)，就把链表转成红黑树，链表长度低于 6，就把红黑树转回链表;

如果结点的 key 曾经存在，则替换其 value 即可；

如果汇合中的键值对大于 12，调用 resize 办法进行数组扩容。”

创立一个新的数组，其容量为旧数组的两倍，并从新计算旧数组中结点的存储地位。结点在新数组中的地位只有两种，原下标地位或原下标 + 旧数组的大小。

之所以抉择红黑树是为了解决二叉查找树的缺点，二叉查找树在非凡状况下会变成一条线性构造（这就跟原来应用链表构造一样了，造成很深的问题），遍历查找会十分慢。举荐：面试问红黑树，我脸都绿了。

而红黑树在插入新数据后可能须要通过左旋，右旋、变色这些操作来保持平衡，引入红黑树就是为了查找数据快，解决链表查问深度的问题，咱们晓得红黑树属于均衡二叉树，然而为了放弃“均衡”是须要付出代价的，然而该代价所损耗的资源要比遍历线性链表要少，所以当长度大于 8 的时候，会应用红黑树，如果链表长度很短的话，基本不须要引入红黑树，引入反而会慢。

每个节点非红即黑
根节点总是彩色的
如果节点是红色的，则它的子节点必须是彩色的（反之不肯定）
每个叶子节点都是彩色的空节点（NIL 节点）
从根节点到叶节点或空子节点的每条门路，必须蕴含雷同数目的彩色节点（即雷同的彩色高度）

在 java 1.8 中，如果链表的长度超过了 8，那么链表将转换为红黑树。（桶的数量必须大于 64，小于 64 的时候只会扩容）

产生 hash 碰撞时，java 1.7 会在链表的头部插入，而 java 1.8 会在链表的尾部插入

在 java 1.8 中，Entry 被 Node 代替(换了一个马甲。

HashMap 参考其余问题；

LinkedHashMap 保留了记录的插入程序，在用 Iterator 遍历时，先取到的记录必定是先插入的；遍历比 HashMap 慢；

TreeMap 实现 SortMap 接口，可能把它保留的记录依据键排序（默认按键值升序排序，也能够指定排序的比拟器）

个别状况下，应用最多的是 HashMap。

HashMap：在 Map 中插入、删除和定位元素时；

TreeMap：在须要按天然程序或自定义程序遍历键的状况下；

LinkedHashMap：在须要输入的程序和输出的程序雷同的状况下。

①、HashMap 是线程不平安的，HashTable 是线程平安的；

②、因为线程平安，所以 HashTable 的效率比不上 HashMap；

③、HashMap 最多只容许一条记录的键为 null，容许多条记录的值为 null，而 HashTable 不容许；

④、HashMap 默认初始化数组的大小为 16，HashTable 为 11，前者扩容时，扩充两倍，后者扩充两倍 +1；

⑤、HashMap 须要从新计算 hash 值，而 HashTable 间接应用对象的 hashCode

ConcurrentHashMap 类（是 Java 并发包 java.util.concurrent 中提供的一个线程平安且高效的 HashMap 实现）。

HashTable 是应用 synchronize 关键字加锁的原理（就是对对象加锁）；

而针对 ConcurrentHashMap，在 JDK 1.7 中采纳分段锁的形式；JDK 1.8 中间接采纳了 CAS（无锁算法）+ synchronized。

除了加锁，原理上无太大区别。另外，HashMap 的键值对容许有 null，然而 ConCurrentHashMap 都不容许。

HashTable 应用一把锁（锁住整个链表构造）解决并发问题，多个线程竞争一把锁，容易阻塞；

ConcurrentHashMap

JDK 1.7 中应用分段锁（ReentrantLock + Segment + HashEntry），相当于把一个 HashMap 分成多个段，每段调配一把锁，这样反对多线程拜访。锁粒度：基于 Segment，蕴含多个 HashEntry。
JDK 1.8 中应用 CAS + synchronized + Node + 红黑树。锁粒度：Node（首结
点）（实现 Map.Entry）。锁粒度升高了。

JDK 1.7 中，采纳分段锁的机制，实现并发的更新操作，底层采纳数组 + 链表的存储构造，包含两个外围动态外部类 Segment 和 HashEntry。

①、Segment 继承 ReentrantLock（重入锁）用来充当锁的角色，每个 Segment 对象守护每个散列映射表的若干个桶；

②、HashEntry 用来封装映射表的键 - 值对；

③、每个桶是由若干个 HashEntry 对象链接起来的链表

JDK 1.8 中，采纳 Node + CAS + Synchronized 来保障并发平安。勾销类 Segment，间接用 table 数组存储键值对；当 HashEntry 对象组成的链表长度超过 TREEIFY_THRESHOLD 时，链表转换为红黑树，晋升性能。底层变更为数组 + 链表 + 红黑树。

①、粒度升高了；

②、JVM 开发团队没有放弃 synchronized，而且基于 JVM 的 synchronized 优化空间更大，更加天然。

③、在大量的数据操作下，对于 JVM 的内存压力，基于 API 的 ReentrantLock 会开销更多的内存。

①、重要的常量：

private transient volatile int sizeCtl;

当为正数时，-1 示意正在初始化，-N 示意 N – 1 个线程正在进行扩容；

当为 0 时，示意 table 还没有初始化；

当为其余负数时，示意初始化或者下一次进行扩容的大小。

②、数据结构：

Node 是存储构造的根本单元，继承 HashMap 中的 Entry，用于存储数据；

TreeNode 继承 Node，然而数据结构换成了二叉树构造，是红黑树的存储构造，用于红黑树中存储数据；

TreeBin 是封装 TreeNode 的容器，提供转换红黑树的一些条件和锁的管制。

③、存储对象时（put() 办法）：

如果没有初始化，就调用 initTable() 办法来进行初始化；

如果没有 hash 抵触就间接 CAS 无锁插入；

如果须要扩容，就先进行扩容；

如果存在 hash 抵触，就加锁来保障线程平安，两种状况：一种是链表模式就间接遍历

到尾端插入，一种是红黑树就依照红黑树结构插入；

如果该链表的数量大于阀值 8，就要先转换成红黑树的构造，break 再一次进入循环

如果增加胜利就调用 addCount() 办法统计 size，并且查看是否须要扩容。

④、扩容办法 transfer()：默认容量为 16，扩容时，容量变为原来的两倍。

helpTransfer()：调用多个工作线程一起帮忙进行扩容，这样的效率就会更高。

⑤、获取对象时（get()办法）：

计算 hash 值，定位到该 table 索引地位，如果是首结点合乎就返回；

如果遇到扩容时，会调用标记正在扩容结点 ForwardingNode.find()办法，查找该结点，匹配就返回；

以上都不合乎的话，就往下遍历结点，匹配就返回，否则最初就返回 null。

程序运行时可能同时更新 ConccurentHashMap 且不产生锁竞争的最大线程数。默认为 16，且能够在构造函数中设置。

当用户设置并发度时，ConcurrentHashMap 会应用大于等于该值的最小 2 幂指数作为理论并发度（如果用户设置并发度为 17，理论并发度则为 32）

转载自：https://zhuanlan.zhihu.com/p/…

关于java:HashMap面试题

1：HashMap 的数据结构？

2：HashMap 的工作原理？

3. 当两个对象的 hashCode 雷同会产生什么？

4. 你晓得 hash 的实现吗？为什么要这样实现？

5. 为什么要用异或运算符？

6.HashMap 的 table 的容量如何确定？loadFactor 是什么？该容量如何变动？这种变动会带来什么问题？

7.HashMap 中 put 办法的过程？

8. 数组扩容的过程？

9. 拉链法导致的链表过深问题为什么不必二叉查找树代替，而抉择红黑树？为什么不始终应用红黑树？

10. 说说你对红黑树的见解？

11.jdk8 中对 HashMap 做了哪些扭转？

12.HashMap，LinkedHashMap，TreeMap 有什么区别？

13.HashMap & TreeMap & LinkedHashMap 应用场景？

14.HashMap 和 HashTable 有什么区别？

15.Java 中的另一个线程平安的与 HashMap 极其相似的类是什么？同样是线程平安，它与 HashTable 在线程同步上有什么不同？

16.HashMap & ConcurrentHashMap 的区别？

17. 为什么 ConcurrentHashMap 比 HashTable 效率要高？

18. 针对 ConcurrentHashMap 锁机制具体分析（JDK 1.7 VS JDK 1.8）

19.ConcurrentHashMap 在 JDK 1.8 中，为什么要应用内置锁 synchronized 来代替重入锁 ReentrantLock？

20.ConcurrentHashMap 简略介绍？

21.ConcurrentHashMap 的并发度是什么？