Java汇合类实现原理

1.Iterable接口

  • 定义了迭代汇合的迭代办法
iterator()forEach() 对1.8的Lambda表达式提供了反对

2. Collection接口

  • 定义了汇合增加的通用办法
int size();boolean isEmpty();boolean contains();boolean add()boolean addAll()boolean remove()        removeAll()Object[] toArray()

3.List接口

  • 元素被增加到汇合中当前,取出的时候是依照放入程序。
  • List能够反复。
  • 存在下标,能够间接依附下标取值
E get()E set()E indexOf()int lastIndexOf()ListIterator listIterator()

3.1 ArrayList类

  • 底层是一个Object数组。
transient Object[] elementData; // non-private to simplify nested class access
  • 初始容量为10
private static final int DEFAULT_CAPACITY = 10;
  • 当数组容量不够是主动扩容为以前的1.5倍
private int newCapacity(int minCapacity) {        // overflow-conscious code        int oldCapacity = elementData.length;        int newCapacity = oldCapacity + (oldCapacity >> 1);
  • 数组最大容量为Integer.MAX_VALUE-8
private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;
  • 线程不平安

3.2.Vector类(不罕用)

  • 底层是一个Object数组
protected Object[] elementData;
  • 初始容量为10
public Vector() {        this(10);    }
  • 数组容量不够的时候主动扩容为原来的一倍
int oldCapacity = elementData.length;        int newCapacity = oldCapacity + ((capacityIncrement > 0) ?                                         capacityIncrement : oldCapacity);
  • 数组最大容量为
private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;
  • 线程平安

3.3 LinkedList

  • 底层是一个列表
/**     * Pointer to first node.     */    transient Node<E> first;    /**     * Pointer to last node.     */    transient Node<E> last;
  • 寄存节点个数
transient int size = 0;
  • 默认构造方法减少元素实现原理
//当默认结构的时候,创立汇合的时候public LinkedList() {    }//应用增加办法,间接将元素增加到开端public boolean add(E e) {        linkLast(e);        return true;    }//给尾部增加元素void linkLast(E e) {        //获取最初一个元素        final Node<E> l = last;        //新创建一个界面,其尾结点为null        final Node<E> newNode = new Node<>(l, e, null);        //将数组中存储最初一个界面的元素复制        last = newNode;        //如果此时汇合为null,则另第一个节点也为该元素,否则就将这个元素的下一个节点设置为该元素节点        if (l == null)            first = newNode;        else            l.next = newNode;    //节点数量减少        size++;        modCount++;    }
  • 指定下标减少元素实现原理
//LinkedList反对指定的索引出减少节点public void add(int index, E element) {        //查看传入的索引是否符合要求        checkPositionIndex(index);        //如果这个索引是最初一个节点,则间接增加        if (index == size)            linkLast(element);        else            //否则            linkBefore(element, node(index));    }//返回了指定下标的NodeNode<E> node(int index) {        // assert isElementIndex(index);        //如果此时的下标小于节点的一半,相当于一个二分查找的办法,        if (index < (size >> 1)) {            Node<E> x = first;            for (int i = 0; i < index; i++)                x = x.next;            return x;        } else {            Node<E> x = last;            for (int i = size - 1; i > index; i--)                x = x.prev;            return x;        }    //将须要插入的元素进行插入void linkBefore(E e, Node<E> succ) {        // assert succ != null;        final Node<E> pred = succ.prev;        final Node<E> newNode = new Node<>(pred, e, succ);        succ.prev = newNode;        if (pred == null)            first = newNode;        else            pred.next = newNode;        size++;        modCount++;    }
实现的思维能够归结为:每一次的插入或者移除,都是通过node()办法获取指定的Node节点,而后通过linkBefore或者linkLast这些办法来具体进行链表的操作。

4.Set接口

  • 插入无序
  • 元素不能反复
  • 底层均为Map汇合实现

4.1 TreeSet类

先来瞅一眼这个类的继承关系吧

  • 实现了AbstractSet领有了Set的属性和办法
  • 实现了NavigableSet,反对一系列导航办法,能够进行准确查找

分析一下这个类的源码

  • 底层实现TreeMap构造
public class TreeSet<E> extends AbstractSet<E>    implements NavigableSet<E>, Cloneable, java.io.Serializable{    /**     * 寄存生成的TreeMap汇合     */    private transient NavigableMap<E,Object> m;    // 作为值增加到TreeMap中,即每一个Entry的键不同但值雷同,都是一个对象的地址    private static final Object PRESENT = new Object();            public TreeSet() {        this(new TreeMap<>());    }        TreeSet(NavigableMap<E,Object> m) {        this.m = m;    }//增加办法    public boolean add(E e) {        return m.put(e, PRESENT)==null;    }    
  • 进行了排序。(在HashMap原理进行剖析)

4.2 HashSet类

  • 底层基于HashMap
    //键    private transient HashMap<E,Object> map;        // 值    private static final Object PRESENT = new Object();        //结构    public HashSet() {        map = new HashMap<>();    }
  • 无序
  • 不可反复

4.3 LinkedHashSet类

  • 底层基于LinkedHashMap实现,通过LinkedHashMap中的办法实现了程序存值。具体实现可看上面的LinkedHashMap
public LinkedHashSet() {        super(16, .75f, true);    }HashSet(int initialCapacity, float loadFactor, boolean dummy) {        map = new LinkedHashMap<>(initialCapacity, loadFactor);    }

5. Map类

  • 键值对的模式存放数据
  • 定义了通用的办法
  • 不可反复
int size()isEmpty();containsKey()containsValue()get()    put()remove()    keyset()values()entrySet()

5.1Entry类

  • Map类的外部类,用来获取所有的键值

5.2HashMap类

put的时候,会通过hash算法,计算一个index,这个index就是节点数组的下标,此时这个实体就被存储到这个数组中。然而因为这个hash算法不能保障任何一个key值计算出来的hash值均雷同,所以采纳链表的形式,挂载雷同的index的实体。在1.8当前,当链表的节点数量大于或者等于8的时候且数组的容量大于64的时候,就会将链表转换为红黑树
  • 底层实现:数组+链表或者红黑树
//保留的数组,初始化16个transient Node<K,V>[] table;//为entrySet和value提供一个缓存transient Set<Map.Entry<K,V>> entrySet;//元素的数量transient int size;//初始容量static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16//最大容量static final int MAXIMUM_CAPACITY = 1 << 30;//数组递增的策略 当size > capacity*loadFacotor的时候递增final float loadFactor;
  • Node节点的定义(列表)
static class Node<K,V> implements Map.Entry<K,V> {        final int hash;        final K key;        V value;        Node<K,V> next;        Node(int hash, K key, V value, Node<K,V> next) {            this.hash = hash;            this.key = key;            this.value = value;            this.next = next;        }
  • 初始容量为16的起因
//hash算法,保障哈希值均匀散布,只有当为16的时候才能够最大水平的保障均匀散布static final int hash(Object key) {        int h;        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);    }
  • put办法
//创立一个HashMap对象,并且设定它的递增策略为0.75倍public HashMap() {        this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted    }static final float DEFAULT_LOAD_FACTOR = 0.75f;//执行put办法public V put(K key, V value) {    //key通过hash算法计算一个index        return putVal(hash(key), key, value, false, true);    }final V putVal(int hash, K key, V value, boolean onlyIfAbsent,                   boolean evict) {        Node<K,V>[] tab; Node<K,V> p; int n, i;    //第一次进入为null,所以执行初始化容器大小        if ((tab = table) == null || (n = tab.length) == 0)            //此时返回的就是初始化容器当前的大小即16            n = (tab = resize()).length;        //计算下标,如果等于null,间接赋值        if ((p = tab[i = (n - 1) & hash]) == null)            tab[i] = newNode(hash, key, value, null);        else {            //如果该数组刚好有值,则采纳链表或者红黑树的形式增加数据节点            Node<K,V> e; K k;            //判断两个节点是否相等            if (p.hash == hash &&                ((k = p.key) == key || (key != null && key.equals(k))))                e = p;            //判断以后节点是否属于红黑树节点            else if (p instanceof TreeNode)                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);            else {                //如果不是间接进行链表连贯                for (int binCount = 0; ; ++binCount) {                    if ((e = p.next) == null) {                        //将以后节点的下一个节点设置为新的实体节点                        p.next = newNode(hash, key, value, null);                        //如果此时的节点容量为7那么将链表转换为红黑树                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st                            treeifyBin(tab, hash);                        break;                    }                    //判断新传入的实体和以后绑定节点的子节点是否雷同,如果雷同间接退出                    if (e.hash == hash &&                        ((k = e.key) == key || (key != null && key.equals(k))))                        break;                    //进入这个子节点                    p = e;                }            }            if (e != null) { // existing mapping for key                V oldValue = e.value;                if (!onlyIfAbsent || oldValue == null)                    e.value = value;                afterNodeAccess(e);                return oldValue;            }        }    //批改次数        ++modCount;    //查看以后容器的容量是否大于threshold ,如果大于减少数组容量为原来的一倍        if (++size > threshold)            resize();        afterNodeInsertion(evict);        return null;}        //初始化容器大小final Node<K,V>[] resize() {        Node<K,V>[] oldTab = table;        //旧容量为0        int oldCap = (oldTab == null) ? 0 : oldTab.length;        int oldThr = threshold;    //设置以后容器的递增为0        int newCap, newThr = 0;    //此时的oldCap=0 , newThr = 0 间接else执行        if (oldCap > 0) {            if (oldCap >= MAXIMUM_CAPACITY) {                threshold = Integer.MAX_VALUE;                return oldTab;            }            //扩容,将数组的容量和扩容因子变为原来的一倍            else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&                     oldCap >= DEFAULT_INITIAL_CAPACITY)                newThr = oldThr << 1; // double threshold        }        else if (oldThr > 0) // initial capacity was placed in threshold            newCap = oldThr;        else {               // zero initial threshold signifies using defaults            //初始化容器为默认16            newCap = DEFAULT_INITIAL_CAPACITY;            //初始化阙值            newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);        }        if (newThr == 0) {            float ft = (float)newCap * loadFactor;            newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?                      (int)ft : Integer.MAX_VALUE);        }        threshold = newThr;        @SuppressWarnings({"rawtypes","unchecked"})        Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];        //初始化存储容器数组        table = newTab;
5.2.1 Hash数据结构

java中所有的数据结构都能够应用数组和指针即援用来实现。而Hash也成散列,就是一个链表加数组实现。

Hash数据结构具备无序的特色。这里的无序指的是存入程序于取出程序不一样。

什么是Hash表的负载因子?负载因子代表了Hash表的空间填充度,即负载因子越大其对空间的使用率越高,但这也造成了查问速度慢,而负载因子越小,其查问速度越快,空间填充度越低。所以在应用的过程个别会通过放弃一个均衡。如HashMap的负载因子初始化为0.75.保障了两者之间的衡量。

Hash表如何存储数据?Hash表的每一次存储都会先调用一个Hash函数,而这个Hash函数最初运算的值就是所存储数据的下标。即当须要查问数据的时候,仅仅只须要调用Hash函数进行一次计算就能够得出该数据所在的下标。

5.2.2 HashMap中的数据结构实现

上面具体解析一下HashMap中的Hash表的实现

在HashMap初始化的时候,首先会给外部的负载因子赋值为0.75,而后创建对象,留神此时的HashMap外部的Node数组并没有实例化。

开始put数据,此时put办法会调用putVal()办法,但在调用这个putVal办法之前,他首先通过hash算法计算了一次这个key所对应的哈希值,而在putVal()办法中,又将这个哈希值通过和数组的容量-1进行&运算,得出了在这个数组的容量范畴内的一个index。此时这个key所须要存储的index正式确定。

确定key当前,须要判断该index下有没有值,如果有,判断新增的这个元素与现有这个元素是否雷同,如果雷同,替换该值;如果不雷同,遍历这个链表,判断这个链表中是否存在和新增元素雷同的值,如果不存在则间接增加到链表尾部,如果存在,替换该值;当然如果此时链表中节点的个数大于或者等于8且数组的容量大于64的时候当前就将链表转化为红黑树。

containKey办法的实现,就是间接通过hash办法计算出哈希值,而后通过&运算,获取数组下标,判断这个下标是否为该值,如果不是,则进行遍历链表或者红黑树。

containeValue办法实现,一级一级遍历工夫复杂度仿佛蛮高的

5.3 LinkedHashMap类

咱们所晓得的LinkedHashMap类能够程序的输入用户所输出的数据。上面谈一下他的实现形式

LinkedHashMap中定义了一个Entry类,继承了HashMap.Node节点类,额定定义了两个属性,before和after,还有最重要的一个办法newNode,这个办法被LinkedHashMap重写,确定了程序性。看到这也就晓得这是双向链表的两个值了。LinkedHashMap在每一次put元素之后都要将该元素的上一个节点设置为之前的那个节点。代码阐明!!!

  • 成员属性
    // 链表的第一个节点,LinkedHashMap会保留链表的最初一个节点的属性,以不便进行节点增加    transient LinkedHashMap.Entry<K,V> head;      // 链表的最初一个节点    transient LinkedHashMap.Entry<K,V> tail;
  • 创建对象了
//老办法,new个对象再说(独身狗的呐喊)public LinkedHashMap() {        super();        accessOrder = false;    }//间接调用HashMap的put办法public V put(K key, V value) {        return putVal(hash(key), key, value, false, true);    }final V putVal(int hash, K key, V value, boolean onlyIfAbsent,                   boolean evict) {    //在putVal中调用了    afterNodeAccess(e);    afterNodeInsertion(evict);  
Node<K,V> newNode(int hash, K key, V value, Node<K,V> e) {        LinkedHashMap.Entry<K,V> p =            new LinkedHashMap.Entry<>(hash, key, value, e);        linkNodeLast(p);        return p;    }// link at the end of list    private void linkNodeLast(LinkedHashMap.Entry<K,V> p) {        //获取最初一个节点        LinkedHashMap.Entry<K,V> last = tail;        //将最初一个节点定义为新增的节点        tail = p;        //如果等于null那么阐明之前没有元素        if (last == null)            head = p;        else {            //如果有,将这个元素的上一个节点定义为之前的最初一个元素            p.before = last;            //最初一个节点的下一个元素定义为新元素            last.after = p;        }    }
//判断这个新的节点是否为最初一个节点,如果不是挪动该节点到最初void afterNodeAccess(Node<K,V> e) { // move node to last        LinkedHashMap.Entry<K,V> last;            //查看以后最初一个节点是否为以后新增的元素        if (accessOrder && (last = tail) != e) {            //p为以后元素,a为下一个元素,b为上一个元素            LinkedHashMap.Entry<K,V> p =                (LinkedHashMap.Entry<K,V>)e, b = p.before, a = p.after;            //将p的下一个元素定义为null,切断和之前元素的分割            p.after = null;            //如果上一个元素为null ,则阐明将该节点的下一个节点赋值为头结点            if (b == null)                head = a;            else                //否则,将上一个节点的下一个节点定义为a,到此,这个新的节点曾经被独立进去了                b.after = a;            //如果此时a不为null            if (a != null)                //则间接赋值                a.before = b;            else                last = b;            if (last == null)                head = p;            else {                p.before = last;                last.after = p;            }            tail = p;            ++modCount;        }    }//永远不起作用removeEldestEntry办法永远返回falsevoid afterNodeInsertion(boolean evict) { // possibly remove eldest        LinkedHashMap.Entry<K,V> first;        if (evict && (first = head) != null && removeEldestEntry(first)) {            K key = first.key;            removeNode(hash(key), key, null, false, true);        }    }protected boolean removeEldestEntry(Map.Entry<K,V> eldest) {        return false;    }

5.4 TreeMap类

  • 底层实现:红黑树
  • 继承了NavigableMap接口,NavigableMap接口继承了SortedMap接口,可反对一系列导航办法即导航操作
  • 实现了Cloneable接口,可被克隆
  • 天然排序
5.4.1TreeMap创立源码剖析
  • TreeMap定义的字段
//比拟器private final Comparator<? super K> comparator;//根节点    private transient Entry<K,V> root;//节点数量    private transient int size = 0;//批改次数    private transient int modCount = 0;//红黑色彩判断private static final boolean RED   = false;    private static final boolean BLACK = true;//节点实体static final class Entry<K,V> implements Map.Entry<K,V> {        K key;        V value;        Entry<K,V> left;        Entry<K,V> right;        Entry<K,V> parent;    //默认色彩为彩色        boolean color = BLACK;}
  • 创建对象
public TreeMap() {    //默认结构器        comparator = null;    }public TreeMap(Comparator<? super K> comparator) {    //传入自定义的结构器        this.comparator = comparator;    }public TreeMap(Map<? extends K, ? extends V> m) {        comparator = null;        putAll(m);    }
  • Put对象
 public V put(K key, V value) {     //赋值        Entry<K,V> t = root;     //如果此时的root为null         if (t == null) {            //查看这个key是否为null            compare(key, key); // type (and possibly null) check            //创立根节点            root = new Entry<>(key, value, null);            size = 1;//设置节点数量            modCount++;//批改次数减少            return null;        }         //定义比拟值        int cmp;        Entry<K,V> parent;        // split comparator and comparable paths        Comparator<? super K> cpr = comparator;     //如果此时存在自定义比拟器,依据比拟器规定进行二分比拟        if (cpr != null) {            do {                parent = t;                cmp = cpr.compare(key, t.key);                if (cmp < 0)                    t = t.left;                else if (cmp > 0)                    t = t.right;                else                    //形同替换value值                    return t.setValue(value);            } while (t != null);        }        else {            //应用默认的比拟器,查找办法一样            if (key == null)                throw new NullPointerException();            @SuppressWarnings("unchecked")                Comparable<? super K> k = (Comparable<? super K>) key;            do {                parent = t;                cmp = k.compareTo(t.key);                if (cmp < 0)                    t = t.left;                else if (cmp > 0)                    t = t.right;                else                    return t.setValue(value);            } while (t != null);        }     //没有以后节点,则创立该元素的实体节点        Entry<K,V> e = new Entry<>(key, value, parent);     //依据比拟器规定,增加节点        if (cmp < 0)            parent.left = e;        else            parent.right = e;     //红黑树主动均衡算法        fixAfterInsertion(e);     //节点数量,批改数量递增        size++;        modCount++;        return null;    }
5.4.2 TreeMap对象减少的过程

创立一个TreeMap,此时能够传入一个比拟器,如果不传入依照默认的天然程序进行比拟。

put对象,首先,查看该root节点是否为null,如果为null,查看以后传入key是否为null,不为null,则间接创立一个root节点。如果以后root节点有值,则通过二分查找,寻找以后能够进行增加的父节点,找到当前依照比拟器规定进行增加。

增加当前,红黑树进行主动均衡实现。

5.5 HashTable类

HashTable也是基于哈希表实现,和HashMap不同的是HashTable是线程平安的。

  • 底层实现:哈希表+链表
 private transient Entry<?,?>[] table;//存储数组 private transient int count;//容器中数据多少private int threshold;//容器容量达到次数当前进行批改private transient int modCount = 0;//批改次数
  • Hash函数
        int hash = key.hashCode();        int index = (hash & 0x7FFFFFFF) % tab.length;
  • 初始化。在构造方法中初始化。初始化指为11
public Hashtable(int initialCapacity, float loadFactor) {        if (initialCapacity < 0)            throw new IllegalArgumentException("Illegal Capacity: "+                                               initialCapacity);        if (loadFactor <= 0 || Float.isNaN(loadFactor))            throw new IllegalArgumentException("Illegal Load: "+loadFactor);        if (initialCapacity==0)            initialCapacity = 1;        this.loadFactor = loadFactor;        table = new Entry<?,?>[initialCapacity];        threshold = (int)Math.min(initialCapacity * loadFactor, MAX_ARRAY_SIZE + 1);    }
  • put办法
public synchronized V put(K key, V value) {        // Make sure the value is not null        if (value == null) {            throw new NullPointerException();        }        // Makes sure the key is not already in the hashtable.        Entry<?,?> tab[] = table;        //hash函数计算一个index        int hash = key.hashCode();        int index = (hash & 0x7FFFFFFF) % tab.length;        @SuppressWarnings("unchecked")        Entry<K,V> entry = (Entry<K,V>)tab[index];        for(; entry != null ; entry = entry.next) {            if ((entry.hash == hash) && entry.key.equals(key)) {                V old = entry.value;                entry.value = value;                return old;            }        }        addEntry(hash, key, value, index);        return null;    }//减少实体private void addEntry(int hash, K key, V value, int index) {        Entry<?,?> tab[] = table;        if (count >= threshold) {            // Rehash the table if the threshold is exceeded            rehash();            tab = table;            hash = key.hashCode();            index = (hash & 0x7FFFFFFF) % tab.length;        }        // Creates the new entry.        @SuppressWarnings("unchecked")        Entry<K,V> e = (Entry<K,V>) tab[index];        tab[index] = new Entry<>(hash, key, value, e);        count++;        modCount++;    }
5.5.1 HashTable和HashMap的区别
HashTableHashMap
底层工夫哈希表+链表哈希表+链表+红黑树
初始化工夫及大小构造方法初始化,大小为11put办法初始化,大小为16
线程平安平安不平安
Hash值间接应用了hashcode从新计算
扩容二倍+1二倍

5.6 Properties类

  • Java配置文件中用的居多
  • 能够间接通过load办法加载配置文件,通过store办法存储配置文件
  • 泛型锁定,为两个String类型

文章首发于公众号@MakerStack