外围概述:本篇咱们将持续深刻学习Collection汇合之Set系列汇合,并且会剖析Set汇合的源码,帮我咱们更好的了解Set汇合的特点。同时也会具体学习Java中的泛型、Collections工具类、数据结构红黑树的特点。
第一章:Collections工具类
1.1-Collections罕用办法(记忆)
java.utils.Collections 是汇合工具类,提供一系列静态方法用来对汇合进行操作 。罕用的办法如下:
public static <T> boolean addAll(Collection<T> c, T... elements)
:往汇合中增加一些元素。public static void shuffle(List<?> list)
打乱程序 :打乱汇合程序。public static <T> void sort(List<T> list)
:将汇合中元素依照默认规定排序。public static <T> void sort(List<T> list,Comparator<? super T> )
:将汇合中元素依照指定规定排序。
示例代码如下:
ArrayList<Integer> list = new ArrayList<>(); //public static <T> boolean addAll(Collection<T> c, T... elements) :往汇合中增加一些元素。 Collections.addAll(list, 1, 3, 4, 5, 6, 8, 7); System.out.println(list); // [1, 3, 4, 5, 6, 8, 7] //public static void shuffle(List<?> list) 打乱程序 :打乱汇合程序。 Collections.shuffle(list); System.out.println(list); // 随机程序[5, 4, 6, 3, 7, 1, 8] //public static <T> void sort(List<T> list) :将汇合中元素依照默认规定排序。 Collections.sort(list); System.out.println(list); // 默认升序[1, 3, 4, 5, 6, 7, 8] //public static <T> void sort(List<T> list,Comparator<? super T> ) :将汇合中元素依照指定规定排序。 Collections.sort(list, new Comparator<Integer>() { @Override public int compare(Integer o1, Integer o2) { return o2-o1; } }); System.out.println(list);
1.2-比拟器Comparator接口(了解)
概述
public interface Comparator<T>
是一个比拟性能,对一些对象的汇合施加了一个整体排序。应用这个性能排序时,须要重写该接口中的办法:int compare(T o1, T o2)
,其中o1和o2代表汇合中两个要比拟的元素,比拟其两个参数的程序。 返回负整数,零或正整数,因为第一个参数小于,等于或大于第二个参数。
案例
需要:用汇合寄存一组学生对象,并应用汇合工具类对汇合中的学生对象排序(依照年龄从小到大的程序排序)。
Student学生类
public class Student{ private String name; private int age; //构造方法 //get/set //toString}
测试类
public static void main(String[] args) { ArrayList<Student> list = new ArrayList<Student>(); list.add(new Student("rose",18)); list.add(new Student("jack",16)); list.add(new Student("abc",20)); Collections.sort(list, new Comparator<Student>() { // 匿名外部类中重写Compare办法 @Override public int compare(Student o1, Student o2) { return o1.getAge()-o2.getAge();//以学生的年龄升序 // return o2.getAge() - o2.getAge(); // 倒序 } }); } for (Student student : list) { System.out.println(student); } }/* 后果: Student{name='jack', age=16} Student{name='rose', age=18} Student{name='abc', age=20}*/
第二章:泛型
2.1-概述(理解)
在后面学习汇合时,咱们都晓得汇合中是能够寄存任意对象的,只有把对象存储汇合后,那么这时他们都会被晋升成Object类型。当咱们在取出每一个对象,并且进行相应的操作,这时必须采纳类型转换。
咱们来看上面一段代码:
package www.penglei666.com.Demo03;import java.util.ArrayList;import java.util.Collection;import java.util.Iterator;public class Test01 { public static void main(String[] args) { Collection coll = new ArrayList(); coll.add("abc"); coll.add("leigege"); coll.add(5);//因为汇合没有做任何限定,任何类型都能够给其中寄存 Iterator it = coll.iterator(); while(it.hasNext()){ //须要打印每个字符串的长度,就要把迭代进去的对象转成String类型 String str = (String) it.next(); System.out.println(str.length()); } }}
异样:程序在运行时产生了问题java.lang.ClassCastException。
问题:为什么会产生类型转换异样呢?
剖析:因为汇合中什么类型的元素都能够存储。导致取出时强转引发运行时 ClassCastException。
解决:怎么来解决这个问题呢?Collection尽管能够存储各种对象,但实际上通常Collection只存储同一类型对象。例如都是存储字符串对象。因而在JDK5之后,新增了泛型(Generic)语法,让你在设计API时能够指定类或办法反对泛型,这样咱们应用API的时候也变得更为简洁,并失去了编译期间的语法查看。
泛型:泛型,未知的类型,能够在类或办法中预支地应用未知的类型。应用泛型能够防止类型转换的麻烦。
留神:个别在创建对象时,将未知的类型确定具体的类型。
2.2-泛型的作用(理解)
上一节只是解说了泛型的引入,那么泛型带来了哪些益处呢?
- 将运行期间的ClassCastException,转移到了编译期间变成了编译失败。
- 防止了类型强转的麻烦。
通过咱们如下代码体验一下:
public static void main(String[] args) { Collection<String> list = new ArrayList<String>(); list.add("abc"); list.add("leigege"); // list.add(5);//当汇合明确类型后,寄存类型不统一就会编译报错 // 汇合曾经明确具体寄存的元素类型,那么在应用迭代器的时候,迭代器也同样会晓得具体遍历元素类型 Iterator<String> it = list.iterator(); while(it.hasNext()){ String str = it.next(); //当应用Iterator<String>管制元素类型后,就不须要强转了。获取到的元素间接就是String类型 System.out.println(str.length()); }}
2.3-定义和应用(记忆)
咱们在汇合中会大量应用到泛型,这里来残缺地学习泛型常识。
泛型,用来灵便地将数据类型利用到不同的类、办法、接口当中。将数据类型作为参数进行传递。
定义和应用含有泛型的类
定义如下:
修饰符 class 类名<代表泛型的变量> { }
例如,API中的ArrayList汇合:
泛型在定义的时候不具体,应用的时候才变得具体。在应用的时候确定泛型的具体数据类型。
class ArrayList<E>{ public boolean add(E e){ } public E get(int index){ } ....}
应用泛型: 即什么时候确定泛型。
在创建对象的时候确定泛型
例如,ArrayList<String> list = new ArrayList<String>();
此时,变量E的值就是String类型,那么咱们的类型就能够了解为:
class ArrayList<String>{ public boolean add(String e){ } public String get(int index){ } ...}
再例如,ArrayList<Integer> list = new ArrayList<Integer>();
此时,变量E的值就是Integer类型,那么咱们的类型就能够了解为:
class ArrayList<Integer> { public boolean add(Integer e) { } public Integer get(int index) { } ...}
定义和应用含有的泛型办法
定义如下:
修饰符 <代表泛型的变量> 返回值类型 办法名(参数){ }
例如,
public class MyGenericMethod { public <MVP> void show(MVP mvp) { System.out.println(mvp.getClass()); } public <MVP> MVP show2(MVP mvp) { return mvp; }}
调用办法时,确定泛型的类型
public static void main(String[] args) { // 创建对象 MyGenericMethod mm = new MyGenericMethod(); // 演示看办法提醒 mm.show("aaa"); mm.show(123); mm.show(12.45);}
含有泛型的接口
定义格局:
public interface MyGenericInterface<E>{ public abstract void add(E e); public abstract E getE(); }
应用格局1:定义类时确定泛型的类型
例如
public class MyImp1 implements MyGenericInterface<String> { @Override public void add(String e) { // 省略... } @Override public String getE() { return null; }}
此时,泛型E的值就是String类型。
应用格局2:始终不确定泛型的类型,直到创建对象时,确定泛型的类型
例如
public class MyImp2<E> implements MyGenericInterface<E> { @Override public void add(E e) { // 省略... } @Override public E getE() { return null; }}
确定泛型:
public static void main(String[] args) { MyImp2<String> my = new MyImp2<String>(); my.add("aa");}
2.4-泛型通配符(理解)
当应用泛型类或者接口时,传递的数据中,泛型类型不确定,能够通过通配符<?>
示意。然而一旦应用泛型的通配符后,只能应用Object类中的共性办法,汇合中元素本身办法无奈应用。
通配符的根本应用
泛型的通配符:不晓得应用什么类型来接管的时候,此时能够应用?,?示意未知通配符。
此时只能遍历该汇合,不能往该汇合中存储数据。
import java.util.ArrayList;import java.util.Collection;public class Test03 { public static void main(String[] args) { Collection<Integer> list1 = new ArrayList<>(); list1.add(1); list1.add(2); show(list1); Collection<String> list2 = new ArrayList<>(); list2.add("abc"); list2.add("def"); show(list2); } public static void show(Collection<?> list) { for (Object o : list) { System.out.println(o); } }}
须要留神的是:泛型不存在继承关系 Collection<Object> list = new ArrayList<String>()
;这种是谬误的。
受限泛型
之前设置泛型的时候,实际上是能够任意设置的,只有是类就能够设置。然而在JAVA的泛型中能够指定一个泛型的下限和上限。
泛型的下限:
- 格局:
类型名称 <? extends 类 > 对象名称
- 意义:
只能接管该类型及其子类
泛型的上限:
- 格局:
类型名称 <? super 类 > 对象名称
- 意义:
只能接管该类型及其父类型
示例
需要:创立老师类和班主任类,提供姓名和年龄属性,并都具备work办法。将多个老师对象和多个班主任对象存储到两个汇合中。提供一个办法能够同时遍历这两个汇合,并能调用work办法。
员工类代码
package www.penglei666.com.Demo04;/** * 员工类 */public abstract class Employee { private String name; private int age; public Employee() { } public Employee(String name, int age) { this.name = name; this.age = age; } public abstract void work(); public String getName() { return name; } public void setName(String name) { this.name = name; } public int getAge() { return age; } public void setAge(int age) { this.age = age; }}
老师类代码
package www.penglei666.com.Demo04;public class Teacher extends Employee { public Teacher(){} public Teacher(String name,int age) { super(name,age); } @Override public void work() { System.out.println(this.getName() + "老师,传道受业解惑"); }}
班主任类代码
package www.penglei666.com.Demo04;public class Manger extends Employee{ public Manger(){} public Manger(String name,int age) { super(name,age); } @Override public void work() { System.out.println(this.getName() + "老班,严格纪律治理班级"); }}
测试类代码
package www.penglei666.com.Demo04;import java.util.ArrayList;import java.util.Collection;public class Test { public static void main(String[] args) { Collection<Teacher> list1 = new ArrayList<>(); list1.add(new Teacher("王建国",30)); list1.add(new Teacher("李树根",40)); Collection<Manger> list2 = new ArrayList<>(); list2.add(new Manger("刘邦",50)); list2.add(new Manger("李世民",22)); show(list1); show(list2); } public static void show(Collection<? extends Employee> list){ for (Employee employee : list) { employee.work(); } }}
第三章:数据结构-红黑树
3.1-什么是红黑树(理解)
红黑树(Red Black Tree) 是一种自均衡二叉查找树,能够通过红色节点和彩色节点尽可能的保障二叉树的均衡,从而来提高效率。
3.2-红黑树的束缚和作用(理解)
束缚
- 节点能够是红色的或者彩色的。
- 根节点是彩色的。
- 叶子节点(特指空节点)是彩色的。
- 每个红色节点的子节点都是彩色的。
- 任何一个节点到其每一个叶子节点的所有门路上彩色节点数雷同。
作用
查问速度快,在进行插入和删除操作时通过特定操作放弃二叉查找树的均衡,从而取得较高的查找性能。
比方查找15,会先和根节点13比拟,比13大则查问根节点右侧并且不查问左侧数据;和17比拟发现小于17,则查问17左侧不查问右侧,和15比拟相等,则查找胜利。
第四章:Set汇合
4.1-概述(理解)
java.util.Set
接口和java.util.List
接口一样,同样继承自Collection
接口,它与Collection
接口中的办法基本一致,并没有对Collection
接口进行性能上的裁减,只是比Collection
接口更加严格了。与List
接口不同的是,Set
接口下的汇合不存储反复的元素。
Set
汇合有多个子类,这里咱们介绍其中的java.util.HashSet
、java.util.LinkedHashSet
这两个汇合。
留神:汇合取出元素的形式能够采纳:迭代器、加强for。
4.2-Set汇合的应用(重点)
public static void main(String[] args) { Set<String> set = new HashSet<String>(); set.add("张三"); set.add("李四"); set.add("王五"); set.add("赵六"); set.add("陈琦"); Iterator<String> it = set.iterator(); while (it.hasNext()){ String str = it.next(); System.out.println(str); } for(String str : set){ System.out.println(str); }}
4.3-对象的哈希值(理解)
java.lang.Object
类中定义了办法:public int hashCode()
返回对象的哈希码值,任何类都继承Object,也都会领有此办法。
定义Person类,不增加任何成员,间接调用Person对象的hashCode()办法,执行Object类的hashCode():
public class Person{}
测试类
public static void main(String[] args){ Person person = new Person(); int code = person.hashCode();}
输入后果:
142666848
看到运行后果,就是一个int类型的整数,如果将这个整数转为十六进制就看到所谓的对象地址值,然而他不是地址值,咱们将他称为对象的哈希值。
Person类重写hashCode()办法:间接返回0
public int hashCode(){ return 0;}
运行后,办法将执行Person类的重写办法,后果为0,属于Person类自定义对象的哈希值,而没有应用父类Object类办法hashCode()。
4.4-String对象的哈希值(理解)
示例代码
public static void main(String[] args){ String s1 = new String("abc"); String s2 = new String("abc"); System.out.println(s1.hashCode()); System.out.println(s2.hashCode());}
程序剖析:两个字符串对象都是采纳new关键字创立的,s1==s2的后果为false,然而s1,s2两个对象的哈希值却是雷同的,均为96354,起因是String类继承Object,重写了父类办法hashCode()建设本人的哈希值。
String类的hashCode办法源码剖析
字符串底层实现是字符数组,被final润饰,一旦创立不能批改。
private final char value[];
定义字符串“abc”或者是new String("abc"),都会转成char value[]数组存储,长度为3。
/* * String类重写办法hashCode() * 返回自定义的哈希值 */public int hashCode() { int h = hash; if (h == 0 && value.length > 0) { char val[] = value; for (int i = 0; i < value.length; i++) { h = 31 * h + val[i]; } hash = h; } return h;}
hashCode源码剖析:
- int h = hash,hash是成员变量,默认值0,int h = 0。
- 判断h==0为true && value.length>0,数组value的长度为3,保留三个字符abc,判断后果整体为true。
- char val[] = value,将value数组赋值给val数组。
for循环3次,将value数组进行遍历,取出abc三个字符。
- 第一次循环: h = 31 h + val[0],h = 31 0 + 97后果:h = 97。
- 第二次循环: h = 31 97 + val[1],h = 31 97 + 98后果:h = 3105。
- 第三次循环: h = 31 3105 + val[2],h = 31 3105 + 99后果:h = 96354。
- return 96354。
- 算法:31 * 上一次的哈希值+字符的ASCII码值,31属于质数,每次乘以31是为了升高字符串不同,然而计算出雷同哈希值的概率。
4.5-哈希表(理解)
什么是哈希表呢?
在JDK1.8之前,哈希表底层采纳数组+链表实现,即应用数组解决抵触,同一hash值的链表都存储在一个数组里。然而当位于一个桶中的元素较多,即hash值相等的元素较多时,通过key值顺次查找的效率较低。而JDK1.8中,哈希表存储采纳数组+链表+红黑树实现,当链表长度超过阈值(8)时,将链表转换为红黑树,这样大大减少了查找时间。
哈希表的初始化容量,数组长度为16个。
- 当数组容量不够时,扩容为原数组长度的2倍
加载因子为0.75。
- 批示当数组的容量被应用到长度的75%时,进行扩容。
简略的来说,哈希表是由数组+链表+红黑树(JDK1.8减少了红黑树局部)实现的,如下图所示。
哈希表存储字符对象的过程图
总而言之,JDK1.8引入红黑树大程度优化了HashMap的性能,那么对于咱们来讲保障HashSet汇合元素的惟一,其实就是依据对象的hashCode和equals办法来决定的。如果咱们往汇合中寄存自定义的对象,那么保障其惟一,就必须复写hashCode和equals办法建设属于以后对象的比拟形式。
HashSet存储原理图
4.6-HashSet汇合的特点(理解)
- HashSet底层数据结构是单向哈希表。
- 不保障元素的迭代程序,存储元素的程序和取出元素的程序不统一。
此汇合不容许存储反复元素。
- 存储在此汇合中的元素应该重写hashCode()和equals()办法保障唯一性。
- 此汇合具备数组,链表,红黑树三种构造特点。
- 线程不平安,运行速度快。
4.7-HashSet存储自定义类型(重点)
给HashSet中寄存自定义类型元素时,须要重写对象中的hashCode和equals办法,建设本人的比拟形式,能力保障HashSet汇合中的对象惟一.
创立自定义Student类:
public class Student { private String name; private int age; //get/set @Override public boolean equals(Object o) { if (this == o) return true; if (o == null || getClass() != o.getClass()) return false; Student student = (Student) o; return age == student.age && Objects.equals(name, student.name); } @Override public int hashCode() { return Objects.hash(name, age); }}
创立测试类:
public static void main(String[] args) { //创立汇合对象 该汇合中存储 Student类型对象 HashSet<Student> stuSet = new HashSet<Student>(); //存储 stuSet.add(new Student("于谦", 43)); stuSet.add(new Student("郭德纲", 44)); stuSet.add(new Student("于谦", 43)); stuSet.add(new Student("郭麒麟", 23)); for (Student stu2 : stuSet) { System.out.println(stu2); } }
4.8-哈希表源代码剖析(理解)
对源码剖析,能够更好的理解哈希表。
HashSet汇合自身并不提供性能,底层依赖HashMap汇合,HashSet构造方法中创立了HashMap对象:
map = new HashMap<>();
因而源代码剖析是剖析HashMap汇合的源代码,HashSet汇合中的add办法调研的是HashMap汇合中的put办法。
HashMap无参数构造方法的剖析
//HashMap中的动态成员变量static final float DEFAULT_LOAD_FACTOR = 0.75f;public HashMap() { this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted}
解析:应用无参数构造方法创立HashMap对象,将加载因子设置为默认的加载因子,loadFactor=0.75F。
HashMap有参数构造方法剖析
public HashMap(int initialCapacity, float loadFactor) { if (initialCapacity < 0) throw new IllegalArgumentException("Illegal initial capacity: " + initialCapacity); if (initialCapacity > MAXIMUM_CAPACITY) initialCapacity = MAXIMUM_CAPACITY; if (loadFactor <= 0 || Float.isNaN(loadFactor)) throw new IllegalArgumentException("Illegal load factor: " + loadFactor); this.loadFactor = loadFactor; this.threshold = tableSizeFor(initialCapacity);}
解析:带有参数构造方法,传递哈希表的初始化容量和加载因子
- 如果initialCapacity(初始化容量)小于0,间接抛出异样。
如果initialCapacity大于最大容器,initialCapacity间接等于最大容器
- MAXIMUM_CAPACITY = 1 << 30 是最大容量 (1073741824)
- 如果loadFactor(加载因子)小于等于0,间接抛出异样
tableSizeFor(initialCapacity)办法计算哈希表的初始化容量。
- 留神:哈希表是进行计算得出的容量,而初始化容量不间接等于咱们传递的参数。
tableSizeFor办法剖析
static final int tableSizeFor(int cap) { int n = cap - 1; n |= n >>> 1; n |= n >>> 2; n |= n >>> 4; n |= n >>> 8; n |= n >>> 16; return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;}
解析:该办法对咱们传递的初始化容量进行位移运算,位移的后果是 8 4 2 1 码
- 例如传递2,后果还是2,传递的是4,后果还是4。
- 例如传递3,后果是4,传递5,后果是8,传递20,后果是32。
Node 外部类剖析
哈希表是采纳数组+链表的实现办法,HashMap中的外部类Node十分重要
static class Node<K,V> implements Map.Entry<K,V> { final int hash; final K key; V value; Node<K,V> next; Node(int hash, K key, V value, Node<K,V> next) { this.hash = hash; this.key = key; this.value = value; this.next = next;}
解析:外部类Node中具备4个成员变量
- hash,对象的哈希值
- key,作为键的对象
- value,作为值得对象(解说Set汇合,不牵扯值得问题)
- next,下一个节点对象
存储元素的put办法源码
public V put(K key, V value) { return putVal(hash(key), key, value, false, true);}
解析:put办法中调研putVal办法,putVal办法中调用hash办法。
- hash(key)办法:传递要存储的元素,获取对象的哈希值
- putVal办法,传递对象哈希值和要存储的对象key
putVal办法源码
Node<K,V>[] tab; Node<K,V> p; int n, i; if ((tab = table) == null || (n = tab.length) == 0) n = (tab = resize()).length;
解析:办法中进行Node对象数组的判断,如果数组是null或者长度等于0,那么就会调研resize()办法进行数组的扩容。
resize办法的扩容计算
if (oldCap > 0) { if (oldCap >= MAXIMUM_CAPACITY) { threshold = Integer.MAX_VALUE; return oldTab; } else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY && oldCap >= DEFAULT_INITIAL_CAPACITY) newThr = oldThr << 1; // double threshold}
解析:计算结果,新的数组容量=原始数组容量<<1,也就是乘以2。
确定元素存储的索引
if ((p = tab[i = (n - 1) & hash]) == null) tab[i] = newNode(hash, key, value, null);
解析:i = (数组长度 - 1) & 对象的哈希值,会失去一个索引,而后在此索引下tab[i],创立链表对象。
不同哈希值的对象,也是有可能存储在同一个数组索引下。
遇到反复哈希值的对象
Node<K,V> e; K k; if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k)))) e = p;
解析:如果对象的哈希值雷同,对象的equals办法返回true,判断为一个对象,进行笼罩操作。
else { for (int binCount = 0; ; ++binCount) { if ((e = p.next) == null) { p.next = newNode(hash, key, value, null); if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st treeifyBin(tab, hash); break; }
解析:如果对象哈希值雷同,然而对象的equals办法返回false,将对此链表进行遍历,当链表没有下一个节点的时候,创立下一个节点存储对象。
4.9-LinkedHashSet汇合(重点)
具备可预知迭代程序的 Set 接口的哈希表和链接列表实现。此实现与 HashSet的不同之外在于,后者保护着一个运行于所有条目标双重链接列表。此链接列表定义了迭代程序,即依照将元素插入到 set 中的程序(插入程序)进行迭代。
public static void main(String[] args) { Set<String> set = new LinkedHashSet<String>(); set.add("bbb"); set.add("aaa"); set.add("abc"); set.add("bbc"); Iterator<String> it = set.iterator(); while (it.hasNext()) { System.out.println(it.next()); } for(String s : set){ System.out.println(s); }}