今天说一说集合,在面试的时候出现的频率非常高,开发中使用的频率也非常高。经常听到有人说 List 是有序,Set 是无序,那么这个有序和无序指的究竟是什么呢?
这里有两个概念,一个是存取元素的顺序,比如我存的时候是 3 4 5 1 2,那么取出来也应该是 3 4 5 1 2 或者 2 1 5 4 3。另一个是元素在容器中大小顺序,更准确说是排序。如果说区分了这两个概念,就好说了,看上面的体系图,List 家族有两名大将,分别是 ArrayList 和 LinkedList。而 Set 家族里主要有 HashSet 和 TreeSet 两名大将。
如果要按照存和取的顺序来讲,ArrayList 和 LinkedList 就属于有序集合,因为 ArrayList 底层是动态数组实现的,而数组是一块连续的空间,每次存的时候都是找到索引,一个接着一个的存储,取的时候也要按照索引遍历出来。
链表也是一样,不是存到链表头就是存到链表尾。因为存和取的顺序有序,模拟栈(先进后出)和队列(先进先出)这两种数据结构也很容易。但这两种结构它们本身并不能对元素进行排序,这也决定了我不能轻易的找到数组或链表中的最大值和最小值,或者说元素和元素之间存储的并没有什么规律。
同样,按照存储顺序来讲,HashSet 依赖哈希存储,计算哈希值之后,会分散到不同的存储位置上,这也就代表存储的时候,元素不是一个挨着一个存储的,而是根据每个元素的 hash 值,散列到了不同的位置。存取的顺序也是不能保证的,元素的排序顺序也是不能保证的,但好处就是存取效率高。
而 TreeSet 依赖的是树存储,在树这种结构中,无论是二分查找树,还是红黑树,在存储元素的时候都会对元素本身进行比较,按照大小放到合适的位置,这也就说明,元素会按照树的性质去存储,那么也就无法保证存和取元素的顺序。但是元素可以在存储的时候根据自身的大小排好序,从而可以很轻易的找到最大值,最小值,以及给定一个元素,找到比他大和比他小元素等操作。
总结:按元素存取顺序来说,List 是有序的,Set 是无序的。按照元素和元素之间的关系来说,List 是无序的,TreeSet 是有序的。而 HashSet 怎么说都是无序的。