这个TreeSet其实和HashSet类似。HashSet底层是通过HashMap实现的,TreeSet其实底层也是通过TreeMap实现的。这篇文章就通过源码来分析一下TreeSet。
一、简介
TreeSet的作用是保存无重复的数据,不过还对这些数据进行了排序。TreeMap的底层是通过红黑树实现的,所以TreeSet底层也是通过红黑树实现的。TreeSet最主要的特点就是对元素进行了排序。我们对其特点进行总结一下:
(1)TreeSet是基于TreeMap的NavigableSet实现。
(2)TreeSet的元素存储在TreeMap中的key中,TreeMap的value是一个常量对象。
(3)非线程安全 。
(4)java8新增分割器spliterator() 方法。
在源码分析中我们也是基于jdk1.8来分析。下面我们就直接来看一下;
二、源码分析
1、继承关系
1//继承了AbstractSet抽象类
2java.lang.Object
3 java.util.AbstractCollection<E>
4 java.util.AbstractSet<E>
5 java.util.TreeSet<E>
6//实现了NavigableSet接口:支持导航方法,比如查找
7//实现了Cloneable接口:意味着它能被克隆
8//实现了Serializable接口:意味着被序列化
9public class TreeSet<E> extends AbstractSet<E>
10 implements NavigableSet<E>, Cloneable, java.io.Serializable
11
2、参数变量
1//存放元素的集合
2private transient NavigableMap<E,Object> m;
3//PRESENT就是上面NavigableMap中的Object
4private static final Object PRESENT = new Object();
第一个疑问:不是说TreeSet是基于TreeMap实现的,为什么这里的参数是NavigableMap?
这是因为TreeMap实现了NavigableMap接口。
第二个疑问,既然TreeSet只使用了NavigableMap的key,那么直接使用null作为NavigableMap的value不就完了,还方面节省内存。
这个疑问就要好好说一下了,如果看过我HashSet那篇文章想必你一定很清楚了。这里可以直接跳过,如果你没看过,我们直接定位到TreeSet的增删方法。深入源码中找寻答案。
1//add方法其实就是Map的put方法
2public boolean add(E e) {
3 return m.put(e, PRESENT)==null;
4}
5//remove方法其实就是Map的remove方法
6public boolean remove(Object o) {
7 return m.remove(o)==PRESENT;
8}
在add方法中,我们会出现两种put情况
情况1:元素e不重复,直接插入即可。
情况2:元素e重复,m.put(e, PRESENT)一看e这个key已经存在了,就会将PRESENT替换掉相应的value值。然后map返回这个value。value不等于null,于是返回false。很明显插入失败了。
但是如果我们把PRESENT替换成null呢?这时候m.put(e, PRESENT)一看e这个key已经存在了,于是map返回null。完了这时候你会发现null等于null。整个add方法返回的就是true。这不就矛盾了嘛。命名插入的是重复数据,返回的结果依然还是true。所以这里使用了PRESENT这个对象就能有效地避免这种情况。
3、构造方法
1 TreeSet(NavigableMap<E,Object> m) {
2 this.m = m;
3 }
4 public TreeSet() {
5 this(new TreeMap<E,Object>());
6 }
7 public TreeSet(Comparator<? super E> comparator) {
8 this(new TreeMap<>(comparator));
9 }
10 public TreeSet(Collection<? extends E> c) {
11 this();
12 addAll(c);
13 }
14 public TreeSet(SortedSet<E> s) {
15 this(s.comparator());
16 addAll(s);
17 }
这五个构造方法,基本上把HashSet的几个特性全部说完了,底层就是new一个TreeMap来实现的,我们还可以假如自己的比较器和排序器。
4、其他方法
增删方法我们已经看了其实就是通过map的put的remove方法来实现的。我们来看一些其他的常见方法
(1)返回子Set
1//底层其实就是通过TreeMap的subMap()实现的
2public NavigableSet<E> subSet(E fromElement, boolean fromInclusive,
3 E toElement, boolean toInclusive) {
4 return new TreeSet<>(m.subMap(fromElement, fromInclusive,
5 toElement, toInclusive));
6}
(2)返回Set的头部和尾部
1// 返回Set的头部,范围是:从头部到toElement。
2// inclusive:是否包含toElement的标志
3public NavigableSet<E> headSet(E toElement, boolean inclusive) {
4 return new TreeSet<E>(m.headMap(toElement, inclusive));
5}
6// 返回Set的尾部,范围是:从fromElement到结尾。
7public NavigableSet<E> tailSet(E fromElement, boolean inclusive) {
8 return new TreeSet<E>(m.tailMap(fromElement, inclusive));
9}
(3)返回set中大于小于等于e的元素
1// 返回Set的第一个元素
2public E first() { return m.firstKey(); }
3// 返回Set的最后一个元素
4public E last() { return m.lastKey(); }
5// 返回Set中小于e的最大元素
6public E lower(E e) { return m.lowerKey(e); }
7// 返回Set中小于/等于e的最大元素
8public E floor(E e) { return m.floorKey(e);}
9// 返回Set中大于/等于e的最小元素
10public E ceiling(E e) { return m.ceilingKey(e);}
11// 返回Set中大于e的最小元素
12public E higher(E e) { return m.higherKey(e);}
(4)获取首尾元素并移除
1// 获取第一个元素,并将该元素从TreeMap中删除。
2public E pollFirst() {
3 Map.Entry<E,?> e = m.pollFirstEntry();
4 return (e == null)? null : e.getKey();
5}
6// 获取最后一个元素,并将该元素从TreeMap中删除。
7public E pollLast() {
8 Map.Entry<E,?> e = m.pollLastEntry();
9 return (e == null)? null : e.getKey();
10}
(5)读写数据
1// 将TreeSet的“比较器、容量,所有的元素值”都写入到输出流中
2private void writeObject(java.io.ObjectOutputStream s)
3 throws java.io.IOException {
4 s.defaultWriteObject();
5 // 写入比较器
6 s.writeObject(m.comparator());
7 // 写入容量
8 s.writeInt(m.size());
9 // 写入“TreeSet中的每一个元素”
10 for (Iterator i=m.keySet().iterator(); i.hasNext(); )
11 s.writeObject(i.next());
12}
还有一个读数据
1private void readObject(java.io.ObjectInputStream s)
2 throws java.io.IOException, ClassNotFoundException {
3 s.defaultReadObject();
4 // 从输入流中读取TreeSet的“比较器”
5 Comparator<? super E> c = (Comparator<? super E>) s.readObject();
6 TreeMap<E,Object> tm;
7 if (c==null)
8 tm = new TreeMap<E,Object>();
9 else
10 tm = new TreeMap<E,Object>(c);
11 m = tm;
12 int size = s.readInt();
13 // 读取TreeSet的全部元素
14 tm.readTreeSet(size, s, PRESENT);
15}
源码很简单基本上都在这。下面我们总结一下。
对于HashSet是用Hash表来存储数据,而TreeSet是用二叉树来存储数据。在不需要排序的时候,还是建议优先使用HashSet,因为速度更快,二叉树需要排序就免不了跳转旋转,所以速度会很慢。
感谢大家一直以来的支持,今天的文章先写到这。