这个TreeSet其实和HashSet类似。HashSet底层是通过HashMap实现的,TreeSet其实底层也是通过TreeMap实现的。这篇文章就通过源码来分析一下TreeSet。

一、简介

TreeSet的作用是保存无重复的数据,不过还对这些数据进行了排序。TreeMap的底层是通过红黑树实现的,所以TreeSet底层也是通过红黑树实现的。TreeSet最主要的特点就是对元素进行了排序。我们对其特点进行总结一下:

(1)TreeSet是基于TreeMap的NavigableSet实现。

(2)TreeSet的元素存储在TreeMap中的key中,TreeMap的value是一个常量对象。

(3)非线程安全 。

(4)java8新增分割器spliterator() 方法。

在源码分析中我们也是基于jdk1.8来分析。下面我们就直接来看一下;

二、源码分析

1、继承关系

 1//继承了AbstractSet抽象类
2java.lang.Object
3        java.util.AbstractCollection<E>
4              java.util.AbstractSet<E>
5                   java.util.TreeSet<E>
6//实现了NavigableSet接口:支持导航方法,比如查找
7//实现了Cloneable接口:意味着它能被克隆
8//实现了Serializable接口:意味着被序列化
9public class TreeSet<Eextends AbstractSet<E>
10    implements NavigableSet<E>, Cloneablejava.io.Serializable
11

2、参数变量

1//存放元素的集合
2private transient NavigableMap<E,Object> m;
3//PRESENT就是上面NavigableMap中的Object
4private static final Object PRESENT = new Object();

第一个疑问:不是说TreeSet是基于TreeMap实现的,为什么这里的参数是NavigableMap?

这是因为TreeMap实现了NavigableMap接口。

第二个疑问,既然TreeSet只使用了NavigableMap的key,那么直接使用null作为NavigableMap的value不就完了,还方面节省内存。

这个疑问就要好好说一下了,如果看过我HashSet那篇文章想必你一定很清楚了。这里可以直接跳过,如果你没看过,我们直接定位到TreeSet的增删方法。深入源码中找寻答案。

1//add方法其实就是Map的put方法
2public boolean add(E e) {
3    return m.put(e, PRESENT)==null;
4}
5//remove方法其实就是Map的remove方法
6public boolean remove(Object o) {
7    return m.remove(o)==PRESENT;
8}

在add方法中,我们会出现两种put情况

情况1:元素e不重复,直接插入即可。

情况2:元素e重复,m.put(e, PRESENT)一看e这个key已经存在了,就会将PRESENT替换掉相应的value值。然后map返回这个value。value不等于null,于是返回false。很明显插入失败了。

但是如果我们把PRESENT替换成null呢?这时候m.put(e, PRESENT)一看e这个key已经存在了,于是map返回null。完了这时候你会发现null等于null。整个add方法返回的就是true。这不就矛盾了嘛。命名插入的是重复数据,返回的结果依然还是true。所以这里使用了PRESENT这个对象就能有效地避免这种情况。

3、构造方法

 1    TreeSet(NavigableMap<E,Object> m) {
2        this.m = m;
3    }
4    public TreeSet() {
5        this(new TreeMap<E,Object>());
6    }
7    public TreeSet(Comparator<? super E> comparator) {
8        this(new TreeMap<>(comparator));
9    }
10    public TreeSet(Collection<? extends E> c) {
11        this();
12        addAll(c);
13    }
14    public TreeSet(SortedSet<E> s) {
15        this(s.comparator());
16        addAll(s);
17    }

这五个构造方法,基本上把HashSet的几个特性全部说完了,底层就是new一个TreeMap来实现的,我们还可以假如自己的比较器和排序器。

4、其他方法

增删方法我们已经看了其实就是通过map的put的remove方法来实现的。我们来看一些其他的常见方法

(1)返回子Set

1//底层其实就是通过TreeMap的subMap()实现的
2public NavigableSet<E> subSet(E fromElement, boolean fromInclusive,
3                        E toElement,   boolean toInclusive)
 
{
4   return new TreeSet<>(m.subMap(fromElement, fromInclusive,
5                        toElement,   toInclusive));
6}

(2)返回Set的头部和尾部

1// 返回Set的头部,范围是:从头部到toElement。
2// inclusive:是否包含toElement的标志
3public NavigableSet<E> headSet(E toElement, boolean inclusive) {
4    return new TreeSet<E>(m.headMap(toElement, inclusive));
5}
6// 返回Set的尾部,范围是:从fromElement到结尾。
7public NavigableSet<E> tailSet(E fromElement, boolean inclusive) {
8    return new TreeSet<E>(m.tailMap(fromElement, inclusive));
9}

(3)返回set中大于小于等于e的元素

 1// 返回Set的第一个元素
2public E first() return m.firstKey(); }
3// 返回Set的最后一个元素
4public E last() return m.lastKey(); }
5// 返回Set中小于e的最大元素
6public E lower(E e) return m.lowerKey(e); }
7// 返回Set中小于/等于e的最大元素
8public E floor(E e) return m.floorKey(e);}
9// 返回Set中大于/等于e的最小元素
10public E ceiling(E e) return m.ceilingKey(e);}
11// 返回Set中大于e的最小元素
12public E higher(E e) return m.higherKey(e);}

(4)获取首尾元素并移除

 1// 获取第一个元素,并将该元素从TreeMap中删除。
2public E pollFirst() {
3    Map.Entry<E,?> e = m.pollFirstEntry();
4    return (e == null)? null : e.getKey();
5}
6// 获取最后一个元素,并将该元素从TreeMap中删除。
7public E pollLast() {
8    Map.Entry<E,?> e = m.pollLastEntry();
9    return (e == null)? null : e.getKey();
10}

(5)读写数据

 1// 将TreeSet的“比较器、容量,所有的元素值”都写入到输出流中
2private void writeObject(java.io.ObjectOutputStream s)
3    throws java.io.IOException 
{
4    s.defaultWriteObject();
5    // 写入比较器
6    s.writeObject(m.comparator());
7    // 写入容量
8    s.writeInt(m.size());
9    // 写入“TreeSet中的每一个元素”
10    for (Iterator i=m.keySet().iterator(); i.hasNext(); )
11        s.writeObject(i.next());
12}

还有一个读数据

 1private void readObject(java.io.ObjectInputStream s)
2    throws java.io.IOException, ClassNotFoundException 
{
3    s.defaultReadObject();
4    // 从输入流中读取TreeSet的“比较器”
5    Comparator<? super E> c = (Comparator<? super E>) s.readObject();
6    TreeMap<E,Object> tm;
7    if (c==null)
8        tm = new TreeMap<E,Object>();
9    else
10        tm = new TreeMap<E,Object>(c);
11    m = tm;
12    int size = s.readInt();
13    // 读取TreeSet的全部元素
14    tm.readTreeSet(size, s, PRESENT);
15}

源码很简单基本上都在这。下面我们总结一下。

对于HashSet是用Hash表来存储数据,而TreeSet是用二叉树来存储数据。在不需要排序的时候,还是建议优先使用HashSet,因为速度更快,二叉树需要排序就免不了跳转旋转,所以速度会很慢。

感谢大家一直以来的支持,今天的文章先写到这。