接上一篇博文:

hash算法的功能:

它能保证通过一个对象快速查找到另一个对象。hash算法的价值在于速度,它可以保证查询得到快速执行。

当需要查询集合中某个元素时,hash算法可以直接根据该元素的值得到该元素保存位置,从而可以让程序快速找到该元素。

当从HashSet中访问元素时,HashSet先计算该元素的hashCode值(也就是调用该对象的hashCode())方法的返回值),然后直接到该hashCode对应的位置去取出该元素。

即也是快速的原因。HashSet中每个能存储元素的“曹位(slot)”通常称为“桶(bucket)”,如果多个元素的hashCode相同,但它们通过equals()方法比较返回false,就需要一个“桶”里放多个元素,从而导致性能下降。

继续深入研究HashSet:

当向HashSet中添加一个可变对象后,并且后面程序修改了该可变对象的属性,可能导致它与集合中其他元素相同,这就可能导致HashSet中包含两个相同的对象。

看下面程序:

  1. class R  
  2. {  
  3.     int count;  
  4.     public R(int count)  
  5.     {  
  6.         this.count = count;  
  7.     }  
  8.     public String toString()  
  9.     {  
  10.         return "R(count属性:" + count + ")";  
  11.     }  
  12.     public boolean equals(Object obj)  
  13.     {  
  14.         if (obj instanceof R)  
  15.         {  
  16.             R r = (R)obj;  
  17.             if (r.count == this.count)  
  18.             {  
  19.                 return true;  
  20.             }  
  21.         }  
  22.         return false;  
  23.     }  
  24.     public int hashCode()  
  25.     {  
  26.         return this.count;  
  27.     }  
  28. }  
  29. public class TestHashSet2  
  30. {  
  31.     public static void main(String[] args)   
  32.     {  
  33.         HashSet<R> hs = new HashSet<R>();  
  34.         hs.add(new R(5));  
  35.         hs.add(new R(-3));  
  36.         hs.add(new R(9));  
  37.         hs.add(new R(-2));  
  38.         //打印TreeSet集合,集合元素是有序排列的  
  39.         System.out.println(hs);  
  40.         //取出第一个元素  
  41.         Iterator<R> it = hs.iterator();  
  42.         R first = (R)it.next();     //first指向集合的第一个元素  
  43.         //为第一个元素的count属性赋值  
  44.         first.count = -3;           //first指向的元素值发生改变,地址并没有改变,大家可以试着用Java内存分配机制(栈和堆)思考下。  
  45.         //再次输出count将看到HashSet里的元素处于无序状态  
  46.         System.out.println(hs);  
  47.         hs.remove(new R(-3));  
  48.         System.out.println(hs);  
  49.         //输出false  
  50.         System.out.println("hs是否包含count为-3的R对象?" + hs.contains(new R(-3)));  
  51.         //输出false  
  52.         System.out.println("hs是否包含count为5的R对象?" + hs.contains(new R(5)));  
  53.  
  54.     }  

程序运行结果:

  1. [R(count属性:5), R(count属性:9), R(count属性:-3), R(count属性:-2)]  
  2. [R(count属性:-3), R(count属性:9), R(count属性:-3), R(count属性:-2)]  
  3. [R(count属性:-3), R(count属性:9), R(count属性:-2)]  
  4. hs是否包含count为-3的R对象?false 
  5. hs是否包含count为5的R对象?false 

说明:程序重写了R类的equals()和hashCode()方法,这两个方法都是根据R对象的count属性来判断。从运行结果可以看出,HashSet集合中有完全相同元素,这表明两个元素已经重复,但因为HashSet在添加它们时已经把它们添加到了不同地方,所以HashSet完全可以容纳两个相同元素。至于第一个count为-3的R对象,它保存在count为5的R对象对应的位置(地址)。当向HashSet中添加可变对象时,必须十分小心。如果修改HashSet集合中的对象,有可能导致该对象与集合中其他对象相等,从而导致HashSet无法准确访问该对象。

HashSet还有一个子类LinkedHashSet,LinkedHashSet集合也根据元素hashCode值来决定元素存储位置,但它同时使用链表维护元素的次序,即当遍历LinkedHashSet集合元素时,HashSet将会按元素的添加顺序来访问集合里的元素。

3、TreeSet类

TreeSet是SortedSet接口的唯一实现,TreeSet可以确保集合元素处于排序状态(元素是有序的)。

TreeSet提供的几个额外方法:

  1. Comparator comparttor(): 返回当前Set使用的Compara投入,或者返回null,表示以自然方式排序。  
  2.  
  3. Object first():返回集合中的第一个元素。  
  4.  
  5. Object last():返回集合中的最后一个元素。  
  6.  
  7. Objiect lower(Object e):返回集合中位于指定元素之前的元素(即小于指定元素的最大元素,参考元素可以不是TreeSet的元素)。  
  8.  
  9. Object higher(Object e):返回集合中位于指定元素之后的元素(即大于指定元素的最小元素,参考元素可以不需要TreeSet的元素)。  
  10.  
  11. SortedSet subSet(fromElement, toElement):返回此Set的子集,范围从fromElement(包含大于等于)到toElement(不包含小于)。  
  12.  
  13. SortedSet headSet(toElement):返回此Set的子集,由小于toElement的元素组成。  
  14.  
  15. SortedSet tailSet(fromElement):返回此Set的子集,由大于或等于fromElement的元素组成。 
  1. public class TestTreeSetCommon  
  2. {  
  3.     public static void main(String[] args)   
  4.     {  
  5.         TreeSet<Integer> nums = new TreeSet<Integer>();  
  6.         //向TreeSet中添加四个Integer对象  
  7.         nums.add(5);  
  8.         nums.add(2);  
  9.         nums.add(10);  
  10.         nums.add(-9);  
  11.         //输出集合元素,看到集合元素已经处于排序状态  
  12.         System.out.println(nums);  
  13.         //输出集合里的第一个元素  
  14.         System.out.println(nums.first());  
  15.         //输出集合里的最后一个元素  
  16.         System.out.println(nums.last());  
  17.         //返回小于4的子集,不包含4  
  18.         System.out.println(nums.headSet(4));  
  19.         //返回大于5的子集,如果Set中包含5,子集中还包含5  
  20.         System.out.println(nums.tailSet(5));  
  21.         //返回大于等于-3,小于4的子集。  
  22.         System.out.println(nums.subSet(-3 , 4));  
  23.     }  

说明:由运行结果可以看出,TreeSet并不是根据元素的插入顺序进行排序,而是根据元素实际值来进行排序。TreeSet采用红黑树的数据结构对元素进行排序.