Java集合框架总结：Set接口的使用2

转载

zqaha 2012-10-16 22:16:34 博主文章分类：java博文转载

文章标签 java set 文章分类 Java 后端开发

接上一篇博文：

hash算法的功能：

它能保证通过一个对象快速查找到另一个对象。hash算法的价值在于速度，它可以保证查询得到快速执行。

当需要查询集合中某个元素时，hash算法可以直接根据该元素的值得到该元素保存位置，从而可以让程序快速找到该元素。

当从HashSet中访问元素时，HashSet先计算该元素的hashCode值（也就是调用该对象的hashCode（））方法的返回值），然后直接到该hashCode对应的位置去取出该元素。

即也是快速的原因。HashSet中每个能存储元素的“曹位（slot）”通常称为“桶（bucket）”，如果多个元素的hashCode相同，但它们通过equals（）方法比较返回false，就需要一个“桶”里放多个元素，从而导致性能下降。

继续深入研究HashSet：

当向HashSet中添加一个可变对象后，并且后面程序修改了该可变对象的属性，可能导致它与集合中其他元素相同，这就可能导致HashSet中包含两个相同的对象。

看下面程序：

class R  
{  
    int count;  
    public R(int count)  
    {  
        this.count = count;  
    }  
    public String toString()  
    {  
        return "R(count属性:" + count + ")";  
    }  
    public boolean equals(Object obj)  
    {  
        if (obj instanceof R)  
        {  
            R r = (R)obj;  
            if (r.count == this.count)  
            {  
                return true;  
            }  
        }  
        return false;  
    }  
    public int hashCode()  
    {  
        return this.count;  
    }  
}  
public class TestHashSet2  
{  
    public static void main(String[] args)   
    {  
        HashSet<R> hs = new HashSet<R>();  
        hs.add(new R(5));  
        hs.add(new R(-3));  
        hs.add(new R(9));  
        hs.add(new R(-2));  
        //打印TreeSet集合，集合元素是有序排列的  
        System.out.println(hs);  
        //取出第一个元素  
        Iterator<R> it = hs.iterator();  
        R first = (R)it.next();     //first指向集合的第一个元素  
        //为第一个元素的count属性赋值  
        first.count = -3;           //first指向的元素值发生改变，地址并没有改变，大家可以试着用Java内存分配机制（栈和堆)思考下。  
        //再次输出count将看到HashSet里的元素处于无序状态  
        System.out.println(hs);  
        hs.remove(new R(-3));  
        System.out.println(hs);  
        //输出false  
        System.out.println("hs是否包含count为-3的R对象？" + hs.contains(new R(-3)));  
        //输出false  
        System.out.println("hs是否包含count为5的R对象？" + hs.contains(new R(5)));  
 
    }  
}

程序运行结果：

[R(count属性:5), R(count属性:9), R(count属性:-3), R(count属性:-2)]  
[R(count属性:-3), R(count属性:9), R(count属性:-3), R(count属性:-2)]  
[R(count属性:-3), R(count属性:9), R(count属性:-2)]  
hs是否包含count为-3的R对象？false 
hs是否包含count为5的R对象？false

说明：程序重写了R类的equals（）和hashCode（）方法，这两个方法都是根据R对象的count属性来判断。从运行结果可以看出，HashSet集合中有完全相同元素，这表明两个元素已经重复，但因为HashSet在添加它们时已经把它们添加到了不同地方，所以HashSet完全可以容纳两个相同元素。至于第一个count为-3的R对象，它保存在count为5的R对象对应的位置（地址）。当向HashSet中添加可变对象时，必须十分小心。如果修改HashSet集合中的对象，有可能导致该对象与集合中其他对象相等，从而导致HashSet无法准确访问该对象。

HashSet还有一个子类LinkedHashSet，LinkedHashSet集合也根据元素hashCode值来决定元素存储位置，但它同时使用链表维护元素的次序，即当遍历LinkedHashSet集合元素时，HashSet将会按元素的添加顺序来访问集合里的元素。

3、TreeSet类

TreeSet是SortedSet接口的唯一实现，TreeSet可以确保集合元素处于排序状态（元素是有序的）。

TreeSet提供的几个额外方法：

Comparator comparttor()： 返回当前Set使用的Compara投入，或者返回null，表示以自然方式排序。  
 
Object first()：返回集合中的第一个元素。  
 
Object last()：返回集合中的最后一个元素。  
 
Objiect lower(Object e)：返回集合中位于指定元素之前的元素（即小于指定元素的最大元素，参考元素可以不是TreeSet的元素）。  
 
Object higher(Object e)：返回集合中位于指定元素之后的元素（即大于指定元素的最小元素，参考元素可以不需要TreeSet的元素）。  
 
SortedSet subSet(fromElement， toElement)：返回此Set的子集，范围从fromElement(包含大于等于）到toElement(不包含小于）。  
 
SortedSet headSet(toElement)：返回此Set的子集，由小于toElement的元素组成。  
 
SortedSet tailSet(fromElement)：返回此Set的子集，由大于或等于fromElement的元素组成。

public class TestTreeSetCommon  
{  
    public static void main(String[] args)   
    {  
        TreeSet<Integer> nums = new TreeSet<Integer>();  
        //向TreeSet中添加四个Integer对象  
        nums.add(5);  
        nums.add(2);  
        nums.add(10);  
        nums.add(-9);  
        //输出集合元素，看到集合元素已经处于排序状态  
        System.out.println(nums);  
        //输出集合里的第一个元素  
        System.out.println(nums.first());  
        //输出集合里的最后一个元素  
        System.out.println(nums.last());  
        //返回小于4的子集，不包含4  
        System.out.println(nums.headSet(4));  
        //返回大于5的子集，如果Set中包含5，子集中还包含5  
        System.out.println(nums.tailSet(5));  
        //返回大于等于-3，小于4的子集。  
        System.out.println(nums.subSet(-3 , 4));  
    }  
}