集及其实现类

实现了Set接口的类HashSet

“基于散列表”的检测重复元素的策略:HashSet里的元素值同这个元素在Set里所存放的索引位置有个对应关系(散列函数),在HashSet里插入元素前,可根据这个元素值和对应关系,计算出这个元素在HashSet里的插入位置,如果在这个位置里(或位置周围)已经存在了待插入元素的值,则不能插入。 

构造方法

HashSet()
HashSet(<E> c)
其他方法
boolean contains(Object o) 判断是否存在指定元素
例10.6 HashSet类的综合应用。
Set<String> set = newHashSet<String>();      
set.add("One");         set.add("One");
System.out.println(set.size());     //输出元素个数为:1     
set.add(“Two”);   System.out.println(set.size());   // 元素个数:2       
System.out.println(set.contains(“One”));     //true,包含元素“One”

第一类集合有着共同的特性:它们存储的对象都是一元的(线性的),只不过存储的方式和使用的数据结构不同,以Collection为基类--封装了线性表的插入、删除等基本操作。

List接口和Set接口都是Collection的子接口                          

     实现List接口:基于线性链表来存放数据的,例如Vector

                              

     实现Set接口:它们不允许有重复的元素,例如HashSet。

在日常生活中,经常需要把复杂对象用索引形式管理的情况。

在Java中,专门建立以Hashtable为代表的“键-值”对类型对象,“键”--索引信息,而“值” –同索引值相对应的信息。

为什么要使用“键-值”对型的数据结构

原因:便于信息检索,提高在大数据量里检索信息的速度。

工作原理

 

(1)如果要从其中查询指定数据的话,不得不依次遍历这个数组,这样效率会很低。

(2)换一种思路:将10存入数组不是插入在第一个空闲空间里!

存在“索引冲突” 问题:对于散列函数,不同的“值”会得到相同的“键”,即不同的对象可能存放在同一个索引位置上。

解决方法

采用技术上的方法,例如设计出尽量降低冲突情况出现的散列函数,或者是指定冲突发生时的应对策略;

根据待存储的数据量,适当提高Hash表的容量--用加大空间的代价,来取冲突发生的低概率

“键-值”对的典范——Hashtable类
在Java的“键-值”对型集合类里,已经封装了用散列函数优化其中数据搜索效率以及处理Hash表里数据冲突的实现细节。其中Hashtable是 “键-值”对型集合类的典范。

构造方法

Hashtable()
Hashtable(int initialCapacity)
Hashtable(int initialCapacity, floatloadFactor)
Hashtable(<K,V> t)
 使用泛型指定Hash表里键和值的类型,例如: 
其它方法
V put(K key, V value):向Hashtable对象中插入“键-值”对
V get(Object key):根据key这个“键”从Hashtable对象中检索到 对应的“值”
例如,ht.put(newInteger(1),new String(“Tom”));
          String str=ht.get(new Integer(1));
boolean containsKey(Object key)
 判断“键”是否存在于Hashtable对象中。boolean containsValue(Object value)
 判断“值” 是否存在于Hashtable中。例如,booleanflag=ht.containsKey(new Integer(2));
          flag=ht.containsValue(“Rose”);
public boolean contains(Object value) 同containsValue()方法。
public void clear()
 将此Hashtable清空,使其不包含任何键。

注意:通过ht.put(newInteger(3), new Integer(27));语句,重新设置了“键”为3的“值”27。如果针对同一个“键”设置了两次“值”,生效的是最后一次的动作。

总结:

     第二类集合的共同特性就是它们存放的数据都是二元的,称其为“键-值”对,通过它们可以快速的根据一个关键字key来得到其所对应的值value,这里之所以称其为关键字就是因为它必须是唯一的,这样才能保证每次通过key所得到的value是固定的,即最近一次设置进去的那个值value。

枚举器与数据操作

枚举器是一个用来访问集合元素的工具,它不仅提供了可以用来访问集合的若干方法,更展示了解决访问对象时“对象类型不确定”难题的思路。

  访问集合类的“不确定性”难题

     Java中有诸多不同类型的Java集合类(比如Vector或List),程序员希望用同一类型的方式来访问其中的数据。

  枚举器接口

     java.util.Iterator(枚举器接口)封装“无差别访问集合对象”的方法。

相关方法

在每一个集合类(比如Vector或Hashtable等)里,都有一个iterator()方法,各集合对象可以通过该方法把遍历本类的控制权交给Iterator接口。

在Iterator的接口里,提供了boolean hasNext()方法,判断出是否可以通过枚举器来得到集合对象中的下一个元素。

在Iterator的接口里,提供了E next()方法,用来获取集合对象里的下一个元素,它返回的是一个泛型对象。

枚举器的使用。

Vector <Integer> v = new Vector <Integer>();
     for(int i = 0;i<5;i++){
           v.addElement(new Integer(i));
     }
     Iterator it = v.iterator();
     while(it.hasNext()){
           System.out.println(it.next().toString());
     }

枚举器“分离”思想

“遍历不同种类的集合对象” 采用“分离”的设计思想;

把遍历这个业务动作同将要实施遍历操作的对象(比如集合)分离,在这个基础上,抽象出遍历不同集合对象的共性代码,并把这些功能代码封装到枚举器这个接口里,就可以用同一套代码,来遍历不同类型的集合;

正是由于枚举器分离了业务动作(枚举)和业务动作要操作的数据(集合),所以它才能以不变应万变。