集及其实现类
实现了Set接口的类HashSet
“基于散列表”的检测重复元素的策略:HashSet里的元素值同这个元素在Set里所存放的索引位置有个对应关系(散列函数),在HashSet里插入元素前,可根据这个元素值和对应关系,计算出这个元素在HashSet里的插入位置,如果在这个位置里(或位置周围)已经存在了待插入元素的值,则不能插入。
构造方法
HashSet()
HashSet(<E> c)
其他方法
boolean contains(Object o) 判断是否存在指定元素
例10.6 HashSet类的综合应用。
Set<String> set = newHashSet<String>();
set.add("One"); set.add("One");
System.out.println(set.size()); //输出元素个数为:1
set.add(“Two”); System.out.println(set.size()); // 元素个数:2
System.out.println(set.contains(“One”)); //true,包含元素“One”
第一类集合有着共同的特性:它们存储的对象都是一元的(线性的),只不过存储的方式和使用的数据结构不同,以Collection为基类--封装了线性表的插入、删除等基本操作。
List接口和Set接口都是Collection的子接口
实现List接口:基于线性链表来存放数据的,例如Vector
实现Set接口:它们不允许有重复的元素,例如HashSet。
在日常生活中,经常需要把复杂对象用索引形式管理的情况。
在Java中,专门建立以Hashtable为代表的“键-值”对类型对象,“键”--索引信息,而“值” –同索引值相对应的信息。
为什么要使用“键-值”对型的数据结构
原因:便于信息检索,提高在大数据量里检索信息的速度。
工作原理
(1)如果要从其中查询指定数据的话,不得不依次遍历这个数组,这样效率会很低。
(2)换一种思路:将10存入数组不是插入在第一个空闲空间里!
存在“索引冲突” 问题:对于散列函数,不同的“值”会得到相同的“键”,即不同的对象可能存放在同一个索引位置上。
解决方法
采用技术上的方法,例如设计出尽量降低冲突情况出现的散列函数,或者是指定冲突发生时的应对策略;
根据待存储的数据量,适当提高Hash表的容量--用加大空间的代价,来取冲突发生的低概率
“键-值”对的典范——Hashtable类
在Java的“键-值”对型集合类里,已经封装了用散列函数优化其中数据搜索效率以及处理Hash表里数据冲突的实现细节。其中Hashtable是 “键-值”对型集合类的典范。
构造方法
Hashtable()
Hashtable(int initialCapacity)
Hashtable(int initialCapacity, floatloadFactor)
Hashtable(<K,V> t)
使用泛型指定Hash表里键和值的类型,例如:
其它方法
V put(K key, V value):向Hashtable对象中插入“键-值”对
V get(Object key):根据key这个“键”从Hashtable对象中检索到 对应的“值”
例如,ht.put(newInteger(1),new String(“Tom”));
String str=ht.get(new Integer(1));
boolean containsKey(Object key)
判断“键”是否存在于Hashtable对象中。boolean containsValue(Object value)
判断“值” 是否存在于Hashtable中。例如,booleanflag=ht.containsKey(new Integer(2));
flag=ht.containsValue(“Rose”);
public boolean contains(Object value) 同containsValue()方法。
public void clear()
将此Hashtable清空,使其不包含任何键。
注意:通过ht.put(newInteger(3), new Integer(27));语句,重新设置了“键”为3的“值”27。如果针对同一个“键”设置了两次“值”,生效的是最后一次的动作。
总结:
第二类集合的共同特性就是它们存放的数据都是二元的,称其为“键-值”对,通过它们可以快速的根据一个关键字key来得到其所对应的值value,这里之所以称其为关键字就是因为它必须是唯一的,这样才能保证每次通过key所得到的value是固定的,即最近一次设置进去的那个值value。
枚举器与数据操作
枚举器是一个用来访问集合元素的工具,它不仅提供了可以用来访问集合的若干方法,更展示了解决访问对象时“对象类型不确定”难题的思路。
访问集合类的“不确定性”难题
Java中有诸多不同类型的Java集合类(比如Vector或List),程序员希望用同一类型的方式来访问其中的数据。
枚举器接口
java.util.Iterator(枚举器接口)封装“无差别访问集合对象”的方法。
相关方法
在每一个集合类(比如Vector或Hashtable等)里,都有一个iterator()方法,各集合对象可以通过该方法把遍历本类的控制权交给Iterator接口。
在Iterator的接口里,提供了boolean hasNext()方法,判断出是否可以通过枚举器来得到集合对象中的下一个元素。
在Iterator的接口里,提供了E next()方法,用来获取集合对象里的下一个元素,它返回的是一个泛型对象。
枚举器的使用。
Vector <Integer> v = new Vector <Integer>();
for(int i = 0;i<5;i++){
v.addElement(new Integer(i));
}
Iterator it = v.iterator();
while(it.hasNext()){
System.out.println(it.next().toString());
}
枚举器“分离”思想
“遍历不同种类的集合对象” 采用“分离”的设计思想;
把遍历这个业务动作同将要实施遍历操作的对象(比如集合)分离,在这个基础上,抽象出遍历不同集合对象的共性代码,并把这些功能代码封装到枚举器这个接口里,就可以用同一套代码,来遍历不同类型的集合;
正是由于枚举器分离了业务动作(枚举)和业务动作要操作的数据(集合),所以它才能以不变应万变。