java 集合平分

转载

mob64ca140a59b0 2024-09-14 07:09:11

文章标签 java 集合平分 System List java 文章分类 Java 后端开发

java集合大体可分为三类，分别是Set、List和Map，它们都继承了基类接口Collection,Collection接口定义了众多操作集合的基本方法，如下：

java 集合平分_java 集合平分

为了访问Collection集合，不得不去了解Iterator接口。该接口很简单，主要用于定义访问集合的方法，如下：

java 集合平分_java 集合平分_02

所以上述的三大类子集合必定都继承了上面2个接口。其中Set集合要求元素不重复，且内部无序，所以访问时只能根据元素值来访问；List内部为动态数组，支持有序，元素也可重复，所以往往有index；Map所代表的集合是具有Key-Value的映射关系的集合，如哈希表。

1.Set

1.1Set不可添加相同元素

import java.util.Collection;
import java.util.Iterator;
import java.util.HashSet;
public class TestSet{
	public static void main(String[] args){	
		Collection c1=new HashSet();
		Person p=new Person();
		c1.add(p);
		c1.add(p);
		System.out.println(c1);
		
		Collection c2=new HashSet();
		String str1=new String("123");
		String str2=new String("123");
		c2.add(str1);
		c2.add(str2);
		System.out.println(c2);		
		}
}
class Person{
	public Person(){}
	public Person(String name){this.name=name;}
        public String name;
}

输出：

[Person@c17164]
[123]

第一次添加了俩次p对象，集合不会重复添加，所以输出了[Person@c17164]，这很合理。但是第二次明明new了两个字符串，str1和str2的引用肯定是不同的，那为什么程序还是会认为是相同的元素呢。查找add(E e)的源码，找到了其中的关键部分，如下

public boolean add(E e) {
	return map.put(e, PRESENT)==null;
    }

 public V put(K key, V value) {
        if (key == null)
            return putForNullKey(value);
        int hash = hash(key.hashCode());
        int i = indexFor(hash, table.length);
        for (Entry<K,V> e = table[i]; e != null; e = e.next) {
            Object k;
            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
                V oldValue = e.value;
                e.value = value;
                e.recordAccess(this);
                return oldValue;
            }
        }

        modCount++;
        addEntry(hash, key, value, i);
        return null;
    }

这一句，

if (e.hash == hash && ((k = e.key) == key || key.equals(k)))

表明，当两个对象的哈希值相等并且对象的equals方法返回真时，则认为两个对象是相同的，并不会进行后面的addEntry操作，即不会添加至集合。

这也就难怪String str1=new String("123")和String str2=new String("123");被认为是同一个对象了，因为String在做equals的时候恰好很特殊，只要值相等，则euqals就返回真。

为了测试源码是否真的是这么执行的，改写程序如下：

import java.util.Collection;
import java.util.Iterator;
import java.util.HashSet;
public class TestSet{
	public static void main(String[] args){		
		Collection c1=new HashSet();
		c1.add(new A());
		c1.add(new A());
		c1.add(new B());
		c1.add(new B());
		c1.add(new C());
		c1.add(new C());	
		System.out.println(c1);
	}	
}
class A{
	@Override
	public boolean equals(Object obj){
		return true;
	}
	@Override
	public int hashCode(){
		return 1;
	}
}
class B{
	@Override
	public int hashCode(){
		return 1;
	}
}
class C{
	@Override
	public boolean equals(Object obj){
		return true;
	}
}

输出：

[B@1, B@1, A@1, C@c17164, C@de6ced]

可以看到，B和C的对象都没有被集合认为是同一个对象，而A类中重写的哈希值和equals永远相等，导致A类new出的匿名对象也是相等的，故只添加了一个。

1.2Set不可修改元素的值

import java.util.Collection;
import java.util.Iterator;
import java.util.HashSet;
public class TestSet{
	public static void main(String[] args){
		
		Collection coll=new HashSet();
		coll.add(new Person("f"));
		coll.add(new Person("l"));
		coll.add(new Person("y"));
		System.out.println(coll);//a
		
		Iterator it=coll.iterator();//b
		while(it.hasNext()){
			Person p=(Person)it.next();
			if(p.name.equals("f")){
				p=new Person();//c
			}
		}
		Iterator it1=coll.iterator();//d
	        while(it1.hasNext()){
			Person p=(Person)it1.next();
			System.out.println(p.name);
		}
		System.out.println(coll);
	}
}
class Person{
	public Person(){}
	public Person(String name){this.name=name;}
        public String name;
}

输出：

[Person@1fb8ee3, Person@c17164, Person@61de33]
 l
 f
 y
 [Person@1fb8ee3, Person@c17164,  Person@61de33]

代码输出表明，HashSet集合的元素并不是有序的，另外在代码c处取出了元素后，为该元素重新赋值，而后输出发现集合并没有改变，这说明iterator迭代器在提供next的方法里应该是类似于copy的技术，目的就是防止在遍历set集合的时候元素被改变。

2.List

List作为Collection的子接口，自然可以调用父接口的基本方法，但由于List集合元素是有序的，所以List接口在父接口的基础上又增加了些方法。这些方法的作用与类父接口类似，只是都会增加一个index参数做为索引。

List中最常用的就是ArrayList，它在Vector的基础上做了许多改进，下面代码将展示List的基本操作用法：

import java.util.List;
import java.util.ArrayList;
import java.util.ListIterator;
public class TestList{
	public static void main(String[] args){
        //向list中添加不同类型的元素，会自动装箱
	List list=new ArrayList();
	list.add(1);
	list.add("123");
	list.add(3.14f);
	//列表元素：[1, 123, 3.14]
	System.out.println("列表元素："+list);
		
	  //清除列表
	  list.clear();
	  
	  list.add("我");
	  list.add("们");
	  list.add("交");
	  list.add("个");
	  list.add("朋");
	  list.add("友");
	  list.add("吧");
	  
	  //列表元素：[我, 们, 交, 个, 朋, 友, 吧]
	  System.out.println("列表元素："+list);
	  
	  List sub1=list.subList(0,list.size()/2);
	  //子列表元素：[我, 们, 交]
	  System.out.println("子列表元素："+sub1);

	  //从list中删除sub
	  sub1.removeAll(list);
	  
	  //列表元素：[个, 朋, 友, 吧]
	  System.out.println("列表元素："+list);
	  
	  //添加至头
	  List sub2=new ArrayList();
	  sub2.add("我");
	  sub2.add("们");
	  sub2.add("交");
	  System.out.println("子列表元素："+sub2);
	  //在list中添加sub2
	  list.addAll(0,sub2);
	  System.out.println("列表元素："+list);
	  
	  //遍历操作
	  ListIterator iter=list.listIterator();
	  System.out.println("--正向遍历--");
	  while(iter.hasNext()){
	  	System.out.println(iter.next());
	  }
	  System.out.println("--反向遍历--");
	  while(iter.hasPrevious()){
	  	System.out.println(iter.previous());
	  }

	}

}

输出：

列表元素：[1, 123, 3.14]
 列表元素：[我, 们, 交, 个, 朋, 友, 吧]
 子列表元素：[我, 们, 交]
 列表元素：[个, 朋, 友, 吧]
 子列表元素：[我, 们, 交]
 列表元素：[我, 们, 交, 个, 朋, 友, 吧]
 --正向遍历--

List就像是一个动态且元素类型可不一的数组，它不仅具有iterator迭代器，而且还有listIterator，后者就像数组一样，支持正向和反向遍历。

3.Map

Map是具有映射关系的集合，key做为主键，可以索引到唯一的value，key和value都可以是对象。如果单独取出Map里的所有值的话，Map看起来就像是Set，而又由于它较之Set又具有索引功能，所以又似乎有些List的影子。实际上，Map的key必须实现equals和hashCode方法，这也就解释了为什么可以将一个对象的引用做为key了(实际上是计算这个对象的hashCode做为主键)，因此不能将同一个对象的引用存入某一个Map中。HashSet实现了Set接口，ArrayList实现了List接口，那么单从命名上就能得知，HashMap肯定实现了Map接口，Map接口的功能如下，

java 集合平分_java_03

在HashSet和ArrayList都有一个访问迭代器的方法iterator(),在Set接口中却没有，毕竟Set是key-value组合，取而代之的是一个keySet()方法，用以返回一个实现了Set接口的对象，从而又可以进行iterator的操作。

基本操作如下，

import java.util.HashMap;
import java.util.Iterator;
public class TestMap{
	public static void main(String[] args){	
		HashMap hash=new HashMap();
		hash.put("1","我");
		hash.put("2","们");
		//主键可为null，但只能有一个null值的主键
		hash.put(null,null);
		//值可以为null，可以有很多个值为null
		hash.put("3",null);
		hash.put("4",null);
		
		System.out.println("直接遍历:"+hash);
		System.out.println("----keySey遍历----:");
		for(Object key :hash.keySet()){
	           System.out.println("key:"+key+" value:"+hash.get(key));
	         }
	         System.out.println("----iterator遍历----:");
	         Iterator iter=hash.keySet().iterator();
	         while(iter.hasNext()){
	  	  String key=(String)iter.next();
		  System.out.println("key:"+key+" value:"+hash.get(key));
	         }
                }
}

输出：

直接遍历:{3=null, null=null, 2=们, 1=我, 4=null}
----keySey遍历----:
key:3 value:null
key:null value:null
key:2 value:们
key:1 value:我
key:4 value:null
----iterator遍历----:
key:3 value:null
key:null value:null
key:2 value:们
key:1 value:我
key:4 value:null

HashMap可以有空key，但是只能有一个，，这符合唯一主键的原则，并且若主键重复了，则会覆盖之前的相同主键。而值却没有限制，有多少个null都可以。此外，在使用HashMap的时候还需要注意下面两点：

1.HashMap是非线程安全的，而Hashtable是线程安全的。

对于各种集合的各种操作，其实可以依赖于Collections类，该类提供了许多静态操作集合的方法，其中就可以将一个普通集合封装为线程安全的集合，如下

Collection c=Collections.synchronized(new ArrayList());

2.了解HashMap的性能

HashMap利用每一个key的哈希值，去为value找寻存储位置。这个存储位置往往被称为“桶”，当哈希值唯一时，那么一个桶中就只有一个对象，这时情况最理想，然而若非正常情况下(比如重写hashCode强制返回相等)，那么一个桶能就有放多个对象，这时性能最差。

上面说道,HashMap与Set、List在某方面都很相似，做为一个强大的集合，它的内部自然也有会动态开辟内存的操作。所有就有了下面几个参数，

capacity(容量)：在初始化HashMap时将会有一个默认值(好象是10吧)，随着集合的大小也会自身调整。

size(元素个数)：有多少个元素size就是多少。

load factor(负载因子)：load factor=size/capacity，取值0~1。

当负载因子很大时，如有90个元素，而集合的容量为100，因子就是0.9，这样情况非常不利于查询操作，因为put和get操作会遍历大量的元素，时间复杂度无形就会增加，但在内存开销上确实是比较节省的，因为集合不会反复的创建，因为每一次扩充集合的操作，就意味着要将原始元素重新插入到新的集合中去，性能开销是很大的。

而当负载因子很小时，查询效率将会非常高（因为遍历少），但是却在内部进行了许多次开辟内存的操作。

因此，在系统中，要根据实际需求正确把握HashMap的用法，如一开始建立集合的时候就知道这个集合非常大，那么就有必要在初始化的时候就指明capacity，不应该使用默认值，这样效率能高点；相反只有少量集合元素时，不应该在创建的时候指定很大的capacity，这明显是在浪费内存。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。