前面已经学习完了List部分的源码,主要是ArrayList和LinkedList两部分内容,这一节主要总结下List部分的内容。

List概括

        先来回顾一下List在Collection中的的框架图:

java那种list适合大数据_List

    从图中我们可以看出:

        1. List是一个接口,它继承与Collection接口,代表有序的队列。

        2. AbstractList是一个抽象类,它继承与AbstractCollection。AbstractList实现了List接口中除了size()、get(int location)之外的方法。

        3. AbstractSequentialList是一个抽象类,它继承与AbstrctList。AbstractSequentialList实现了“链表中,根据index索引值操作链表的全部方法”。

        4. ArrayList、LinkedList、Vector和Stack是List的四个实现类,其中Vector是基于JDK1.0,虽然实现了同步,但是效率低,已经不用了,Stack继承与Vector,所以不再赘述。

        5. LinkedList是个双向链表,它同样可以被当作栈、队列或双端队列来使用。

 

ArrayList和LinkedList区别

    我们知道,通常情况下,ArrayList和LinkedList的区别有以下几点:

 

        1. ArrayList是实现了基于动态数组的数据结构,而LinkedList是基于链表的数据结构;

        2. 对于随机访问get和set,ArrayList要优于LinkedList,因为LinkedList要移动指针;

       3. 对于添加和删除操作add和remove,一般大家都会说LinkedList要比ArrayList快,因为ArrayList要移动数据。但是实际情况并非这样,对于添加或删除,LinkedList和ArrayList并不能明确说明谁快谁慢,下面会详细分析。

        我们结合之前分析的源码,来看看为什么是这样的:

        ArrayList中的随机访问、添加和删除部分源码如下:

1. //获取index位置的元素值
2. public E get(int index) {
3. rangeCheck(index); //首先判断index的范围是否合法
4.  
5. return elementData(index);
6. }
7.  
8. //将index位置的值设为element,并返回原来的值
9. public E set(int index, E element) {
10. rangeCheck(index);
11.  
12. E oldValue = elementData(index);
13. elementData[index] = element;
14. return oldValue;
15. }
16.  
17. //将element添加到ArrayList的指定位置
18. public void add(int index, E element) {
19.     rangeCheckForAdd(index);
20.  
21.     ensureCapacityInternal(size + 1);  // Increments modCount!!
22.     //将index以及index之后的数据复制到index+1的位置往后,即从index开始向后挪了一位
23.     System.arraycopy(elementData, index, elementData, index + 1,
24.                      size - index); 
25.     elementData[index] = element; //然后在index处插入element
26.     size++;
27. }
28.  
29. //删除ArrayList指定位置的元素
30. public E remove(int index) {
31.     rangeCheck(index);
32.  
33.     modCount++;
34.     E oldValue = elementData(index);
35.  
36.     int numMoved = size - index - 1;
37.     if (numMoved > 0)
38.         //向左挪一位,index位置原来的数据已经被覆盖了
39.         System.arraycopy(elementData, index+1, elementData, index,
40.                          numMoved);
41.     //多出来的最后一位删掉
42.     elementData[--size] = null; // clear to let GC do its work
43.  
44.     return oldValue;
45. }

    LinkedList中的随机访问、添加和删除部分源码如下:

1. //获得第index个节点的值
2. public E get(int index) {
3. checkElementIndex(index);
4. return node(index).item;
5. }
6.  
7. //设置第index元素的值
8. public E set(int index, E element) {
9. checkElementIndex(index);
10. Node<E> x = node(index);
11. E oldVal = x.item;
12. x.item = element;
13. return oldVal;
14. }
15.  
16. //在index个节点之前添加新的节点
17. public void add(int index, E element) {
18. checkPositionIndex(index);
19.  
20. if (index == size)
21. linkLast(element);
22. else
23. linkBefore(element, node(index));
24. }
25.  
26. //删除第index个节点
27. public E remove(int index) {
28. checkElementIndex(index);
29. return unlink(node(index));
30. }
31.  
32. //定位index处的节点
33. Node<E> node(int index) {
34. // assert isElementIndex(index);
35. //index<size/2时,从头开始找
36. if (index < (size >> 1)) {
37. Node<E> x = first;
38. for (int i = 0; i < index; i++)
39. x = x.next;
40. return x;
41. } else { //index>=size/2时,从尾开始找
42. Node<E> x = last;
43. for (int i = size - 1; i > index; i--)
44. x = x.prev;
45. return x;
46. }
47. }

        从源码可以看出,ArrayList想要get(int index)元素时,直接返回index位置上的元素,而LinkedList需要通过for循环进行查找,虽然LinkedList已经在查找方法上做了优化,比如index < size / 2,则从左边开始查找,反之从右边开始查找,但是还是比ArrayList要慢。这点是毋庸置疑的。
        ArrayList想要在指定位置插入或删除元素时,主要耗时的是System.arraycopy动作,会移动index后面所有的元素;LinkedList主耗时的是要先通过for循环找到index,然后直接插入或删除。这就导致了两者并非一定谁快谁慢,下面通过一个测试程序来测试一下两者插入的速度:

 

1. import java.util.ArrayList; 
2. import java.util.Collections; 
3. import java.util.LinkedList; 
4. import java.util.List; 
5. /*
6. * @description 测试ArrayList和LinkedList插入的效率
7. * @eson_15 
8. */
9. public class ArrayOrLinked { 
10. static List<Integer> array=new ArrayList<Integer>(); 
11. static List<Integer> linked=new LinkedList<Integer>(); 
12.  
13. public static void main(String[] args) { 
14.  
15. //首先分别给两者插入10000条数据
16. for(int i=0;i<10000;i++){ 
17. array.add(i); 
18. linked.add(i); 
19. } 
20. //获得两者随机访问的时间
21. System.out.println("array time:"+getTime(array)); 
22. System.out.println("linked time:"+getTime(linked)); 
23. //获得两者插入数据的时间
24. System.out.println("array insert time:"+insertTime(array)); 
25. System.out.println("linked insert time:"+insertTime(linked)); 
26.  
27. } 
28. public static long getTime(List<Integer> list){ 
29. long time=System.currentTimeMillis(); 
30. for(int i = 0; i < 10000; i++){ 
31. int index = Collections.binarySearch(list, list.get(i)); 
32. if(index != i){ 
33. System.out.println("ERROR!"); 
34. } 
35. } 
36. return System.currentTimeMillis()-time; 
37. } 
38.  
39. //插入数据
40. public static long insertTime(List<Integer> list){ 
41. /*
42. * 插入的数据量和插入的位置是决定两者性能的主要方面,
43. * 我们可以通过修改这两个数据,来测试两者的性能
44. */
45. long num = 10000; //表示要插入的数据量
46. int index = 1000; //表示从哪个位置插入
47. long time=System.currentTimeMillis(); 
48. for(int i = 1; i < num; i++){ 
49. list.add(index, i); 
50. } 
51. return System.currentTimeMillis()-time; 
52.  
53. } 
54.  
55. }

        主要有两个因素决定他们的效率,插入的数据量和插入的位置。我们可以在程序里改变这两个因素来测试它们的效率。

        当数据量较小时,测试程序中,大约小于30的时候,两者效率差不多,没有显著区别;当数据量较大时,大约在容量的1/10处开始,LinkedList的效率就开始没有ArrayList效率高了,特别到一半以及后半的位置插入时,LinkedList效率明显要低于ArrayList,而且数据量越大,越明显。比如我测试了一种情况,在index=1000的位置(容量的1/10)插入10000条数据和在index=5000的位置以及在index=9000的位置插入10000条数据的运行时间如下:

1. 在index=1000出插入结果:
2. array time:4
3. linked time:240
4. array insert time:20
5. linked insert time:18
6.  
7. 在index=5000处插入结果:
8. array time:4
9. linked time:229
10. array insert time:13
11. linked insert time:90
12.  
13. 在index=9000处插入结果:
14. array time:4
15. linked time:237
16. array insert time:7
17. linked insert time:92

        从运行结果看,LinkedList的效率是越来越差。

        所以当插入的数据量很小时,两者区别不太大,当插入的数据量大时,大约在容量的1/10之前,LinkedList会优于ArrayList,在其后就劣与ArrayList,且越靠近后面越差。所以个人觉得,一般首选用ArrayList,由于LinkedList可以实现栈、队列以及双端队列等数据结构,所以当特定需要时候,使用LinkedList,当然咯,数据量小的时候,两者差不多,视具体情况去选择使用;当数据量大的时候,如果只需要在靠前的部分插入或删除数据,那也可以选用LinkedList,反之选择ArrayList反而效率更高