一.描述:
1. 工作中,常常遇到这样的要求: 将列表里符合(或不符合)某条件的元素删除, 如:
有列表list = [ "a", "b", "c", "d" ], 删除其中的"a", "b", "c"
2. 关键在于遍历: 建议从尾部开始, 取代常规的从头部开始
此处只考虑 ArrayList;
二.推断:
当 list 删除元素 "a" 之后, 变为 [ "b", "c", "d" ], 猜想, list 内部数组发生变化(内存的变化):
list(1) --> list(0),
list(2) --> list(1),
list(3) --> list(2),
list(4)删除
list(n):表示list内部数组的元素;
--> :表示复制到,或移动到
三.证明:
查看源码java.util.ArrayList.remove()
1. public E remove(int
2. RangeCheck(index);
3.
4. modCount++;
5. E oldValue = (E) elementData[index];
6.
7. int numMoved = size - index - 1;
8. if (numMoved > 0)
9. 1, elementData, index, numMoved);
10. null; // Let gc do its work
11.
12. return
13. }
里面的System.arraycopy(),正是将 欲删除的元素 后面的 元素, 依次向前移动一个位置(内存), 最后再将
最后一个元素删除(值空, 删除由GC处理).
与预想的吻合.
四.分析:
1.从list头部开始遍历:
列表元素 删除元素 操作后列表元素 内存移动次数
----------------------------------------------------------------------------------------------------
[ "a", "b", "c", "d" ] "a" [ "b", "c", "d" ] 3
[ "b", "c", "d" ] "b" [ "c", "d" ] 2
[ "c", "d" ] "c" [ "d" ] 1
----------------------------------------------------------------------------------------------------
合计 6
2.从list尾部开始遍历:
列表元素 删除元素 操作后列表元素 内存移动次数
----------------------------------------------------------------------------------------------------
[ "a", "b", "c", "d" ] "c" [ "a", "b", "d" ] 1
[ "a", "b", "d" ] "b" [ "a", "d" ] 1
[ "a", "d" ] "a" [ "d" ] 1
----------------------------------------------------------------------------------------------------
合计 3
3.综上两点, 从list尾部开始遍历 可以减少底层的操作次数, 提高程序执行得效率.
五.实践:
此例, 删除了99999个元素(共100000), 免得有人投机取巧用clear,当然用clear是最快的,因为不涉及内存移动.
1. import
2. import
3.
4. public class
5.
6. private static int MAX = 100000;
7.
8. public static void
9. "容量:"
10. removeFromF();
11. removeFromL();
12. }
13.
14. private static void
15.
16. List data = initData();
17.
18. long
19. for (int i = 0; i < data.size() - 2; i++) {
20. data.remove(i);
21. }
22. long
23.
24. "从前往后remove(留下最后一个):" + (l1 - l0) + "MS");
25. }
26.
27. private static void
28.
29. List data = initData();
30.
31. long
32. for (int i = data.size() - 2; i >= 0; i--) {
33. data.remove(i);
34. }
35. long
36.
37. "从后往前remove(留下最后一个):" + (l1 - l0) + "MS");
38. }
39.
40. private static
41. new
42. for (int i = 0; i < MAX; i++) {
43. data.add(i);
44. }
45. return
46. }
47. }
结果:
- 容量:100000
- 从前往后remove(留下最后一个):3596MS
- 从后往前remove(留下最后一个):6MS
这耗时, 不是一个数量级的,随着数据增大, 差距越明显.
六.番外:
随便记一下:
1. public E remove(int
2. RangeCheck(index);
3.
4. modCount++;
5. E oldValue = (E) elementData[index];
6.
7. int numMoved = size - index - 1;
8. if (numMoved > 0)
9. 1, elementData, index, numMoved);
10. null; // Let gc do its work
11.
12. return
13. }
当做其删除操作时, list 内部数组的大小是没有变化的(假如此时GC尚未工作), 变化的只是size, 而在外部我们能得到的
是size, 最多也只能得到 0 ~ size-1 的元素.
七:扩展:
手动删除excel列时,也建议 从后面开始删. 源码没有看过,是根据现象猜测的.
举例:
excel2007 (2003没试过,猜想应该是一样的)
从A ~ BB列, 20000行数据, 删除其中的A列 和 BB列, 看看哪个快?
有兴趣可试试....