迭代器( iterator)

——是访问集合元素的一种方式,迭代器从集合的第一个元素开始访问,直到所有元素被访问结束。并且,迭代器只能向前访问。

  • 优点:不要求事先准备好整个迭代过程中的所有元素,迭代器仅仅在迭代到某个元素时才计算该元素。在这之前和之后,元素可以不存在或者被销毁。这一大优点使迭代器特别适合用于遍历一些巨大的或是无限的集合。
  • 迭代器更大的功劳是:提供一个统一的访问集合的接口,只要是定义了__iter__()方法对象,就可以使用迭代器访问。
  • 迭代器有两个基本的方法:
  1. next()方法   : 返回迭代器的下一个元素
  2. __iter__方法 : 返回迭代器对象本身

使用迭代器

  • 使用内建函数iter(iterable)可以获取迭代器对象
>>> list = range(5)
>>> it = iter(list)
>>> it
<listiterator object at 0x01A63110>
  • 使用next()方法可以访问下一个元素
>>> it.next()
0
>>> it.next()
1
>>> it.next()
2
  • python处理迭代器越界是抛出StopIteration异常
>>> it.next()
3
>>> it.next
<method-wrapper 'next' of listiterator object at 0x01A63110>
>>> it.next()
4
>>> it.next()

Traceback (most recent call last):
File "<pyshell#27>", line 1, in <module>
it.next()
StopIteration
  • 使用迭代器进行遍历
>>>list = range(5)
>>>it = iter(list)try:
while True:
val = it.next()
print valexcept StopIteration:
pass

结果:

>>>
0
1
2
3
4

 

  • Python专门为for关键字做了迭代器的语法糖。

在for循环中,Python将自动调用工厂函数iter()获得迭代器,自动调用next()获取元素,还完成了检查StopIteration异常的工作

如下:

>>> a = (1, 2, 3, 4)
>>> for key in a:
print key
1
2
3
4

* 解析:首先python对关键字in后的对象调用iter函数迭代器,然后调用迭代器的next方法获得元素,直到抛出StopIteration异常。

  • 默认情况下,dict迭代的是key(for key in d);

   如果要迭代value,可以用for value in d.itervalues();

   如果要同时迭代key和value,可以用for k, v in d.iteritems()。

  • Python内置的enumerate函数可以把一个list变成索引-元素对,这样就可以在for循环中同时迭代索引和元素本身:
>>> for i, value in enumerate(['A', 'B', 'C']):
... print i, value
...
0 A
1 B
2 C
  • 内建的isinstance函数可以判断一个变量是不是字符串:
>>> x = 'abc'
>>> y = 123
>>> isinstance(x, str)
True
>>> isinstance(y, str)
False