迭代器是可以迭代的对象。 在本教程中,您将了解迭代器的工作原理,以及如何使用​​__iter__​​​和​​__next__​​方法构建自己的迭代器。

迭代器在Python中无处不在。 它们优雅地实现在循环,推导,生成器等中,但隐藏在明显的视觉中。

Python中的迭代器只是一个可以迭代的对象。一个将一次返回数据的对象或一个元素。

从技术上讲,Python迭代器对象必须实现两个特殊的方法​​__iter__()​​​和​​__next__()​​,统称为迭代器协议。

如果我们从中获取一个迭代器,那么一个对象被称为​​iterable​​。 大多数Python中的内置容器是列表,元组,字符串等都是可迭代的。

​iter()​​​函数(这又调用​​__iter__()​​方法)返回一个迭代器。

通过Python中的迭代器迭代

使用​​next()​​​函数来手动遍历迭代器的所有项目。当到达结束,没有更多的数据要返回时,它将会引发​​StopIteration​​。 以下是一个例子。

# define a list
my_list = [4, 7, 0, 3]

# get an iterator using iter()
my_iter = iter(my_list)

## iterate through it using next()

#prints 4
print(next(my_iter))

#prints 7
print(next(my_iter))

## next(obj) is same as obj.__next__()

#prints 0
print(my_iter.__next__())

#prints 3
print(my_iter.__next__())

## This will raise error, no items left
next(my_iter)

  更优雅的自动迭代方式是使用​​for​​​循环。 使用​​for​​循环可以迭代任何可以返回迭代器的对象,例如列表,字符串,文件等。

>>> for element in my_list:
... print(element)
...


3

  

循环如何实际工作?

在上面的例子中看到的,​​for​​循环能够自动通过列表迭代。

事实上,​​for​​​循环可以迭代任何可迭代对象。我们来仔细看一下在Python中是如何实现​​for​​循环的。

for element in iterable:
# do something with element

  实际上它是以类似下面的方式来实现的 -

# create an iterator object from that iterable
iter_obj = iter(iterable)

# infinite loop
while True:
try:
# get the next item
element = next(iter_obj)
# do something with element
except StopIteration:
# if StopIteration is raised, break from loop
break

  

所以在​​for​​​的内部,​​for​​​循环通过在可迭代的对象上调用​​iter()​​​来创建一个迭代器对象​​iter_obj​​。

有意思的是,这个​​for​​循环实际上是一个无限循环~..~。

在循环中,它调用​​next()​​​来获取下一个元素,并使用该值执行​​for​​​循环的主体。 在所有对象耗尽后,引发​​StopIteration​​异常,内部被捕获从而结束循环。请注意,任何其他类型的异常都将正常通过。

在​​Python​​中构建自己的Iterator

构建迭代器在Python中很容易。只需要实现​​__iter__()​​​和​​__next__()​​方法。

​__iter__()​​方法返回迭代器对象本身。如果需要,可以执行一些初始化。

​__next__()​​​方法必须返回序列中的下一个项目(数据对象)。 在到达结束后,并在随后的调用中它必须引发​​StopIteration​​异常。

在这里,我们展示一个例子,在每次迭代中给出下一个​​2​​的几次方。 次幂指数从零开始到用户设定的数字。

class PowTwo:
"""Class to implement an iterator
of powers of two"""

def __init__(self, max = 0):
self.max = max

def __iter__(self):
self.n = 0
return self

def __next__(self):
if self.n <= self.max:
result = 2 ** self.n
self.n += 1
return result
else:
raise StopIteration

  现在可以创建一个迭代器,并通过它迭代如下 -

>>> a = PowTwo(4)
>>> i = iter(a)
>>> next(i)

>>> next(i)

>>> next(i)

>>> next(i)

>>> next(i)

>>> next(i)
Traceback (most recent call last):
...
StopIteration

  也可以使用​​for​​循环迭代那些迭代器类。

>>> for i in PowTwo(5):
... print(i)
...


8

  

​Python无限迭代器​

迭代器对象中的项目不必都是可耗尽的,可以是无限迭代器(永远不会结束)。 处理这样的迭代器时一定要小心。

下面是用来演示无限迭代器的一个简单的例子。

内置的函数​​iter()​​可以用两个参数来调用,其中第一个参数必须是可调用对象(函数),而第二个参数是标头。迭代器调用此函数,直到返回的值等于指定值。

>>> int()


>>> inf = iter(int,1)
>>> next(inf)

>>> next(inf)

  

可以看到,​​int()函​​​数总是返回​​0​​​,所以将它作为​​iter(int,1)​​​传递将返回一个调用​​int()​​​的迭代器,直到返回值等于​​1​​。这从来没有发生,所以这样就得到一个无限迭代器。

我们也可以建立自己的无限迭代器。 以下迭代器理论上将返回所有奇数。

class InfIter:
"""Infinite iterator to return all
odd numbers"""

def __iter__(self):
self.num = 1
return self

def __next__(self):
num = self.num
self.num += 2
return num

  示例运行如下 -

>>> a = iter(InfIter())
>>> next(a)

>>> next(a)

>>> next(a)

>>> next(a)

  

当迭代这些类型的无限迭代器时,请注意指定终止条件。

使用迭代器的优点是它们可以节省资源。 如上所示,我们可以获得所有奇数,而不将整个系统存储在内存中。理论上,可以在有限的内存中计算有无限的项目。

 

作者:沐雪
文章均系作者原创或翻译,如有错误不妥之处,欢迎各位批评指正。本文版权归作者所有,如需转载恳请注明。
​​​ 为之网-热爱软件编程 http://www.weizhi.cc/​