python-迭代器（Iterator）详解

原创

网络风云9 2025-04-01 15:48:51 ©著作权

文章标签 python 开发语言迭代器生成器迭代 文章分类 Python 后端开发

©著作权归作者所有：来自51CTO博客作者网络风云9的原创作品，请联系作者获取转载授权，否则将追究法律责任

python-迭代器（Iterator）详解_迭代器

在 python 中，迭代器是一种遵循特定协议的对象，允许我们遍历容器中的元素（如列表、元组、字典等，叫可迭代对象），而无需直接操作容器的内部数据结构。迭代器是 python 中非常重要的概念，它的实现机制和使用方式使得我们能够高效、简洁地处理集合数据。

1、基本概念

迭代器是 python 中为了简化数据遍历而设计的一种机制。它的意义主要体现在以下几个方面：

统一访问接口：迭代器为各种容器提供统一的访问接口，不需要关心容器的具体实现。
懒加载：迭代器支持懒加载（lazy evaluation），即元素在需要时才被计算和返回。这使得它能处理非常大的数据集合，而不会一次性占用过多的内存。
内存效率：迭代器每次只生成一个元素，而不是一次性生成所有元素，从而节省内存。
简单且可扩展：通过迭代器协议，python 允许用户自定义迭代器类。

2、迭代器的工作原理

迭代器遵循以下两个基本协议：

__iter__()：该方法返回一个迭代器对象。一个对象只要实现了 __iter__() 方法，它就可以被迭代。
__next__()：该方法返回容器中的下一个元素。如果没有元素可以返回，则抛出 StopIteration 异常，表示迭代结束。

在实际使用时，python 内部会自动调用 __next__() 方法来获取下一个元素，并在遍历完成后触发 StopIteration 异常，停止迭代。

3、迭代器的用途和用法

迭代器常用于需要遍历集合数据的场景，常见用途包括：

遍历容器（如列表、元组、字典等）中的元素。
按需生成数据流（例如大文件处理、无限序列生成等）。
通过生成器（yield）实现惰性计算。

3.1 创建自定义迭代器

你可以通过实现 __iter__() 和 __next__() 方法来创建自己的迭代器类。

示例：自定义迭代器类

class MyIterator:

    def __init__(self, start, end):

        self.current = start
        self.end = end

    def __iter__(self):

        return self  # 返回迭代器对象本身

    def __next__(self):

        if self.current >= self.end:

            raise StopIteration  # 迭代完成时抛出 StopIteration 异常

        self.current += 1

        return self.current - 1

# 使用自定义迭代器
iterator = MyIterator(1, 5)

for num in iterator:

    print(num)

输出：

在上述代码中，MyIterator 类实现了一个从 start 到 end 的迭代器。每次调用 __next__() 都返回下一个数字，直到迭代完成，抛出 StopIteration 异常。

3.2 使用内置的迭代器

python 内置的 list、tuple、str、dict 等容器都实现了迭代器协议，因此你可以直接使用它们的迭代器。

示例：使用内置容器的迭代器

# 列表迭代
my_list = [1, 2, 3, 4]

for num in my_list:

    print(num)

# 字符串迭代
my_string = "hello"

for char in my_string:

    print(char)

输出：

python 内置容器都实现了 __iter__() 和 __next__() 方法，因此我们可以像上述代码那样直接用 for 循环进行迭代。

3.3 使用生成器（Generator）作为迭代器

生成器是实现迭代器的一种更简便的方式，它允许你使用 yield 关键字生成数据。每次调用生成器的 __next__() 方法时，生成器会从 yield 表达式处恢复并生成下一个值。

示例：生成器函数

def count_up_to(limit):

    current = 1

    while current <= limit:

        yield current

        current += 1

# 使用生成器
gen = count_up_to(5)

for num in gen:

    print(num)

输出：

生成器函数 count_up_to() 每次调用 yield 时会暂停并返回当前值，直到迭代器结束。

4、迭代器的特点

惰性计算（Lazy Evaluation）：迭代器是一种惰性求值的方式，每次调用 __next__() 方法时才计算下一个元素。这使得迭代器特别适用于大数据量的处理，因为它不会一次性将所有元素加载到内存中。

一次性遍历：迭代器一旦被消耗，就不能重新遍历。如果需要重新迭代，必须创建一个新的迭代器实例。

节省内存：由于迭代器按需生成元素，而不是一次性加载整个集合，因此它比直接使用列表等数据结构更节省内存，尤其在处理大数据时非常有效。

兼容 for 循环：迭代器与 for 循环兼容，Python 会自动调用迭代器的 __next__() 方法来遍历容器，简化了代码。

实现简单的自定义迭代：通过实现 __iter__() 和 __next__() 方法，开发者可以自定义复杂的迭代逻辑。

5、迭代器的注意事项

StopIteration 异常：迭代器必须在没有更多元素时抛出 StopIteration 异常，否则程序会陷入死循环。

不可重复遍历：一旦迭代器被消耗，无法再继续使用。如果你需要多次遍历，可以创建新的迭代器对象。

生成器的性能和内存优势：生成器是实现迭代器的高效方式，尤其是在处理大规模数据时，它能够避免内存溢出并提高性能。

迭代器协议的遵循：如果你创建自定义迭代器，确保正确实现 __iter__() 和 __next__() 方法，并处理好 StopIteration 异常。

6、迭代器和生成器的比较

特性	迭代器	生成器
定义方式	需要实现 __iter__() 和 __next__() 方法	使用 yield 关键字
内存占用	可能需要更多内存（如存储数据）	按需生成，内存占用较低
使用便捷性	需要手动管理状态	自动管理状态，简洁易用
性能	稍逊色，尤其是需要额外状态管理时	性能优越，尤其在处理大数据时
多次迭代	不能多次迭代，需要重新创建	可以多次迭代，生成器本身可以重用

迭代器是 Python 中一个非常强大的工具，能够提供统一且简洁的方式来遍历集合数据。通过实现 __iter__() 和 __next__() 方法，Python 允许你自定义迭代器来满足不同的需求。生成器作为一种简化的迭代器形式，能够高效地处理大规模数据。迭代器不仅使代码更加简洁，而且节省内存、提高性能，特别适用于大数据和惰性计算场景。在实际开发中，合理使用迭代器和生成器能够大大优化代码结构和执行效率。