Python中的yield
- yield是什么?
- 什么是生成器?
- 为什么要用yield(生成器)?
- 生成器的Python代码示例
yield是什么?
yield是Python中的关键字,yield的出现用于构造生成器(generator)。Python三大器(装饰器、迭代器、生成器)中一种,但是生成器的构造方法不仅仅是使用yield关键字一种方法。还有生成器表达式的方式。
什么是生成器?
Python中的生成器的工作原理类似于过安检的过程。由于人流量较大,如果所有人一下子过安检,则会出现问题(门被堵了:阻塞,地方不够用:内存溢出)。所以就要在安检口安排工作人员,进行限流,让人们“间歇性”的一个一个通过。Python中的yield关键字其实就是安检口的工作人员。
以上是我的个人理解,如有问题请见谅!
Python中对生成器的定义如下:
生成器是特定的函数,允许返回一个值,然后“暂停”代码的执行,稍后恢复(从暂停状态恢复)。
说到生成器不得不说另一个东西:协同程序
协同程序是可以运行的独立函数调用,可以暂停或者挂起,从程序离开的地方继续或者重新开始。
举个栗子!
当协同程序暂停的时候,我们可以从中获得中间的返回值,当调用回到程序时可以传入额外或者改变了的参数。但仍能从上次离开的地方继续执行,并且恢复所有的完整状态。其实生成器就是一个协同程序。
此外,生成器还是可迭代对象。还有三个常用的方法:next()、send()、close()
为什么要用yield(生成器)?
有的小伙伴不解,生成器的作用和for循环迭代的效果是一样的,为什么我要用生成器?
答:
效果相当实属不假,但是在巨大数据集的穿越(迭代)时,资源的消耗不是一个数量级的。
具体来说:
for循环遍历一个万亿级别的长列表,会将这个列表的全部数据载入到内存中去,如果你的内存很小就会溢出,即使是内存很大,这个操作也是十分占用资源的。
而使用生成器,则会将数据的状态(例如:遍历到列表的哪个位置等等)保存到内存中,每次调用时去读取需要的数据。
生成器是一个内存使用更加友好的结构。从这点解读来看,可能生成器的出现就是为了用时间换空间。
生成器的Python代码示例
- 生成器表达式:
my_generator = (i for i in range(10))
print(my_generator)
>>> <generator object <genexpr> at 0x7f89afbfc4c0>
print(my_generator[1])
>>> TypeError: 'generator' object is not subscriptable
print(next(my_generator))
>>> 0
print(next(my_generator))
>>> 1
for ele in my_generator:
print(ele)
>>>
0
1
2
3
4
5
6
7
8
9
- 函数式生成器:
def my_gen_func(my_list):
for i in my_list:
yield i
my_generator = [i for i in range(5)]
for ele in my_gen_func(my_generator):
print(ele)
>>>
0
1
2
3
4