惰性加载 pytorch python惰性计算

转载

AI独步天下 2023-12-09 18:56:39

文章标签 惰性加载 pytorch python中and和or的惰性求值特点生成器迭代 Python 文章分类 PyTorch 人工智能

惰性求值，也就是延迟求值，表达式不会在它被绑定到变量之后就立即求值，而是等用到时再求值。这个特性可以解决一些巨大甚至无限的集合列表，如菲波那切数列、几十G的文件等等。延迟求值的一个好处是能够建立可计算的无限列表而没有妨碍计算的无限循环或大小问题。

Python 中的很多方法没有直接返回列表，而是返回了一个可迭代的generator (生成器)对象，这便是python的惰性求值，因为在创建一个很大的列表时，对内存的开销非常大，太大时python会直接报错，举个🌰：range()方法是产生一个指定范围列表，在Python3之前，该方法直接产生一个列表，xrange() 产生一个生成器：

>>> xrange(100)

xrange(100)

>>> range(100)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99]

当参数里面的值足够大时，range()产生了一个巨大的列表，这是内存会吃不消，等待一段时间后程序会直接被Kill掉：

>>> for i in range(999999999999):

... print i

...

Killed: 9

占满内存

用xrange() 方法就不回出现这种问题，并且可以一直运行：

>>> for i in xrange(999999999999):

... print i

...

在Python3中range已经被改为了xrange,所以在python3中可以放心使用range().

惰性求值不要求你事先准备好整个迭代过程中所有的元素。迭代器仅仅在迭代至某个元素时才计算该元素，而在这之前或之后，元素可以不存在或者被销毁

还有前文所说的list comprehension语句,在两边放上[]，会产生别表，如果数据源很长则会报内存错误:

>>> print [i for i in range(9999999999999999)]
Python(1627,0x7fffe5b713c0) malloc: *** mach_vm_map(size=80000000000000000) failed (error code=3)
*** error: can't allocate region
*** set a breakpoint in malloc_error_break to debug
Traceback (most recent call last):
File "", line 1, in 
MemoryError

这样直接产生列表没有效率，为了创建生成器对象，可以在list comprehension两边放上()，这样它就有了惰性求值的特性。

>>> print((i for i in range(99999999999999)))

at 0x106e29f10>

使用next()内建函数访问生成器里的元素：

num = (i for i in range(5))
>>> num
 at 0x106e89048>
>>> next(num)
0
>>> next(num)
1
>>> for j in range(4):
... print(next(num))
...

Traceback (most recent call last):
File "", line 2, in 
StopIteration

当访问到最后元素时，再调用next(),Python将会抛出StopIteration异常。Python正是根据是否检查到这个异常来决定是否停止迭代。

step1 = someLongOperation1()
step2 = someLongOperation2()
step3 = concatenate(step1, step2)

以上代码需要分别执行一二两步操作，第三步用到一二两步的结果，在Pyhton中会有序的执行这些函数：首先是 someLongOperation1，然后 someLongOperation2，最后 concatenate，如果确保没有函数修改或依赖于全局变量，第一二步可以被并行执行。假设我们不想并行运行这两个函数，我们只在其他函数依赖于 step1 和 step2 时才需要执行这两个函数。我们甚至在 concatenate 调用之前都不必执行他们，可以把他们的求值延迟到 concatenate 函数内实际用到他们的位置。如果函数中用到了if分支语句，条件无关step1和step2则可以尽量将判断条件放前面以减少不必要的计算：

step1 = someLongOperation1()
step2 = someLongOperation2()
if condition:
step3 = concatenate(step1, step2)

换为：

if condition:
step1 = someLongOperation1()
step2 = someLongOperation2()
step3 = concatenate(step1, step2)

如果 concatenate 是一个带有条件分支的函数并且有的分支中只用了两个参数中的一个，另一个参数就永远没有必要被求值。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：java简述说明extends的用途和使用时的语法格式 extend java

下一篇：android 微信聊天页面底部加号微信聊天框下面

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

惰性加载 pytorch python惰性计算

惰性加载 pytorch python惰性计算

51CTO博客