介绍
我们在前一章“Lambda 运算符、过滤器、Reduce 和 Map”中了解到,Guido van Rossum 更喜欢列表推导式,而不是使用 map、filter、reduce 和 lambda 的构造。在本章中,我们将介绍有关列表推导式的基本知识。
列表推导式是在 Python 2.0 中添加的。本质上,它是 Python 实现数学家使用的众所周知的集合符号的方式。例如,在数学中,自然数的平方数是由 { x2 | 创建的。x ∈ ℕ } 或复整数集合 { (x,y) | x ∈ ℤ ∧ y ∈ ℤ }。
列表推导式是在 Python 中定义和创建列表的一种优雅方式。这些列表通常具有集合的特性,但不一定是集合。
列表推导式完全替代了 lambda 函数以及函数 map()、filter() 和 reduce()。对于大多数人来说,列表理解的语法更容易掌握。
例子
在关于 lambda 和 map() 的章节中,我们设计了一个 map() 函数来将摄氏值转换为华氏度,反之亦然。它看起来像这样的列表理解:
摄氏度 = [ 39.2 , 36.5 , 37.3 , 37.8 ]
华氏度 = [ (( float ( 9 ) / 5 ) * x + 32 ) for x in 摄氏 ]
打印(华氏度)
输出:
[102.56, 97.7, 99.14, 100.03999999999999]
毕达哥拉斯三元组由三个正整数 a、b 和 c 组成,使得 a2 + b2 = c2。这样的三元组通常写成 (a, b, c),最著名的例子是 (3, 4, 5)。以下列表推导式创建了毕达哥拉斯三元组:
[( x , y , z ) for x in range ( 1 , 30 ) for y in range ( x , 30 ) for z in range ( y , 30 ) if x ** 2 + y ** 2 == z ** 2 ]
输出:
[(3, 4, 5),
(5, 12, 13),
(6, 8, 10),
(7, 24, 25),
(8, 15, 17),
(9, 12, 15),
(10, 24, 26),
(12, 16, 20),
(15, 20, 25),
(20, 21, 29)]
另一个例子:设 A 和 B 是两个集合,A 和 B 的叉积(或笛卡尔积),记作 A×B,是所有对的集合,其中第一个元素是集合 A 的成员,第二个元素是是集合 B 的成员。
数学定义:A×B = {(a, b) : a属于A,b属于B}。在 Python 中很容易完成:
颜色 = [ “红色” , “绿色” , “黄色” , “蓝色” ]
事物 = [ “房子” , “汽车” , “树” ]
coloured_things = [ ( x , y ) for x in colours for y in things ]
打印(coloured_things )
输出:
[('red', 'house'), ('red', 'car'), ('red', 'tree'), ('green', 'house'), ('green', 'car') , ('green', 'tree'), ('yellow', 'house'), ('yellow', 'car'), ('yellow', 'tree'), ('blue', 'house') , ('blue', 'car'), ('blue', 'tree')]
生成器理解
生成器推导式是在 Python 2.6 中引入的。它们就像一个列表推导式,但带有括号 - 圆括号 - 而不是(方)括号。否则,语法和工作方式就像列表推导式,但生成器推导式返回的是生成器而不是列表。
x = ( x ** 2 for x in range ( 20 ))
打印( x )
x = 列表( x )
打印( x )
输出:
<生成器对象 <genexpr> 在 0x000002441374D1C8>
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81, 100, 121, 144, 169, 196, 225, 256, 289, 324, 361]
一个更苛刻的例子
使用埃拉托色尼筛法计算 1 到 100 之间的素数:
noprimes = [ j for i in range ( 2 , 8 ) for j in range ( i * 2 , 100 , i )]
primes = [ x for x in range ( 2 , 100 ) if x not in noprimes ]
print ( primes )
输出:
[2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97 ]
我们想把前面的例子变成更一般的形式,这样我们就可以计算到任意数 n 的素数列表:
from math import sqrt
n = 100
sqrt_n = int ( sqrt ( n ))
no_primes = [ j for i in range ( 2 , sqrt_n + 1 ) for j in range ( i * 2 , n , i )]
no_primes
输出:
[4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52 , 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 6, , 12, 15, 18, 21, 24, 27, 30, 33, 36, 39, 42, 45, 48, 51, 54, 57, 60, 63, 66, 69, 72, 75, 78, 81 , 87, 90, 93, 96, 99, 8, 12, 16, 20, 24, 28, 32, 36, 40, 44, 48, 52, 56, 60, 64, 68, 72, 76, 40, 80 , 88, 92, 96, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 12, 18, 24 , 36, 42, 48, 54, 60, 66, 72, 78, 84, 90, 96, 14, 21, 28, 35, 42, 49, 56, 63, 70, 77, 84, 91, 68 , 24, 32, 40, 48, 56, 64, 72, 80, 88, 96, 18, 27, 36, 45, 54, 63, 72, 81, 90, 99, 20, 30, 40, 50 , 70, 80, 90]
如果我们看一下 no_primes 的内容,就可以看出我们有问题。此列表中包含许多重复条目:
输出:
[4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52 , 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 6, , 12, 15, 18, 21, 24, 27, 30, 33, 36, 39, 42, 45, 48, 51, 54, 57, 60, 63, 66, 69, 72, 75, 78, 81 , 87, 90, 93, 96, 99, 8, 12, 16, 20, 24, 28, 32, 36, 40, 44, 48, 52, 56, 60, 64, 68, 72, 76, 40, 80 , 88, 92, 96, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 12, 18, 24 , 36, 42, 48, 54, 60, 66, 72, 78, 84, 90, 96, 14, 21, 28, 35, 42, 49, 56, 63, 70, 77, 84, 91, 68 , 24, 32, 40, 48, 56, 64, 72, 80, 88, 96, 18, 27, 36, 45, 54, 63, 72, 81, 90, 99, 20, 30, 40, 50 , 70, 80, 90]
解决这个难以忍受的问题比您想象的要容易。这只是将方括号更改为大括号的问题,或者换句话说:我们将使用集合推导式。
集合理解
集合推导类似于列表推导,但返回一个集合而不是一个列表。在语法上,我们使用大括号而不是方括号来创建集合。集合理解是解决上一小节中的问题的正确功能。我们能够创建没有双峰的非素数集:
from math import sqrt
n = 100
sqrt_n = int ( sqrt ( n ))
no_primes = { j for i in range ( 2 , sqrt_n + 1 ) for j in range ( i * 2 , n , i )}
no_primes
输出:
{4, 6, 8, 9, 10, 12, 14, 15, 16, 18, 20, 21, 22, 24, 25, 26, 27, 28, 30, 32, 33, 34, 35, 36, 38 , 39, 40, 42, 44, 45, 46, 48, 49, 50, 51, 52, 54, 55, 56, 57, 58, 60, 62, 63, 64, 65, 66, 68, 69 , 72, 74, 75, 76, 77, 78, 80, 81, 82, 84, 85, 86, 87, 88, 90, 91, 92, 93, 94, 95, 96, 98, 99}
primes = { i for i in range ( 2 , n ) if i not in no_primes }
print ( primes )
输出:
{2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97 }
计算素数的递归函数
以下 Python 脚本使用递归函数来计算素数。它结合了这样一个事实,即检查素数的倍数直到 n 的平方根就足够了:
from math import sqrt
def primes ( n ):
if n == 0 :
return []
elif n == 1 :
return []
else :
p = primes ( int ( sqrt ( n )))
no_p = { j for i in p 为 Ĵ 在 范围(我* 2 , ñ + 1 , i )}
p = { x for x in range ( 2 , n + 1 ) if x not in no_p }
return p
for i in range ( 1 , 50 ):
print ( i , primes ( i ))
输出:
1 []
2 {2}
3 {2, 3}
4 {2, 3}
5 {2, 3, 5}
6 {2, 3, 5}
7 {2, 3, 5, 7}
8 {2, 3, 5, 7}
9 {2, 3, 5, 7}
10 {2, 3, 5, 7}
11 {2, 3, 5, 7, 11}
12 {2, 3, 5, 7, 11}
13 {2, 3, 5, 7, 11, 13}
14 {2, 3, 5, 7, 11, 13}
15 {2, 3, 5, 7, 11, 13}
16 {2, 3, 5, 7, 11, 13}
17 {2, 3, 5, 7, 11, 13, 17}
18 {2, 3, 5, 7, 11, 13, 17}
19 {2, 3, 5, 7, 11, 13, 17, 19}
20 {2, 3, 5, 7, 11, 13, 17, 19}
21 {2, 3, 5, 7, 11, 13, 17, 19}
22 {2, 3, 5, 7, 11, 13, 17, 19}
23 {2, 3, 5, 7, 11, 13, 17, 19, 23}
24 {2, 3, 5, 7, 11, 13, 17, 19, 23}
25 {2, 3, 5, 7, 11, 13, 17, 19, 23}
26 {2, 3, 5, 7, 11, 13, 17, 19, 23}
27 {2, 3, 5, 7, 11, 13, 17, 19, 23}
28 {2, 3, 5, 7, 11, 13, 17, 19, 23}
29 {2, 3, 5, 7, 11, 13, 17, 19, 23, 29}
30 {2, 3, 5, 7, 11, 13, 17, 19, 23, 29}
31 {2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31}
32 {2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31}
33 {2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31}
34 {2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31}
35 {2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31}
36 {2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31}
37 {2, 3, 5, 37, 7, 11, 13, 17, 19, 23, 29, 31}
38 {2, 3, 5, 37, 7, 11, 13, 17, 19, 23, 29, 31}
39 {2, 3, 5, 37, 7, 11, 13, 17, 19, 23, 29, 31}
40 {2, 3, 5, 37, 7, 11, 13, 17, 19, 23, 29, 31}
41 {2, 3, 5, 37, 7, 41, 11, 13, 17, 19, 23, 29, 31}
42 {2, 3, 5, 37, 7, 41, 11, 13, 17, 19, 23, 29, 31}
43 {2, 3, 5, 37, 7, 41, 11, 43, 13, 17, 19, 23, 29, 31}
44 {2, 3, 5, 37, 7, 41, 11, 43, 13, 17, 19, 23, 29, 31}
45 {2, 3, 5, 37, 7, 41, 11, 43, 13, 17, 19, 23, 29, 31}
46 {2, 3, 5, 37, 7, 41, 11, 43, 13, 17, 19, 23, 29, 31}
47 {2, 3, 5, 37, 7, 41, 11, 43, 13, 47, 17, 19, 23, 29, 31}
48 {2, 3, 5, 37, 7, 41, 11, 43, 13, 47, 17, 19, 23, 29, 31}
49 {2, 3, 5, 37, 7, 41, 11, 43, 13, 47, 17, 19, 23, 29, 31}
版本 2.x 和 3.x 之间的差异
在 Python 2 中,循环控制变量不是局部的,即它可以在列表推导式之外更改该名称的另一个变量,如下面的示例所示:
x = "这个值会在列表理解中改变"
res = [x for x in range(3)]
资源
[0, 1, 2]
X
2
res = [i for i in range(5)]
一世
4
Guido van Rossum 将这种效果称为“Python 多年来的'肮脏小秘密'之一”。1 这样做的原因是效率。“它最初是为了让列表理解速度非常快而有意妥协,虽然这对于初学者来说不是一个常见的陷阱,但它确实偶尔会刺痛人们。”2
这个“肮脏的小秘密”在 Python3 中是固定的,你可以在下面的代码中看到:
x = "Python 3 修复了肮脏的小秘密"
res = [ x for x in range ( 3 )]
print ( res )
[ 0 , 1 , 2 ]
x
输出:
[0, 1, 2]
脚注:1 Guido van Rossum:从列表推导到生成器表达式
2 dto。