列表生成式(list comprehension)是一种简化代码的优美方法。根据python文档,“列表生成式提供了一种创建列表的简洁方法。”在这篇教程里,我将会使用一些例子来展示如果使用列表推导式。

Tools

1ea python

1 平方列表

如果你想创建一个包含1到10的平方的列表,你可以这样做:

Python

squares                   =                   [         ]


for                   x                   in                   range         (         10         )         :


             squares         .         append         (         x         *         *         2         )

这是一个简单的例子,但是使用列表生成式可以更简洁地创建这个列表。

Python

squares                   =                   [         x         *         *         2                   for                   x                   in                   range         (         10         )         ]

这个最简单的列表生成式由方括号开始,方括号内部先是一个表达式,其后跟着一个for语句。列表生成式总是返回一个列表。

2 整除3的数字列表

通常,你可能这样写:

Python

numbers                   =                   [         ]


for                   x                   in                   range         (         100         )         :


             if                   x                   %                   3                   ==                   0         :


                 numbers         .         append         (         x         )

你可以在列表生成式里包含一个if语句,来有条件地为列表添加项。为了创建一个包含0到100间能被3整除的数字列表,可以使用列表推导式:

Python

numbers                   =                   [         x                   for                   x                   in                   range         (         100         )                   if                   x                   %                   3                   ==                   0         ]

3 找出质数

这通常要使用好几行代码来实现。

Python

noprimes                   =                   [         ]


for                   i                   in                   range         (         2         ,                   8         )         :


             for                   j                   in                   range         (         i         *         2         ,                   50         ,                   i         )         :


                 noprimes         .         append         (         j         )


primes                   =                   [         ]


for                   x                   in                   range         (         2         ,                   50         )         :


             if                   x                   not                   in                   noprimes         :


                 primes         .         append         (         x         )

不过,你可以使用两个列表生成式来简化代码。

Python

noprimes                   =                   [         j                   for                   i                   in                   range         (         2         ,                   8         )                   for                   j                   in                   range         (         i         *         2         ,                   50         ,                   i         )         ]


primes                   =                   [         x                   for                   x                   in                   range         (         2         ,                   50         )                   if                   x                   not                   in                   noprimes         ]

第一行代码在一个列表生成式里使用了多层for循环。第一个循环是外部循环,第二个循环是是内部循环。为了找到质数,我们首先找到一个非质数的列表。通过找出2-7的倍数来产生这个非质数列表。然后我们循环遍历数字并查看每个数字是否在非质数列表。

修正:正如reddit上的shoyer指出的,使用集合(set)来查找noprimes(代码里的属性参数,译者注)效率更高。由于noprimes应该只包含唯一的值,并且我们频繁地去检查一个值是否存在,所以我们应该使用集合。集合的使用语法和列表的使用语法类似,所以我们可以这样使用:

Python

noprimes                   =                   set         (         j                   for                   i                   in                   range         (         2         ,                   8         )                   for                   j                   in                   range         (         i         *         2         ,                   50         ,                   i         )         )


primes                   =                   [         x                   for                   x                   in                   range         (         2         ,                   50         )                   if                   x                   not                   in                   noprimes         ]

4 嵌套列表降维

假设你有一个列表的列表(列表里包含列表)或者一个矩阵,

Python

matrix                   =                   [         [         0         ,         1         ,         2         ,         3         ]         ,                   [         4         ,         5         ,         6         ,         7         ]         ,                   [         8         ,         9         ,         10         ,         11         ]         ]

并且你想把它降维到一个一维列表。你可以这样做:

Python

flattened                   =                   [         ]


for                   row          in                   matrix         :


             for                   i                   in                   row         :


                 flattened         .         append         (         i         )

使用列表生成式:

Python

flattened                   =                   [         i                   for                   row          in                   matrix          for                   i                   in                   row         ]

这使用了两个for循环去迭代整个矩阵。外层(第一个)循环按行迭代,内部(第二个)循环对该行的每个项进行迭代。

5 模拟多个掷硬币事件

假设需要模拟多次掷硬币事件,其中0表示正面,1表示反面,你可以这样编写代码:

Python

from                   random                   import                   random


results                   =                   [         ]


for                   x                   in                   range         (         10         )         :


             results         .         append         (         int         (         round         (         random         (         )         )         )         )

或者使用列表生成式使代码更简洁:

Python

from                   random                   import                   random


results                   =                   [         int         (         round         (         random         (         )         )         )                   for                   x                   in                   range         (         10         )         ]

这里使用了range函数循环了10次。每一次我们都把random()的输出进行四舍五入。因为random()函数返回一个0到1的浮点数,所以对输出进行四舍五入就会返回0或者1。Round()函数返回一个浮点型数据,使用int()将其转为整型并添加到列表里。

6 移除句子中的元音字母

假设你有一个句子,

Python

sentence                   =                   'Your mother was a hamster'

并且你想移除所有的元音字母。我们可以使用几行代码轻易做到:

Python

vowels                   =                   'aeiou'


non_list                   =                   [         ]


for                   l                   in                   sentence         :


             if                   not                   l                   in                   vowels         :


                 non_list         .         append         (         l         )


nonvowels                   =                   ''         .         join         (         non_list         )

或者你可以使用列表生成式简化它:

Python

vowels                   =                   'aeiou'


nonvowels                   =                   ''         .         join         (         [         l                   for                   l                   in                   sentence          if                   not                   l                   in                   vowels         ]         )

这个例子使用列表生成式创建一个字母列表,字母列表的字母来自sentence句子的非元音字母。然后我们把生成的列表传给join()函数去转换为字符串。

修正:正如reddit上的iamadogwhatisthis提出的,这个例子不需要列表生成式。使用生成器(generator)更好:

Python

vowels                   =                   'aeiou'


nonvowels                   =                   ''         .         join         (         l                   for                   l                   in                   sentence          if                   not                   l                   in                   vowels         )

注意,这里去掉了方括号。这是因为join函数接收任意可迭代的数据,包括列表或者生成器。这个没有方括号的语法使用了生成器。这产生(与列表生成式)同样的结果,相对于之前把所有条目包装成一个列表,生成器在我们遍历时才产生相应的条目。这可以使我们不必保存整个列表到内存,并且这对于处理大量数据更有效率。

 7 获取目录里的文件名列表

下面的代码将会遍历my_dir目录下的文件,并在files里追加每个以txt为后缀的文件名。

Python

import                   os


files                   =                   [         ]


for                   f                   in                   os         .         listdir         (         './my_dir'         )         :


             if                   f         .         endswith         (         '.txt'         )         :


                 files         .         append         (         f         )

这同样可以使用列表生成式简化代码:

Python

import                   os


files                   =                   [         f                   for                   f                   in                   os         .         listdir         (         './my_dir'         )                   if                   f         .         endswith         (         '.txt'         )         ]

或者你可以获取一个相对路径的列表:

Python

import                   os


files                   =                   [         os.path         .         join         (         './my_dir'         ,                   f         )                   for                   f                   in                   os         .         listdir         (         './my_dir'         )                   if                   f         .         endswith         (         '.txt'         )         ]

感谢reddit上的rasbt提供。

8 将csv文件读取为字典列表

我们常常需要读取和处理csv文件的数据。处理csv数据的一个最有用的方法就是把它转换为一个字典列表。

Python

import                   csv


data                   =                   [         ]


for                   x                   in                   csv         .         DictReader         (         open         (         'file.csv'         ,                   'rU'         )         )         :


             data         .         append         (         x         )

你可以使用列表生成式快速实现:

Python

import                   csv


data                   =                   [                   x                   for                   x                   in                   csv         .         DictReader         (         open         (         'file.csv'         ,                   'rU'         )         )         ]

DictReader类将会自动地使用csv文件的第一行作为字典的key属性名。DictReader类返回一个将会遍历csv文件所有行的对象。这个文件对象通过open()函数产生。我们提供了open()两个参数–第一个是csv文件名,第二个是模式。在这例子,‘rU’有两个意思。想往常一样,‘r’表示以读模式打开文件。‘U’表明我们将会接受通用换行符–‘n’,‘r’和‘rn’。

感谢reddit上的blacwidonsfw提供。