生成器表达式

1 生成器表达式定义

 

生成器表达式并不真正的创建数字列表,而是返回一个生成器对象,此对象在每次计算出一个条目后,把这个条目"产生"(yield)出来。生成器表达式使用了"惰性计算"或称作"延时求值"的机制。生成器表达式可以用来处理大数据文件。

 

序列过长,并且每次只需要获取一个元素时,应该考虑生成器表达式而不是列表解析。

 

    生成器表达式产生的是一个生成器对象,实质就是迭代器。

 

2 生成器表达式语法

 

语法:

 

  (expression for iter_val in iterable)

 

  (expression for iter_val in iterable if cond_expr)

例:

g=("egg%s"%i for i in range(100))
print(g)
print(next(g))
print(next(g))

输出结果:

<generator object <genexpr> at 0x0000007E9A403D00>
egg0
egg1

 

可以处理大数据文件:

f=open("a.txt")
l=[]
for line in f:
    line = line.strip()
    l.append(line)
print(l)

f.seek(0)
l1=[line.strip() for line in f]
print(l1)

f.seek(0)
g=(line.strip() for line in f)
print(g)
print(next(g))

输出结果:

['wen', 'yan', 'jie']
['wen', 'yan', 'jie']
<generator object <genexpr> at 0x0000000A2B173D00>
wen

 

4、List函数可以处理迭代器和可迭代对象

 

List后面可以跟可迭代对象,和for的实质是一样的。 List函数将可迭代对象使用iter方法,变成迭代器,然后使用迭代器的next方法遍历可迭代器的值,并存储为列表类型,在最后报错的时候结束。

 

文件a.txt的内容是

wen
yan
      jie

编程代码:  

f=open('a.txt')
g=(line.strip() for line in f)
l=list(g)
print(l)

输出结果:

['wen', 'yan', 'jie']

 

5、sum函数可以处理迭代器和可迭代对象

 

Sum后面可以跟可迭代对象,和sum的实质是一样的。 Sum函数将可迭代对象使用iter方法,变成迭代器,然后使用迭代器的next方法遍历可迭代器的值,并,在最后报错的时候结束。

 

g=(i for i in range(10))
print(g)
print(sum(g))
print(sum(range(10)))
print(sum([0,1,2,3,4,5,6,7,8,9]))

输出结果: 

<generator object <genexpr> at 0x0000008ED3FA3D00>
45
45
45

Sum中也可以跟可迭代的对象,跟for,list的工作实质类型

print(sum([1,2,3,4]))

  

 

6、声明式编程 

 

一种编程方式,将需要很多语句的代码写成声明变量的形式

 

g=(line.strip() for line in f)

 

 

7、 生成器表达式举例

 

在文件a.txt中的内容:

 

apple 10 3

 

tesla 1000000 1

 

mac 3000 2

 

lenovo 30000 3

 

chicken 10 3

1 计算购买总共的花费:

以前的做法:
money_l=[]
with open('a.txt') as f:
    for line in f:
        goods=line.split()
        res=float(goods[-1])*float(goods[-2])
        money_l.append(res)
print(money_l)
使用生成器表达式的做法
f=open('a.txt')
g=(float(line.split()[-1])*float(line.split()[-2]) for line in f)
for i in g:
    print(i)
f=open('a.txt')
g=(float(line.split()[-1])*float(line.split()[-2]) for line in f)
print(sum(g))
一句话做法:不要这样做,python代码不是要写少,而是要写好,能看懂,且逻辑好
with open('a.txt') as f:
    print(sum(float(line.split()[-1])*float(line.split()[-2]) for line in f))

 

2 将a.txt文件中的每行内容转化为字典类型并且存储到列表

以前做法:

res=[]
with open('a.txt') as f:
    for line in f:
        l=line.split()
        d={}
        d["name"]=l[0]
        d["price"]=l[1]
        d["count"]=l[2]
        res.append(d)
print(res)

输出结果:

[{'price': '10', 'name': 'apple', 'count': '3'}, {'price': '1000000', 'name': 'tesla', 'count': '1'}, {'price': '3000', 'name': 'mac', 'count': '2'}, 
{'price': '30000', 'name': 'lenovo', 'count': '3'}, {'price': '10', 'name': 'chicken', 'count': '3'}]

 

生成器表达式做法

有报错的:

with open('a.txt') as f:
    res=(line.split() for line in f)
    print(res)
    dic_g=({'name':i[0],'price':i[1],'count':i[2]} for i in res)
    print(dic_g)
print(dic_g)
print(next(dic_g))  #原因在于dic_g生成器迭代需要res生成器迭代,res生成器迭代需要f迭代器迭代,f是打开文件的句柄,一关闭,res生成器和dic_g生成器都不能使用

输出结果:

<generator object <genexpr> at 0x00000044A0DA3D00>
<generator object <genexpr> at 0x00000044A0DA3E08>
<generator object <genexpr> at 0x00000044A0DA3E08>
ValueError: I/O operation on closed file.         #报错

  

正确生成器做法:

with open('a.txt') as f:
    res=(line.split() for line in f)
    print(res)
    dic_g=({'name':i[0],'price':i[1],'count':i[2]} for i in res)
    print(dic_g)
    apple_dic=next(dic_g)
    print(apple_dic["count"])

输出结果:

<generator object <genexpr> at 0x00000081D5243D00>
<generator object <genexpr> at 0x00000081D5243E08>
3

  

3 将a.txt文件中的每行内容转化为字典类型并且取出单价大于10000的商品存储到列表,

生成器表达式调用生成器表达式

with open('a.txt') as f:
    res=(line.split() for line in f)
    print(res)
    dic_g=({'name':i[0],'price':i[1],'count':i[2]} for i in res if float(i[1]) >10000)
    print(dic_g)
    for i in dic_g:
        print(i)

输出结果:

<generator object <genexpr> at 0x000000DB4C633D00>
<generator object <genexpr> at 0x000000DB4C633DB0>
{'price': '1000000', 'count': '1', 'name': 'tesla'}
{'price': '30000', 'count': '3', 'name': 'lenovo'}

 

with open('a.txt') as f:
    res=(line.split() for line in f)
    print(res)
    dic_g=({'name':i[0],'price':i[1],'count':i[2]} for i in res if float(i[1]) >10000)
    print(dic_g)
print(list(dic_g))

输出结果:

<generator object <genexpr> at 0x00000099A0953D00>
<generator object <genexpr> at 0x00000099A0953DB0>
[{'price': '1000000', 'name': 'tesla', 'count': '1'}, {'price': '30000', 'name': 'lenovo', 'count': '3'}]

 

今日作业

(1)有两个列表,分别存放来老男孩报名学习linux和python课程的学生名字

linux=['钢弹','小壁虎','小虎比','alex','wupeiqi','yuanhao']

python=['dragon','钢弹','zhejiangF4','小虎比']

问题一:得出既报名linux又报名python的学生列表

linux=['钢弹', '小壁虎', '小虎比', 'alex', 'wupeiqi', 'yuanhao']
python=['dragon', '钢弹', 'zhejiangF4', '小虎比']
li=[i for i in linux for j in python if i==j]
print(li)
li=(i for i in linux for j in python if i==j)
print(list(li))

问题二:得出只报名linux,而没有报名python的学生列表

li=[ i for i in linux if i not in python]
print(li)
li=(i for i in linux if i not in python)
print(list(li))

问题三:得出只报名python,而没有报名linux的学生列表

li=[i for i in python if i not in linux]
print(li)
li=(i for i in python if i not in linux)
print(list(li))

 

(2)

         shares={

         'IBM':36.6,

         'lenovo':27.3,

         'huawei':40.3,

         'oldboy':3.2,

         'ocean':20.1

 }

问题一:得出股票价格大于30的股票名字列表

li=( i for i,j in shares.items() if j > 30)
print(list(li))

问题二:求出所有股票的总价格

li=(float(j) for j in shares.values())
print(sum(li))
print(sum(float(j) for j in shares.values()))

  

(3)

l=[10,2,3,4,5,6,7]

得到一个新列表l1,新列表中每个元素是l中对应每个元素值的平方。过滤出l1中大于40的值,然后求和

l = [10, 2, 3, 4, 5, 6, 7]
l1=[i**2 for i in l]
print(l1)
l2=[i for i in l1 if i >40]
print(sum(l2))