迭代器:迭代的工具
#1 什么是迭代:指的是一个重复的过程,每一次重复称为一次迭代,并且每一次重复的结果是下一次重复的初始值
#2 为什么要有迭代器? #对于序列类型:str,list,tuple,可以依赖索引来迭代取值, #但是对于dict,set,文件,python必须为我们提供一种不依赖于索引的迭代取值的方式-》迭代器
#3 可迭代的对象(下列都是):obj.iter
name='egon'
l=[1,2,3]
t=(1,2,3)
d={'name':'egon','age':18,'sex':'male'}
s={'a','b','c'}
f=open('a.txt','w',encoding='utf-8')
name.__iter__
l.__iter__
t.__iter__
d.__iter__
s.__iter__
f.__iter__
#4 迭代器对象(文件是):obj.iter,obj.next
f.__iter__
f.__next__
#总结: #1 可迭代对象不一定是迭代器对象 #2 迭代器对象一定是可迭代的对象 #3 调用obj.iter()方法,得到的是迭代器对象(对于迭代器对象,执行__iter__得到的仍然是它本身)
#for循环就是依赖的将可迭代对象转换为迭代器对象,然后进行迭代
#总结迭代器的优缺点: #优点: #1、提供一种统一的、不依赖于索引的取值方式,为for循环的实现提供了依据 #2、迭代器同一时间在内存中只有一个值——》更节省内存,
#缺点: #1、只能往后取,并且是一次性的 #2、不能统计值的个数,即长度
l=[1,2,3,4,5,6]
l[0]
l[1]
l[2]
l[0]
l_iter=l.__iter__()
# print(l_iter)
print(next(l_iter))
print(next(l_iter))
print(next(l_iter))
生成器
#1 什么是生成器:只要在函数体内出现yield关键字,那么再执行函数就不会执行函数代码,会得到一个结果,该结果就是生成器 #生成器就是迭代器
#yield的功能: #1、yield为我们提供了一种自定义迭代器对象的方法 #2、yield与return的区别1:yield可以返回多次值 #2:函数暂停与再继续的状态是由yield帮我们保存的
#模拟tail -f access.log |grep 404
import time
def tail(file):
with open(file,'rb') as f:
f.seek(0,2)
while True:
line = f.readline()
if line:
yield line
else:
time.sleep(0.05)
lines=tail('access.log')
def grep(lines,pattern):
for line in lines:
line = line.decode('utf-8')
if pattern in line:
print(line)
grep(tail('access.log'),'404')
#了解知识点:yield表达式形式的用法
def eater(name):
print('%s 开始吃饭' %name)
food_list=[]
while True:
food=yield food_list #food=yield='鸡丁'
food_list.append(food)
print('%s start to eat %s' %(name,food))
e=eater('dzm')
#需要先初始化
next(e)
#然后e.send:1 从暂停的位置将值传给yield 2、与next一样
print(e.send('米饭'))
print(e.send('鸡丁'))
三元表达式
def my_max(x,y):
if x > y:
return x
else:
return y
res=my_max(10,20)
print(res)
#示例一
x=10
y=20
res=x if x > y else y
print(res)
#示例二
name=input('>>: ').strip()
res='sb' if name == 'alex' else 'nb'
print(res)
列表推导式
#示例一
l=[]
for i in range(1,11):
res='egg'+str(i)
l.append(res)
print(l)
l=['egg'+str(i) for i in range(1,11)]
print(l)
#示例二
l1=['egg'+str(i) for i in range(1,11) if i >= 6]
print(l1)
l1=[]
for i in range(1,11):
if i >= 6:
l1.append('egg'+str(i))
生成器表达式
#把列表推导式的[]换成()就是生成器表达式 #生成器比较节省内存
g=('egg'+str(i) for i in range(0,1000000000000000000000000000000000))
print(g) #显示结果g是个生成器
print(next(g))
print(next(g))
print(next(g))
#示例
with open('a.txt','r',encoding='utf-8') as f:
#求文件a.txt中最长的行的长度(长度按字符个数算,需要使用max函数)
print(max(len(line)for line in f))
#求文件a.txt中总共包含的字符个数
print(sum(len(line) for line in f))
递归
#递归调用:在调用一个函数的过程中,直接或者间接又调用该函数本身,称之为递归调用 #递归必备的两个阶段:1、递推 2、回溯 #python中的递归效率低,需要在进入下一次递归时保留当前的状态,在其他语言中可以有解决方法:尾递归优化,即在函数的最后一步(而非最后一行)调用自己,但是python又没有尾递归,且对递归层级做了限制
#举例,计算age(5)的数值
# age(5) = age(4) + 2
# age(4) = age(3) + 2
# age(3) = age(2) + 2
# age(2) = age(1) + 2
#
# age(1) = 18
def func(n):
if n == 1:
return 18
else:
return func(n-1)+2
res=func(5)
print(res)
#总结递归的使用: #1. 必须有一个明确的结束条件 #2. 每次进入更深一层递归时,问题规模相比上次递归都应有所减少 #3. 递归效率不高,递归层次过多会导致栈溢出(在计算机中,函数调用是通过栈(stack)这种数据结构实现的,每当进入一个函数调用,栈就会加一层栈帧,每当函数返回,栈就会减一层栈帧。由于栈的大小不是无限的,所以,递归调用的次数过多,会导致栈溢出)
二分法
#了解的知识点 l=[1,2,10,30,33,99,101,200,301,402] #从小到大排列的数字列表,找到301
def search(l,num):
print(l)
if len(l) == 0:
print('没有这个内容')
return
mid_index = len(l) // 2
if num > l[mid_index]:
search(l[mid_index+1:],num)
elif num < l[mid_index]:
search(l[0:mid_index],num)
else:
print(num)
x=int(input('请输入数字: '))
search(l,x)
匿名函数
def func(): #func=内存地址
print('from func')
func()
#上面这是有名函数
#举例 #内存地址
def my_sum(x,y):
return x+y
#把上面有名函数变为匿名函数
#自带return返回值效果
print(lambda x,y:x+y)
#打印后得到一个内存地址
#给这个内存地址传参执行
print((lambda x,y:x+y)(1,2))
#得到3
#也可以:
func=lambda x,y:x+y
#print(func)
print(func(1,2))
#lambda匿名函数通常跟别的函数配合使用 #匿名意味着引用计数为0,使用一次就释放,除非让其有名字
内置函数(与匿名函数配合使用)
#max,min,sorted,map,reduce,filter #上面的函数都遵循迭代器对象 #next一次取一次值
#字典的运算:最小值,最大值,排序
salaries={
'egon':3000,
'alex':100000000,
'wupeiqi':10000,
'yuanhao':2000
}
#zip 拉链
s='hello'
l=[1,2,3]
g=zip(s,l)
#g是一个内存地址 #zip的结果是一个迭代器
print(list(g))
#结果
[('h', 1), ('e', 2), ('l', 3)]
#使用列表形式表现出来,从结果可以看出一一对应的保存在一个小元祖中
#max函数 #举例,求上面字典中工资最高的人名
#方法1,可以和上面的zip函数配合
g=zip(salaries.values(),salaries.keys())
#这样就可以按照薪资value比较,字典默认按照keys比较
print(max(g))
#结果
(100000000, 'alex')
#方法2,与匿名函数配合
print(max(salaries,key=lambda x:salaries[x]))
#结果:
alex
#'key='表示指定max函数比较的依据
#'k'是前面每次循环salaries后得到的字典的key,salaries[k]的结果返回给前面的key
#也就是说这里使用字典中的value进行比较,但显示的还是比较后结果所对应的字典中的key
#min函数
#用法跟max相同
print(min(salaries,key=lambda k:salaries[k]))
#sorted 排序
#与max用法相同
print(sorted(salaries,key=lambda k:salaries[k]))
#还可以加个reverse=True将结果反转
print(sorted(salaries,key=lambda k:salaries[k],reverse=True))
高阶函数
map函数 映射
map()函数接收两个参数,一个是函数,一个是Iterable,map将传入的函数依次作用到序列的每个元素,并把结果作为新的Iterator返回
例1:
def f(x):
return x * x
r = map(f, [1,2,3,4,5,6,7,8,9])
r = list(r)
print(r)
[1, 4, 9, 16, 25, 36, 49, 64, 81]
map()传入的第一个参数是f,即函数对象本身。由于结果r是一个Iterator,Iterator是惰性序列,因此通过list()函数让它把整个序列都计算出来并返回一个list
例2:
list(map(str, [1, 2, 3, 4, 5, 6, 7, 8, 9]))
['1', '2', '3', '4', '5', '6', '7', '8', '9']
例3:
names = ['AAA', 'BBB', 'CCC']
g = map(lambda name: '%s_傻子' % name, names)
print(list(g))
['AAA_傻子', 'BBB_傻子', 'CCC_傻子']
filter 过滤
和map()类似,filter()也接收一个函数和一个序列。和map()不同的是,filter()把传入的函数依次作用于每个元素,然后根据返回值是True还是False决定保留还是丢弃该元素。
例如,在一个list中,删掉偶数,只保留奇数,可以这么写:
def is_odd(n):
return n % 2 == 1
list(filter(is_odd, [1, 2, 4, 5, 6, 9, 10, 15]))
# 结果: [1, 5, 9, 15]
把一个序列中的空字符串删掉,可以这么写:
def not_empty(s):
return s and s.strip()
list(filter(not_empty, ['A', '', 'B', None, 'C', ' ']))
# 结果: ['A', 'B', 'C']
可见用filter()这个高阶函数,关键在于正确实现一个“筛选”函数。
注意到filter()函数返回的是一个Iterator,也就是一个惰性序列,所以要强迫filter()完成计算结果,需要用list()函数获得所有结果并返回list
与lambda配合使用
names=['AAA_SB', 'BBB_SB', 'CCC_SB','egon']
g=filter(lambda x:x.endswith('SB'),names)
print(list(g))
['AAA_SB', 'BBB_SB', 'CCC_SB']
reduce
reduce把一个函数作用在一个序列[x1, x2, x3, ...]上,这个函数必须接收两个参数,reduce把结果继续和序列的下一个元素做累积计算,其效果就是:
reduce(f, [x1, x2, x3, x4]) = f(f(f(x1, x2), x3), x4)
比方说对一个序列求和,就可以用reduce实现:
from functools import reduce
def add(x, y):
return x + y
x = reduce(add, range(1, 101))
print(x)
5050
当然求和运算可以直接用Python内建函数sum(),没必要动用reduce
与lambda配合:
from functools import reduce
print(reduce(lambda x,y:x+y,range(1,101)))
5050
内置函数
#需要掌握
#divmod 得到商和余
print(divmod(10001,25))
(400, 1)
#只要余不为0就需要加1
#enumerate #对于一个可迭代的(iterable)/可遍历的对象(如列表、字符串),enumerate将其组成一个索引序列,利用它可以同时获得索引和值 #enumerate多用于在for循环中得到计数
l=['a','b','c']
for i,v in enumerate(l):
print(i,v)
#结果:
0 a
1 b
2 c
#enumerate还可以接收第二个参数,用于指定索引起始值,如:
list1 = ["这", "是", "一个", "测试"]
for index, item in enumerate(list1, 1):
print(index, item)
#结果: 1 这 2 是 3 一个 4 测试
#补充 #如果要统计文件的行数,可以这样写: #利用enumerate():
count = 0
for index, line in enumerate(open(filepath,'r')):
count += 1
#eval #将字符串str当成有效的表达式来求值并返回计算结果 #将字符串转成相应的对象,转换成列表,转换成字典,转换成元组等
res=eval('[1,2,3]')
print(res,type(res))
#结果:
[1, 2, 3] <class 'list'>
#pow
res=pow(2,3,3) #2的三次方的结果对3取余
print(res)
#结果:
2
#round 四舍五入
print(round(3.5))
4
#slice 切片 #制造一个切片格式
l=['a','b','c','d','e','f']
s=slice(1,5,2)
print(l[s])
#结果:
['b', 'd']