删除列表元素很多同学想当然的认为不就是循环遍历加上if判断再del吗?真的有这么简单吗?
还是直接上代码看案例吧:
import time# 删除下面列表中所有张姓元素,输出的结果应该是['李老大','李老二']lst = ['张老大', '张老二', '李老大', '张老三', '李老二']*10000# 直接for循环遍历列表,remove需要删除的元素def del1(lst): for i in lst: if i[0] == '张': lst.remove(i) # 在删lst[0]'张老大'的时候,列表长度变成4,导致lst[1]取值成了'李老大',跳过了'张老二' return lst # 返回的结果不符合预期# 正向遍历,通过建一个原列表的副本,然后遍历副本,删除原列表中的元素def del2(lst): lst2 = lst.copy() # 创建副本内存和时间开销大 for i in lst2: if i[0] == '张': lst.remove(i) # 删除第一个匹配的元素,检索匹配时间开销大 return lst # 结果虽然正确,但效率极低,不要用这种方法# 使用高阶函数filter方法def del3(lst): def comp(n): # 创建过滤函数 return n[0] != '张' #对于首字符不是'张'的元素返回True,予以保留。若返回False的予以删除。 return list(filter(comp, lst)) # filter高阶函数删除列表中的元素,# 删除条件是comp方法,返回的是迭代器,需要list方法转成列表# 倒序删除法def del4(lst): for i in range(len(lst) - 1, -1, -1): # 注意len(lst)必须-1,因为列表元素下标是0至len(lst)-1;# 时刻谨记for循环左开右闭,从lst队尾循环到开头必须是-1,写0会漏了lst[0];-1表示倒序排列。# range实际就是int数字列表生成式,在这生成的是[49999,49998,..1,0],通过下标访问列表的指定元素。 if lst[i][0] == '张': del lst[i] return lst# 倒序删除之while循环,效果和for序号一致,运行效率差别极其微小(for序号方法内存开销略大一点点)。# while循环代码要写7行,for循环只要5行,更推荐使用for循环。但while循环代码阅读起来更易懂。def del5(lst): length = len(lst) - 1 while length >= 0: if lst[length][0] == '张': del lst[length] length -= 1 return lst # lst = del1(lst) # del1方法直接遍历列表删除指定元素,返回结果错误# print(lst)# t1 = time.time()# lst = del2(lst) # del2方法通过创建列表副本,遍历副本删除原件中的指定元素,结果正确,但效率极低# t2 = time.time()# print(f"遍历方法删除元素用时:{t2 - t1:.5f}") # 4.51529,在这可以看到代码优化的必要性。t1 = time.time()lst = del3(lst)t2 = time.time()print(f"filter方法删除元素用时:{t2 - t1:.5f}") # 0.00596,最优解,性能最佳,消耗内存最少。# t1 = time.time()# lst = del4(lst)# t2 = time.time()# print(f"遍历方法删除元素用时:{t2 - t1:.5f}") # 0.07991,次优解,自己循环遍历更灵活。# t1 = time.time()# lst = del5(lst)# t2 = time.time()# print(f"遍历方法删除元素用时:{t2 - t1:.5f}") # 0.08516,次优解,自己循环遍历更灵活。
以上案例注释非常详细,初学者可以认真阅读与思考。其中del4()for循环和del5()while循环时间消耗几乎一致,for循环内存消耗略大一点点。for循环可以比while循环少写2行代码,学python自然要学简洁的写法,在同样性能指标下代码行数越少越好,写循环优先用for。
另外提一句,使用filter高阶函数运行速度是for或while的13-15倍,因为filter实际执行的是c代码。在python中有很多内置方法实际是c代码,用好了会大大提高运行效率。虽然python是公认的开发效率高运行效率低,但是只要针对运算量极大的循环执行代码块进行恰当优化(通常就是使用这种c代码的内置方法,有能力的也可以自定义c代码方法,或者是第三方的c代码方法),python性能并不弱多少,而开发效率提升很多,所以python会这么流行。
编写代码首先要避免bug,多做测试检查运行结果是否符合预期。其次要注重代码性能(无bug的代码才考虑改进算法提高性能,有bug的代码0性能),代码性能一般看2个指标,1是时间消耗,2是资源消耗(通常指内存消耗,特殊场合还有别的资源消耗)。
在学习python的路上,大家一起加油吧