1.简化导入模块名

简化调用代码, 更简单!

#Bad code
import urllib.request
url = r''
req = urllib.request.Request(url)
response = urllib.request.urlopen(req)

#Good code
from urllib import request 
url = r''
req = request.Request(url)
response = request.urlopen(req)

使用别名避免可能造成模块名重复的问题,简单

from module_a import hello as a_h
from module_b import hello as b_h
from bs4 import BeautifulSoup as BS
html = '''<html>
            ......
       </html>'''
soup = BS(html)

2.关于 "_" 

这是一个非常有用的功能,可惜很少人知道。

当你在交互界面敲代码,获得一个临时结果,却没有用变量名去保存它的时候,可以用"_"来获取最近一次临时结果。

>>> 1 + 1
2
>>> _
2

在"_"中存储最后输出的值。这在交互式模式中是非常有用的,当你在过程中没有保存计算结果,或者你想看最后一步执行的输出结果。

3.合并字符串

这是一个老生常谈的问题,当我们需要将数个字符串合并的时候,习惯性的使用"+"作为连接字符串的手段。

然而,由于不可变对象在内存中生成后无法修改,合并后的字符串会重新开辟出一块内存空间来存储。这样像滚雪球一样,将内存快速消耗殆尽。

# Bad code
string = ['a','b','c','d','e','f','g','h']
def fun(string):
    all_string = ''
    for i in string:
        all_string += i
    return all_string

# Good code  更简洁安全
string = ['a','b','c','d','e','f','g,'h']
def fun(string):
    all_string = ''.join(string)
    return all_string

4.强大的zip()

它是Python的内建函数,zip函数接受任意多个(包括0个和1个)序列作为参数,返回一个包含tuple的list。zip()函数可以在很多场景简化你的代码。

矩阵的行列互换

# Bad code
a = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
re_a = [[row[col] for row in a] for col in range(len(a))]

>>> [[1, 4, 7], [2, 5, 8], [3, 6, 9]]

# Good code
a = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
re_a = list(zip(*a))

>>> [[1, 4, 7], [2, 5, 8], [3, 6, 9]]

交换dict的键值

# Bad code
a = {'a': 1, 'b': 2, 'c': 3, 'd': 4}
def reverse_dict(a):
    new_dict = {}
    for k,v in m.items():
        new_dict[v] = k
    return new_dict

# Good code
a = {'a': 1, 'b': 2, 'c': 3, 'd': 4}
def reverse_dict(a):
    k = a.keys()
    v = a.values()
    new_dict = dict(zip(v, k))
    return new_dict

{1: 'a', 2: 'b', 3: 'c', 4: 'd'}

合并list相邻项 (参考8,列表分割为同样大小的块)

a = [1, 2, 3, 4, 5, 6]
list(zip( a[::2], a[1::2] ))
>>> [(1, 2), (3, 4), (5, 6)]

5.变量值交换

# Bad
tmp = a
a = b
b = tmp

#Good
a, b = b, a

6.在循环中获取索引(数组下标)?

a = [8, 23, 45, 12, 78]
for index, value in enumerate(a):
    print(index , value)

python代码在运行可以改代码吗 python编写的代码怎么运行_python代码在运行可以改代码吗

7.如何在只用一行捕获多个异常?

 

try:
    pass
except (ExceptionA,ExceptionB,.....) as e:
    pass

8.把列表分割成同样大小的块?

a = [1, 2, 3, 4, 5, 6]
list(zip( *[iter(a)]*2 ))
>>> [(1, 2), (3, 4), (5, 6)]
##  参考 4.zip() 中合并list相邻项
a = [1, 2, 3, 4, 5, 6]
list(zip( *[iter(a)]*3 ))
>>> [(1, 2, 3), (4, 5, 6)]

9.如何查找列表中某个元素的下标?

a = ['a', 'b', 'c', 'd', 'e', 'f']
a.index('a')
>>> 0

10.如何快速反转字符串?

#Bad
a = 'Python is a powerful languange.'
list_a = list(a)
list_a.reverse()
re_a = ''.join(list_a) 

#Good
a = 'Python is a powerful languange.'
re_a = a[::-1]

11.数值比较

x = 2
if 1< x <3:
    print(x)
>>> 2
if 1< x >0:
    print(x)
>>> 2

12.优雅的打开文件

平时在使用类似文件的流对象时,使用完毕后要调用close方法关闭。with…as语句提供了一个非常方便的替代方法:open打开文件后将返回的文件流对象赋值给f,然后在with语句块中使用。with语句块完毕之后,会隐藏地自动关闭文件。

with open('nothing.txt','r') as f:
    f.read()

13.和你的内存说再见

crash = dict(zip(range(10 **0xA), range(10 **0xA)))

用range()生成,不会抛MemoryError,然后进行压缩,再转换成dict,内存很快会消耗干净的,电脑就一动不动了......

range(10 **0xA)
>>> range(0, 10000000000)

14、使用局部变量

尽量使用局部变量代替全局变量:便于维护,提高性能并节省内存。

使用局部变量替换模块名字空间中的变量,例如 ls = os.linesep。一方面可以提高程序性能,局部变量查找速度更快;另一方面可用简短标识符替代冗长的模块变量,提高可读性。

15、减少函数调用次数

对象类型判断时,采用isinstance()最优,采用对象类型身份(id())次之,采用对象值(type())比较最次。

#判断变量num是否为整数类型
type(num) == type(0)    #调用三次函数
type(num) is type(0)    #身份比较
isinstance(num,(int))   #调用一次函数

不要在重复操作的内容作为参数放到循环条件中,避免重复运算。

#每次循环都需要重新执行len(a)
while i < len(a):
    statement

#len(a)仅执行一次
m = len(a)
while i < m:
    statement

如需使用模块X中的某个函数或对象Y,应直接使用from X import Y,而不是import X; X.Y。这样在使用Y时,可以减少一次查询(解释器不必首先查找到X模块,然后在X模块的字典中查找Y)。

16、采用映射替代条件查找

映射(比如dict等)的搜索速度远快于条件语句(如if等)。Python中也没有select-case语句。

#if查找
if a == 1:
    b = 10
elif a == 2:
    b = 20
...

#dict查找,性能更优
d = {1:10,2:20,...}
b = d[a]

17、直接迭代序列元素

对序列(str、list、tuple等),直接迭代序列元素,比迭代元素的索引速度要更快。

a = [1,2,3]

#迭代元素
for item in a:
   print(item)

#迭代索引
for i in range(len(a)):
   print(a[i])

18、采用生成器表达式替代列表解析

列表解析(list comprehension),会产生整个列表,对大量数据的迭代会产生负面效应。

而生成器表达式则不会,其不会真正创建列表,而是返回一个生成器,在需要时产生一个值(延迟计算),对内存更加友好。

#计算文件f的非空字符个数
#生成器表达式
l = sum([len(word) for line in f for word in line.split()])

#列表解析
l = sum(len(word) for line in f for word in line.split())

19、先编译后调用

使用eval()、exec()函数执行代码时,最好调用代码对象(提前通过compile()函数编译成字节码),而不是直接调用str,可以避免多次执行重复编译过程,提高程序性能。

正则表达式模式匹配也类似,也最好先将正则表达式模式编译成regex对象(通过re.complie()函数),然后再执行比较和匹配。

20、模块编程习惯

模块中的最高级别Python语句(没有缩进的代码)会在模块导入(import)时执行(不论其是否真的必要执行)。因此,应尽量将模块所有的功能代码放到函数中,包括主程序相关的功能代码也可放到main()函数中,主程序本身调用main()函数。

可以在模块的main()函数中书写测试代码。在主程序中,检测name的值,如果为'main'(表示模块是被直接执行),则调用main()函数,进行测试;如果为模块名字(表示模块是被调用),则不进行测试。