一直想学习python,虽然编程写了不少,但有时仍不得要领。这篇blog主要是记录python的一些主要特性。
前言
python学习总结,包括python的一些基本语法,高级特性,函数式编程,面向对象编程以及错误调试,测试和多线程。
Python基础
字符串
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
第一行注释是为了告诉Linux/OS X系统,这是一个Python可执行程序,Windows系统会忽略这个注释;
第二行注释是为了告诉Python解释器,按照UTF-8编码读取源代码,否则,你在源代码中写的中文输出可能会有乱码。
数据类型和变量
整数
浮点数
字符串
布尔值
list和tuple
list与tuple的区别:list是可变的,tuple一旦定义则不可变。
定义
List
空List的定义方法: classmates = []
classmates = ['Michael', 'Bob', 'Tracy']
print(classmates)
print(classmates[-1])
结果:
['Michael', 'Bob', 'Tracy']
Tracy
Tuple
空Tuple的定义方法: classmates = ()
classmates = ('Michael', 'Bob', 'Tracy')
print(classmates)
print(classmates[-1])
结果:
('Michael', 'Bob', 'Tracy')
Tracy
条件判断
elif是else if的缩写,完全可以有多个elif,所以if语句的完整形式就是:
if <条件判断1>:
<执行1>
elif <条件判断2>:
<执行2>
elif <条件判断3>:
<执行3>
else:
<执行4>
循环
Python的循环有两种,一种是for…in循环,依次把list或tuple中的每个元素迭代出来
names = ['Michael', 'Bob', 'Tracy']
for name in names:
print(name)
第二种循环是while循环,只要条件满足,就不断循环,条件不满足时退出循环。
sum = 0
n = 99
while n > 0:
sum = sum + n
n = n - 2
print(sum)
与大多数语言类似的 break 与 continue 语句的作用也相似。
dict与set
dict
Python内置了字典:dict的支持,dict全称dictionary,在其他语言中也称为map,使用键-值(key-value)存储,由于是用红黑树构造的,具有极快的查找速度。
以下介绍dict的定义,索引以及get(),pop()函数。
dict定义:
d = {'Michael': 95, 'Bob': 75, 'Tracy': 85}
索引:
d = {'Michael': 95, 'Bob': 75, 'Tracy': 85}
print(d['Bob'])
结果:75
get()方法,dict提供的get方法,如果key不存在,可以返回None,或者自己指定的value:
print(d.get('Bob', 0))
结果:75
print(d.get('B', 0))
结果:0
pop()方法,要删除一个key,用pop(key)方法,对应的value也会从dict中删除:
d = {'Michael': 95, 'Bob': 75, 'Tracy': 85}
d.pop('Bob')
print(d)
结果:{'Michael': 95, 'Tracy': 85}
函数
定义函数
定义函数例子:
def my_abs(x):
if x >= 0:
return x
else:
return -x
如果你已经把my_abs()的函数定义保存为abstest.py文件了,那么,可以在该文件的当前目录下启动Python解释器,用from abstest import my_abs来导入my_abs()函数,注意abstest是文件名(不含.py扩展名)
空函数
如果想定义一个什么事也不做的空函数,可以用pass语句:
def nop():
pass
缺少了pass,代码运行就会有语法错误。
参数检查
调用函数时,如果参数个数不对,Python解释器会自动检查出来,并抛出TypeError:
>>> my_abs(1, 2)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: my_abs() takes 1 positional argument but 2 were given
但是如果参数类型不对,Python解释器就无法帮我们检查。
让我们修改一下my_abs的定义,对参数类型做检查,只允许整数和浮点数类型的参数。数据类型检查可以用内置函数isinstance()实现:
def my_abs(x):
if not isinstance(x, (int, float)):
raise TypeError('bad operand type')
if x >= 0:
return x
else:
return -x
返回多个值
函数可以返回多个值吗?答案是肯定的。
import math
def move(x, y, step, angle=0):
nx = x + step * math.cos(angle)
ny = y - step * math.sin(angle)
return nx, ny
以上代码返回的多个参数会自动以tuple的方式返回。
r = move(100, 100, 60, math.pi / 6)
print(r)
结果:
(151.96152422706632, 70.0)
函数的参数
位置参数
def power(x, n):
s = 1
while n > 0:
n = n - 1
s = s * x
return s
power(x, n)函数有两个参数:x和n,这两个参数都是位置参数,调用函数时,传入的两个值按照位置顺序依次赋给参数x和n。
默认参数
添加默认参数:
def power(x, n=2):
s = 1
while n > 0:
n = n - 1
s = s * x
return s
当我们调用power(5)时,相当于调用power(5, 2)。
默认参数的一个需要注意的问题:
def add_end(L=[]):
L.append('END')
return L
正常调用时,结果似乎不错:
add_end([1, 2, 3])
结果:[1, 2, 3, 'END']
但多次调用时,就出问题了:
print(add_end())
print(add_end())
print(add_end())
结果:
['END']
['END', 'END']
['END', 'END', 'END']
Python函数在定义的时候,默认参数L的值就被计算出来了,即[],因为默认参数L也是一个变量,它指向对象[],每次调用该函数,如果改变了L的内容,则下次调用时,默认参数的内容就变了,不再是函数定义时的[]了。
所以,定义默认参数要牢记一点:默认参数必须指向不变对象!
修改后的函数:
def add_end(L=None):
if L is None:
L = []
L.append('END')
return L
可变参数
在Python函数中,还可以定义可变参数。顾名思义,可变参数就是传入的参数个数是可变的,可以是1个、2个到任意个,还可以是0个。
def calc(numbers):
sum = 0
for n in numbers:
sum = sum + n * n
return sum
关键字参数
可变参数允许你传入0个或任意个参数,这些可变参数在函数调用时自动组装为一个tuple。而关键字参数允许你传入0个或任意个含参数名的参数,这些关键字参数在函数内部自动组装为一个dict。
示例:
def person(name, age, **kw):
print('name:', name, 'age:', age, 'other:', kw)
person('Bob', 35, city='Beijing')
person('Adam', 45, gender='M', job='Engineer')
结果:
name: Bob age: 35 other: {'city': 'Beijing'}
name: Adam age: 45 other: {'gender': 'M', 'job': 'Engineer'}
命名关键字参数
要限制关键字参数的名字,就可以用命名关键字参数。
定义方法如下:
def person(name, age, *, city, job):
print(name, age, city, job)
参数组合
在Python中定义函数,可以用必选参数、默认参数、可变参数、关键字参数和命名关键字参数,这5种参数都可以组合使用。但是请注意,参数定义的顺序必须是:必选参数、默认参数、可变参数、命名关键字参数和关键字参数。
def f1(a, b, c=0, *args, **kw):
print('a =', a, 'b =', b, 'c =', c, 'args =', args, 'kw =', kw)
def f2(a, b, c=0, *, d, **kw):
print('a =', a, 'b =', b, 'c =', c, 'd =', d, 'kw =', kw)
在函数调用的时候,Python解释器自动按照参数位置和参数名把对应的参数传进去。
>>> f1(1, 2)
a = 1 b = 2 c = 0 args = () kw = {}
>>> f1(1, 2, c=3)
a = 1 b = 2 c = 3 args = () kw = {}
>>> f1(1, 2, 3, 'a', 'b')
a = 1 b = 2 c = 3 args = ('a', 'b') kw = {}
>>> f1(1, 2, 3, 'a', 'b', x=99)
a = 1 b = 2 c = 3 args = ('a', 'b') kw = {'x': 99}
>>> f2(1, 2, d=99, ext=None)
a = 1 b = 2 c = 0 d = 99 kw = {'ext': None}
递归函数
经典的例子:
def fibo(x):
if (x == 1 or x == 2):
return 1
else:
return fibo(x-1) + fibo(x-2)
print(fibo(30))
高级特性
切片
取一个list或tuple的部分元素是非常常见的操作。
例子:
L = ['Michael', 'Sarah', 'Tracy', 'Bob', 'Jack']
L[0:3]表示,从索引0开始取,直到索引3为止,但不包括索引3。
print(L[0:3])
结果:
['Michael', 'Sarah', 'Tracy']
print(L[-2:-1])
结果:
['Bob']
创建一个0-99的数列
L = list(range(100))
前10个数,每两个取一个
print(L[:10:2])
结果:
[0, 2, 4, 6, 8]
所有数,每5个取一个:
print(L[::5])
结果:
[0, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95]
迭代
在Python中,迭代是通过for … in来完成的。
dict的迭代:
d = {'a': 1, 'b': 2, 'c': 3}
for key in d:
print(key)
结果:
a
b
c
默认情况下,dict迭代的是key。如果要迭代value,可以用for value in d.values(),如果要同时迭代key和value,可以用for k, v in d.items()。
d = {'a': 1, 'b': 2, 'c': 3}
for key in d.values():
print(key)
结果:
1
2
3
同时获取key和value:
d = {'a': 1, 'b': 2, 'c': 3}
for key in d.items():
print(key)
结果:
('a', 1)
('b', 2)
('c', 3)
列表生成式
列表生成式即List Comprehensions,是Python内置的非常简单却强大的可以用来创建list的生成式。
列表生成式则可以用一行语句代替循环生成list:
print(x * x for x in range(1, 11)])
结果:
[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]
随机生成一个40位的随机数:
print("%s"*5%tuple([random.randint(10000000,99999999) for i in range(5)]))
还可以使用两层循环,可以生成全排列:
[m + n for m in 'ABC' for n in 'XYZ']
结果:
['AX', 'AY', 'AZ', 'BX', 'BY', 'BZ', 'CX', 'CY', 'CZ']
生成器
通过列表生成式,我们可以直接创建一个列表。但是,受到内存限制,列表容量肯定是有限的。而且,创建一个包含100万个元素的列表,不仅占用很大的存储空间,如果我们仅仅需要访问前面几个元素,那后面绝大多数元素占用的空间都白白浪费了。
所以,如果列表元素可以按照某种算法推算出来,那我们是否可以在循环的过程中不断推算出后续的元素呢?这样就不必创建完整的list,从而节省大量的空间。在Python中,这种一边循环一边计算的机制,称为生成器:generator。
让我们看看列表生成式与生成器的区别:
列表生成式:
L = [x * x for x in range(10)]
生成器:
g = (x * x for x in range(10))
创建L和g的区别仅在于最外层的[]和(),L是一个list,而g是一个generator。
list可以直接打印出来,但generator只能一个一个的生成。generator也是可以迭代的。
g = (x * x for x in range(10))
for n in g:
print(n)
generator非常强大。如果推算的算法比较复杂,用类似列表生成式的for循环无法实现的时候,还可以用函数来实现。
迭代器
凡是可作用于for循环的对象都是Iterable类型;
凡是可作用于next()函数的对象都是Iterator类型,它们表示一个惰性计算的序列;
集合数据类型如list、dict、str等是Iterable但不是Iterator,不过可以通过iter()函数获得一个Iterator对象。
Python的for循环本质上就是通过不断调用next()函数实现的。