一直想学习python,虽然编程写了不少,但有时仍不得要领。这篇blog主要是记录python的一些主要特性。

前言

python学习总结,包括python的一些基本语法,高级特性,函数式编程,面向对象编程以及错误调试,测试和多线程。

Python基础

字符串

#!/usr/bin/env python3
# -*- coding: utf-8 -*-

第一行注释是为了告诉Linux/OS X系统,这是一个Python可执行程序,Windows系统会忽略这个注释;

第二行注释是为了告诉Python解释器,按照UTF-8编码读取源代码,否则,你在源代码中写的中文输出可能会有乱码。

数据类型和变量

整数
浮点数
字符串
布尔值

list和tuple

list与tuple的区别:list是可变的,tuple一旦定义则不可变。

定义

List
空List的定义方法: classmates = []

classmates = ['Michael', 'Bob', 'Tracy']
print(classmates)
print(classmates[-1])

结果:
['Michael', 'Bob', 'Tracy']
Tracy

Tuple
空Tuple的定义方法: classmates = ()    

classmates = ('Michael', 'Bob', 'Tracy')
print(classmates)
print(classmates[-1])

结果:
 ('Michael', 'Bob', 'Tracy') 
 Tracy

条件判断

elif是else if的缩写,完全可以有多个elif,所以if语句的完整形式就是:

if <条件判断1>:
    <执行1>
elif <条件判断2>:
    <执行2>
elif <条件判断3>:
    <执行3>
else:
    <执行4>

循环

Python的循环有两种,一种是for…in循环,依次把list或tuple中的每个元素迭代出来

names = ['Michael', 'Bob', 'Tracy']
for name in names:
    print(name)

第二种循环是while循环,只要条件满足,就不断循环,条件不满足时退出循环。

sum = 0
n = 99
while n > 0:
    sum = sum + n
    n = n - 2
print(sum)

与大多数语言类似的 break 与 continue 语句的作用也相似。

dict与set

dict

Python内置了字典:dict的支持,dict全称dictionary,在其他语言中也称为map,使用键-值(key-value)存储,由于是用红黑树构造的,具有极快的查找速度。

以下介绍dict的定义,索引以及get(),pop()函数。

dict定义:
d = {'Michael': 95, 'Bob': 75, 'Tracy': 85}

索引:
d = {'Michael': 95, 'Bob': 75, 'Tracy': 85}
print(d['Bob'])
结果:75

get()方法,dict提供的get方法,如果key不存在,可以返回None,或者自己指定的value:

print(d.get('Bob', 0))
结果:75
print(d.get('B', 0))
结果:0

pop()方法,要删除一个key,用pop(key)方法,对应的value也会从dict中删除:

d = {'Michael': 95, 'Bob': 75, 'Tracy': 85}
d.pop('Bob')
print(d)
结果:{'Michael': 95, 'Tracy': 85}

函数

定义函数

定义函数例子:

def my_abs(x):
    if x >= 0:
        return x
    else:
        return -x

如果你已经把my_abs()的函数定义保存为abstest.py文件了,那么,可以在该文件的当前目录下启动Python解释器,用from abstest import my_abs来导入my_abs()函数,注意abstest是文件名(不含.py扩展名)

空函数

如果想定义一个什么事也不做的空函数,可以用pass语句:

def nop():
    pass

缺少了pass,代码运行就会有语法错误。

参数检查

调用函数时,如果参数个数不对,Python解释器会自动检查出来,并抛出TypeError:

>>> my_abs(1, 2)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: my_abs() takes 1 positional argument but 2 were given

但是如果参数类型不对,Python解释器就无法帮我们检查。

让我们修改一下my_abs的定义,对参数类型做检查,只允许整数和浮点数类型的参数。数据类型检查可以用内置函数isinstance()实现:

def my_abs(x):
    if not isinstance(x, (int, float)):
        raise TypeError('bad operand type')
    if x >= 0:
        return x
    else:
        return -x

返回多个值

函数可以返回多个值吗?答案是肯定的。

import math

def move(x, y, step, angle=0):
    nx = x + step * math.cos(angle)
    ny = y - step * math.sin(angle)
    return nx, ny

以上代码返回的多个参数会自动以tuple的方式返回。

r = move(100, 100, 60, math.pi / 6)
print(r)

结果:
(151.96152422706632, 70.0)

函数的参数

位置参数

def power(x, n):
    s = 1
    while n > 0:
        n = n - 1
        s = s * x
    return s

power(x, n)函数有两个参数:x和n,这两个参数都是位置参数,调用函数时,传入的两个值按照位置顺序依次赋给参数x和n。

默认参数

添加默认参数:

def power(x, n=2):
    s = 1
    while n > 0:
        n = n - 1
        s = s * x
    return s

当我们调用power(5)时,相当于调用power(5, 2)。

默认参数的一个需要注意的问题:

def add_end(L=[]):
    L.append('END')
    return L

正常调用时,结果似乎不错:

add_end([1, 2, 3])

结果:[1, 2, 3, 'END']

但多次调用时,就出问题了:

print(add_end())
print(add_end())
print(add_end())

结果:
['END']
['END', 'END']
['END', 'END', 'END']

Python函数在定义的时候,默认参数L的值就被计算出来了,即[],因为默认参数L也是一个变量,它指向对象[],每次调用该函数,如果改变了L的内容,则下次调用时,默认参数的内容就变了,不再是函数定义时的[]了。

所以,定义默认参数要牢记一点:默认参数必须指向不变对象!

修改后的函数:

def add_end(L=None):
    if L is None:
        L = []
    L.append('END')
    return L

可变参数

在Python函数中,还可以定义可变参数。顾名思义,可变参数就是传入的参数个数是可变的,可以是1个、2个到任意个,还可以是0个。

def calc(numbers):
    sum = 0
    for n in numbers:
        sum = sum + n * n
    return sum

关键字参数

可变参数允许你传入0个或任意个参数,这些可变参数在函数调用时自动组装为一个tuple。而关键字参数允许你传入0个或任意个含参数名的参数,这些关键字参数在函数内部自动组装为一个dict。

示例:

def person(name, age, **kw):
        print('name:', name, 'age:', age, 'other:', kw)
person('Bob', 35, city='Beijing')
person('Adam', 45, gender='M', job='Engineer')

结果:
name: Bob age: 35 other: {'city': 'Beijing'}
name: Adam age: 45 other: {'gender': 'M', 'job': 'Engineer'}

命名关键字参数

要限制关键字参数的名字,就可以用命名关键字参数。
定义方法如下:

def person(name, age, *, city, job):
    print(name, age, city, job)

参数组合

在Python中定义函数,可以用必选参数、默认参数、可变参数、关键字参数和命名关键字参数,这5种参数都可以组合使用。但是请注意,参数定义的顺序必须是:必选参数、默认参数、可变参数、命名关键字参数和关键字参数。

def f1(a, b, c=0, *args, **kw):
    print('a =', a, 'b =', b, 'c =', c, 'args =', args, 'kw =', kw)

def f2(a, b, c=0, *, d, **kw):
    print('a =', a, 'b =', b, 'c =', c, 'd =', d, 'kw =', kw)

在函数调用的时候,Python解释器自动按照参数位置和参数名把对应的参数传进去。

>>> f1(1, 2)
a = 1 b = 2 c = 0 args = () kw = {}
>>> f1(1, 2, c=3)
a = 1 b = 2 c = 3 args = () kw = {}
>>> f1(1, 2, 3, 'a', 'b')
a = 1 b = 2 c = 3 args = ('a', 'b') kw = {}
>>> f1(1, 2, 3, 'a', 'b', x=99)
a = 1 b = 2 c = 3 args = ('a', 'b') kw = {'x': 99}
>>> f2(1, 2, d=99, ext=None)
a = 1 b = 2 c = 0 d = 99 kw = {'ext': None}

递归函数

经典的例子:

def fibo(x):
    if (x == 1 or x == 2):
        return 1
    else:
        return fibo(x-1) + fibo(x-2)

print(fibo(30))

高级特性

切片

取一个list或tuple的部分元素是非常常见的操作。

例子:

L = ['Michael', 'Sarah', 'Tracy', 'Bob', 'Jack']

L[0:3]表示,从索引0开始取,直到索引3为止,但不包括索引3。

print(L[0:3])

结果:

['Michael', 'Sarah', 'Tracy']

print(L[-2:-1])

结果:

['Bob']

创建一个0-99的数列

L = list(range(100))

前10个数,每两个取一个

print(L[:10:2])

结果:

[0, 2, 4, 6, 8]

所有数,每5个取一个:

print(L[::5])

结果:

[0, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95]

迭代

在Python中,迭代是通过for … in来完成的。
dict的迭代:

d = {'a': 1, 'b': 2, 'c': 3}
for key in d:
    print(key)

结果:

a
b
c

默认情况下,dict迭代的是key。如果要迭代value,可以用for value in d.values(),如果要同时迭代key和value,可以用for k, v in d.items()。

d = {'a': 1, 'b': 2, 'c': 3}
for key in d.values():
    print(key)

结果:

1
2
3

同时获取key和value:

d = {'a': 1, 'b': 2, 'c': 3}
for key in d.items():
    print(key)

结果:

('a', 1)
('b', 2)
('c', 3)

列表生成式

列表生成式即List Comprehensions,是Python内置的非常简单却强大的可以用来创建list的生成式。

列表生成式则可以用一行语句代替循环生成list:

print(x * x for x in range(1, 11)])

结果:

[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]

随机生成一个40位的随机数:

print("%s"*5%tuple([random.randint(10000000,99999999) for i in range(5)]))

还可以使用两层循环,可以生成全排列:

[m + n for m in 'ABC' for n in 'XYZ']

结果:

['AX', 'AY', 'AZ', 'BX', 'BY', 'BZ', 'CX', 'CY', 'CZ']

生成器

通过列表生成式,我们可以直接创建一个列表。但是,受到内存限制,列表容量肯定是有限的。而且,创建一个包含100万个元素的列表,不仅占用很大的存储空间,如果我们仅仅需要访问前面几个元素,那后面绝大多数元素占用的空间都白白浪费了。

所以,如果列表元素可以按照某种算法推算出来,那我们是否可以在循环的过程中不断推算出后续的元素呢?这样就不必创建完整的list,从而节省大量的空间。在Python中,这种一边循环一边计算的机制,称为生成器:generator。

让我们看看列表生成式与生成器的区别:

列表生成式:
L = [x * x for x in range(10)]
生成器:
g = (x * x for x in range(10))

创建L和g的区别仅在于最外层的[]和(),L是一个list,而g是一个generator。
list可以直接打印出来,但generator只能一个一个的生成。generator也是可以迭代的。

g = (x * x for x in range(10))
for n in g:
    print(n)

generator非常强大。如果推算的算法比较复杂,用类似列表生成式的for循环无法实现的时候,还可以用函数来实现。

迭代器

凡是可作用于for循环的对象都是Iterable类型;

凡是可作用于next()函数的对象都是Iterator类型,它们表示一个惰性计算的序列;

集合数据类型如list、dict、str等是Iterable但不是Iterator,不过可以通过iter()函数获得一个Iterator对象。

Python的for循环本质上就是通过不断调用next()函数实现的。