一、内置函数
1. complex([real[,imag]])
返回一个复数,实部 + 虚部*1j,或者把字符串或者数字转成复数形式。
参数可以是复数表达式,也可以是字符串。当参数是字符串的时候,数字与操作符之间不能有空格。即comple('1 + 2j')是错误的。
print(complex(1, 2))
print(complex(1 + 2j))
print(complex('1+2j'))
# 输出 1+2j
print(complex(1))
# 输出 1+0j
满足:实部 + 虚部*1j 的数被称为复数。
a = 1 + 3j
# 求实部
print(a.real)
# 求虚部
print(a.imag)
# 求共轭
print(a.conjugate())
2. chr(i) 与 ord(i)
chr(i) 是将当前整数 i 转成对应的 ascii 字符,可以是十进制,也可以是十六进制,其中0 <= i <= 0x10ffff (1114111)。其对应的逆操作为 ord(i),i 为 ascii 字符。
下面的函数演示如何求一个可迭代对象的 ascil字符 或者其对应的数值。注意函数 ordplus ,参数 x 中的每一个元素必须是单个字符,如果是列表,形式如下:[‘P’ , ‘y’, ‘t’ , ‘h’, ‘o’ , ‘n’]。
def chrplus(x):
chr_string = ''
for elem in x:
chr_string += chr(elem)
return chr_string
def ordplus(x):
ord_list = []
for elem in x:
ord_list.append(ord(elem))
return ord_list
x = 'Python高效编程'
temp = ordplus(x)
print(temp)
# 输出:[112, 121, 116, 104, 111, 110,
# 39640, 25928, 32534,31243]
init = chrplus(temp)
print(init)
# 输出:Python高效编程
3.enumerate(iterable, start=0)
返回 enumerate 对象。迭代对象必须是序列,迭代器,或者其他支持迭代的对象。enmerate() 函数返回的是迭代器,同样是可迭代对象。每次迭代的元素,都包含元素在序列里的序号(strat 默认值为 0) 和元素对应值。因此,我们可以用 for 循环获取返回值。
等价于:
def enumerate(sequence, start=0):
n = start
for elem in sequence:
yield n, elem
n += 1
for i, elem in enumerate(['P', 'y', 't', 'h', 'o', 'n']):
print(i, elem)
4. abs(x)
返回数的绝对值。参数可以是整数或者浮点数。如果参数是复数,返回复数的模。Python 中虚数用数值加上字符 j 的形式表示。要注意 j 前面的数值不能省略,比如 1j。
下面是我写的简易版的 abs 函数:
from math import sqrt
def naive_abs(x):
# isinstance 判断参数x是否为整数或浮点数
if isinstance(x, int) or isinstance(x, float):
if x < 0:
x = - x
# 判断参数x是否为复数
elif isinstance(x, complex):
# x.real 复数的实部
# x.imag 复数的虚部
real = x.real
imag = x.imag
# 求复数的模
x = sqrt(real ** 2 + imag ** 2)
else :
return '请输入 int float complex'
return x
print(abs(3+4j))
print(naive_abs(3+4j))
# 输出 5.0
print(abs(-6))
print(naive_abs(-6))
# 输出 6
二、算法与数据结构
1. 二分查找
要想使用二分搜索,首先要确保迭代序列是有序的。对于无序序列,我们首先要进行排序操作。
每次循环缩小一半搜索范围,时间复杂度为 O(logn)。每次循环,比较选取的中间数与需要查找的数字,如果待查数小于中间数,就减少右界至中间数的前一个数;如果待查数大于中间数,就增加左界到中间数后一个数;如果待查数等于中间数,返回中间数的下标,该下标即为待查数在序列中的位置。当左界大于右界时,循环结束,说明序列中并没有待查数。
def binary_search(item, find):
# 有序可迭代对象
left, right = 0, len(item) - 1
mid = left + (right - left) // 2
while left <= right:
if item[mid] == find:
return mid
elif item[mid] > find:
right = mid - 1
else:
left = mid + 1
mid = left + (right - left) // 2
return None
seq = [1, 4, 7, 9, 13, 17, 18, 21, 34, 45, 65]
binary_search(seq, 13)
# 输出:4
2. 快速排序
首先要打乱序列顺序 ,以防算法陷入最坏时间复杂度。快速排序使用“分而治之”的方法。对于一串序列,首先从中选取一个数,凡是小于这个数的值就被放在左边一摞,凡是大于这个数的值就被放在右边一摞。然后,继续对左右两摞进行快速排序。直到进行快速排序的序列长度小于 2 (即序列中只有一个值或者空值)。
# quicksort
import random
def quicksort(seq):
if len(seq) < 2:
return seq
else:
base = seq[0]
left = [elem for elem in seq[1:] if elem < base]
right = [elem for elem in seq[1:] if elem > base]
return quicksort(left) + [base] + quicksort(right)
seq = [9, 8, 7, 6, 5, 4, 3]
random.shuffle(seq)
# seq:[6, 4, 9, 3, 8, 5, 7]
print(quicksort(seq))
# 输出:[3, 4, 5, 6, 7, 8, 9]
3. 冒泡排序
冒泡排序(顺序形式),从左向右,两两比较,如果左边元素大于右边,就交换两个元素的位置。其中,每一轮排序,序列中最大的元素浮动到最右面。也就是说,每一轮排序,至少确保有一个元素在正确的位置。这样接下来的循环,就不需要考虑已经排好序的元素了,每次内层循环次数都会减一。其中,如果有一轮循环之后,次序并没有交换,这时我们就可以停止循环,得到我们想要的有序序列了。
def bouble_sort(sequence):
seq = sequence[:]
length = len(seq) - 1
i = j = 0
flag = 1
while i < length:
j = 0
while j < length - i:
if seq[j] > seq[j + 1]:
seq[j], seq[j + 1] = seq[j + 1], seq[j]
flag = 0
j += 1
if flag:
break
i += 1
return seq
4. 选择排序
选择排序,每次选择当前序列的最小值,将其与当前序列的第一个元素交换位置,每迭代一次,当前序列长度减一。迭代结束,即可得到有序序列。
def find_minimal_index(seq):
min_elem = seq[0]
count = 0
min_elem_index = count
for elem in seq[1:]:
count += 1
if elem < min_elem:
elem, min_elem = min_elem, elem
min_elem_index = count
return min_elem_index
def select_sort(sequence):
# 选择排序
seq = sequence[:]
length = len(seq)
for i in range(length):
index = find_minimal_index(seq[i:])
seq[index + i], seq[i] = seq[i], seq[index + i]
return seq
5. 去重序列重复元素
首先新建一个集合 set,对于序列中的元素,如果已经在集合中了,我们就不返回这个值。如果不在集合中,就向集合添加这个元素,并返回这个值。key 是函数名,通过修改 key,我们可以改变重复元素的判断依据。比如对于下面这个序列:a = [{'a': 6, 'b': 4}, {'a': 6, 'b': 3}, {'a': 6, 'b': 4},{'a': 8, 'b': 12}]list(dedupe(a, lambda x: x['a']))这里我们把 dedupe 设置为,基于关键字 ‘a’ 对应值去除重复元素,也就是说集合中添加的元素为关键字 ‘a’ 对应值。输出为:[{'a': 6, 'b': 4}, {'a': 8, 'b': 12}]list(dedupe(a, lambda x: (x['a'],x['b'])))这里,集合添加的是关键字’a’和’b’对应值的元组。
输出为: [{'a': 6, 'b': 4}, {'a': 6, 'b': 3}, {'a': 8, 'b': 12}]
# Python高效编程
def dedupe(sequence, key):
# 依序去除重复元素
seen = set()
items = sequence[:]
for item in items:
if key:
seq = key(item)
if seq not in seen:
seen.add(seq)
yield item
6. Vector
这一节,我们来实现一个简单的 Vector 类。Vector 类有两个属性,为 x,y 坐标,即对应向量的横纵坐标。首先,实现重载 + 号的方法def __add__,及实现两个向量的加法。具体做法是:将加号两边的 Vector 对象的 x, y值相加,得到新的 x, y值并且返回一个新的向量对象。__sub__方法实现了 Vector 对象的减法,和加法差不多。让向量对象的对应属性相减,并返回新的向量对象。__ads__方法,使得可以对实例进行 ads操作(即取横纵坐标的模)。__mul__方法,使得实例可以通过乘法进行伸缩的操作。__repr__与__str__方法使得打印对象更加美观。
import math
# Python高效编程
class Vector(object):
def __init__(self, x, y):
self.x = x
self.y = y
def __add__(self, other):
x = self.x + other.x
y = self.y + other.y
return Vector(x, y)
def __sub__(self, other):
x = self.x - other.x
y = self.y - other.y
return Vector(x, y)
def __abs__(self):
return math.sqrt(self.x ** 2 + self.y ** 2)
def __bool__(self):
return bool(self.x or self.y)
def __mul__(self, times):
return Vector(self.x * times, self.y * times)
def __repr__(self):
return 'Vector({}, {})'.format(self.x, self.y)
__str__ = __repr__
def main():
v1 = Vector(3, 5)
v2 = Vector(4, 5)
v3 = v1 + v2
v4 = v3 * 2
v5 = v2 - v1
print(v3)
print(v4)
print(abs(v3))
print(v5)
if __name__ == '__main__':
main()
# 输出:
# Vector(7, 10)
# Vector(14, 20)
# 12.206555615733702
# Vector(1, 0)
7. 具名元组
具名元组(namedtuple) 是 python 标准库 collections 中的工厂函数。它接受两个参数,第一个参数表示类的名称,第二个参数是类的字段名。后者可以是可迭代对象,也可以是空格隔开的字符串。然后,我们通过一串参数的形式将参数传递到构造函数中。这样,我们既可以通过字段名访问元素,也可以用索引访问元素。
from collections import namedtuple
ToDo = namedtuple('ToDo', 'date content priority')
t = ToDo(12, 'null', 1)
print(t.date)
print(t[1])
# 输出:
# 12
# null
下面是具名元组的演示程序:我们创建了一个 ToDoList 类,并且支持 + 、索引、切片与显示等操作。并且通过格式化输出,美化打印结果。
from collections import namedtuple
ToDo = namedtuple('ToDo', 'date content priority')
class ToDoList:
def __init__(self):
self.item = []
def add(self, date, content, priority):
self.item.append(ToDo(date, content, priority))
def _modify(self, item):
self.item = item
@property
def _getitem(self):
return self.item
def __getitem__(self, pos):
return self.item[pos]
def __add__(self, other):
item = self._getitem + other._getitem
t = ToDoList()
t._modify(item)
return t
def __repr__(self):
items = self._getitem
text = '{:<5}{:^10}{:^10}'.format('date', 'content', 'priority')
fmt = '{:<5}{:^10}{:^10}'
for item in items:
text += '
'
text += fmt.format(item.date, item.content, item.priority)
return text
__str__ = __repr__
def main():
t1 = ToDoList()
t1.add(12, 'play', 0)
t1.add(8, 'seek', 6)
t2 = ToDoList()
t2.add(4, 'sleep', 2)
t3 = t1 + t2
print(t3)
if __name__ == '__main__':
main()
# 输出
# date content priority
#12 play 0
#8 seek 6
# 4 sleep 2
三、递归
1. 阶乘
迭代停止条件:n < 2
# 阶乘
# n > 0
def factor(n):
return 1 if n < 2 else n * factor(n-1)
2. 序列和
迭代停止条件:序列为空
# 和
def naive_sum(seq):
if not seq:
return 0
else:
return seq[0] + naive_sum(seq[1:])
3. 求序列长度
迭代停止条件:序列为空
# 计数
def naive_count(seq):
if not seq:
return 0
else:
return 1 + naive_count(seq[1:])
4. 求序列最大值
迭代停止条件:序列为空
# 最大值
count = 1
def naive_max(seq):
global count
global max_num
if count:
max_num = seq[0]
count = 0
if not seq:
count = 1
return max_num
else:
if seq[0] > max_num:
seq[0], max_num = max_num, seq[0]
return naive_max(seq[1:])