列表和元组


基础

列表和元组,都是一个可以放置任意数据类型的有序集合

l = [1, 2, 'hello', 'world']  # 列表中同时含有int和string类型的元素

tup = ('jason', 22)  # 元组中同时含有int和string类型的元素
  • 区别

列表是动态的,长度大小不固定,可以随意地增加、删减或者改变元素(mutable)

元组是静态的,长度大小固定,无法增加删减或者改变(immutable)

实例

l = [1, 2, 3, 4]
l[3] = 40
l
[1, 2, 3, 40]

tup = (1, 2, 3, 4)
tup[3] = 40
# 报错:TypeError

如果想对已有的元组做任何“改变”,只能重新开辟一块内存,创建新的元组。

实例

tup = (1, 2, 3, 4)
new_tup = tup + (5,)  # 创建新的元组new_tup,并依次填充原元组的值
new_tup
(1, 2, 3, 4, 5)

# 对于列表来说,只是修改原来列表元素,不会创建新的列表
l = [1, 2, 3, 4]
l.append(5)
l
[1, 2, 3, 4, 5]
  • Python中的列表和元组都支持负数索引
l = [1, 2, 3, 4]
l[-1]
4

tup = (1, 2, 3, 4)
tup[-1]
4
  • 列表和元组都支持切片操作
l = [1, 2, 3, 4]
l[1:3]
[2, 3]

tup = (1, 2, 3, 4)
tup[1:3  # 返回元组中索引从1到2的子元组
(2, 3)
  • 列表和元组可以随意嵌套
l = [[1, 2, 3], [4, 5]]  # 列表的每一个元素也是一个列表
tup = ((1, 2, 3), (4, 5, 6))  # 元组的每一个元素也是一个元组
  • 两者可以通过list()和tuple()函数相互转换
list((1, 2, 3))
[1, 2, 3]

tuple([1, 2, 3])
(1, 2, 3)
  • 列表和元组常用的内置函数
l = [3, 2, 3, 7, 8, 1]
l.count(3)
2

l.index(7)
3

l.reverse()
l
[1, 8, 7, 3, 2, 3]

l.sort()
l
[1, 2, 3, 3, 7, 8]

tup = (3, 2, 3, 7, 8, 1)
tup.count(3)
2

tup.index(7)
3

list(reversed(tup))
[1, 8, 7, 3, 2, 3]

sorted(tup)
[1, 2, 3, 3, 7, 8]

函数含义:

count(item)统计列表/元组中item出现的次数

index(item)表示返回列表/元组中item第一次出现的索引

list.reverse()和list.sort()表示原地倒转列表和排序(元组没有这两个函数)

reversed()和sorted()同样表示对列表/元组进行倒序和排序,reversed()返回一个倒转后的迭代器;sorted()返回拍好序列的新列表

列表和元组存储方式的差异

示例

l = [1, 2, 3]
l.__sizeof__()
64

tup = (1, 2, 3)
tup.__sizeof__()
48

放置相同的元素,元组的存储空间要比列表要少16字节

由于列表是动态的,所以它需要存储指针,来指向对应的元素(对于int型,8字节)。

另外,由于列表可变,所以需要额外存储已经分的长度大小(8字节),这样才可以实时追踪列表空间的使用情况,当空间不足,及时分配额外空间。

l = []
l.__sizeof__()  # 空列表的存储空间为40字节
40
l.append(1)
l.__sizeof__() 
72  # 加入了元素1之后,列表为其分配了可以存储4个元素的空间 (72 - 40)/8 = 4
l.append(2) 
l.__sizeof__()
72  # 由于之前分配了空间,所以加入元素2,列表空间不变
l.append(3)
l.__sizeof__() 
72  # 同上
l.append(4)
l.__sizeof__() 
72  # 同上
l.append(5)
l.__sizeof__() 
104  # 加入元素5之后,列表的空间不足,所以又额外分配了可以存储4个元素的空间

为了减少每次增加/删减操作空间分配的开销,Python每次分配空间时都会额外多分配一些,这样的机制(over-allocating)保证了其操作的高效性:增加/删除的时间复杂度均为O(1)

对于元组,长度带下固定,元素不可变,所以存储空间固定。

列表和元组的性能

元组要比列表更加轻量级一些,所以总体上来说,元组的性能速度要略优于列表

Python在后台,对静态数据做一些资源缓存(resource caching)。通常来说,因为垃圾回收机制的存在,一些变量不被使用了,Python就会回收它们所占用的内存,返还给操作系统,以便其他变量或者其他应用使用

但时对于一些静态变量,比如元组,如果它不被使用并且占用空间不大时,Python会暂时缓存这部分内存。

这样下次在创建同样大小的元组时,Python就可以不再用像操作系统发出请求,去寻找内存,而是直接分配之前缓存的内存空间,这样就能大大加快程序的运行速度。

示例

  • 初始化一个相同元素的列表和元组分别所需时间
python3 -m timeit 'x=(1,2,3,4,5,6)'
20000000 loops, best of 5: 9.97 nsec per loop
python3 -m timeit 'x=[1,2,3,4,5,6]'
5000000 loops, best of 5: 50.1 nsec per loop

如果想要增加、删减或者改变元素,那么列表显然更优

列表和元组的使用场景
  • 如果存储的数据和数量不变,如一个函数,返回一个地点的经纬度,选元组更合适
def get_location():
    ......
    return (longitude, latitude)
  • 如果存储的数据或数量是可变的,如社交平台上的一个日记功能,统计用户看过的内容,选列表更合适
viewer_owner_id_list = []  # 里面的每个元素记录了这个viewer一周内看过的所有owner的id
records = queryDB(viewer_id)  # 索引数据库,拿到某个viewer一周内的日志
for record in records:
    viewer_owner_id_list.append(record.id)