数据结构是以某种方式(如通过编号)组合起来的数据元素(如数、字符乃至其他数据结构)的集合。Python中常见的数据结构可以统称为容器(container)。序列(如字符串、列表和元组)、映射(如字典)以及集合(set)是三类主要的容器。在Python中,最基本的数据结构为序列(sequence)。
1 序列的定义
- 所谓序列,指的是一块可存放多个值的连续内存空间,这些值按一定顺序排列,可通过每个值所在位置的编号(称为索引)访问它们。
- Python中有6种内建的序列。其中字符串、列表和元组是最常见的类型。还包括Unicode字符串、buffer对象和xrange对象。重点介绍字符串(str)、列表(list)和元组(tupel)。
- 序列是Python中最基本的数据结构。序列中的每个元素都分配一个数字 - 它的位置,或索引,第一个索引是0,第二个索引是1,依此类推。
- 字符串(str)、列表(list)、元组(tupel)都可以进行的操作包括索引,切片,加,乘,检查成员。
2 序列的通用操作
2.1 索引
序列中,每个元素都有属于自己的编号(索引)。从起始元素开始,索引值从0开始递增,如下图所示。
除此之外,Python 还支持索引值是负数,此类索引是从右向左计数,换句话说,从最后一个元素开始计数,从索引值 -1 开始,如下图所示。
注意:
在使用负值作为列序中各元素的索引值时,是从 -1 开始,而不是从 0 开始。
负数索引与正数索引之间存在一个规律:当正数索引+负数索引的绝对值=元素的个数,它们所指的是同一个元素。
2.2 切片
切片操作是访问序列中元素的另一种方法,它可以访问一定范围内的元素,通过切片操作,可以生成一个新的序列。
序列实现切片操作的语法格式如下:
sname[start : end : step]
其中,各个参数的含义分别是:
- sname:表示序列的名称;
- start:表示切片的开始索引位置(包括该位置),此参数也可以不指定,会默认为 0,也就是从序列的开头进行切片;
- end:表示切片的结束索引位置(不包括该位置),如果不指定,则默认为序列的长度;
- step:表示在切片过程中,隔几个存储位置(包含当前位置)取一次元素,也就是说,如果 step 的值大于 1,则在进行切片去序列元素时,会“跳跃式”的取元素。如果省略设置 step 的值,则最后一个冒号就可以省略。
2.3 相加
Python 中,支持两种类型相同的序列使用“+”运算符做相加操作,它会将两个序列进行连接,但不会去除重复的元素。
这里所说的“类型相同”,指的是“+”运算符的两侧序列要么都是列表类型,要么都是元组类型,要么都是字符串。
2.4 相乘
Python 中,使用数字 n 乘以一个序列会生成新的序列,其内容为原来序列被重复 n 次的结果。
2.5 检查成员
Python 中,可以使用 in 关键字检查某元素是否为序列的成员,返回值为布尔值。其语法格式为:
value in sequence
其中,value 表示要检查的元素,sequence 表示指定的序列。
和 in 关键字用法相同,但功能恰好相反的,还有 not in 关键字,它用法检查某个元素是否不包含在指定的序列中,其语法格式为:
value not in sequence
3 序列的内置函数
Python提供了几个内置函数(如下表所示),可用于实现与序列相关的一些常用操作。
函数 | 功能 |
len() | 计算序列的长度,即返回序列中包含多少个元素。 |
max() | 找出序列中的最大元素。注意,对序列使用 sum() 函数时,做加和操作的必须都是数字,不能是字符或字符串,否则该函数将抛出异常,因为解释器无法判定是要做连接操作(+ 运算符可以连接两个序列),还是做加和操作。 |
min() | 找出序列中的最小元素。 |
list() | 将序列转换为列表。 |
tuple() | 将序列转换为元组。 |
str() | 将序列转换为字符串。 |
sum() | 计算元素和。 |
sorted() | 对元素进行排序。 |
reversed() | 反向序列中的元素。 |
enumerate() | 将序列组合为一个索引序列,多用在 for 循环中。 |
zip() | 返回由各个参数的序列组成的元组。 |
序列的通用操作及内置函数在后面进行详细举例。