Python --- 序列

1、序列概念

序列(sequence)是Python中最基本的数据结构。序列中的每一个元素都有自己独立的空间,并且也分配了一个序列号-----即索引。第一个元素的索引是0,第二个是1,以此类推。序列的索引也可以从右向左看,最后一个是-1,倒数第二个是-2,........。

Python内建的序列有列表、元组和字符串、Unicode字符串、buffer对象和xrange对象。

序列的两个主要特点是索引操作符和切片操作符。

1) 索引操作符让我们可以从序列中抓取一个特定的项目。

索引可以是负数,这样位置就是从序列尾开始计算的,如list[-1]表示序列最后一个项目。

2)切片操作符让我们能够获取序列的一个切片,即一部分子序列。

切片操作符是序列名后跟一个方括号,方括号中有一对可选的数字,并且用冒号分隔。切片操作符中的第一个数(冒号之前)表示切片开始的位置,第二个数(冒号之后)表示切片的结束位置,但不包括这个位置(如:list[2:5])。如果切片时,不指定第一个数,Python就会从序列的首开始(如list[:5])。如果不指定结束位置,Python就会停止在序列尾(如:list[3:])。

有时候,我们提取子序列时,可能不需要连续提取,可能隔一个或隔几个提取一个,这个时候就用到切片的步长值,默认的步长值是1,通常不写。

步长可以为负数,步长的正负表示索引的方向,正号表示从左到右索引;负号表示从右向左索引。当我们需要改变它时,直接在切片尾序列数后添加一个步长值即可,并且之间也是用冒号分隔的(如str[2:6:2])。

使用步长值,需要注意的是索引的方向,必须根据步长的正负进行规则调整。例如:

⑴步长为正数时

①起始位置的数和结束位置的数都是整数时,那么起始位置的数的必须小于结束位置的数,如str1[2:6:2]

②起始位置的数和结束位置的数都是负数时,那么起始位置的数的绝对值必须大于结束位置的数的绝对值,如str1[-6:-2:2]

⑵步长为负数时

①起始位置的数和结束位置的数都为整数时,起始位置的数必须大于结束位置的数,如tr1[6:2:-2]

②起始位置的数和结束位置的数都是负数时,起始位置的数的绝对值必须小于结束位置的数的绝对值,如str1[-2:-6:-2]

如果不遵守这个规则,就将得不到我们想要的结果。

2、序列的常用操作

[ ] [:] [: : ] :切片操作符

+     : 连接2个序列操作符

*     : 重复序列元素操作符

in,not in   : 成员操作符, 判断元素是否在序列中

len()  :求字符串的长度函数

max()  :  返回序列中的最大值函数

min()  :  返回序列中的最小值函数

cmp(tuple1, tuple2) : 比较2个序列值是否相同的函数

本文主要讨论字符串、列表、元组,由于它们都是序列,所以也遵循序列的一些操作规则。下面以字符串为例讲解一下切片和索引的基本操作:

>>>str = "abcdefghijklmn"
#查看字符串的长度
>>>len(str)
14
#切取下标2-6,但不包括6的字符串序列,也就相当于切取长度6-2=4的字符序列
>>>str[2:6]
'cdef'
>>>str[-4:-1]
'klm'
#从下标2开始切取到结束
>>>str[2:]
'cdefghijklmn'
#从首位开始切取到下标为6的子序列
>>>str[:7]
'abcdefg'
#以步长为2切取下标2-9的子序列
>>>str[2:9:2]
'cegi'
#使用“+”连接两字符串
>>>str[2:5] + str[10:14]
'cdeklmn'
#字符串重复打印3次
>>>str[1:3] * 3
'bcbcbc'
>>>"*" * 5
'*****'
#查看字符'c'是否存在字符串str中,存在返回true,不存在返货false
>>>'c' in str
True
>>>'z' in str
False
>>>"abc" in str
True
#查看"12"是否不在字符串str中,不存在返回true,存在返回false
>>>"12" not in str
True
#以步长为1,从右像左显示,也就是将原字符串翻转。
>>>str[::-1]
'nmlkjihgfedcba'
#获取字符串中最大的字符,以字符的ASCII码的值为比较依据
>>>max(str)
'n'
#获取字符串中最小的字符
>>>min(str)
'a'