Python --- 序列
1、序列概念
序列(sequence)是Python中最基本的数据结构。序列中的每一个元素都有自己独立的空间,并且也分配了一个序列号-----即索引。第一个元素的索引是0,第二个是1,以此类推。序列的索引也可以从右向左看,最后一个是-1,倒数第二个是-2,........。
Python内建的序列有列表、元组和字符串、Unicode字符串、buffer对象和xrange对象。
序列的两个主要特点是索引操作符和切片操作符。
1) 索引操作符让我们可以从序列中抓取一个特定的项目。
索引可以是负数,这样位置就是从序列尾开始计算的,如list[-1]表示序列最后一个项目。
2)切片操作符让我们能够获取序列的一个切片,即一部分子序列。
切片操作符是序列名后跟一个方括号,方括号中有一对可选的数字,并且用冒号分隔。切片操作符中的第一个数(冒号之前)表示切片开始的位置,第二个数(冒号之后)表示切片的结束位置,但不包括这个位置(如:list[2:5])。如果切片时,不指定第一个数,Python就会从序列的首开始(如list[:5])。如果不指定结束位置,Python就会停止在序列尾(如:list[3:])。
有时候,我们提取子序列时,可能不需要连续提取,可能隔一个或隔几个提取一个,这个时候就用到切片的步长值,默认的步长值是1,通常不写。
步长可以为负数,步长的正负表示索引的方向,正号表示从左到右索引;负号表示从右向左索引。当我们需要改变它时,直接在切片尾序列数后添加一个步长值即可,并且之间也是用冒号分隔的(如str[2:6:2])。
使用步长值,需要注意的是索引的方向,必须根据步长的正负进行规则调整。例如:
⑴步长为正数时
①起始位置的数和结束位置的数都是整数时,那么起始位置的数的必须小于结束位置的数,如str1[2:6:2]
②起始位置的数和结束位置的数都是负数时,那么起始位置的数的绝对值必须大于结束位置的数的绝对值,如str1[-6:-2:2]
⑵步长为负数时
①起始位置的数和结束位置的数都为整数时,起始位置的数必须大于结束位置的数,如tr1[6:2:-2]
②起始位置的数和结束位置的数都是负数时,起始位置的数的绝对值必须小于结束位置的数的绝对值,如str1[-2:-6:-2]
如果不遵守这个规则,就将得不到我们想要的结果。
2、序列的常用操作
[ ] [:] [: : ] :切片操作符
+ : 连接2个序列操作符
* : 重复序列元素操作符
in,not in : 成员操作符, 判断元素是否在序列中
len() :求字符串的长度函数
max() : 返回序列中的最大值函数
min() : 返回序列中的最小值函数
cmp(tuple1, tuple2) : 比较2个序列值是否相同的函数
本文主要讨论字符串、列表、元组,由于它们都是序列,所以也遵循序列的一些操作规则。下面以字符串为例讲解一下切片和索引的基本操作:
>>>str = "abcdefghijklmn"
#查看字符串的长度
>>>len(str)
14
#切取下标2-6,但不包括6的字符串序列,也就相当于切取长度6-2=4的字符序列
>>>str[2:6]
'cdef'
>>>str[-4:-1]
'klm'
#从下标2开始切取到结束
>>>str[2:]
'cdefghijklmn'
#从首位开始切取到下标为6的子序列
>>>str[:7]
'abcdefg'
#以步长为2切取下标2-9的子序列
>>>str[2:9:2]
'cegi'
#使用“+”连接两字符串
>>>str[2:5] + str[10:14]
'cdeklmn'
#字符串重复打印3次
>>>str[1:3] * 3
'bcbcbc'
>>>"*" * 5
'*****'
#查看字符'c'是否存在字符串str中,存在返回true,不存在返货false
>>>'c' in str
True
>>>'z' in str
False
>>>"abc" in str
True
#查看"12"是否不在字符串str中,不存在返回true,存在返回false
>>>"12" not in str
True
#以步长为1,从右像左显示,也就是将原字符串翻转。
>>>str[::-1]
'nmlkjihgfedcba'
#获取字符串中最大的字符,以字符的ASCII码的值为比较依据
>>>max(str)
'n'
#获取字符串中最小的字符
>>>min(str)
'a'