字符串的本质事字符序列
Python的字符串是不可变的,无法修改。
Python不支持单字符类型,单字符也是作为一个字符串使用的
引号创建字符串
可以通过使用单引号或者双引号创建字符串,优点是可以创建本身就包含引号的字符串,而不用使用转义字符。
可以使用连续三个单引号或者三个双引号创建多行字符串。
Python允许空字符串存在
不包含任何字符且长度为零。
len()用于计算字符串包含多少字符。
转义字符|
转义字符 | 描述 |
\ (在行尾时) | 续航符 |
\ \ | 反斜杠符号 |
’ | 单引号 |
" | 双引号 |
\b | 退格 |
\n | 换行 |
\t | 横向制表符 |
\r | 回车 |
拼接字符串
1.可以使用+将多个字符串拼接起来,例:“a”+“b” ==>> “ab”
(1)如果两边都是字符串则拼接
(2)如果两边都是数字则计算
(3)如果两边的类型不同则抛出异常
2.可以直接将多个字面字符串放到一起实现拼接,例如’AA’ ‘BB’ =>>‘AABB’
字符串复制
可以使用 * 完成字符串的复制,例:“a”*3 ==>>“aaa”
不换行打印
在使用print()时,会自动打印一个换行符,如果不想换行,可以通过参数 end = “任意字符” 。实现末尾添加任何内容。
从控制台读取字符
我们可以使用input()来从控制台读取键盘输入的内容
str()实现数字转型字符串
str()可以将其它数据类型转换为字符串
使用[]提取字符串
因为字符串的本质是字符序列,我们可以通过在字符串后添加[],在[]中添加指定偏移量,可以提取该位置的指定字符。
正向搜索:最左侧第一个字符偏移量为0 向右依次增加,直到 len(str ) - 1为止
反向搜索:最右侧第一个字符为偏移量为-1 向左依次减少,直到 -len(str)为止
使用replace()完成字符串的替换
字符串不可改变,当需要替换某些字符时,可以通过创建新的字符串来实现。
a = “abcdef”
a = a.replace(“c”,“s”)
a ==>> “absdef”
其实质是创建了新的字符串对象,并指向了变量a。
字符串切片slice操作
切片 slice 操作可以让我们快速的提取子字符串。
标准格式为: [起始偏移量start:终止偏移量end:步长 step]
典型操作(三个量为正数的情况)如下:
操作和说明 | 示例 | 结果 |
[:] 提取整个字符串 | “abcdef” [:] | “abcdef” |
[start:]从start 索引开始到结尾 | “abcdef” [2:] | “cdef” |
[:end]从头开始知道 end-1 | “abcdef” [:2] | “ab” |
[start:end]从start 到 end-1 | “abcdef” [2:4] | “cd” |
[start: end:step]从 start 提取到 end-1,步长是 step | “abcdef” [1:5:2] | “bd” |
其他操作(三个量为负数)的情况
示例 | 说明 | 结果 |
“abcdefghijklmnopqrstuv wxyz”[-3: ] | 倒数三个 | “xyz” |
“abcdefghijklmnopqrstuv wxyz”[-8:-3] | 倒数第八个到倒数第 三个(包头不包尾 | ‘stuvw’ |
“abcdefghijklmnopqrstuv wxyz”[::-1] | 步长为负,从右到左 反向提 | ‘zyxwvutsrqpon mlkjihgfedcba’ |
切片操作时,起始偏移量和终止偏移量不在[0,字符串长度-1]这个范围,也不会报错。起始 偏移量小于0则会当做 0,终止偏移量大于“长度-1”会被当成-1
split()分割和join()合并
split()可以基于指定分隔符将字符串分隔成多个子字符串(存储到列表中)。如果不指定分隔 符,则默认使用空白字符(换行符/空格/制表符)。示例代码如下:
>>> a = "to be or not to be"
>>>> a.split() ['to', 'be', 'or', 'not', 'to', 'be']
>>>> a.split('be')
>['to ', ' or not to ', '']
join()的作用和split()作用刚好相反,用于将一系列子字符串连接起来。示例代码如下
>>> a = ['sxt','sxt100','sxt200']
>>> '*'.join(a)
'sxt*sxt100*sxt200'
拼接字符串要点: 使用字符串拼接符+,会生成新的字符串对象,因此不推荐使用+来拼接字符串。推荐 使用join 函数,因为join函数在拼接字符串之前会计算所有字符串的长度,然后逐一拷贝, 仅新建一次对象。
字符串驻留机制和字符串比较
字符串驻留:仅保存一份相同且不可变字符串的方法,不同的值被存放在字符串驻留池中。 Python 支持字符串驻留机制,对于符合标识符规则的字符串(仅包含下划线(_)、字母 和数字)会启用字符串驻留机制驻留机制。
字符串比较和同一性
我们可以直接使用==,!=对字符串进行比较,是否含有相同的字符。 我们使用is / not is,判断两个对象是否同一个对象。比较的是对象的地址,即 id(obj1)是 否和 id(obj2)相等
成员操作符
in /not in 关键字,判断某个字符(子字符串)是否存在于字符串中
去除首尾信息
我们可以通过 strip()去除字符串首尾指定信息。通过 lstrip()去除字符串左边指定信息, rstrip()去除字符串右边指定信息
>>> "*s*x*t*".strip("*")
's*x*t'
>>> "*s*x*t*".lstrip("*")
's*x*t*'
>>> "*s*x*t*".rstrip("*")
'*s*x*t'
>>> " sxt ".strip()
>'sxt'
格式排版
center() 居中、ljust() 左对齐、rjust() 右对齐 这三个函数用于对字符串实现排版.
其他方法
- isalnum() 是否为字母或数字
- isalpha() 检测字符串是否只由字母组成(含汉字)。
- isdigit() 检测字符串是否只由数字组成。
- isspace() 检测是否为空白符
- isupper() 是否为大写字母
- islower() 是否为小写字母