目录
- 字符串_unicode字符集_三种创建字符串方式_len()
- 字符串介绍
- 字符串基本特点
- 字符串的编码
- 引号创建字符串
- 空字符串和len()函数
- 字符串_转义字符_字符串拼接_字符串复制_input()
- 转义字符
- 字符串拼接
- 字符串复制
- 不换行打印
- 从控制台读取字符串
- 字符串_str()_使用[]提取字符_replace()替换生成新字符串_内存分析
- str()实现数字转为字符串
- 使用[]提取字符
- replace()实现字符串替换
- 字符串_切片slice操作_逆序
- 字符串切片slice操作
字符串_unicode字符集_三种创建字符串方式_len()
字符串介绍
字符串基本特点
- 字符串的本质是:字符序列。Python的字符串是不可变的,我们无法对原字符串做任何修改。但是,我们可以将字符串一部分复制到新创建的字符串中,达到“看起来修改”的效果。
- Python不支持单字符类型,单字符也是作为一个字符串使用的。
字符串的编码
- Python3直接支持Unicode,可以表示世界上任何书面语言的字符。Python3的字符默认就是16位Unicode编码,ASCII码是Unicode编码的子集。
- 使用内置函数 ord()可以把字符串转换成对应的Unicode编码的子集。
- 使用内置函数chr()可以把十进制数字转换成对应的字符。
(注:本质上就是将数字和字符对应起来,和C语言中的ASCII编码类似,只不过这里Unicode编码更丰富而已。)
>>>ord(‘A’)
65
>>>ord(‘高’)
39640
>>>chr(66)
‘B’
>>>ord(‘淇’)
28103
引号创建字符串
我们可以通过单引号或者双引号创建字符串。例如:a=’abc’ b=”python”
- 使用两种引号的好处是可以创建本身就包含引号的字符串,而不用使用转义字符。
例如:
>>>a=”teacher”
>>>print(a)
teacher
>>>b=’name is “tom”’
>>>print(b)
name is “tom”
- 连续三个单引号或者三个双引号,可以帮助我们创建多行字符串。
例如:
>>>resume=’’’ name=”gaoqi”
company=”sxt” age=18
lover=”tom” ’’’
>>>print(resume)
name=”gaoqi”
company=”sxt” age=18
lover=”tom”
空字符串和len()函数
- Python允许空字符串存在,不包含任何字符且长度为0。
例如:
>>>c=’’
>>>len(c)
0
- len()用于计算字符串含有多少字符。
例如:
>>>str=’abcdef’
>>>len(str)
6
字符串_转义字符_字符串拼接_字符串复制_input()
转义字符
我们可以使用“/ + 特殊字符”,实现某些难以用字符表示的效果。比如:换行等。
常见转义字符有:
转义字符 | 描述 |
|(在行尾时) | 续行符 |
\ | 反斜杠符号 |
\’ | 单引号 |
\” | 双引号 |
\b | 退格(Backspace) |
\n | 换行 |
\t | 横向制表符 |
\r | 回车 |
【操作】测试转义字符的使用
>>>a=’I\nlove\nU’
>>>a
‘I\nlove\nU’
>>>print(a)
I
love
U
续行符\
>>>print(‘aabbcc\
ccddee’)
aabbccccddee
【操作】使用原始字符串输出的技巧
>>>c=’c:\aa\bb.mp4’
>>>c
‘c:\x07a\x08b.mp4’
>>>c=’\c:\\aa\\bb.mp4’
>>>c
‘\\c:\\aa\\bb.mp4’
>>>c=r’c:\aa\bb.mp4’
>>>c
‘c:\\aa\\bb.mp4’
字符串拼接
- 可以使用+将多个字符串拼接起来。
例如:‘aa’+’bb’==>’aabb’
- 如果两边都是字符串,则拼接
- 如果两边都是数字,则加法运算
- 如果两边类型不同,则抛出异常
- 可以将多个字面字符串直接放到一起实现拼接。例如:‘aa’ ’bb’==>’aabb’
【操作】字符串拼接操作
>>>a=’sxt’+’gaoqi’
>>>a
‘sxtgaoqi’
>>>b=’sxt’’gaoqi’
>>>b
‘sxtgaoqi’
字符串复制
使用*可以实现字符串复制。
【操作】字符串复制操作
>>>a=’sxt’*3
>>>a
‘sxtsxtsxt’
不换行打印
我们前面调用print函数时,会自动打印一个换行符。有时,我们并不想进行换行,不想它自动添加换行符。这时我们可以通过参数end=“任意字符串”。实现末尾添加任何内容:
>>>print(‘sxt’,end=’’)
>>>print(‘sxt’,end=’##’)
>>>print(‘sxt’)
sxtsxt##sxt
(注:end使得以任意字符串结尾,而不是默认的以换行符结尾)
从控制台读取字符串
我们可以使用input()函数从控制台读取键盘输入的内容。
>>>myname=input(‘请输入名字:’)
请输入名字:Liuan
>>>myname
‘Liuan’
字符串_str()_使用[]提取字符_replace()替换生成新字符串_内存分析
str()实现数字转为字符串
- str()可以帮我们将其他类型数据转换为字符串。例如:
str(5.20)==>‘5.20’ str(3.14e2)==>’314.0’ str(True)==>’True’ - 当我们调用print()函数时,解释器自动调用str()将非字符串的对象转成了字符串。我们在面向对象章节中详细介绍。
使用[]提取字符
- 字符串的本质就是字符序列,我们可以通过在字符串后面添加[],在[]里面指定偏移量,可以提取该位置的单个字符。
- 正向搜索:
最左侧第一个字符,偏移量为0,第二个偏移量为1,以此类推。直到len(str)-1为止。 - 反向搜索:
最右侧第一个字符,偏移量为-1,倒数第二个偏移量为-2,以此类推。直到-len(str)为止。
【操作】使用[]提取字符串中的字符
>>>a=’abcdefghijklmnopqrstuvwxyz’
>>>a
‘abcdefghijklmnopqrstuvwxyz’
>>>a[0]
‘a’
>>>a[3]
‘d'
>>>a[26-1]
‘z'
>>>a[-1]
‘z'
>>>a[-26]
‘a'
(注:像一把刻度尺。以第一个字符为0刻度,往左为负,往右为正)
replace()实现字符串替换
字符串是不可改变的(比如定义一个字符串str=’abc’,str[0]=’z’是错误的,python会抛出一个Error)
但是我们有时候确实需要替换某些字符。这时,只能通过创建新的字符串来实现。
>>>a=’abcdefghijklmnopqrstuvwxyz’
>>>a
‘abcdefghijklmnopqrstuvwxyz’
>>>a=a.replace(‘c’,’安’)
>>>a
‘ab安defghijklmnopqrstuvwxyz’
>>>a='abcdefghijklmnopqrstuvwxyz'
>>>print(a)
abcdefghijklmnopqrstuvwxyz
>>>len(a)
26
>>>b=a.replace('c','安')
>>>print(b)
ab安defghijklmnopqrstuvwxyz
>>>len(a);len(b)
26
26
>>>c=a.replace('c','刘安')
>>>print(c)
ab刘安defghijklmnopqrstuvwxyz
>>>len(c)
27
整个过程中,实际上我们是创建了新的字符串对象,并指向了变量a,而不是修改了以前的字符串。内存图见下:
字符串_切片slice操作_逆序
字符串切片slice操作
切片slice操作可以让我们快速的截取字符串。标准格式为:
[起始偏移量start:终止偏移量end:步长step]
- 典型操作(三个量为正数的情况下
- 其他操作(三个量为负数的情况下):
示例 | 说明 | 结果 |
‘abcdefghijklmnopqrstuvwxyz’[-3:] | 倒数三个 | ‘xyz’ |
‘abcdefghijklmnopqrstuvwxyz’[-8:-3] | 倒数第八个到倒数第三个(不包括倒数第三个) | ‘stuvw’ |
‘abcdefghijklmnopqrstuvwxyz’[::-1] | 步长为负,从右往左反向提取 | ‘zyxwvutsrqponmllkjihgfedcba’ |
- 切片操作时,起始偏移量和终止偏移量不在[0,字符串长度-1]范围内,也不会报错。起始偏移量小于0则会当做0,终止偏移量大于“长度-1”会被当成长度-1。
例如:
>>>’abcdefg’[3:50]
‘defg’
我们发现正常输出结果,没有报错。
【操作】
- 将“to be or not to be”逆序输出
- 将’sxtsxtsxtsxt’字符串中所有s输出
(Tips:用[::-1]和设置step步长分别实现)