Unicode编码:(Python字符串采用的编码方式)
- 统一字符编码,即覆盖几乎所有字符的编码方式
- 从0到1114111 (0x10FFFF)空间,每个编码对应一个字符
- Python字符串中每个字符都是Unicode编码字符
字符串:由0个或多个字符组成的有序字符序列,由一对单引号或一对双引号表示,三单引号或三双引号可表示多行字符串
索引: <字符串>[M] 返回字符串中单个字符
切片: <字符串>[M: N:K] 返回字符串中一段字符子串 注:左M闭右N开,步长K可省略,默认1
特殊字符:
转义符 \:1、表达特定字符的本意
2、形成一些组合,表达一些不可打印的含义,如: "\b"回退, "\n"换行(光标移动到下行首), "\r" 回车(光标移动到本行首)
字符串操作符:
x + y       连接两个字符串x和y
n * x 或 x * n    复制n次字符串x
x in s       如果x是s的子串,返回True,否则返回False
字符串处理函数:
len(x)      返回字符串x的长度
str(x)      任意类型 x 转换为字符串形式
hex(x) 或 oct(x) 整数 x 的十六进制或八进制小写形式字符串
chr(u)       x 为Unicode编码,返回其对应的字符
ord(x)       x 为字符,返回其对应的Unicode编码
字符串处理方法:
str.lower() 或 str.upper()      返回字符串的副本,全部字符小写/大写
str.split(sep=None)         返回一个列表,由str根据sep被分隔的部分组成
str.count(sub)           返回子串sub在str中出现的次数
str.replace(old, new)        返回字符串str副本,所有old子串被替换为new
str.center(width[,fillchar])      字符串str根据宽度width居中,fillchar可选
str.strip(chars)           从str中去掉在其左侧和右侧chars中列出的字符
str.join(iter)            在iter变量除最后元素外每个元素后增加一个str
字符串类型的格式化:
str.format(<逗号分隔的参数>)
:
<填充>
<对齐>
<宽度>
<,>
< . 精度>
<类型>
引导符号
用于填充的
单个字符
< 左对齐
> 右对齐
^ 居中对齐
槽设定的输
出宽度
数字的千位
分隔符
浮点数小数
精度 或 字
符串最大输
出长度
整数类型
b, c, d, o, x, X
浮点数类型
e, E, f, %