Python字符串

  • 一:字符串基本特点
  • 二:字符串的编码
  • 三:引号创建字符串
  • 四:空字符串和 len()函数
  • 五:转义字符
  • 六:字符串拼接
  • 七:字符串复制
  • 八:不换行打印
  • 九:从控制台读取字符串
  • 十:str()实现数字转型字符串
  • 十一:使用[]提取字符
  • 十二:replace()实现字符串替换
  • 十三:字符串切片 slice 操作
  • 十四:split()分割和 join()合并
  • 十五:字符串驻留机制和字符串比较
  • 十六:字符串比较和同一性
  • 十七:成员操作符
  • 十八:字符串常用方法汇总
  • 十九:去除首尾信息
  • 二十:大小写转换
  • 二十一:格式排版
  • 二十二:其他方法
  • 二十三:格式化字符串
  • 二十四:填充与对齐
  • 二十五:数字格式化

一:字符串基本特点

字符串的本质是:字符序列。Python 的字符串是不可变的,我们无法对原字符串做任何修改。但,可以将字符串的一部分复制到新创建的字符串,达到“看起来修改”的效果。

Python 不支持单字符类型,单字符也是作为一个字符串使用的。

二:字符串的编码

Python3 直接支持 Unicode,可以表示世界上任何书面语言的字符。Python3 的字符默认就是 16 位 Unicode 编码,ASCII 码是 Unicode 编码的子集。
使用内置函数 ord()可以把字符转换成对应的 Unicode 码;
使用内置函数 chr()可以把十进制数字转换成对应的字符。

三:引号创建字符串

我们可以通过单引号或双引号创建字符串。例如:a=’abc’; b=”sxt”

使用两种引号的好处是可以创建本身就包含引号的字符串,而不用使用转义字符。

连续三个单引号或三个双引号,可以帮助我们创建多行字符串

四:空字符串和 len()函数

Python 允许空字符串的存在,不包含任何字符且长度为 0

len()用于计算字符串含有多少字符

五:转义字符

我们可以使用“+特殊字符”,实现某些难以用字符表示的效果。比如:换行等。常见的转义字符有这些:

python文件中包含某个字符串额行 python字符串含有某个字符_bc

六:字符串拼接

  1. 可以使用+将多个字符串拼接起来。例如:’aa’+ ’bb’ ==>’aabb’
    (1) 如果+两边都是字符串,则拼接。
    (2) 如果+两边都是数字,则加法运算。
    (3) 如果+两边类型不同,则抛出异常。
  2. 可以将多个字面字符串直接放到一起实现拼接。例如:’aa’’bb’==>’aabb

七:字符串复制

使用*可以实现字符串复制。

>>> a = 'Sxt'*3
>>> a
'SxtSxtSxt

八:不换行打印

我们前面调用 print 时,会自动打印一个换行符。有时,我们不想换行,不想自动添加换行符。我们可以自己通过参数 end = “任意字符串”。实现末尾添加任何内容

print("sxt",end=' ')
print("sxt",end='##')
print("sxt")
sxt sxt##sxt

九:从控制台读取字符串

我们可以使用 input()从控制台读取键盘输入的内容。

>>> myname = input("请输入名字:")
请输入名字:鲁硕
>>> myname
'鲁硕'

十:str()实现数字转型字符串

str()可以帮助我们将其他数据类型转换为字符串

str(5.20) ==> ‘5.20’
str(3.14e2)==>’314.0’
str(True) ==> ‘True’

当我们调用 print()函数时,解释器自动调用了 str()将非字符串的对象转成了字符串。

十一:使用[]提取字符

字符串的本质就是字符序列,我们可以通过在字符串后面添加[],在[]里面指定偏移量,可以提取该位置的单个字符。

正向搜索:
最左侧第一个字符,偏移量是 0,第二个偏移量是 1,以此类推。直到 len(str)-1为止。

反向搜索:
最右侧第一个字符,偏移量是-1,倒数第二个偏移量是-2,以此类推,直到-len(str)为止。

>>> a = 'abcdefghijklmnopqrstuvwxyz' 
>>> a
'abcdefghijklmnopqrstuvwxyz' 
>>> a[0]
'a' 
>>> a[3]
'd' 
>>> a[26-1]
'z' 
>>> a[-1]
>'z' 
>>>> a[-26]
'a'

十二:replace()实现字符串替换

字符串是“不可改变”的,我们通过[]可以获取字符串指定位置的字符,但是我们不能改变字符串。我们尝试改变字符串中某个字符,发现报错了:

>>> a = 'abcdefghijklmnopqrstuvwxyz' 
>>> a
'abcdefghijklmnopqrstuvwxyz' 
>>> a[3]='高' 
Traceback (most recent call last):
File "<pyshell#94>", line 1, in <module>
a[3]='高' TypeError: 'str' object does not support item assignment

字符串不可改变。但是,我们确实有时候需要替换某些字符。这时,只能通过创建新的字符串来实现。

>>> a = 'abcdefghijklmnopqrstuvwxyz' 
>>> a
'abcdefghijklmnopqrstuvwxyz' 
>>> a = a.replace('c','高')
'ab 高 defghijklmnopqrstuvwxyz'

整个过程中,实际上我们是创建了新的字符串对象,并指向了变量 a,而不是修改了以前的字符串。 内存图如下:

python文件中包含某个字符串额行 python字符串含有某个字符_字符串_02

十三:字符串切片 slice 操作

切片 slice 操作可以让我们快速的提取子字符串。标准格式为:
[起始偏移量 start:终止偏移量 end:步长 step]

典型操作(三个量为正数的情况)如下:

python文件中包含某个字符串额行 python字符串含有某个字符_偏移量_03


其他操作(三个量为负数)的情况:

python文件中包含某个字符串额行 python字符串含有某个字符_bc_04


切片操作时,起始偏移量和终止偏移量不在[0,字符串长度-1]这个范围,也不会报错。起始偏移量小于 0 则会当做 0,终止偏移量大于“长度-1”会被当成-1。

十四:split()分割和 join()合并

split()可以基于指定分隔符将字符串分隔成多个子字符串(存储到列表中)。如果不指定分隔符,则默认使用空白字符(换行符/空格/制表符)。

>>> a = "to be or not to be" >>> a.split()
['to', 'be', 'or', 'not', 'to', 'be']
>>> a.split('be')
['to ', ' or not to ', '']

join()的作用和 split()作用刚好相反,用于将一系列子字符串连接起来。示例代码如下:

>>> a = ['sxt','sxt100','sxt200']
>>> '*'.join(a)
'sxt*sxt100*sxt200'

拼接字符串要点:
使用字符串拼接符+,会生成新的字符串对象,因此不推荐使用+来拼接字符串。推荐使用 join 函数,因为 join 函数在拼接字符串之前会计算所有字符串的长度,然后逐一拷贝,仅新建一次对象。

测试+拼接符和 join(),不同的效率

import time
time01 = time.time() #起始时刻
a = ""
for i in range(1000000):a += "sxt"
time02 = time.time() #终止时刻
print("运算时间:"+str(time02-time01))
time03 = time.time() #起始时刻
li = []
for i in range(1000000):
li.append("sxt")
a = "".join(li)
time04 = time.time() #终止时刻
print("运算时间:"+str(time04-time03))

十五:字符串驻留机制和字符串比较

字符串驻留:仅保存一份相同且不可变字符串的方法,不同的值被存放在字符串驻留池中。
Python 支持字符串驻留机制,对于符合标识符规则的字符串(仅包含下划线(_)、字母和数字)会启用字符串驻留机制驻留机制。

>>> a = "abd_33" 
>>> b = "abd_33" 
>>> a is b
True
>>> c = "dd#" 
>>> d = "dd#" 
>>> c is d
False
>>> str1 = "aa" 
>>> str2 = "bb" 
>>> str1+str2 is "aabb"
False
>>> str1+str2 == "aabb" 
True

十六:字符串比较和同一性

我们可以直接使用==,!=对字符串进行比较,是否含有相同的字符。
我们使用 is / not is,判断两个对象是否同一个对象。比较的是对象的地址,即 id(obj1)是否和 id(obj2)相等。

十七:成员操作符

in /not in 关键字,判断某个字符(子字符串)是否存在于字符串中。

十八:字符串常用方法汇总

字符串有很多常用的方法,我们需要熟悉。我们通过表格将这些方法汇总起来,方便大家查阅。希望大家针对每个方法都做一次测试。

常用查找方法

我们以一段文本作为测试:
a=’’‘我是高淇,今年 18 岁了,我在北京尚学堂科技上班。我的儿子叫高洛希,他 6 岁了。我是一个编程教育的普及者,希望影响 6000 万学习编程的中国人。我儿子现在也开始学习编程,希望他 18 岁的时候可以超过我’’’

python文件中包含某个字符串额行 python字符串含有某个字符_python_05

十九:去除首尾信息

我们可以通过 strip()去除字符串首尾指定信息。通过 lstrip()去除字符串左边指定信息,rstrip()去除字符串右边指定信息。

>>> "*s*x*t*".strip("*")
's*x*t' 
>>> "*s*x*t*".lstrip("*")
's*x*t*' 
>>> "*s*x*t*".rstrip("*")
'*s*x*t' 
>>> " sxt ".strip()
'sxt'

二十:大小写转换

编程中关于字符串大小写转换的情况,经常遇到。我们将相关方法汇总到这里。为了方便学习,先设定一个测试变量:

a = “gaoqi love programming, love SXT”

python文件中包含某个字符串额行 python字符串含有某个字符_python文件中包含某个字符串额行_06

二十一:格式排版

center()、ljust()、rjust()这三个函数用于对字符串实现排版。示例如下:

>>> a="SXT" 
>>> a.center(10,"*")
'***SXT****' 
>>> a.center(10)
' SXT ' 
>>> a.ljust(10,"*")
'SXT*******'

二十二:其他方法

  1. isalnum() 是否为字母或数字
  2. isalpha() 检测字符串是否只由字母组成(含汉字)。
  3. isdigit() 检测字符串是否只由数字组成。
  4. isspace() 检测是否为空白符
  5. isupper() 是否为大写字母
  6. islower() 是否为小写字母
>>> "sxt100".isalnum()
True
>>> "sxt 尚学堂".isalpha()
True
>>> "234.3".isdigit()
False
>>> "23423".isdigit()
True
>>> "aB".isupper()
False
>>> "A".isupper()
True
>>> "\t\n".isspace()
True

二十三:格式化字符串

format()基本用法

Python2.6 开始,新增了一种格式化字符串的函数 str.format(),它增强了字符串格式化的功能。

基本语法是通过 {} 和 : 来代替以前的 % 。

format 函数可以接受不限个参数,位置可以不按顺序。

>>> a = "名字是:{0},年龄是:{1}" 
>>> a.format("卢梭",18)
'名字是:卢梭,年龄是:18'

我们可以通过{索引}/{参数名},直接映射参数值,实现对字符串的格式化,非常方便。

二十四:填充与对齐

填充常跟对齐一起使用

^、<、>分别是居中、左对齐、右对齐,后面带宽度

:号后面带填充的字符,只能是一个字符,不指定的话默认是用空格填充

>>> "{:*>8}".format("245")
'*****245' 
>>> "我是{0},我喜欢数字{1:*^8}".format("卢梭","666")
'我是卢梭,我喜欢数字**666***'

二十五:数字格式化

浮点数通过 f,整数通过 d 进行需要的格式化

>>> a = "我是{0},我的存款有{1:.2f}" 
>>> a.format("高淇",3888.234342)
'我是高淇,我的存款有 3888.23'

python文件中包含某个字符串额行 python字符串含有某个字符_bc_07