读书笔记-Python-字符串详解(包含长字符串和原始字符串)-《Python 基础教程》

一、什么是字符串

若干个字符的集合就是一个字符串(String)。Python 中的字符串必须由双引号" "或者单引号' '包围,具体格式为:"字符串内容",'字符串内容'

字符串的内容可以包含字母、标点、特殊符号、中文、日文等全世界的所有文字

合法的字符串:"123789"、"123abc"、"http://c.biancheng.net/python/"、"C语言中文网成立8年了"

Python 字符串中的双引号和单引号没有任何区别

二、处理字符串中的引号

1) 对引号进行转义

在引号前面添加反斜杠\就可以对引号进行转义,让 Python 把它作为普通文本对待,例如:

1. str1 = 'I\'m a great coder!'
2. str2 = "引文双引号是\",中文双引号是“"
3. print(str1)
4. print(str2)

运行结果:

I'm a great coder!


引文双引号是",中文双引号是“

2) 使用不同的引号包围字符串

如果字符串内容中出现了单引号,那么我们可以使用双引号包围字符串,反之亦然。例如:



  1. str1 = "I'm a great coder!" #使用双引号包围含有单引号的字符串
  2. str2 = '引文双引号是",中文双引号是“' #使用单引号包围含有双引号的字符串
  3. print(str1)
  4. print(str2)



运行结果和上面相同。

三、字符串的换行

 Python 不是格式自由的语言,它对程序的换行、缩进都有严格的语法要求。要想换行书写一个比较长的字符串,必须在行尾添加反斜杠\,请看下面的例子:

1. s2 = 'It took me six months to write this Python tutorial. \
2. Please give me more support. \
3. I will keep it updated.'

上面 s2 字符串的比较长,所以使用了转义字符\对字符串内容进行了换行,这样就可以把一个长字符串写成多行。

另外,Python 也支持表达式的换行,例如:

1. num = 20 + 3 / 4 + \
2. 2 * 3
3. print(num)

四、Python长字符串

使用三个单引号或者双引号可以对多行内容进行注释,这其实是 Python 长字符串的写法。所谓长字符串,就是可以直接换行(不用加反斜杠\)书写的字符串。

Python 长字符串由三个双引号"""或者三个单引号'''包围,语法格式如下:

"""长字符串内容"""
'''长字符串内容'''

在长字符串中放置单引号或者双引号不会导致解析错误。

如果长字符串没有赋值给任何变量,那么这个长字符串就不会起到任何作用,和一段普通的文本无异,相当于被注释掉了。

注意,此时 Python 解释器并不会忽略长字符串,也会按照语法解析,只是长字符串起不到实际作用而已。

当程序中有大段文本内容需要定义成字符串时,优先推荐使用长字符串形式,因为这种形式非常强大,可以在字符串中放置任何内容,包括单引号和双引号。

【实例】将长字符串赋值给变量:

1. longstr = '''It took me 6 months to write this Python tutorial.
2. Please give me a to 'thumb' to keep it updated.
3. The Python tutorial is available at http://c.biancheng.net/python/.'''
4. print(longstr)

长字符串中的换行、空格、缩进等空白符都会原样输出,所以你不能写成下面的样子:

1. longstr = '''
2.  It took me 6 months to write this Python tutorial.
3.  Please give me a to 'thumb' to keep it updated.
4.  The Python tutorial is available at http://c.biancheng.net/python/.
5. '''
6. print(longstr)


虽然这样写格式优美,但是输出结果将变成:

    It took me 6 months to write this Python tutorial.
    Please give me a to 'thumb' to keep it updated.
    The Python tutorial is available at http://c.biancheng.net/python/.
 

字符串内容前后多出了两个空行,并且每一行的前面会多出四个空格。

五、Python原始字符串

Python 字符串中的反斜杠\有着特殊的作用,就是转义字符,例如上面提到的\'\"
转义字符有时候会带来一些麻烦,例如我要表示一个包含 Windows 路径D:\Program Files\Python 3.8\python.exe这样的字符串,在 Python 程序中直接这样写肯定是不行的,不管是普通字符串还是长字符串。因为\的特殊性,我们需要对字符串中的每个\都进行转义,也就是写成D:\\Program Files\\Python 3.8\\python.exe这种形式才行。

这种写法需要特别谨慎,稍有疏忽就会出错。为了解决转义字符的问题,Python 支持原始字符串。在原始字符串中,\不会被当作转义字符,所有的内容都保持“原汁原味”的样子。

在普通字符串或者长字符串的开头加上r前缀,就变成了原始字符串,具体格式为:

str1 = r'原始字符串内容'
str2 = r"""原始字符串内容"""

将上面的 Windows 路径改写成原始字符串的形式:

1. rstr = r'D:\Program Files\Python 3.8\python.exe'
2. print(rstr)


原始字符串中的引号

如果普通格式的原始字符串中出现引号,程序同样需要对引号进行转义,否则 Python 照样无法对字符串的引号精确配对;但是和普通字符串不同的是,此时用于转义的反斜杠会变成字符串内容的一部分。

请看下面的代码:

1. str1 = r'I\'m a great coder!'
2. print(str1)



输出结果:

I\'m a great coder!

需要注意的是,Python 原始字符串中的反斜杠仍然会对引号进行转义,因此原始字符串的结尾处不能是反斜杠,否则字符串结尾处的引号会被转义,导致字符串不能正确结束。

在 Python 中有两种方式解决这个问题:一种方式是改用长字符串的写法,不要使用原始字符串;另一种方式是单独书写反斜杠,这是接下来要重点说明的。

例如想表示D:\Program Files\Python 3.8\,可以这样写:

1. str1 = r'D:\Program Files\Python 3.8' '\\'
2. print(str1)



我们先写了一个原始字符串r'D:\Program Files\Python 3.8',紧接着又使用'\\'写了一个包含转义字符的普通字符串,Python 会自动将这两个字符串拼接在一起,所以上面代码的输出结果是:

D:\Program Files\Python 3.8\