Python3的简单基本类型字符串str(二)

  • 4.2 字符串入门String
  • 4.2.1 repr和字符串
  • 4.2.2 input和raw_input
  • 4.2.3 长字符串
  • 4.2.4 bytes
  • 4.2.5 字符串格式化
  • 4.2.6 Python自带两个帮助函数
  • 4.2.7 删除多余空白
  • 4.2.8 字符串的查找,替换
  • 4.2.9 字符串的分割,连接方法
  • 4.2.9 运算符


4.2 字符串入门String

字符串的意思就是“一串字符”,比如“Hello,田心木瓜”是一个字符串。
Python中的字符串用单引号 ’ 或双引号 " 括起来,同时使用反斜杠 \ 转义特殊字符(比如对引号进行转义)。也可以在字符串前面添加一个 r,表示原始字符串。

In [1]: txmg = "It is a \'charcter\'." #转义字符的使用
In [2]: print (txmg)

It is a 'charcter'.

字符串的截取的语法格式如下:

变量[头下标:尾下标]

索引值以 0 为开始值,-1 为从末尾的开始位置。

In [3]: ss = 'ABCDEFGHIJ' #定义一个字符串

In [7]: ss[2]
Out[7]: 'C'

In [8]: ss[0]
Out[8]: 'A'

In [9]: ss[-9]
Out[9]: 'B'

In [10]: ss[1]
Out[10]: 'B'

In [11]: ss[-1]
Out[11]: 'J'

Python不断加入str python str in_startswith


加号 + 是字符串的连接符, 星号 * 表示复制当前字符串,紧跟的数字为复制的次数。实例如下:

In [13]: print (ss[0:-1]) #第一个到最后,不包含最后一个J
ABCDEFGHI

In [14]: print (ss[1:5])  # 输出从第二个开始到第五个的字符
BCDE

In [15]: print (ss[3:]) #输出从第4个开始到最后
DEFGHIJ

In [16]: print (ss * 3) # 输出字符串3次
ABCDEFGHIJABCDEFGHIJABCDEFGHIJ

In [17]: print (ss + "hhhhh") # 连接字符串
ABCDEFGHIJhhhhh

小结

  • 反斜杠可以用来转义,使用r可以让反斜杠不发生转义。
  • 字符串可以用+运算符连接在一起,用*运算符重复。
  • Python中的字符串有两种索引方式,从左往右以0开始,从右往左以-1开始。
  • Python中的字符串不能改变。

4.2.1 repr和字符串

Python不允许直接拼接数值和字符串,必须先将数值转换成字符串。
可以使用str()或repr()函数,举例如下:
In [18]: meat = "猪肉很贵啊,价钱是:"

In [19]: price = 88.78

In [20]: print (meat + price)
---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-20-78cdd90a9753> in <module>
----> 1 print (meat + price)

TypeError: can only concatenate str (not "float") to str

In [21]: print (meat + str(price))
猪肉很贵啊,价钱是:88.78

In [22]: print (meat + repr(price))
猪肉很贵啊,价钱是:88.78

4.2.2 input和raw_input

input()函数用于向用户生成一个提示,然后获取用户输入的内容,此函数总会将用户输入的内容放入字符串中,因此用户输入任何内容,input()函数总是返回一个字符串。
raw_input()是python 2中的,相当于python 3中的input

In [27]: i = input()
1

In [28]: print (type(i))
<class 'str'>

In [29]: j = input()
2.89

In [30]: print (type(j))
<class 'str'>

In [31]: h = input()
hello

In [32]: print (type(h))
<class 'str'>

4.2.3 长字符串

‘’'三个引号一般用于多行注释,但是也可以将它赋值,如下例子。

In [33]: ls = '''"It is a long long long.
    ...: stroy ,please read it.
    ...: are u ok?"
    ...: '''

In [34]: print (ls)
"It is a long long long.
stroy ,please read it.
are u ok?"

4.2.4 bytes

python3 新增bytes类型,str是以多个字符组成, bytes是以多个字节组成,bytes只负责以字节(二进制格式)序列来记录数据,由于bytes保存原始的字节(二进制格式)数据,因此bytes对象可用于网络上传输数据,也可用于存储各种二进制格式的文件。比如图片,音乐等文件。

如果字符串内容都是ASCII字符,则可直接在字符串之前添加b来构建bytes值。

调用bytes()函数,将字符串按照指定字符集转换成bytes,默认使用UTF-8字符集。

调用字符串本身的encode() 方法将字符串按指定字符集转换成bytes,默认使用UTF-8字符集

Python不断加入str python str in_startswith_02

4.2.5 字符串格式化

Python提供了“%”对各种类型的数据进行格式化输出,

Python不断加入str python str in_Python不断加入str_03

In [35]: number = -29

In [36]: print ('number is %6i' % number)
number is    -29

In [37]: print ('number is %6d' % number)
number is    -29

In [38]: print ('number is %6o' % number)
number is    -35

In [39]: print ('number is %6x' % number)
number is    -1d

In [40]: print ('number is %6X' % number)
number is    -1D

In [41]: print ('number is %6S' % number)

In [42]: print ('number is %6s' % number)
number is    -29

%6 -> 6是指输出最小宽度为6。
转换浮点数的宽度可以用%6.3f,感兴趣可以自己试一下

python中字符串还支持用in运算符判断是否包含某个子串,还有获取字符串的长度,用内置len()函数,还可以用min()和max()函数获取字符串中最小字符和最大字符

In [43]: ah = 'This is has two dogs.'

In [44]: 'two' in ah
Out[44]: True

In [48]: 'nn' in ah
Out[48]: False
In [49]: len(ah)
Out[49]: 21

In [50]: min(ah)
Out[50]: ' '

In [51]: max(ah)
Out[51]: 'w'

4.2.6 Python自带两个帮助函数

dir():列出指定类或模块包含的全部内容(包括函数,方法,类,变量等)
help():查看某个函数或方法的帮助文档

感兴趣的可自行尝试, 比如dir(str)

4.2.7 删除多余空白

字符串还提供了了如下常用的方法来删除空白
strip():删除字符串前后的空白
lstrip():删除字符串前面(左边)的空白
rstrip():删除字符串后面(右边)的空白

注意:因为字符串类型是不可变的,所以上述三个方法是删除空白的副本,并没有真正改变字符串本身

In [55]: abc = " the is hh   "

In [56]: print (abc)
 the is hh

In [57]: abc.strip()
Out[57]: 'the is hh'

In [58]: abc.lstrip()
Out[58]: 'the is hh   '

In [59]: abc.rstrip()
Out[59]: ' the is hh'

In [60]: print (abc)
 the is hh

还可以删除指定字符的

In [80]: s123 = 'the is hhhhhhioo'

In [81]: print (s123)
the is hhhhhhioo

In [82]: print (s123.lstrip('th'))
e is hhhhhhioo

In [83]: print (s123.rstrip('isioo'))
the is hhhhhh

In [84]: print (s123.strip('tioo'))
he is hhhhhh

4.2.8 字符串的查找,替换

startswith(): 判断字符串是否以指定子串开头。
endstwith():判断字符串是否以指定子串结尾。
find():查找指定子串在字符串中出现的位置,如果没有知道指定子串,则返回-1.
index():查找指定子串在字符串中出现的位置,如果没有知道指定子串,则引发VauleError错误
replace():使用指定子串替换字符串中的目标子串。
translate():使用指定的翻译映射表对字符串执行替换。

感兴趣自行测试即可,不在这里演示了哈。

4.2.9 字符串的分割,连接方法

split(): 将字符串按指定分隔符分割成多个短语
join(): 将多个短语连接成字符串

In [87]: print (a1.split()) #使用空白对字符串进行分割
['crazyPython', 'is', 'a', 'good', 'book']

In [88]: print (a1.split(None, 2)) #使用空白对字符串进行分割,最多只分割前两个单词
['crazyPython', 'is', 'a good book']

In [91]: print (a1.split('y')) #使用y来进行分割
['craz', 'P', 'thon is a good book']

In [92]: my_a1 = a1.split()
In [94]: print (my_a1)
['crazyPython', 'is', 'a', 'good', 'book']

In [95]: print ('/'.join(my_a1))
crazyPython/is/a/good/book

In [96]: print (','.join(my_a1))
crazyPython,is,a,good,book

4.2.9 运算符

python运算符:

  • 赋值运算符

Python不断加入str python str in_Python不断加入str_04

  • 算术运算符
  • 位运算符
  • 索引运算符
In [97]: a10 = 'abcdefghijklmnopq'
In [99]: print (a10[2:8:3]) #获取索引2到索引8的子串,步长为3
cf

In [100]: print (a10[2:8:2]) #获取索引2到索引8的子串,步长为2
ceg
  • 比较运算符
  • 逻辑运算符

三目运算符

In [101]: bb = 12

In [102]: cc = 4

In [103]: st = "bb 大于 cc" if bb > cc else "bb不大于cc"

In [104]: print (st)
bb 大于 cc

Python不断加入str python str in_字符串_05