一、字符串定义初始化
- s1 = 'string'
- 一个个字符组成的有序的序列,是字符的集合,使用单引号,双引号,三引号引住的字符序列
- 字符串是不可变的对象,python3起,字符串就是Unicode类型
二、字符串元素访问
1、 字符串支持使用索引访问
- sql = "select * from user where name='tom'"
- sql[4] 字符串访问
- sql[4] = 'o' 字符串赋值能否成功? (不能赋值)
- >>> sql = "select * from user where name='tom'"
>>> sql
"select * from user where name='tom'"
>>> sql[4]
'c'
>>> sql[4] = 'o'
Traceback (most recent call last):
File "<pyshell#52>", line 1, in <module>
sql[4] = 'o'
TypeError: 'str' object does not support item assignment
>>>
2、有序的字符集合,字符序列可迭代
- >>> for x in sql:
- print(x)
三、字符串join连接
- 将可迭代对象连接起来,使用string作为分隔符
- 可迭代对象本身元素都是字符串,返回一个新字符串
- lst1 + lst2: 将2个字符串连接在一起,返回一个新的字符串
- 举例:
- >>> lst = ['1','2','3']
>>> print("\"".join(lst)) 分隔符是双引号
1"2"3
>>> print(" ".join(lst)) 空格分隔
1 2 3
>>> print("\n".join(lst)) 换行分隔
1
2
3
>>> - >>> lst = ['1','2','3']
>>> lst1 = ['1',['a','b'],'3']
>>> lst + lst1 将2个字符串连接在一起,返回一个新的字符串
['1', '2', '3', '1', ['a', 'b'], '3']
四、字符串分割
分割字符串的方法有两种
1、split:从左至右,将字符串按照分隔符分割成若干字符串,并返回列表
- 格式:split(sep=None,maxslit=-1)
- sep指定分割符字符串,缺省的情况下空白字符串作为分隔符
- maxslit指定分割的次数,-1表示遍历整个字符串
- rsplit: 从右向左
- 举例:
- s1 = "I'm \ta super student."
- >>> s1.split(' ') 以空格为分隔符
["I'm", '\ta', 'super', 'student.']
>>> s1.split('s') 以s为分隔符
["I'm \ta ", 'uper ', 'tudent.']
>>> s1.split('super') 以super为分隔符
["I'm \ta ", ' student.']
>>> s1.split(' ',maxsplit=-1) 以空格遍历分隔
["I'm", '\ta', 'super', 'student.']
>>> s1.split(' ',maxsplit=1) 以空格分隔一次
["I'm", '\ta super student.']
>>> s1.split(' ',maxsplit=2) 以空格分隔两次
["I'm", '\ta', 'super student.']
>>> s1.split('\t',maxsplit=2) 以\ta分隔两次
["I'm ", 'a super student.']
2、splietlines([keepends])
- 按照行来切分字符串
- keepends指的是是否保留分隔符
- 行分隔符包括\n, \r\n, \r等
- s2 = '''I'm a super student.
You're a super teacher.
''' - >>> print(s2)
I'm a super student.
You're a super teacher.
>>> print(s2.splitlines())
["I'm a super student.", "\t\t\t\tYou're a super teacher.", '\t\t\t']
>>> print(s2.splitlines(True))
["I'm a super student.\n", "\t\t\t\tYou're a super teacher.\n", '\t\t\t']
>>>
3、partition(sep): 将字符串按照分隔符分割成2段,返回这2段和分隔符的元组
- 从左至右,遇到分隔符就把字符串分割成两部分,返回头,分隔符,尾三部分的三元组
- 如果没有找到分隔符,就返回头,2个空元素的三元组
- sep分割字符串,必须制定
- rpartition(sep) 从右至左
- 举例:
- >>> s1 = "I'm a supper student."
- >>> s1.partition('s')
("I'm a ", 's', 'upper student.') - >>> s1.partition('stu')
("I'm a supper ", 'stu', 'dent.')
>>> s1.partition(' ')
("I'm", ' ', 'a supper student.') - >>> s1.partition('abc')
("I'm a supper student.", ' ', ' ')
五、字符串修改
1、replace(old, new[,count])
- 字符串中找到匹配替换为新子串,返回新字符串
- count表示替换几次,不指定就是全部替换
- 举例:
- >>> s = 'www.magede.com'
- 全部替换
>>> s.replace('w', 'p')
'ppp.magede.com' - 替换两次
>>> s.replace('w', 'p',2)
'ppw.magede.com' - 替换两次
>>> s.replace('ww', 'p', 2)
'pw.magede.com' - 替换两次
>>> s.replace('www', 'python',2)
'python.magede.com'
>>>
2、strip([chars])
- 从字符串两端去除指定的字符集chars中的所有字符,如果chars没有指定,去除两端的空白字符
- 举例:
- >>> s = "\r\n\t Hello Python \n \t"
>>> s.strip()
'Hello Python' - >>> s = " I am very very very sorry "
>>> s.strip('ly')
' I am very very very sorry '
>>> s.strip('ly ')
'I am very very very sorr'
六、字符串查找
1、find(sub[,start[,end]])
- 在指定的区间【start,end】,从左至右,查找子串sub,找到返回索引,没有找到返回-1
- rfind: 从右至左
- 举例:
- >>> s = " I am very very very sorry "
>>> s.find('very')
6
>>> s.find('very',5)
6
>>> s.find('very',5,10)
6
>>> s.find('very',15)
16
>>>
2、index(sub[,start[,end]])
- 在指定的区间【start,end】,从左至右,查找子串sub,找到返回索引,没有找到抛出异常ValueError,时间复杂度是O(n)
- 举例:
- >>> s = " I am very very very sorry "
>>> s.index('very')
6
>>> s.index('very',5)
6
3、count(sub[,start[,end]])
- 在指定的区间【start,end】,从左至右,统计子串sub出现次数,时间复杂度是O(n)
- 举例:
- >>> s = " I am very very very sorry "
>>> s.count('very')
3
>>> s.count('very',5)
3
>>>
七、字符串判断
1、endswitch(suffix[,start[,end]])
- 在指定的区间【start,end】,字符串是否是suffix结尾
2、 startswitch(prefix[,start[,end]])
- 在指定的区间【start,end】,字符串是否是prefix开头
八、字符串格式化
- 字符串的格式化是一种拼接字符串输出样式的手段,更灵活方便
- join拼接只能使用分隔符,且要求被拼接的是可迭代对象
- + 加号拼接字符串还算方便,但是非字符串需要先转换为字符串才能拼接
- 在2.5版本之前,只能使用c语言printf style风格的print输出,格式要求占位符:使用%和格式字符组成,例如%d, %s等
1、使用format函数格式字符串语法
- "{} {xxx}".format(*args, **kwargs)
- args是位置参数,是一个元组
- kwargs是关键字参数,是一个字典
- {}花括号是表示占位符,表示按照顺序匹配位置参数,{n} 表示取位置参数索引为n的值
- {xxx}表示在关键字参数中搜索名称一致的
- {{}} 表示打印花括号
2、位置参数
- "{}:{}".format('192.168.1.100', 8888),这就是按照位置顺序,用位置参数替换前面的格式字符串占位符{}
- >>> "{}:{}".format('192.168.1.100', 8888)
'192.168.1.100:8888'
>>>
3、关键字参数或命名参数
- "{server}{1}:{0}".format(8888, '192.168.1.100', server='Web Sever Info:'),位置参数按照序号(索引)匹配,关键字参数按照名称匹配
- >>> "{server}{1}:{0}".format(8888, '192.168.1.100', server='Web Sever Info:')
'Web Sever Info:192.168.1.100:8888'
>>>
4、访问元素
- "{0[0]}:{0[1]}".format(('magedu','com'))
- >>> "{0[0]}:{0[1]}".format(('magedu','com'))
'magedu:com'
5、对象属性访问
>>> Point = namedtuple('Point','x y')
>>> p = Point(4,5)
>>> "{{{0.x},{0.y}}}".format(p)
'{4,5}'
>>>
6、 对齐
- >>> '{0}*{1}={2:<2}'.format(3, 2, 2*3)
'3*2=6 '
>>> - >>> '{0}*{1}={2:<02}'.format(3, 2, 2*3)
'3*2=60'
>>> - >>> '{0}*{1}={2:>02}'.format(3, 2, 2*3)
'3*2=06'
>>> - >>> '{:^30}'.format('centered')
' centered '
>>> - >>> '{:*^30}'.format('centered')
'***********centered***********'
>>>
7、进制
- >>> "int.{0:d};hex:{0:x}; oct:{0:o}; bin:{0:b}".format(42)
'int.42;hex:2a; oct:52; bin:101010'
>>> - >>> "int.{0:d};hex:{0:#x}; oct:{0:#o}; bin:{0:#b}".format(42)
'int.42;hex:0x2a; oct:0o52; bin:0b101010'
>>>
- octets = [192,168,0,]
- >>> octets = [192,168,0,1]
>>> '{:02x}{:02x}{:02x}{:02x}'.format(*octets)
'c0a80001'
>>>
注意: 请使用format函数格式化字符串