文本的处理是数据分析工作中很重要的业务领域。Python的字符串变量用于操纵文本型数据。以下命令就定义了一个字符串变量,用于存放一段文本资料。

f format python 正负号 python中负数_操作符


在Python中,文本数据使用一对单引号或双引号来界定的,其定义方式非常简单。现在我们重点来学习对文本数据的常用操作。

1.连接操作

连接操作完成多个文本内容的拼接,使用“+”操作符。

f format python 正负号 python中负数_python 定义一个负数_02


2.截取操作

截取操作根据字符在文本中的位置提取文本数据的部分内容。比如提取product_name变量中第3个位置开始到第5个位置之前的内容,就可以写成

f format python 正负号 python中负数_f format python 正负号_03


为什么结果不是“:苹”,而是“苹果”呢?原因是字符的位置(也叫下标)是从0开始计数的,这一点需要牢记。绝大多数编程语言都遵循这个计数规则。

如果我想提取第三个位置开始的所有内容,可以使用如下操作:


f format python 正负号 python中负数_字符串_04


引申一下,如果我想提取第5个位置开始的所有内容,就使用如下操作:


f format python 正负号 python中负数_操作符_05


如果我们把下标写成负数会怎样呢?

f format python 正负号 python中负数_Python_06


原来当下标为负数时,Python是从后向前进行定位提取的。这是Python很有特色的一种做法,能够满足我们逆向操作的特殊需要。

3.替换操作

替换操作可以使用新内容替换文本中的指定内容,如:


f format python 正负号 python中负数_操作符_07


product_name字符串变量中的所有“苹果”字样被全部替换为"华为"。

4.计数操作

技术操作完成对文本内容的计数统计,如len()函数完成对所有字符数量的统计:


f format python 正负号 python中负数_Python_08


而count()函数则完成对指定内容的统计。


f format python 正负号 python中负数_f format python 正负号_09


需要注意的是len()函数是Python的公共函数,而count()是字符串变量的函数,所以count()前面需要加变量名称。

5.查找操作

查找操作用来确定指定内容是否出现在一段文本中,如:


f format python 正负号 python中负数_字符串_10


我们使用“in”操作符。操作符的前面是要查找的内容,后面是被查找的大段文本,位置不能写反。

“in”操作符的计算结果是逻辑型的,如果要查找的内容出现在被查找的文本中,结果是True,否则就是False。

6.定位操作

定位操作也是一种查找操作,但是它返回的是要查找内容在文本中的位置。如:

f format python 正负号 python中负数_f format python 正负号_11


定位操作使用字符串变量的find()函数和rfind()函数,所以这两个函数在使用时前面要加上被缠找的字符串变量名称,并用小数点“.”隔开。如上例的product_name。find用于从前向后查找,rfind()是从后向前查找。如果找到内容,则返回第一次找到的起始位置,否则返回-1。