一、split()函数

1、语法:

str.split(str="",num=string.count(str))[n]

str:表示为分隔符。默认为所有的空字符,包括空格、换行(\n)、制表符(\t)等,但是不能为空(’’)。若字符串中没有分隔符,则把整个字符串作为列表的一个元素
num:表示分割次数。默认为 -1, 即分隔所有,如果存在参数num,则仅分隔成 num+1 个子字符串,并且每一个子字符串可以赋给新的变量
[n]:表示选取分割的列表中下标为n的分片
返回值:返回分割后的字符串列表

2、分离字符串

str = "www.csdn.net"
2.1.以’.'为分隔符
print(str.split('.'))
>>
['www', 'csdn', 'net']
2.2.分割一次
print(str.split('.',1))
>>
['www', 'csdn.net']
2.3.分割两次,并取序列为1的项
print(str.split('.',2)[1])
>>
csdn
2.4.分割两次,并把分割后的三个部分保存到三个文件
s1, s2, s3 =str.split('.',2)

print(s1) >>> www

print(s2) >>> csdn

print(s3)  >>> net

二、os.path.split()函数

1.语法:

os.path.split('PATH')

1.PATH指一个文件的全路径作为参数:

2.如果给出的是一个目录和文件名,则输出路径和文件名

3.如果给出的是一个目录名,则输出路径和为空文件名

2、分离文件名和路径

import os
print(os.path.split(’/d/soft/python/’))
(’/d/soft/python’, ‘’)
print(os.path.split(’/d/soft/python’))
(’/d/soft’, ‘python’)

3、实例:获得域名

str="hello csdn<[www.csdn.net]>byebye"

print(str.split("[")[1].split("]")[0])

www.csdn.net

我们在学习 python 爬虫的时候例如需要保存图片,图片名称的获取,可以依照下列方法:

url = "http://www.baidu.com/python3/image/123.jpg"
path =url.split("/")[-1]

输出结果:
'123.jpg'