小刘在蔚来汽车实习,今天领导提了一个需求,要爬取csv文件中的所有链接获得爬取后的文件名与文件路径
首先看看如何获得文件路径
def getfile(rootdir):
list = os.listdir(rootdir)#列出文件夹下所有的目录与文件
lujing=[]
for i in range(0,len(list)):
rootdir = r'C:\Users\xiaoLiu\Desktop\pinglun\2019-11-11'
path = os.path.join(rootdir,list[i])
lujing.append(path)
df=pd.Series(lujing)
df.to_csv('./pictureName.csv',index=False)
这样就可以获得你需要的跟目录下的所有文件路径
调用函数
if __name__ == '__main__':
rootdir = r'C:\Users\xiaoLiu\Desktop\pinglun\2019-11-11'
getfile(rootdir)
结果看一下
路径有了接下来看文件名
import os
def file_name(file_dir):
for root, dirs, files in os.walk(file_dir):
print(root) #当前目录路径
print(dirs) #当前路径下所有子目录
print(files) #当前路径下所有非目录子文件
这样就可以获取到具体的文件名,而不是全部目录