最近突发奇想想做一个问卷星数据爬取的脚本,当我在使用pandas打开同级目录下的 1.xlsx的时候,我又看到了极其不想看到的那句话:Traceback (most recent call last),就知道又有问题产生了(寄),问题是这样的:
FileNotFoundError: [Errno 2] No such file or directory: '1.xlsx'
真是奇了个怪了,我一开始以为是文件的问题,或者是打开方式不对,于是我尝试了各种版本的文件,还是没有打开。在茫茫网海寻找半天之后,我发现是python工作目录的问题,即当前文件所在目录和python的工作目录是不一样的,下边是我的目录:
而从vscode中可以看出我当前的工作路径如下:
python中也提供了查看和修改当前工作目录的函数,在os库里:
print('当前工作目录为:',os.getcwd()) #获取当前工作目录
os.chdir('D:\\program\\python_program\\crawler') #修改当前工作目录
print('修改后的工作目录为:',os.getcwd()) #再次获取当前工作目录
修改后的结果如下:
因为修改目录还需要提前知道文件在哪个目录下面,所以我又通过查资料找到了另一种更为简便的方法,通过inspect库获取当前文件所在位置,进一步获取获取当前文件上级目录名,这样我们在对当前文件同级目录下的其他文件进行操作的时候会方便许多,代码如下:
#在当前文件目录下创建材料收集目录
current_file_name = inspect.getfile(inspect.currentframe())
#print(current_file_name) #取当前文件名
current_file_path = current_file_name[::-1].split('\\',1)[1][::-1]
#print(current_file_path) #处理当前文件上级目录名
aim_file_path = '.\collection'
aim_file_path = current_file_path + aim_file_path
if not os.path.exists(aim_file_path):
os.mkdir(aim_file_path) #创建材料收集目录