什么是异常?
异常即是一个事件,该事件会在程序执行过程中发生,影响了程序的正常执行。
一般情况下,在Python无法正常处理程序时就会发生一个异常。
异常是Python对象,表示一个错误。
当Python脚本发生异常时我们需要捕获处理它,否则程序会终止执行。
常见的异常有:
其中,我们经常能遇到的ERROR有:KeyboardInterrupt、Exception、AssertionError、AttributeError、EOFError、IOError、ImportError、MemoryError、RuntimeError、SyntaxError、TypeError、ValueError、UnicodeError等
异常处理
捕捉异常可以使用try/except语句。
try/except语句用来检测try语句块中的错误,从而让except语句捕获异常信息并处理。
如果你不想在异常发生时结束你的程序,只需在try里捕获它。
语法:
以下为简单的try....except...else的语法:
try:
<语句> #运行一行可能会出现错误的代码
except <名字>:
<语句> #如果在try部份引发了'name'异常,执行的语句
except <名字>,<数据>:
<语句> #如果引发了'name'异常,获得附加的数据
else:
<语句> #如果没有异常发生
最近在公司处理数据的时候,才了解到异常处理的方便所在~~
背景:
同事A和同事B都做了数据标注,并最后交予我整合数据,但是由于沟通上的问题和同事A和B的粗心,在图片统一命名的时候发生了一些不易发觉的错误,包含小错误的图片大概有十几二十张,这些图片很难发觉,因为图片总量有好几千张。
先介绍一些正确的统一命名格式:行人ID(5)_C摄像头ID(5)_时间(可选)序号(3).jpg,如:00001_C10001_201809271330_001.jpg
但是同事A容易把’C’打成’c’,把’’打成‘__ ’ 等,这些错误会导致提取关键字的时候发生错误,比如我们用split函数,以’’为分割字符来分割文件名,提取它的行人ID信息的时候,某一个文件名的‘_’变成了‘__’就会导致读取失败或者错误;或者使用正则表达式pattern = re.compile(r'([-\d]+)_C(\d+)')来获取行人ID和摄像头ID的时候,某个文件的’c’和’C’混淆了,也会导致正则表达式无法提取到对应的信息。
分析:
从几千设置几万的数据集中手动查找这些命名错误的文件肯定是不可行的,但是如果编写程序检查命名格式,再遇到错误名字的时候,又会使得整个程序停下,虽然这时候可以定位到那个命名错误的文件,但是如果这样的文件有20个,那你就得运行程序20次,况且,到底有多少个错误命名的文件,你通常事先不会知道,那么有什么办法呢?
异常处理!
当出现异常的时候,你可以观察一下出现的是什么异常,然后针对该异常的情况,采取相应的措施,在本案例中,我们显然是想要跳过该异常文件,继续检查整个文件夹中的所有文件,那么我们就可以这样写: 代码:
check_data.py
import os
import shutil
#设置总路径
PATH = 'E:/HGTX347/data2/'
#获取所有文件路径
def file_name(file_dir):
L=[]
for root, dirs, files in os.walk(file_dir):
for file in files:
if os.path.splitext(file)[1] == '.jpg':
L.append(file)
return L
def remove_time(i):
if i < length:
id = L[i].split('_',4)
print (id)
#文件重命名
os.rename(PATH+file_dir+id[0]+''+id[1]+''+id[2]+''+id[3],PATH+new_file_dir+id[0]+''+id[1]+'_'+id[2]+'.jpg')
#设置文件夹名字,里面有需要改名的文件
file_dir="query/"
new_file_dir = "temp/"
#获取文件路径,存放于数组L中
L = file_name(file_dir)
#获取数组长度(图片数量)
length = len(L)
i=0
for i in range(length):
try:
remove_time(i)
except FileExistsError: #根据控制台提示的Error类型来设置
continue #如果发现异常,跳过这个文件,继续
print('finished processing'+str(i+1)+' pitures')
这样一来,原来的文件夹下剩下的文件就都是不符合条件的命名错误的文件了,这时候就可以一个一个地改名,方便快捷~