在大批量处理数据集图片时,使用Python中的os.listdir(),发现读取的图片不是按照预想的顺序读取,是乱序的,这… … … …忍不了,为了解决这个问题,总结了Python 按照图片名称顺序(升序)读取文件夹中图片处理的方法。
目录
- 乱序的样纸
- 数字图片名解决办法
- 示例代码1
- 示例1处理结果对比图
- 多字符串名组合的解决办法
- 示例代码2
- 示例2处理结果对比图
- 总结
乱序的样纸
直接使用os.listdir()读取处理后乱序的样纸如下:
数字图片名解决办法
加入下面这条代码即可有序读取图片处理:
file.sort(key=lambda x:int(x.split('.')[0]))
示例代码1
具体的位置见下:
file = os.listdir(path=input_dir)
file.sort(key=lambda x:int(x.split('.')[0]))
for item in file:
img = cv2.imread(os.path.join(input_dir, item),cv2.IMREAD_GRAYSCALE)
下面是一段使用局部直方图均衡化方法,按图片名顺序批量处理文件夹中图片的例子:
import cv2
import os
import sys
# 需要读取的路径
input_dir = 'runs/detect/INF_2023.3.3_405_Original_select2 Extract/roi'
output_dir = 'runs/detect/INF_2023.3.3_405_Original_select2 Extract/roi Enhanse Enhance'
if not os.path.exists(output_dir):
os.makedirs(output_dir)
index = 1
file = os.listdir(path=input_dir)
# file.remove('.DS_Store')
file.sort(key=lambda x:int(x.split('.')[0]))
for item in file:
img = cv2.imread(os.path.join(input_dir, item),cv2.IMREAD_GRAYSCALE)
print('Being processed picture %s' % index+" "+item)
# 灰度转换
gray = img # cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 局部直方图均衡化处理
clahe = cv2.createCLAHE(clipLimit=2, tileGridSize=(10, 10)) ## 限制对比度自适应直方图均衡化
# 将灰度图像和局部直方图相关联, 把直方图均衡化应用到灰度图
result = clahe.apply(gray)
# 保存图片
cv2.imwrite(output_dir + '/' + str(index) + '.jpg', result)
index += 1
key = cv2.waitKey(30) & 0xff
if key == 27:
sys.exit(0)
示例1处理结果对比图
按顺序处理后的样纸如下:
多字符串名组合的解决办法
使用正则表达式匹配定位子字符串:
- 使用正则表达式
\((\d+)\)
匹配提取括号中的数字部分。 - match.group(1)可以获取第一个捕获组,也就是括号中的数字。
- 使用
int()
将匹配的字符串转换为整数。
我自己的原图片名为:week_1 (140).jpg
通过先 .split(‘(’) 再 .split(‘)’) 来获取括号中的内容,最后转换为整数
filelist.sort(key=lambda x: int(x.split('(')[1].split(')')[0]))
示例代码2
import os
import shutil
class BatchRename():
'''
批量重命名文件夹中的图片文件
'''
def __init__(self):
self.path = 'data/INF_All_9.1/Temp_JPG' #表示需要命名处理的文件夹
self.save_path='data/INF_All_9.1/Temp_JPG_Sort'#保存重命名后的图片地址
def rename(self):
filelist = os.listdir(self.path) #获取文件路径
# filelist.sort(key=lambda x: int(x.split('.')[0])) # 先按照名称顺序排好序
filelist.sort(key=lambda x: int(x.split('(')[1].split(')')[0])) # 先按照名称顺序排好序
total_num = len(filelist) #获取文件长度(个数)
i = 1 #表示文件的命名是从1开始的
for item in filelist:
print(item)
if item.endswith('.jpg'): #初始的图片的格式为jpg格式的(或者源文件是png格式及其他格式,后面的转换格式就可以调整为自己需要的格式即可)
src = os.path.join(os.path.abspath(self.path), item)#当前文件中图片的地址
dst = os.path.join(os.path.abspath(self.save_path), ''+'week'+str(i) + '.jpg')#处理后文件的地址和名称,可以自己按照自己的要求改进
try:
# os.rename(src, dst)
shutil.copy(src, dst)
print ('converting %s to %s ...' % (src, dst))
i = i + 1
except:
continue
print ('total %d to rename & converted %d jpgs' % (total_num, i))
if __name__ == '__main__':
demo = BatchRename()
demo.rename()
示例2处理结果对比图
按照原图片名顺序改名后的效果如下,可以看出按照原图片名顺序自定义修改图片名后顺序没有被打乱: