在大批量处理数据集图片时,使用Python中的os.listdir(),发现读取的图片不是按照预想的顺序读取,是乱序的,这… … … …忍不了,为了解决这个问题,总结了Python 按照图片名称顺序(升序)读取文件夹中图片处理的方法。


目录

  • 乱序的样纸
  • 数字图片名解决办法
  • 示例代码1
  • 示例1处理结果对比图
  • 多字符串名组合的解决办法
  • 示例代码2
  • 示例2处理结果对比图
  • 总结


乱序的样纸

直接使用os.listdir()读取处理后乱序的样纸如下:

python 读取文件夹中的文件 按照名称排序 python按文件夹顺序读文件_opencv

数字图片名解决办法

加入下面这条代码即可有序读取图片处理:

file.sort(key=lambda x:int(x.split('.')[0]))

示例代码1

具体的位置见下:

file = os.listdir(path=input_dir)
file.sort(key=lambda x:int(x.split('.')[0]))

for item in file:
    img = cv2.imread(os.path.join(input_dir, item),cv2.IMREAD_GRAYSCALE)

下面是一段使用局部直方图均衡化方法,按图片名顺序批量处理文件夹中图片的例子:

import cv2
import os
import sys

# 需要读取的路径

input_dir = 'runs/detect/INF_2023.3.3_405_Original_select2 Extract/roi'
output_dir = 'runs/detect/INF_2023.3.3_405_Original_select2 Extract/roi Enhanse Enhance'

if not os.path.exists(output_dir):
    os.makedirs(output_dir)

index = 1

file = os.listdir(path=input_dir)
# file.remove('.DS_Store')
file.sort(key=lambda x:int(x.split('.')[0]))

for item in file:
    img = cv2.imread(os.path.join(input_dir, item),cv2.IMREAD_GRAYSCALE)
    print('Being processed picture %s' % index+"  "+item)

    # 灰度转换
    gray = img  # cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

    # 局部直方图均衡化处理
    clahe = cv2.createCLAHE(clipLimit=2, tileGridSize=(10, 10))  ## 限制对比度自适应直方图均衡化

    # 将灰度图像和局部直方图相关联, 把直方图均衡化应用到灰度图
    result = clahe.apply(gray)

    # 保存图片
    cv2.imwrite(output_dir + '/' + str(index) + '.jpg', result)
    index += 1

    key = cv2.waitKey(30) & 0xff
    if key == 27:
        sys.exit(0)

示例1处理结果对比图

按顺序处理后的样纸如下:

python 读取文件夹中的文件 按照名称排序 python按文件夹顺序读文件_python_02

多字符串名组合的解决办法

使用正则表达式匹配定位子字符串:

  1. 使用正则表达式\((\d+)\)匹配提取括号中的数字部分。
  2. match.group(1)可以获取第一个捕获组,也就是括号中的数字。
  3. 使用int()将匹配的字符串转换为整数。

我自己的原图片名为:week_1 (140).jpg

通过先 .split(‘(’) 再 .split(‘)’) 来获取括号中的内容,最后转换为整数

filelist.sort(key=lambda x: int(x.split('(')[1].split(')')[0]))

示例代码2

import os
import shutil

class BatchRename():
    '''
    批量重命名文件夹中的图片文件

    '''
    def __init__(self):
        self.path = 'data/INF_All_9.1/Temp_JPG'  #表示需要命名处理的文件夹
        self.save_path='data/INF_All_9.1/Temp_JPG_Sort'#保存重命名后的图片地址
    def rename(self):
        filelist = os.listdir(self.path) #获取文件路径
        # filelist.sort(key=lambda x: int(x.split('.')[0])) # 先按照名称顺序排好序
        filelist.sort(key=lambda x: int(x.split('(')[1].split(')')[0]))  # 先按照名称顺序排好序
        total_num = len(filelist) #获取文件长度(个数)
        i = 1 #表示文件的命名是从1开始的
        for item in filelist:
            print(item)
            if item.endswith('.jpg'):  #初始的图片的格式为jpg格式的(或者源文件是png格式及其他格式,后面的转换格式就可以调整为自己需要的格式即可)
                src = os.path.join(os.path.abspath(self.path), item)#当前文件中图片的地址
                dst = os.path.join(os.path.abspath(self.save_path), ''+'week'+str(i) + '.jpg')#处理后文件的地址和名称,可以自己按照自己的要求改进
                try:
                    # os.rename(src, dst)
                    shutil.copy(src, dst)
                    print ('converting %s to %s ...' % (src, dst))
                    i = i + 1
                except:
                    continue
        print ('total %d to rename & converted %d jpgs' % (total_num, i))

if __name__ == '__main__':
    demo = BatchRename()
    demo.rename()

示例2处理结果对比图

按照原图片名顺序改名后的效果如下,可以看出按照原图片名顺序自定义修改图片名后顺序没有被打乱:

python 读取文件夹中的文件 按照名称排序 python按文件夹顺序读文件_示例代码_03