在使用Keras搭建验证码识别模型时,需要大量的验证码图片。在这里,使用captcha模块生成验证码图片,验证码图片名称为验证码上显示的字符串。
1 生成单张验证码图片并显示
生成一张验证码的代码如下:
from captcha.image import ImageCaptcha
import matplotlib.pyplot as plt
import numpy as np
import random
import string
#characters为验证码上的字符集,10个数字加26个大写英文字母
#0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ str类型
characters=string.digits+string.ascii_uppercase
width,height,n_len,n_class=170,80,4,len(characters)
#设置验证码图片的宽度widht和高度height
#除此之外还可以设置字体fonts和字体大小font_sizes
generator=ImageCaptcha(width=width,height=height)
#生成随机的4个字符的字符串
random_str=''.join([random.choice(characters) for j in range(4)])
#生成验证码
img=generator.generate_image(random_str)
#显示验证码图片和验证码标题
plt.imshow(img)
plt.title(random_str)
plt.show()
程序运行结果为:
2 验证码图片的显示与保存
上面代码中生成的验证码是PIL图像格式,因此也可以直接使用PIL自带的show方法显示图片,save方法保存图片
如下:
#显示验证码
img.show()
#保存验证码
file_name=random_str+'.jpg'
img.save(file_name)
3 批量生成验证码样本集
当我们在深度学习中,进行验证码进行字符识别,需要大量的图片,因此我们可以批量生成大量的样本。这里以生成一万张样本为例。
代码如下:
from captcha.image import ImageCaptcha
import matplotlib.pyplot as plt
import numpy as np
import random
import string
from PIL import Image
#characters为验证码上的字符集,10个数字加26个大写英文字母
#0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ str类型
characters=string.digits+string.ascii_uppercase
width,height,n_len,n_class=170,80,4,len(characters)
#生成一万张验证码
for i in range(10000):
generator=ImageCaptcha(width=width,height=height)
random_str=''.join([random.choice(characters) for j in range(4)])
img=generator.generate_image(random_str)
#将图片保存在目录yzm文件夹下
file_name='./yzm/'+random_str+'_'+str(i)+'.jpg'
img.save(file_name)
当程序执行完,会在文件夹yzm下生成一万张验证码图片