OpenCV识别十字和T字 opencv识别数字字母

转载

mob64ca13f7419f 2024-03-01 14:11:35

文章标签 OpenCV识别十字和T字 opencv数字识别 git python Desktop 文章分类 计算机视觉人工智能

1 说明

=====

1.1 OCR(光学字符识别)：

该字体有几种用途，其中自动化系统需要定义标准的字符形状以正确扫描不使用条形码的数字和文本。

OCR 应用的一些实例包括银行支票、护照、序列标签和邮件。

OCR-A 和 OCR-B 字体有能够被 OCR 扫描设备准确读取的字符形状。

OpenCV识别十字和T字 opencv识别数字字母_git

1.2 OCR-A：

1.2.1 源码下载，打不开

https://en.wikipedia.org/wiki/OCR-A

OpenCV识别十字和T字 opencv识别数字字母_Desktop_02

1.2.2 我用OCRAExtended.ttf代替OCRA.ttf也可以。

2 效果图

OpenCV识别十字和T字 opencv识别数字字母_OpenCV识别十字和T字_03

3 准备

=====

3.1 环境：

python3.8+opencv4.2.0+deepin-linux深度操作系统+微软编辑器vscode。

3.2 文件结果

OpenCV识别十字和T字 opencv识别数字字母_python_04

3.3 参考文章：

#英文原版文章https://www.pyimagesearch.com/2017/07/17/credit-card-ocr-with-opencv-and-python/#中文文章对源代码进行注释，排版，删减，修改bug，调试和运行

3.4 本次银行卡为Visa，国内银行卡暂时不行。

4 模板字体

========

4.1 网上下载

OpenCV识别十字和T字 opencv识别数字字母_OpenCV识别十字和T字_05

4.2 自己生成

4.2.1 代码：

import pygamefrom pygame.locals import *def main():    pygame.init()    screen = pygame.display.set_mode((1000, 450))  #窗口的大小    pygame.display.set_caption('OCRA数字模板')  #窗口标题，中文不需要特别的设置    background = pygame.Surface(screen.get_size())    background = background.convert()    background.fill((250, 250, 250))    #自己下载OCRAExtended.ttf    #显示中文的设置和字体，及路径，字体大小120比较好    font = pygame.font.Font('/home/xgj/Desktop/ocraI/OCRAExtended.ttf', 120)          text = font.render("0123456789", 1, (10, 10, 10))      textpos = text.get_rect()    textpos.center = background.get_rect().center    background.blit(text, textpos)    screen.blit(background, (0, 0))    pygame.display.flip()    while 1:        for event in pygame.event.get():            if event.type == QUIT:                return                screen.blit(background, (0, 0))                pygame.display.flip()if __name__ == '__main__':     main()

4.2.2 图

OpenCV识别十字和T字 opencv识别数字字母_opencv数字识别_06

截图并命名为：card1.png

5 代码

====

5.1 myutils.py(自建模块被引用)

import cv2def sort_contours(cnts, method="left-to-right"):    reverse = False    i = 0    if method == "right-to-left" or method == "bottom-to-top":        reverse = True    if method == "top-to-bottom" or method == "bottom-to-top":        i = 1    boundingBoxes = [cv2.boundingRect(c) for c in cnts] #用一个最小的矩形，把找到的形状包起来x,y,h,w    (cnts, boundingBoxes) = zip(*sorted(zip(cnts, boundingBoxes),                                        key=lambda b: b[1][i], reverse=reverse))    return cnts, boundingBoxesdef resize(image, width=None, height=None, inter=cv2.INTER_AREA):    dim = None    (h, w) = image.shape[:2]    if width is None and height is None:        return image    if width is None:        r = height / float(h)        dim = (int(w * r), height)    else:        r = width / float(w)        dim = (width, int(h * r))    resized = cv2.resize(image, dim, interpolation=inter)    return resized

5.2 bankcardre.py(主程序代码)

#第1步：模块导入import  cv2import numpy as  npimport myutils  #自建模块被引用from imutils import contours#第2步：指定信用卡类型，国内银行卡暂时不行FIRST_NUMBER = {    "3": "American Express",    "4": "Visa",    "5": "MasterCard",    "6": "Discover Card"}#第3步：显示函数定义#因为需要展示的图片比较多，这样打包显得代码简洁def cv_show(str,thing):    cv2.imshow(str, thing)    cv2.waitKey(0)    cv2.destroyAllWindows()#第4步：数字字体模板导入和处理img=cv2.imread("/home/xgj/Desktop/bankcardre/card1.png")# 灰度图ref = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)#二值化ref=cv2.threshold(ref,10,255,cv2.THRESH_BINARY_INV)[1]cv_show("img_ref",ref)# 计算轮廓#cv2.findContours()函数接受的参数为二值图，即黑白的(不是灰度图)#cv2.RETR_EXTERNAL只检测外轮廓，cv2.CHAIN_APPROX_SIMPLE只保留终点坐标#返回的list中每个元素都是图像中的一个轮廓#下面bug，注释掉，删除一个ref_#ref_,refCnts,hierarchy=cv2.findContours(ref.copy(), cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)refCnts,hierarchy=cv2.findContours(ref.copy(), cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)cv2.drawContours(img,refCnts,-1,(0,0,255),3)cv_show('img',img)#print (np.array(refCnts).shape)  #注释掉否则报错refCnts = myutils.sort_contours(refCnts, method="left-to-right")[0]#排序，从左到右，从上到下digits = {}for (i, c) in enumerate(refCnts):    # 计算外接矩形并且resize成合适大小    (x, y, w, h) = cv2.boundingRect(c)    roi = ref[y:y + h, x:x + w]    roi = cv2.resize(roi, (57, 88))    # 每一个数字对应每一个模板    digits[i] = roi# 初始化卷积核rectKernel = cv2.getStructuringElement(cv2.MORPH_RECT, (9, 3))sqKernel = cv2.getStructuringElement(cv2.MORPH_RECT, (5, 5))#第5步：银行卡图片处理#读取需要识别的银行卡的图片，预处理image = cv2.imread("/home/xgj/Desktop/bankcardre/1.png")cv_show('image',image)image = myutils.resize(image, width=300)gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)cv_show('gray',gray)#礼帽操作，突出更明亮的区域tophat = cv2.morphologyEx(gray, cv2.MORPH_TOPHAT, rectKernel)cv_show('tophat',tophat)#ksize=-1相当于用3*3的gradX = cv2.Sobel(tophat, ddepth=cv2.CV_32F, dx=1, dy=0, ksize=-1)gradX = np.absolute(gradX)(minVal, maxVal) = (np.min(gradX), np.max(gradX))gradX = (255 * ((gradX - minVal) / (maxVal - minVal)))gradX = gradX.astype("uint8")#print (np.array(gradX).shape) #注释掉否则报错cv_show('gradX',gradX)#通过闭操作(先膨胀，再腐蚀)将数字连在一起gradX = cv2.morphologyEx(gradX, cv2.MORPH_CLOSE, rectKernel)cv_show('gradX',gradX)#THRESH_OTSU会自动寻找合适的阈值，适合双峰，需把阈值参数设置为0thresh = cv2.threshold(gradX, 0, 255,    cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]cv_show('thresh',thresh)#再来一个闭操作thresh = cv2.morphologyEx(thresh, cv2.MORPH_CLOSE, sqKernel) #再来一个闭操作cv_show('thresh',thresh)# 计算轮廓#修改bug#hresh_, threshCnts, hierarchy = cv2.findContours(thresh.copy(), cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)threshCnts, hierarchy = cv2.findContours(thresh.copy(), cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)cnts = threshCntscur_img = image.copy()cv2.drawContours(cur_img,cnts,-1,(0,0,255),3)cv_show('img',cur_img)locs = []# 遍历轮廓for (i, c) in enumerate(cnts):    # 计算矩形    (x, y, w, h) = cv2.boundingRect(c)    ar = w / float(h)    # 选择合适的区域，根据实际任务来，这里的基本都是四个数字一组    if ar > 2.5 and ar < 4.0:        if (w > 40 and w < 55) and (h > 10 and h < 20):            #符合的留下来            locs.append((x, y, w, h))# 将符合的轮廓从左到右排序locs = sorted(locs, key=lambda x:x[0])output = []# 遍历每一个轮廓中的数字for (i, (gX, gY, gW, gH)) in enumerate(locs):    # initialize the list of group digits    groupOutput = []    # 根据坐标提取每一个组    group = gray[gY - 5:gY + gH + 5, gX - 5:gX + gW + 5]    cv_show('group',group)    # 预处理    group = cv2.threshold(group, 0, 255,        cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]    cv_show('group',group)    # 计算每一组的轮廓，注释掉，修改bug    #group_,digitCnts,hierarchy = cv2.findContours(group.copy(), cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)        digitCnts,hierarchy = cv2.findContours(group.copy(), cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)    digitCnts = contours.sort_contours(digitCnts,        method="left-to-right")[0]    # 计算每一组中的每一个数值    for c in digitCnts:        # 找到当前数值的轮廓，resize成合适的的大小        (x, y, w, h) = cv2.boundingRect(c)        roi = group[y:y + h, x:x + w]        roi = cv2.resize(roi, (57, 88))        cv_show('roi',roi)        # 计算匹配得分        scores = []        # 在模板中计算每一个得分        for (digit, digitROI) in digits.items():            # 模板匹配            result = cv2.matchTemplate(roi, digitROI,                cv2.TM_CCOEFF)            (_, score, _, _) = cv2.minMaxLoc(result)            scores.append(score)        # 得到最合适的数字        groupOutput.append(str(np.argmax(scores)))    # 画出来    cv2.rectangle(image, (gX - 5, gY - 5),        (gX + gW + 5, gY + gH + 5), (0, 0, 255), 1)    cv2.putText(image, "".join(groupOutput), (gX, gY - 15),        cv2.FONT_HERSHEY_SIMPLEX, 0.65, (0, 0, 255), 2)    # 得到结果    output.extend(groupOutput)#第6步：终端显示和结束# 打印结果print("Credit Card Type: {}".format(FIRST_NUMBER[output[0]]))print("Credit Card #: {}".format("".join(output)))cv2.imshow("Image", image)cv2.waitKey(0)

6 小结

====

6.1 python和opencv的银行卡数字识别为主，目前以美国银行卡识别为主，国内银行卡识别类似。

6.2 注意数字模板OCR-A字体的相关知识复习和模板生成。

6.3 本文介绍比网上的介绍更全面和更细致，更容易懂，适合收藏。

OpenCV识别十字和T字 opencv识别数字字母_OpenCV识别十字和T字_07