【计算机视觉40例】案例21：图像分类

原创

superdont 2022-08-15 10:37:31 博主文章分类：计算机视觉40例简介 ©著作权

文章标签 计算机视觉 opencv python 计算机视觉40例计算机视觉案例教程 文章分类 虚拟化云计算

©著作权归作者所有：来自51CTO博客作者superdont的原创作品，请联系作者获取转载授权，否则将追究法律责任

图像分类是计算机视觉最基础的任务之一。开始，人们对较简单的具有10个数字类别的手写数字数据集MNIST进行分类。后来，人们对更加复杂的具有10个分类的CIFAR10和100个分类的CIFAR100进行分类。再后来，ImageNet成为人们在分类时所使用的主要数据集。

图像分类，简单来说就是将不同的图像划分到不同的类别内，并保证最小的分类误差。

【例题】使用GoogleNet完成图像分类。

# -*- coding: utf-8 -*-
"""
Created on Mon Sep  6 14:16:58 2021
@author: 李立宗  lilizong@gmail.com
微信公众号：计算机视觉之光（微信号cvlight）
计算机视觉40例——从入门到深度学习（OpenCV-Python）
李立宗 著     电子工业出版社
"""
import numpy as np
import cv2
#=======读取原始图像=============
image=cv2.imread("tower.jpg")
#=======调用模型=============
# 依次执行四个函数：
# readNetFromeCaffe/blogFromImage/setInput/forward
config='model/bvlc_googlenet.prototxt'
model='model/bvlc_googlenet.caffemodel'
net = cv2.dnn.readNetFromCaffe(config, model)
#与readnet不同，需要注意参数的先后顺序
blob = cv2.dnn.blobFromImage(image, 1, (224, 224), (104, 117, 123))
net.setInput(blob)
prob = net.forward()
#=======读取分类信息============
classes =  open('model/label.txt', 'rt').read().strip().split("\n")
#=======确定分类所在行============
rowIndex = np.argsort(prob[0])[::-1][0]
#=======绘制输出结果============
result = "result: {}, {:.0f}%".format(classes[rowIndex],prob[0][rowIndex]*100)
cv2.putText(image, result, (25, 45),  cv2.FONT_HERSHEY_SIMPLEX,1, (0, 0, 255), 2)
#====显示原始输入图像======
cv2.imshow("result",image)
cv2.waitKey()
cv2.destroyAllWindows()

运行程序，显示如图1所示图像。

【计算机视觉40例】案例21：图像分类_opencv

图1 结果展示

从运行结果可以看到识别结果为“灯塔（beacon, lighthouse, beacon light, pharos）”，置信度为：98.69%。

欢迎大家阅读《计算机视觉40例——从入门到深度学习（OpenCV-Python）》一书中第24章《深度学习应用实践》获取详细内容。

《计算机视觉40例——从入门到深度学习（OpenCV-Python）》在介绍Python基础、OpenCV基础、计算机视觉理论基础、深度学习理论的基础上，介绍了计算机视觉领域内具有代表性的40个典型案例。这些案例中，既有传统的案例（数字识别、答题卡识别、物体计数、缺陷检测、手势识别、隐身术、以图搜图、车牌识别、图像加密、指纹识别等），也有深度学习案例（图像分类、风格迁移、姿势识别、实例分割等），还有人脸识别方面的案例（表情识别、驾驶员疲劳监测、识别性别与年龄等）。

【计算机视觉40例】案例21：图像分类_计算机视觉40例_02