使用yolov5进行图像识别 yolo识别原理

转载

mob64ca140e76c8 2024-02-15 17:36:56

YOLO算法详解

图像识别算法是计算机视觉的基础算法，例如VGG，GoogLeNet，ResNet等，这类算法主要是判断图片中目标的种类。

目标检测和图像识别类似。但是目标检测不仅要识别图像中物体的类别，还要获得图像中物体的位置、大小、类别等，并返回其坐标值。

使用yolov5进行图像识别 yolo识别原理_相对坐标

例如上图。在图像识别中，对于人，车，自行车这三类来说，图像识别会给出个预测的概率矩阵[0.1,0.9,0.1]，因此该图像会被识别成车这一类别。而目标检测中，不仅要预测这是辆车，还要给出车的中心坐标，车的长和宽。对于目标检测来说，输出结果类似于这种格式：

使用yolov5进行图像识别 yolo识别原理_目标检测_02

其中:

c1、c2、c3是目标属于人、车、自行车的概率，基于此，我们可以使用滑动窗口对整张图片进行处理来定位目标。就像是用一个放大镜去图像的每个区域去查找是否包含目标。这样的方法简单粗暴有效，但是效率极低，计算复杂度太高，所以不会这么去做。

目前，基于深度学习算法的一系列目标检测算法大致可以分为两大流派：

之前的R-CNN系列虽然准确率比较高，但是即使是发展到Faster R-CNN，检测一张图片如上图所示也要7fps(原文为5fps)，为了使得检测的工作能够用到实时的场景中，提出了YOLO。

YOLO是You Only Look Once的缩写。这也是为了特别突出YOLO区别于两阶段算法的特点，从名字就可以感受到，YOLO算法速度很快，事实上也是如此。可以看出在同样的设备上，YOLO可以达到45帧每秒的速度。

下面是YOLO的模型框架图：

使用yolov5进行图像识别 yolo识别原理_相对坐标_03

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯