在人工智能机器学习的领域中,目前最火的莫过于计算机视觉了,这项技术一直广受关注,而其中的目标检测是计算机视觉领域中最常见的问题之一。
从去年的 YOLOv4 发布后,目标检测框架被问的最多的问题就是:“有没有同学复现 YOLOv4 的, 可以交流一下么”。这是因为原版的YOLO使用的是C语言进行编程,让很多人望而却步。
那么,YOLO为什么如此重要?究竟好学吗?
我们先简单看一下什么是YOLO,它其实是一种实时目标检测算法,也是第一个平衡所提供检测的质量和速度的算法。YOLO可以找出照片存在的对象,也可以指示位置和数量。这种模型在机器人和汽车工业中都有应用,因此检测速度至关重要。
YOLO检测速度非常快。因为检测问题是回归问题,所以不需要复杂的管道。它比“R-CNN”快1000倍,比“Fast R-CNN”快100倍。
YOLO能够处理实时视频,延迟非常小,连25毫秒都不到。精度也是以前实时系统的两倍多。更为重要的是YOLO遵循“端到端深度学习”的实践。
目前来说,YOLO 一共发布了四个版本,其中 YOLOv1 奠定了整个系列的基础,后面的系列就是在第一版基础上的改进,只为提升性能。