只有0.7M？超超超轻量SOTA目标检测模型揭秘！

原创

3D视觉工坊 2022-12-12 11:55:46 ©著作权

©著作权归作者所有：来自51CTO博客作者3D视觉工坊的原创作品，请联系作者获取转载授权，否则将追究法律责任

目标检测作为计算机视觉领域的顶梁柱，不仅可以独立完成车辆、商品、缺陷检测等任务，也是人脸识别、视频分析、以图搜图等复合技术的核心模块，在自动驾驶、工业视觉、安防交通等领域的商业价值有目共睹。

只有0.7M？超超超轻量SOTA目标检测模型揭秘！_ico

正因如此，YOLOv5、YOLOX、PP-YOLOE、PP-PicoDet等优秀算法层出不穷，各有优劣侧重。而在当前云、边、端多场景协同的产业大趋势下，运行速度、模型计算量、模型格式转化、硬件适配、统一部署方案等实际问题都需要考虑，到底该怎么选呢？

今天小编就给大家推荐一个，针对云、边、端各环境都深层优化的超强目标检测开发套件 — PaddleDetection。无论你追求的是高精度、轻量化，还是场景预训练模型，它其中的模型都能以业界最高标准满足你的需求。同时，这些模型都拥有统一的使用方式及部署策略，不再需要进行模型转化、接口调整，更贴合工业大生产标准化、模块化的需求！

只有0.7M？超超超轻量SOTA目标检测模型揭秘！_github_02

还在等什么！赶紧查看全部开源代码并Star收藏吧！！
传送门： https://github.com/PaddlePaddle/PaddleDetection

只有0.7M？超超超轻量SOTA目标检测模型揭秘！_ico_03

下面，让我们来详细解读下这个开发套件中的模型，是如何达到业界最高标准，又如何提供产业最佳实践体验的！

PP-YOLOE：

高精度SOTA目标检测模型

PP-YOLOE根据不同应用场景设计了s/m/l/x，4个尺寸的模型来支持不同算力水平的硬件，无论是哪个尺寸，精度-速度都超越当前所有同等计算量下的YOLO模型！

性能卓越：具体来说，PP-YOLOE-l在COCO test-dev上以精度51.4%，TRT FP16推理速度149FPS的优异数据，相较YOLOX，精度提升1.3%，加速25%；相较YOLOv5，精度提升0.7%，加速26.8%。训练速度较PP-YOLOv2提高33%，大幅降低模型训练成本。
部署友好：与此同时，PP-YOLOE在结构设计上避免使用如deformable convolution或者matrix nms之类的特殊算子，使其能轻松适配更多硬件。当前已经完备支持NVIDIA V100、T4这样的云端GPU架构以及如Jetson系列等边缘端GPU和FPGA开发板。

PP-YOLOE完整代码实现：

https://github.com/PaddlePaddle/PaddleDetection/tree/release/2.4/configs/ppyoloe

技术报告：

https://arxiv.org/abs/2203.16250

PP-PicoDet：

0.7M超超超轻量SOTA目标检测模型

超乎想象的超小体积及超预期的性能，使PP-PicoDet成为边缘、低功耗硬件部署的最佳选择。

更强性能：PP-PicoDet-S参数量仅有1.18M，却有32.5%mAP的精度，不仅精度比相较YOLOX-Nano高6.7%，推理速度还提升了26%；相较比NanoDet-Plus，mAP也高出了2%，速度提升30%。最新增加的PP-PicoDet-XS更是仅有0.7M，在CPU上预测速度可达250FPS以上，在训练速度上也大幅提升一倍以上。
更好优化支持：考虑到端侧对计算量的优化追求是极致的，PP-PicoDet在模型量化训练和稀疏化压缩方案支持方面做了更深度的打磨，仅需两步，即可实现在移动端部署加速30%以上的效果。

只有0.7M？超超超轻量SOTA目标检测模型揭秘！_github_04

更友好部署：为了部署更加轻松高效， PP-PicoDet在模型导出环节，将模型的后处理包含在了网络中，支持预测直接输出检测结果，无需额外开发后处理模块，还能端到端加速10%-20%。

PP-PicoDet代码实现：

https://github.com/PaddlePaddle/PaddleDetection/tree/release/2.4/configs/picodet
技术报告地址：

https://arxiv.org/abs/2111.00902

更多开源社区优秀算法

统一、极致的开发体验

PaddleDetection还第一时间收录了如YOLOv4、YOLOX及SwinTransformer等在内的前沿优秀算法，与Faster-RCNN、YOLOv3等经典算法一同，为用户提供极致简单、统一的使用方式，且得益于飞桨原生推理库Paddle Inference及飞桨端侧推理框架Paddle Lite的能力，通过支持TensorRT和OpenVino，开发者可以快速完成在服务端和边缘端GPU或ARM CPU、NPU等硬件上的高性能加速部署。此外，PaddleDetection还支持一键导出为ONNX格式，顺畅对接ONNX生态。