Retinanet-FPN做目标检测详细教程
- 一. 项目环境
- 二.项目连接
- 三.项目搭建
- 3.1 数据准备
- 3.2 搭建流程
- 四.源码分析
- 五.参考文章
一. 项目环境
以下是我工程的环境(基于ubuntu18.04):
环境 | 版本 |
python | 3.6 |
pytorch | 1.5.0 |
注释:环境主要是pytorch环境,而且库很好安装,缺少什么库就安装什么库,这个很简单;
二.项目连接
论文连接:https://arxiv.org/abs/1708.02002
项目连接:https://github.com/yhenon/pytorch-retinanet
三.项目搭建
3.1 数据准备
3.1.1准备coco数据集下载:
coco数据集地址下载方法一:
train2017:http://images.cocodataset.org/zips/train2017.zip
val2017:http://images.cocodataset.org/zips/val2017.zip
test2017:http://images.cocodataset.org/zips/test2017.zip
trainval2017:http://images.cocodataset.org/annotations/annotations_trainval2017.zip
trainval2017:http://images.cocodataset.org/annotations/stuff_annotations_trainval2017.zip
image_info_test2017:http://images.cocodataset.org/annotations/image_info_test2017.zipcoco数据集地址百度云下载方法二:
链接: https://pan.baidu.com/s/1XrRHtRIHu5Jp5j4Rv_-vXA 密码: cw0l
数据目录图片展示:
3.1.2数据增强和路径配置:
注释:数据增强和筛选很重要,后期我会专门讲解这块。
路径配置在train.py(P27).
3.2 搭建流程
3.2.1搭建流程:
github下载源码并把环境配置配置好,用pycharm打开。train.py参数配置好就可以运行,太简单了/haha.jpg/。然后可以单步调试就行了。具体函数在源码分析里面详细讲解。
四.源码分析
4.1.1代码目录:
4.2.1代码流程:
- 前期准备:
1》论文熟悉了,通读两遍。
2》弄明白focalLoss原理,很简单的思想。参考:
Retinanet的思想FocalLoss的原理
3》Resnet50结构: - 2.代码熟悉:
1》大致流程图如下: