前言在上一篇中我们详细的debug了Faster-RCNN的RPN网络,以及如何依据RPN对anchor进行第一次的坐标偏移。值得注意的是整个过程都是在图像的原始比例上进行的,而不是在stride层面。RPN网络的输出参数是直接调整原始anchor坐标的。 在这篇文章中我们会继续debug网络的分类部分,即模型是如何基于ROI的输出结果进行分类和回归的。源码debug我们首先回到上次nets/fr
  论文链接2、使用步骤1.引入库2.读入数据总结
oriented rcnn代码解析 文章目录rpn_head.forward_trainroi_head.forward_train class OrientedRCNN(RotatedTwoStageDetector) 类似rotated faster rcnn它们都继承两阶段检测器类。 所以训练的整体框架都如下:rpn_head.forward_train代码主体?outs = self(x)
一、什么是transformertransformer是目前最流行的特征抽取器transformer是采用encoder-decoder架构。论文Attention Is All You Need中给出encoder层是6层encoder堆叠在一起的,deco样是6层decoder堆叠在一起。分解成一个encoder和一个decoder的话如下:RNN缺点:1. RNN不能并行:RNN是依赖前一时
转载 7月前
77阅读