万字长文概述单目3D目标检测算法 3d目标检测前景

转载

mob6454cc798a0c 2024-07-29 19:03:56

文章标签 万字长文概述单目3D目标检测算法深度学习目标检测数据集 sed 文章分类 计算机视觉人工智能

论文题目：Not All Points Are Equal: Learning Highly Efficient Point-based Detectors

for 3D LiDAR Point Clouds

cvpr 2022

如题目所说，本篇文章认为像pointnet++的sa层来采取下采样点或者像pvrcnn中的基于feature距离的代表点，随着下采样的进行，往往会遗漏一些前景目标，作者做了个实验：

万字长文概述单目3D目标检测算法 3d目标检测前景_数据集

实验发现，随着下采样点的减少，car类别还能基本保持recall不变，但是一些小目标如行人和自行车，下降得就比较厉害。pvrcnn中才用的基于feature距离的fps也仅仅起到了抑制作用。作者认为pointnet++的sa层很大一部分计算量运用在了计算背景点的特征上，这是没有必要的，因为他们对于目标的回归是不重要的。

因此本文提出的基于点的目标检测算法，实际上是基于前景点的目标检测算法，既兼顾了计算效率，又提升了尤其是小目标的检测ap，因为我们可以从前面的实验中看到下采样主要损失的是小目标的recall。老规矩，上图。

万字长文概述单目3D目标检测算法 3d目标检测前景_目标检测_02

文章主要是对于下采样阶段进行了创新。

对于输入的原始点云，首先把他们丢进3个轻量化的sa层，从后面的appendix可以看到这个sa层是异于pointnet++里的sa层的，他只有2个半径。

随后对于进行了一轮下采样后的点输入到instance-aware downsampling，这里主要是对于前面所输出的点进行两层mlp编码，输出每个点的label。分清楚他们是车、行人、自行车还是背景点，随后对于分数高的k个点我们进行采样，然后把他们输入到下一个编码层。训练中我们对于实际上的gt点进行onehot编码，方便进行训练：

万字长文概述单目3D目标检测算法 3d目标检测前景_sed_03