图文 | 稀疏感兴趣区域池化在目标检测中的应用_数据

专家

解读

图文 | 稀疏感兴趣区域池化在目标检测中的应用_数据_02

图像数据与一个或多个核卷积,并生成相应的一个或多个特征映射。感兴趣区域图是从一个或多个特征图中提取出来的,并基于候选的一个或多个特征进行合并。池化生成的特征向量维数小于与一个或多个特征映射相关联的维数。在神经网络中,特征向量被展平并作为一个层输入。神经网络输出与图像数据中的对象相关联的分类。

图文 | 稀疏感兴趣区域池化在目标检测中的应用_计算机视觉_03

上图就是分类的特征选择过程,3个特征选择boxes用在了不同的类别上。特征选择box的数量取决于类别的数量。上图中的114就是感兴趣区域,106就是感兴趣区域池化后的特征图。其实在一副图片中有很多感兴趣区域。

下图是解释下CNN的运行过程,其实CNN可以学习一个对应的模式来提取重要的特征。其中216就是今天要提及的核心:

图文 | 稀疏感兴趣区域池化在目标检测中的应用_计算机视觉_04

图文 | 稀疏感兴趣区域池化在目标检测中的应用_池化_05

下图这个分别展示了Weven和Wodd的稀疏核:

图文 | 稀疏感兴趣区域池化在目标检测中的应用_数据_06

图文 | 稀疏感兴趣区域池化在目标检测中的应用_计算机视觉_07

Sparse ROI Pooling

图文 | 稀疏感兴趣区域池化在目标检测中的应用_池化_08

图文 | 稀疏感兴趣区域池化在目标检测中的应用_数据_09

ROI池化其实会导致稀疏和冗余的特征,特别是在水平和垂直不安全的位置(通过box突出显示)。本次技术主要是跳过奇数或者偶数索引的特征,通过这样做,他可以在不影响特征表示的情况下,将全连接层的参数减半。

图文 | 稀疏感兴趣区域池化在目标检测中的应用_池化_10

CNN和目标检测的系统组件示意图

下图就展示了一个案例,检测图像中的目标方法的流程图。该方法至少由一个硬件处理器执行。702是图像的接收,图像数据可能包括真实数据。

图文 | 稀疏感兴趣区域池化在目标检测中的应用_数据_11

图文 | 稀疏感兴趣区域池化在目标检测中的应用_计算机视觉_12




END