nlp 卷积注意力卷积网络注意力机制

转载

mob64ca140d96d9 2024-01-30 01:51:18

文章标签 nlp 卷积注意力池化卷积激活函数 文章分类 文心一言 AIGC

文章目录

主要工作
method

channel attention module
spatial attention module
如何结合spatial attention module与channel attention module

实验

主要工作

提出了一种具有注意力机制的前馈卷积神经网络——Convolutional Block Attention Module(CBAM)

method

注意力机制是人类视觉所特有的大脑信号处理机制。人类视觉通过快速扫描全局图像，获得需要重点关注的目标区域，也就是一般所说的注意力焦点，而后对这一区域投入更多注意力资源，以获取更多所需要关注目标的细节信息，而抑制其他无用信息[摘自深度学习中的注意力机制]，作者希望CNN也能获得此类能力，实际上，通过grad-CAM对CNN可视化，优秀的网络结构往往能正确定位图中目标所在区域，也即优秀的网络本身就具有注意力机制，作者希望通过强化这一概念，让网络性能更加优异，并且对于噪声输入更加健壮

CNN的卷积操作从channel与spatial两个维度提取特征，因此，论文从channel与spatial两个维度提取具有意义的注意力特征，motivation如下：

由于每个feature map相当于捕获了原图中的某一个特征，channel attention有助于筛选出有意义的特征，即告诉CNN原图哪一部分特征具有意义（what）
由于feature map中一个像素代表原图中某个区域的某种特征，spatial attention相当于告诉网络应该注意原图中哪个区域的特征（where）

CBAM将某一层的特征图抽取出来，接着进行channel attention与spatial attention的提取后，与原特征图进行结合作为下一层卷积层的输入，具体流程如下：

nlp 卷积注意力卷积网络注意力机制_激活函数

channel attention module

总体流程如下：

nlp 卷积注意力卷积网络注意力机制_激活函数_02

对输入的特征图使用全局平均池化与全局最大池化，分别输入到MLP中，将结果进行element-wise add，经过激活函数后输出channel attention module，如下：

nlp 卷积注意力卷积网络注意力机制_卷积_03

$nlp 卷积注意力卷积网络注意力机制_卷积_04$ 表示sigmoid激活函数，设 $nlp 卷积注意力卷积网络注意力机制_nlp 卷积注意力_05$ 的大小为 $nlp 卷积注意力卷积网络注意力机制_nlp 卷积注意力_06$ ， $nlp 卷积注意力卷积网络注意力机制_卷积_07$ 为 $nlp 卷积注意力卷积网络注意力机制_卷积_08$ 的矩阵， $nlp 卷积注意力卷积网络注意力机制_池化_09$ 为 $nlp 卷积注意力卷积网络注意力机制_激活函数_10$ 的矩阵， $nlp 卷积注意力卷积网络注意力机制_激活函数_11$ 大小为 $nlp 卷积注意力卷积网络注意力机制_池化_12$ ，即 $nlp 卷积注意力卷积网络注意力机制_nlp 卷积注意力_05$ 的channel个数。

spatial attention module

总体流程如下：

nlp 卷积注意力卷积网络注意力机制_卷积_14

沿着通道方向对特征图 $nlp 卷积注意力卷积网络注意力机制_池化_15$ 施加全局平均池化与全局最大池化，将 $nlp 卷积注意力卷积网络注意力机制_nlp 卷积注意力_06$ 的特征图转变为 $nlp 卷积注意力卷积网络注意力机制_池化_17$ 的特征图，什么是通道方向的全局池化呢？若特征图的大小为 $nlp 卷积注意力卷积网络注意力机制_nlp 卷积注意力_06$ ，则池化层的大小为 $nlp 卷积注意力卷积网络注意力机制_池化_19$ ，即可得到 $nlp 卷积注意力卷积网络注意力机制_池化_20$ 的特征图。 $nlp 卷积注意力卷积网络注意力机制_池化_17$ 的特征图后接一个7卷积层，卷积大小通过实验后确定为7*7，得到 $nlp 卷积注意力卷积网络注意力机制_池化_20$ 的特征图，经过激活函数后输出spatial attention module，如下：

nlp 卷积注意力卷积网络注意力机制_nlp 卷积注意力_23

如何结合spatial attention module与channel attention module

对原图施加channel attention module，即在通道方向将channel attention module广播为 $nlp 卷积注意力卷积网络注意力机制_nlp 卷积注意力_06$ 大小的特征图后，与原特征图进行element-wise multiplication。
对原图施加spatial attention module，即将 $nlp 卷积注意力卷积网络注意力机制_池化_20$ 的spatial attention module与 $nlp 卷积注意力卷积网络注意力机制_nlp 卷积注意力_06$ 大小的原特征图集合中的每一张特征图进行element-wise multiplication。

我们有三个策略：

先对原特征图施加channel attention module 后 spatial attention module
先对原特征图施加spatial attention module 后 channel attention module
分别对原特征图施加spatial attention module 与 channel attention module，将两者进行element-wise add后用sigmoid函数激活后输出

经过试验，发现第一个策略效果最佳，试验结果如下：

nlp 卷积注意力卷积网络注意力机制_激活函数_27