MobileNetV2: Inverted Residuals and Linear Bottlenecks

关注 seniusen

文章目录

1. 摘要
2. 讨论和直觉
2.1. 深度可分离卷积
2.2. 线性瓶颈结构
2.3. 反转残差
3. 网络结构
4. 实验结果

MobileNetV2: Inverted Residuals and Linear Bottlenecks

原创

seniusen 2021-06-10 14:38:24 ©著作权

文章标签 反转残差结构深度卷积 文章分类 深度学习人工智能

©著作权归作者所有：来自51CTO博客作者seniusen的原创作品，请联系作者获取转载授权，否则将追究法律责任

1. 摘要

作者提出了一个新的网络架构 MobileNetV2，该架构基于反转残差结构，其中的跳跃连接位于较瘦的瓶颈层之间。中间的扩展层则利用轻量级的深度卷积来提取特征引入非线性，而且，为了维持网络的表示能力作者去除了较窄层的非线性激活函数。

2. 讨论和直觉

2.1. 深度可分离卷积

MobileNetV2 采用和 MobileNetV1 一样 3×3 大小的深度可分离卷积，相比标准卷积可以减少 8 到 9 倍的计算量。

2.2. 线性瓶颈结构

长期以来，人们一直认为神经网络中的兴趣流形（mainfold of interest）也就是激活特征，可以被嵌入到低维子空间中。基于这个事实，我们可以通过减少某一层网络的维度也就是通道数来减少激活特征的空间维度。MobileNetV1 中的宽度因子就是用来减少激活空间的维度的，直到激活特征可以扩展出整个空间，我们就找到了一个最佳的参数。

但是，神经网络中还有非线性激活函数，这时候，上面的直觉就不成立了。比如 ReLU 会把负的激活值变为零，换句话说，深度网络仅在输出域的非零部分具有线性分类器的功能。如果 ReLU 使得某一个通道的一些值变为零，这会不可避免地带来那个通道的信息损失，但如果通道数比较多，我们就可以通过一种结构用其它通道的激活值来补偿这个损失。

MobileNetV2: Inverted Residuals and Linear Bottlenecks_反转残差结构

用一个随机矩阵 \(T\) 将左边的螺旋线嵌入到 \(n\) 维空间然后用 ReLU 激活，再用 \(T^{-1}\) 投影回去。可以看到 \(n=2,3\) 时信息损失非常大，而维度较高时则恢复得比较好。

因此，为了避免损失太多信息，作者采用线性瓶颈层，也就是在通道数比较少的瓶颈层不采用非线性激活函数。

2.3. 反转残差

MobileNetV2: Inverted Residuals and Linear Bottlenecks_深度卷积_02

上图中每个块的厚度代表通道数的大小。可以看到，之前的残差结构先用一个 1×1 的卷积来降低通道数，然后进行一个卷积操作，最后再用一个 1×1 的卷积将通道数恢复到原始大小，跳跃连接建立在两个通道数比较多的层之间，并且每一层都采用 ReLU 激活。

而反转残差结构则是先用一个 1×1 的卷积来提高通道数，然后进行一个深度卷积操作，最后再用一个 1×1 的卷积将通道数降低到原始大小，跳跃连接建立在两个通道数比较少的瓶颈层之间，并且画阴影的两个块没有 ReLU 激活函数。

上图右边中间两层通道数比较多，所以采用激活函数，信息损失也没有那么大；而两端通道数比较少，如果激活的话信息损失会非常大，所以不采用激活函数。

详细结构如下所示，其中瓶颈层到中间层通道数的提升比例称之为扩展因子 t，激活函数采用 ReLU6，也就是限制激活的最大值为 6。

MobileNetV2: Inverted Residuals and Linear Bottlenecks_深度卷积_03

3. 网络结构

MobileNetV2: Inverted Residuals and Linear Bottlenecks_反转残差结构_04

如上表所示，第一层是标准卷积，然后后面是前述的瓶颈结构。其中 t 是扩展因子，c 是输出通道数， n 是重复次数，s 代表步长。如果步长为 2 ，代表当前重复结构的第一个块步长为 2，其余的步长为 1，步长为 2 时则没有跳跃连接，如下图所示。

MobileNetV2: Inverted Residuals and Linear Bottlenecks_反转残差结构_05

此外，也可以像 MobileNetV1 那样继续利用宽度乘子和分辨率乘子进一步降低模型的大小。

4. 实验结果

在 ImageNet 上的分类结果如下所示：

MobileNetV2: Inverted Residuals and Linear Bottlenecks_深度卷积_06

在 COCO 数据集上的目标检测结果如下图所示：

MobileNetV2: Inverted Residuals and Linear Bottlenecks_深度卷积_07

此外，作者还对比了不同的跳跃连接方式和是否采用线性瓶颈结构，进一步验证了网络设计的合理性。

MobileNetV2: Inverted Residuals and Linear Bottlenecks_深度卷积_08

MobileNetV2: Inverted Residuals and Linear Bottlenecks_深度卷积_09

赞
收藏
评论
分享
举报

上一篇：MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications

下一篇：ShuffleNet V2: Practical Guidelines for Efficient CNN Architecture Design

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费直播
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册