说到“深度学习”,它的最明显的特色就是“深”,并且通过很深层次的网络,来实现准确率非常高的图像识别、语音识别等能力。因此,我们就会觉得深的网络比浅的网络好,从而网络被设计的越来越深。

resnet的shortcut是什么 resnet的优点_resnet的shortcut是什么

但是,随着网络的加深,训练集准确率却逐渐下降,这与最初的设想背道而驰。这时,出现了一个全新的网络,使这种准确率变得良好起来,它就是深度残差网络(ResNet)。

 

那么,为什么ResNet可以解决“随着网络加深,准确率不下降”的问题? 

01

突 现

ResNet是一个由微软开发的深度卷积网络,它赢得了2015 年的ImageNet图像分类任务竞赛第一名,将网络深度提升到了152层,错误率降到了3.57,这是前所未有的。

resnet的shortcut是什么 resnet的优点_神经网络_02

ResNet是非常强大的骨干模型,经常在许多计算机视觉任务中使用,现在一些大厂的图像识别工程师,经常运用到ResNet。ResNet最根本的突破在于它使得我们可以训练成功非常深的神经网络。

02

发 展

在ResNet没有出现之前,梯度消失问题非常严重。例如,在中间层增加辅助损失作为额外的监督,其实也很难达到效果,这时候训练较深的神经网络非常困难的。

resnet的shortcut是什么 resnet的优点_深度学习_03

而用残差学习来解决退化问题,是因为残差学习相比原始特征直接学习更容易,ResNet的核心思想是引入所谓的“恒等映射捷径连接(identity shortcut connection)”,可以跳过一层或多层会使得堆积层在输入特征基础上学习到新的特征,从而拥有更好的性能。

03

实 用

ResNet有很好的实用性,如果我们在做图像分类任务中的人脸表情识别,可以很好的运用ResNet,我们先使用深度卷积神经网络来提取图像特征,然后用ResNet作为分类模型,来完成人脸表情识别的任务。

resnet的shortcut是什么 resnet的优点_神经网络_04

从ResNet原理入手,你可以一窥人工智能技术。

04

机 遇

ResNet在研究界越来越受到欢迎,俨然迅速成为计算机视觉任务中主流架构。但是,往往我们在自学ResNet的时候,会对网络结构难以理解,那么,我们应该如何顺利掌握CNN、ResNet,正确掌握计算机视觉CV要领呢?

其实,ResNet的原理与应用并不难,你只需要跟对老师,上对课程。