keras学习记录——resnet为什么用averagepooling?


目录

keras学习记录——resnet为什么用averagepooling?

前言

一、池化层

二、为什么在resnet后加均值池化而不是最大池化?

三、实际测试

总结


前言

本篇主要讨论resnet最后的pooling层为什么用averagepooling,而不是maxpooling?

主要用实验来回答这个问题,另外讲解了averagepooling和maxpooling的优缺点,并做了一些猜测(科研需要猜测,哈哈)


 

一、池化层

主要分为两种:averagepooling和maxpooling。

最大池化提取边缘等“最重要”的特征,而平均池化提取的特征更加smoothly。对于图像数据,你可以看到差异。虽然两者都是出于同样的原因使用,但我认为max pooling更适合提取极端功能。平均池有时不能提取好的特征,因为它将全部计入并计算出平均值,这对于对象检测类型任务可能不好用。

二、为什么在resnet后加均值池化而不是最大池化?

猜测1:提取全局信息时适用于averagepooling,如分类;而提取局部信息时适用maxpooling,如roi pooling。

猜测2:在pooling层后面直接接上全连接层,全连接层在训练时是比较容易过拟合的,而averagepooling可以起到正则化的作用,正好可以防止过拟合。

猜测3:resnet不是采用传统的连通层进行CNN分类,而是设置了一些特别的通路将特征相加起来,因此看起来平均或许能更好的提取所需特征。

三、实际测试

本博客使用本人之前的博客中提到的网络,若有兴趣请转keras学习记录——训练resnet模型对cifar10分类,分别以averagepooling和maxpooling做训练,得出实验数据。

图中0_acc和0_vla_acc分别为averagepooling对应的训练集和验证集的准确率,case0_acc和case0_vla_acc分别为maxpooling对应的训练集和验证集的准确率。由图可知,在resnet中averagepooling相较于maxpooling,效果要好。

ResNet 瓶颈 resnet pooling_池化


总结

学习了pooling相关的知识,记录下来,发现印象加深了好多,果然好记性不如好博客呀。

另外以后有机会测一下全局均值池化,可能效果比这两个更好。