卷积神经网络里必须有激活层吗卷积神经网络激活函数relu

转载

bingfeng 2023-12-27 19:58:06

文章标签 卷积神经网络里必须有激活层吗深度学习神经网络机器学习全连接 文章分类 midjourney AIGC

原文要点梳理：

1、最近几年卷积神经网络中，激活函数往往不选择sigmoid或tanh函数，而是选择relu函数：f(x) = max(0, x)。

卷积神经网络里必须有激活层吗卷积神经网络激活函数relu_卷积神经网络里必须有激活层吗

选择relu的原因：

1）速度快。计算代价小

2）减轻梯度消失问题：sigmoid函数的导数最大值为0.25，累乘之后越来越小。relu导数始终为1。因此relu可以支持更深的网络。

3）稀疏性：大脑在日常工作中只有大约5%激活。sigmoid激活函数激活率为50%。relu小于零完全不激活，因此可以获得一个更低的激活率。

第一个问题：有了全连接网络，为何要引入卷积网络。全连接层为何不适合图像识别任务？
答：
1）参数量太多
2）没有利用像素之间的位置信息：每个像素和其周围像素的联系比较紧密，如果把所有像素都等同看待，孤立之后意义不大。且每个元素连接之后，连接权重大量重复多余。低效。
3）网络层数限制：网络层数越多其表达能力越强，但是：全连接神经网络的梯度很难传递超过三层。所以通过梯度下降法训练深度模型很困难。
第二个问题：卷积网络怎么解决这个问题的？有哪些优化？
答：
1）局部连接：不再全连接。减少参数。
2）权值共享：一组连接可以共享同一个权重，而不是每个连接有一个不同的权重，这样又减少了很多参数。
3）下采样：Pooling来减少每层的样本数。减少参数量，提升模型鲁棒性。