李宏毅机器学习——深度学习反向传播算法

原创

愤怒的可乐 2022-07-13 17:00:38 ©著作权

文章标签 深度学习反向传播算法激活函数神经网络 文章分类 Spark 大数据

©著作权归作者所有：来自51CTO博客作者愤怒的可乐的原创作品，请联系作者获取转载授权，否则将追究法律责任

引言

在神经网络中，为了更有效的计算梯度，需要用到反向传播算法。我们先从链式求导法则开始。

链式求导法

先介绍下链式求导法则，在后面的反向传播算法中会用到。

有 $李宏毅机器学习——深度学习反向传播算法_反向传播算法$

那么 $李宏毅机器学习——深度学习反向传播算法_激活函数_02$ ;

有 $李宏毅机器学习——深度学习反向传播算法_反向传播算法_03$

李宏毅机器学习——深度学习反向传播算法_神经网络_04

改变了s会改变x和y，从而改变了z。

$李宏毅机器学习——深度学习反向传播算法_深度学习_05$

注意，如果改变s会改变多个变量，它们的关系也是成立的。

损失函数

李宏毅机器学习——深度学习反向传播算法_反向传播算法_06

假设给定一组参数 $李宏毅机器学习——深度学习反向传播算法_激活函数_07$ ,把一个训练数据 $李宏毅机器学习——深度学习反向传播算法_神经网络_08$ 代入NN(神经网络)中，会得到输出 $李宏毅机器学习——深度学习反向传播算法_激活函数_09$ 。

$李宏毅机器学习——深度学习反向传播算法_激活函数_10$ 是输出 $李宏毅机器学习——深度学习反向传播算法_激活函数_09$ 和实际 $李宏毅机器学习——深度学习反向传播算法_激活函数_12$ 距离函数，值越大代表越距离远，也就是效果越不好。

那在神经网络训练算法中，损失函数定义为：

$李宏毅机器学习——深度学习反向传播算法_神经网络_13$

如果把损失函数对参数 $李宏毅机器学习——深度学习反向传播算法_深度学习_14$ 做微分的话，得到

$李宏毅机器学习——深度学习反向传播算法_神经网络_15$

只要计算出某一笔数据对 $李宏毅机器学习——深度学习反向传播算法_深度学习_14$ 的微分，就可以得到 $李宏毅机器学习——深度学习反向传播算法_激活函数_17$ 对 $李宏毅机器学习——深度学习反向传播算法_深度学习_14$ 的微分。

李宏毅机器学习——深度学习反向传播算法_深度学习_19

假设我们先考虑这个神经元。

李宏毅机器学习——深度学习反向传播算法_神经网络_20

假设只有两个输入 $李宏毅机器学习——深度学习反向传播算法_深度学习_21$ ，计算 $李宏毅机器学习——深度学习反向传播算法_反向传播算法_22$ 得到 $李宏毅机器学习——深度学习反向传播算法_激活函数_23$ 后再代入激活函数，经过多次运算会得到最终的输出 $李宏毅机器学习——深度学习反向传播算法_神经网络_24$ 。

李宏毅机器学习——深度学习反向传播算法_深度学习_25

现在问题是如何计算损失(距离函数) $李宏毅机器学习——深度学习反向传播算法_神经网络_26$ 对 $李宏毅机器学习——深度学习反向传播算法_深度学习_14$ 的偏微分 $李宏毅机器学习——深度学习反向传播算法_神经网络_28$

利用链式求导法

$李宏毅机器学习——深度学习反向传播算法_深度学习_29$

计算 $李宏毅机器学习——深度学习反向传播算法_神经网络_30$ 的过程叫做正向过程(Forward pass)；计算 $李宏毅机器学习——深度学习反向传播算法_神经网络_31$ 的过程叫做反向过程(Backward pass)。

正向过程

$李宏毅机器学习——深度学习反向传播算法_反向传播算法_22$

$李宏毅机器学习——深度学习反向传播算法_激活函数_33$

李宏毅机器学习——深度学习反向传播算法_反向传播算法_34

如上图所示，假设输入是 $李宏毅机器学习——深度学习反向传播算法_反向传播算法_35$ ，上面蓝色神经元的参数： $李宏毅机器学习——深度学习反向传播算法_激活函数_36$ ，激活函数是Sigmoid函数；
下面蓝色神经元的参数： $李宏毅机器学习——深度学习反向传播算法_激活函数_37$

对下面的神经元来说，计算 $李宏毅机器学习——深度学习反向传播算法_激活函数_38$ 的偏微分，可以很快得出 $李宏毅机器学习——深度学习反向传播算法_神经网络_39$ ，也就是输入 $李宏毅机器学习——深度学习反向传播算法_深度学习_40$ ,随着从前往后计算每个神经元的输出，整个过程就可以很快结束，因此叫正向过程。

反向过程

李宏毅机器学习——深度学习反向传播算法_深度学习_41

困难的是如何计算 $李宏毅机器学习——深度学习反向传播算法_神经网络_31$

$李宏毅机器学习——深度学习反向传播算法_深度学习_43$

假设激活函数是Sigmoid函数 $李宏毅机器学习——深度学习反向传播算法_神经网络_44$ ，然后得到的函数值 $李宏毅机器学习——深度学习反向传播算法_反向传播算法_45$ 会乘上某个权重(比如 $李宏毅机器学习——深度学习反向传播算法_激活函数_46$ )再加上其他值得到 $李宏毅机器学习——深度学习反向传播算法_反向传播算法_47$ (注意这里只是一个符号，不是 $李宏毅机器学习——深度学习反向传播算法_激活函数_23$ 的导数)； $李宏毅机器学习——深度学习反向传播算法_反向传播算法_45$ 也会乘上权重(比如 $李宏毅机器学习——深度学习反向传播算法_反向传播算法_50$ )再加上其他东西得到 $李宏毅机器学习——深度学习反向传播算法_深度学习_51$ (注意这里只是一个符号，不是 $李宏毅机器学习——深度学习反向传播算法_激活函数_23$ 的二阶导数)；

李宏毅机器学习——深度学习反向传播算法_反向传播算法_53

$李宏毅机器学习——深度学习反向传播算法_神经网络_54$

可以这样理解， $李宏毅机器学习——深度学习反向传播算法_激活函数_23$ 通过影响 $李宏毅机器学习——深度学习反向传播算法_反向传播算法_45$ 来影响 $李宏毅机器学习——深度学习反向传播算法_神经网络_26$ 。

而

$李宏毅机器学习——深度学习反向传播算法_激活函数_58$

那就剩下

$李宏毅机器学习——深度学习反向传播算法_深度学习_59$

改变了 $李宏毅机器学习——深度学习反向传播算法_反向传播算法_45$ 会改变 $李宏毅机器学习——深度学习反向传播算法_神经网络_61$ 和 $李宏毅机器学习——深度学习反向传播算法_深度学习_51$ ，从而改变了 $李宏毅机器学习——深度学习反向传播算法_神经网络_26$

我们先计算简单的

$李宏毅机器学习——深度学习反向传播算法_激活函数_64$

有
$李宏毅机器学习——深度学习反向传播算法_激活函数_65$

同理

$李宏毅机器学习——深度学习反向传播算法_反向传播算法_66$

现在难点就是 $李宏毅机器学习——深度学习反向传播算法_反向传播算法_67$ 和 $李宏毅机器学习——深度学习反向传播算法_深度学习_68$

我们这里先假装我们知道这两项的值。然后整理下原来的式子:

$李宏毅机器学习——深度学习反向传播算法_激活函数_69$

李宏毅机器学习——深度学习反向传播算法_反向传播算法_70

假设有另外一个特殊的神经元，它是上图的样子，输入就是 $李宏毅机器学习——深度学习反向传播算法_反向传播算法_67$ 和 $李宏毅机器学习——深度学习反向传播算法_深度学习_68$ ，它们分别乘以 $李宏毅机器学习——深度学习反向传播算法_激活函数_46$ 和 $李宏毅机器学习——深度学习反向传播算法_反向传播算法_50$ ，然后求和得到的结果再乘上 $李宏毅机器学习——深度学习反向传播算法_深度学习_75$
就得到了 $李宏毅机器学习——深度学习反向传播算法_神经网络_31$