批次反向传播反向传播的步骤

转载

mob6454cc7a88c0 2024-05-07 16:22:10

文章标签 批次反向传播人工智能代价函数反向传播算法反向传播 文章分类 深度学习人工智能

反向传播算法（Backpropagation）是目前用来训练人工神经网络（Artificial Neural Network，ANN）的最常用且最有效的算法。其主要思想是：

（1）将训练集数据输入到ANN的输入层，经过隐藏层，最后达到输出层并输出结果，这是ANN的前向传播过程；

（2）由于ANN的输出结果与实际结果有误差，则计算估计值与实际值之间的误差，并将该误差从输出层向隐藏层反向传播，直至传播到输入层；

（3）在反向传播的过程中，根据误差调整各种参数的值；不断迭代上述过程，直至收敛。

反向传播算法的思想比较容易理解，但具体的公式则要一步步推导，因此本文着重介绍公式的推导过程。

1. 变量定义

批次反向传播反向传播的步骤_反向传播

上图是一个三层人工神经网络，layer1至layer3分别是输入层、隐藏层和输出层。如图，先定义一些变量：

批次反向传播反向传播的步骤_人工智能_02

表示第

批次反向传播反向传播的步骤_代价函数_03

层的第

批次反向传播反向传播的步骤_批次反向传播_04

个神经元连接到第

批次反向传播反向传播的步骤_反向传播_05

层的第

批次反向传播反向传播的步骤_代价函数_06

个神经元的权重；

批次反向传播反向传播的步骤_代价函数_07

表示第

批次反向传播反向传播的步骤_反向传播_05

层的第

批次反向传播反向传播的步骤_代价函数_06

个神经元的偏置；

批次反向传播反向传播的步骤_批次反向传播_10

表示第

批次反向传播反向传播的步骤_反向传播_05

层的第

批次反向传播反向传播的步骤_代价函数_06

个神经元的输入，即：

批次反向传播反向传播的步骤_代价函数_13

批次反向传播反向传播的步骤_批次反向传播_14

表示第

批次反向传播反向传播的步骤_反向传播_05

层的第

批次反向传播反向传播的步骤_代价函数_06

个神经元的输出，即：

批次反向传播反向传播的步骤_人工智能_17

其中

批次反向传播反向传播的步骤_人工智能_18

表示激活函数。

2. 代价函数

代价函数被用来计算ANN输出值与实际值之间的误差。常用的代价函数是二次代价函数（Quadratic cost function）：

批次反向传播反向传播的步骤_人工智能_19

其中，

批次反向传播反向传播的步骤_反向传播_20

表示输入的样本，

批次反向传播反向传播的步骤_反向传播_21

表示实际的分类，

批次反向传播反向传播的步骤_代价函数_22

表示预测的输出，

批次反向传播反向传播的步骤_反向传播算法_23

表示神经网络的最大层数。

3. 公式及其推导

本节将介绍反向传播算法用到的4个公式，并进行推导。 如果不想了解公式推导过程，请直接看第4节的算法步骤。

首先，将第

批次反向传播反向传播的步骤_反向传播_05

层第

批次反向传播反向传播的步骤_代价函数_06

个神经元中产生的错误（即实际值与预测值之间的误差）定义为：

批次反向传播反向传播的步骤_人工智能_26

本文将以一个输入样本为例进行说明，此时代价函数表示为：

批次反向传播反向传播的步骤_反向传播_27

公式1（计算最后一层神经网络产生的错误）：

批次反向传播反向传播的步骤_代价函数_28

其中，

批次反向传播反向传播的步骤_代价函数_29

表示Hadamard乘积，用于矩阵或向量之间点对点的乘法运算。公式1的推导过程如下：

批次反向传播反向传播的步骤_反向传播_30

公式2（由后往前，计算每一层神经网络产生的错误）：

批次反向传播反向传播的步骤_反向传播算法_31

推导过程：

批次反向传播反向传播的步骤_代价函数_32

公式3（计算权重的梯度）：

批次反向传播反向传播的步骤_反向传播_33

推导过程：

批次反向传播反向传播的步骤_人工智能_34

公式4（计算偏置的梯度）：

批次反向传播反向传播的步骤_批次反向传播_35

推导过程：

批次反向传播反向传播的步骤_反向传播_36

4. 反向传播算法伪代码

输入训练集

对于训练集中的每个样本x，设置输入层（Input layer）对应的激活值
：

前向传播：

批次反向传播反向传播的步骤_批次反向传播_38

，

批次反向传播反向传播的步骤_反向传播_39

计算输出层产生的错误：

批次反向传播反向传播的步骤_反向传播_40

反向传播错误：

批次反向传播反向传播的步骤_反向传播算法_41

使用梯度下降（gradient descent），训练参数：

批次反向传播反向传播的步骤_批次反向传播_42

批次反向传播反向传播的步骤_人工智能_43

转载于:

反向传播算法（Backpropagation）是目前用来训练人工神经网络（Artificial Neural Network，ANN）的最常用且最有效的算法。其主要思想是：

（1）将训练集数据输入到ANN的输入层，经过隐藏层，最后达到输出层并输出结果，这是ANN的前向传播过程；

（2）由于ANN的输出结果与实际结果有误差，则计算估计值与实际值之间的误差，并将该误差从输出层向隐藏层反向传播，直至传播到输入层；

（3）在反向传播的过程中，根据误差调整各种参数的值；不断迭代上述过程，直至收敛。

反向传播算法的思想比较容易理解，但具体的公式则要一步步推导，因此本文着重介绍公式的推导过程。

1. 变量定义

批次反向传播反向传播的步骤_反向传播

上图是一个三层人工神经网络，layer1至layer3分别是输入层、隐藏层和输出层。如图，先定义一些变量：

批次反向传播反向传播的步骤_人工智能_02

表示第

批次反向传播反向传播的步骤_代价函数_03

层的第

批次反向传播反向传播的步骤_批次反向传播_04

个神经元连接到第

批次反向传播反向传播的步骤_反向传播_05

层的第

批次反向传播反向传播的步骤_代价函数_06

个神经元的权重；

批次反向传播反向传播的步骤_代价函数_07

表示第

批次反向传播反向传播的步骤_反向传播_05

层的第

批次反向传播反向传播的步骤_代价函数_06

个神经元的偏置；

批次反向传播反向传播的步骤_批次反向传播_10

表示第

批次反向传播反向传播的步骤_反向传播_05

层的第

批次反向传播反向传播的步骤_代价函数_06

个神经元的输入，即：

批次反向传播反向传播的步骤_代价函数_13

批次反向传播反向传播的步骤_批次反向传播_14

表示第

批次反向传播反向传播的步骤_反向传播_05

层的第

批次反向传播反向传播的步骤_代价函数_06

个神经元的输出，即：

批次反向传播反向传播的步骤_人工智能_17

其中

批次反向传播反向传播的步骤_人工智能_18

表示激活函数。

2. 代价函数

代价函数被用来计算ANN输出值与实际值之间的误差。常用的代价函数是二次代价函数（Quadratic cost function）：

批次反向传播反向传播的步骤_人工智能_19

其中，

批次反向传播反向传播的步骤_反向传播_20

表示输入的样本，

批次反向传播反向传播的步骤_反向传播_21

表示实际的分类，

批次反向传播反向传播的步骤_代价函数_22

表示预测的输出，

批次反向传播反向传播的步骤_反向传播算法_23

表示神经网络的最大层数。

3. 公式及其推导

本节将介绍反向传播算法用到的4个公式，并进行推导。 如果不想了解公式推导过程，请直接看第4节的算法步骤。

首先，将第

批次反向传播反向传播的步骤_反向传播_05

层第

批次反向传播反向传播的步骤_代价函数_06

个神经元中产生的错误（即实际值与预测值之间的误差）定义为：

批次反向传播反向传播的步骤_人工智能_26

本文将以一个输入样本为例进行说明，此时代价函数表示为：

批次反向传播反向传播的步骤_反向传播_27

公式1（计算最后一层神经网络产生的错误）：

批次反向传播反向传播的步骤_代价函数_28

其中，

批次反向传播反向传播的步骤_代价函数_29

表示Hadamard乘积，用于矩阵或向量之间点对点的乘法运算。公式1的推导过程如下：

批次反向传播反向传播的步骤_反向传播_30

公式2（由后往前，计算每一层神经网络产生的错误）：

批次反向传播反向传播的步骤_反向传播算法_31

推导过程：

批次反向传播反向传播的步骤_代价函数_32

公式3（计算权重的梯度）：

批次反向传播反向传播的步骤_反向传播_33

推导过程：

批次反向传播反向传播的步骤_人工智能_34

公式4（计算偏置的梯度）：

批次反向传播反向传播的步骤_批次反向传播_35

推导过程：

批次反向传播反向传播的步骤_反向传播_36

4. 反向传播算法伪代码

输入训练集

对于训练集中的每个样本x，设置输入层（Input layer）对应的激活值
：

前向传播：

批次反向传播反向传播的步骤_批次反向传播_38

，

批次反向传播反向传播的步骤_反向传播_39

计算输出层产生的错误：

批次反向传播反向传播的步骤_反向传播_40

反向传播错误：

批次反向传播反向传播的步骤_反向传播算法_41

使用梯度下降（gradient descent），训练参数：

批次反向传播反向传播的步骤_批次反向传播_42

批次反向传播反向传播的步骤_人工智能_43

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：python数据模型物理模型 python建立数据模型

下一篇：keepalived双网卡都配置双虚拟IP 双网卡虚拟机

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯