误差传播公式梯度下降

关注 jordana

文章目录

文章目录
一、参数说明
二、公式定义
三、结合实例分析推导过程(全连接神经网络)
四、卷积神经网络的反向传播
五、固定网络参数反向优化输入(或参数)
五、参考资料

误差传播公式梯度下降

转载

jordana 2024-09-04 10:43:36

文章标签 误差传播公式梯度下降反向传播算法的推导 CNN 反向传播实例分析 文章分类 深度学习人工智能

文章目录

一、参数说明
二、公式定义
三、结合实例分析推导过程(全连接神经网络)

1. 我们以一个两层神经元为例对推导过程详细分析
2. 梯度值的推导

（a）抽象的推导过程
（b）结合实际例子的推导过程

3. 反向传播总结

四、卷积神经网络的反向传播
五、固定网络参数反向优化输入(或参数)
五、参考资料

一、参数说明

误差传播公式梯度下降_实例分析

$误差传播公式梯度下降_实例分析_02$ ：表示 第 l-1 层的第 j 个激活特征 到 第 l 层第 i 个神经元
$误差传播公式梯度下降_反向传播算法的推导_03$ ：表示 第 l-1 层的第 j 个激活特征 到 第 l 层第 i 个神经元 的偏置(其中 $误差传播公式梯度下降_CNN_04$ 恒为 0，表示偏置项；第 0 个特征 $误差传播公式梯度下降_反向传播_05$
Note：输入层算作 第 0 层、 j 代表第 l-1 层的激活特征的下标（ $误差传播公式梯度下降_误差传播公式梯度下降_06$ ）、 i 代表第 l 层的神经元的下标 （ $误差传播公式梯度下降_反向传播_07$ ）

二、公式定义

$误差传播公式梯度下降_实例分析_08$ 层神经元的状态值： $误差传播公式梯度下降_CNN_09$ ，表示一个神经元所获得的输入信号的加权和(即：特征的线性组合)
$误差传播公式梯度下降_实例分析_08$ 层神经元的激活值： $误差传播公式梯度下降_反向传播_11$ ，特征的非线性映射，可把 $误差传播公式梯度下降_实例分析_12$ 看作 更高级的特征
激活函数： $误差传播公式梯度下降_CNN_13$
损失函数(MSE): $误差传播公式梯度下降_误差传播公式梯度下降_14$
向量的导数（注意 维度从下到上排列）

三、结合实例分析推导过程(全连接神经网络)

1. 我们以一个两层神经元为例对推导过程详细分析

误差传播公式梯度下降_误差传播公式梯度下降_15

输入特征和输出类标值分别为:
$误差传播公式梯度下降_CNN_16$
各参数初始化值分别为：

2. 梯度值的推导

（a）抽象的推导过程

误差传播公式梯度下降_反向传播算法的推导_17

误差传播公式梯度下降_CNN_18

（b）结合实际例子的推导过程

误差传播公式梯度下降_反向传播算法的推导_19

3. 反向传播总结

从误差项的公式中可以看出：

第 $误差传播公式梯度下降_反向传播_20$ 层的误差项可以通过第 $误差传播公式梯度下降_CNN_21$ 层的误差项计算得到，这就是误差的反向传播（Backpropagation，BP）
反向传播算法的含义是：第 $误差传播公式梯度下降_误差传播公式梯度下降_22$ 的一个神经元的误差项是所有与该神经元相连的 第 $误差传播公式梯度下降_反向传播_23$ 的神经元的 误差项的权重和 再乘上该神经元 激活函数的导数。

全连接神经网络的训练过程可以分为以下四步：

首先，前向 计算每一层的 状态值（作为整体，用于求导后带入导数公式）和激活值，且保存每一层的 权重值
其次，计算输出层的误差项（因为输出层没有 $误差传播公式梯度下降_实例分析_24$
然后，反向 传播计算每一层的误差
最后，计算每一层参数的偏导数，并按下面的公式更新参数

误差传播公式梯度下降_实例分析_25

四、卷积神经网络的反向传播

卷积神经网络的反向传播如下图所示：
卷积类型，其中 n 为输入大小，m 为卷积核大小

五、固定网络参数反向优化输入(或参数)

已经训练好的模型（固定权重），可通过 loss 反向传播（主要是残差）来反向优化输入（或参数）
可参考AI-编解码、AI-ISP、Learning to Prompt for Vision-Language Models

误差传播公式梯度下降_CNN_26

五、参考资料

1、https://xpqiu.github.io/slides/20151226_CCFADL_NNDL.pdf 2、卷积神经网络(CNN)反向传播算法 3、Convolutional Neural Networks backpropagation: from intuition to derivation 4、Backpropagation In Convolutional Neural Networks

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

赞
收藏
评论
分享
举报

上一篇：python修改字典key值

下一篇：MYSQL 复制一条数据为10条

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费直播
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册