梯度为0神经网络梯度神经网络

关注 mob64ca140b466e

文章目录

主要内容
一、梯度检测
二、随机初始化
三、神经网络算法步骤总结
3.1 选择神经网络架构
3.2 训练一个神经网络的基本步骤

梯度为0神经网络梯度神经网络

转载

mob64ca140b466e 2024-02-02 13:47:58

文章标签 梯度为0神经网络神经网络机器学习深度学习初始化 文章分类 神经网络人工智能

主要内容

梯度检测
随机初始化
神经网络算法步骤总结

一、梯度检测

在采用反向传播算法时很容易产生于一些小的 bug(程序错误)，当它与梯度算法或者其他算法一起工作时，看起来能正常运行并且代价函数也在逐渐变小，但最后的到的神经网络的误差会比无 bug 的情况下高出一个量级，这时采用梯度检测就能很好的避免这些问题
在每次使用神经网络或者其他复杂模型中实现反向传播或者类似梯度下降算法时，都建议做梯度检测
梯度检验的基本思想 是利用数学上的导数/偏导数的定义的思想，在2*ε很小的情况下，将两点连线的斜率近似等于中点的曲线斜率，由此验证在算法中计算得到的导数/偏导的准确性
在θ为实数的情况下，计算过程如下图：

梯度为0神经网络梯度神经网络_梯度为0神经网络

θ是向量的情况下，计算过程如下图：

梯度为0神经网络梯度神经网络_机器学习_02

梯度为0神经网络梯度神经网络_机器学习_03

假设通过中值定理得到的梯度为approxgrad，经过反向传播得到的梯度为grad，如果满足以下等式，则说明反向传播得到的梯度精度还行。
梯度计算正确的情况下，当算法进行学习的时候要关闭梯度检测，因为它非常耗时。

二、随机初始化

在之前的θ向量初始化采取的策略是：zero initializtion(对称权重问题 )，这样初始化会出现同层hidden unit完全对称，出现高冗余，权重都相同。
合理的应该采用随机初始化 的策略，对于权重矩阵中的每一个θ，我们选用[-ε, ε]的均匀分布来初始化它。

三、神经网络算法步骤总结

3.1 选择神经网络架构

选择每一层多少个隐藏单元以及多少个隐藏层。
输入层和输出层units由特征维度和分类个数决定。
注意输出矩阵y需要写成成向量形式 as [1 0 0 …]T

3.2 训练一个神经网络的基本步骤

随机初始化权重矩阵initialization weights

通常把权重初始化为很小的值，接近于0

执行前向传播算法计算预测值forward propagation

即对于神经网络中任意一个输入 x^(i) 计算出对于的 h(x^(i) )的值，也就是一个输出值 y 的向量

通过代码计算出代价函数J(θ)
执行反向传播算法来计算出偏导数项，即dJ/dθ

具体实现过程：使用for 循环对m 个样本进行遍历，在循环内对每个样本进行前向和反向算法
得到神经网络每一层中每个单元的激活值和 delta 项
在循环体外通过 delta 计算出偏导数项

梯度为0神经网络梯度神经网络_神经网络_04

梯度检验gradient check

把用反向传播算法得到的偏导数值与用数值方法得到的估计值进行比较
用梯度检测来确保两种方法得到基本接近的两个值，确保用反向传播算法得到的结果时正确的
停用梯度检测

使用一个最优化算法（如梯度下降算法或者更加高级的优化算法）和反向传播算法相结合，来得到最小化 J(θ)

J(θ) 是一个非凸函数，理论上可能得到的是局部最小值

梯度为0神经网络梯度神经网络_初始化_05

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

赞
收藏
评论
分享
举报

上一篇：编程猫python老师面试编程猫老师面试复试

下一篇：android开发树状组织结构可单选多选全选三方库 android 树状图

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费直播
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册