神经网络训练如何给数据集加权神经网络参数训练

转载

jacksky 2023-11-08 20:59:06

文章标签 神经网络训练如何给数据集加权方差激活函数归一化 文章分类 神经网络人工智能

参数初始化：

神经网络训练如何给数据集加权神经网络参数训练_归一化

xavier初始化：

条件：优秀的初始化应该使得各层的激活值和梯度的方差在传播过程中保持一致

神经网络训练如何给数据集加权神经网络参数训练_归一化_02

初始化方法：

神经网络训练如何给数据集加权神经网络参数训练_激活函数_03

假设激活函数关于0对称，且主要针对于全连接神经网络。适用于tanh和softsign

He初始化：

条件：正向传播时，状态值的方差保持不变；反向传播时，关于激活值的梯度的方差保持不变。
适用于ReLU的初始化方法：

Drop out：

dropout是指在深度学习网络的训练过程中，对于神经网络单元，按照一定的概率将其暂时从网络中丢弃，故而每一个mini-batch都在训练不同的网络。对于一个有N个节点的神经网络，有了dropout后，就可以看做是$2^n$个模型的集合了，但此时要训练的参数数目却是不变的。

没有dropout的神经网络：

神经网络训练如何给数据集加权神经网络参数训练_方差_04

有dropout的神经网络：

神经网络训练如何给数据集加权神经网络参数训练_神经网络训练如何给数据集加权_05

上面的Bernoulli函数的作用是以概率系数p随机生成一个取值为0或1的向量，代表每个神经元是否需要被丢弃。

代码层面实现让某个神经元以概率p停止工作，其实就是让它的激活函数值以概率p变为0。比如我们某一层网络神经元的个数为1000个，其激活函数输出值为y1、y2、y3、......、y1000，我们dropout比率选择0.4，那么这一层神经元经过dropout后，1000个神经元中会有大约400个的值被置为0。

预测的时候，每一个单元的参数要预乘以p：

神经网络训练如何给数据集加权神经网络参数训练_激活函数_06