神经网络构造三角函数神经网络有哪三层

转载

架构魔法之光 2023-09-28 16:28:08

文章标签 神经网络构造三角函数神经网络 DNN 数据 文章分类 神经网络人工智能

深度神经网络（Deep Neural Networks，以下简称DNN）是深度学习的基础

DNN网络结构

DNN内部的神经网络层可以分为三类，输入层，隐藏层和输出层，如下图示例，一般来说第一层是输入层，最后一层是输出层，而中间的层数都是隐藏层。

神经网络构造三角函数神经网络有哪三层_神经网络构造三角函数

一般说到神经网络的层数是这样计算的，输入层不算，从隐藏层开始一直到输出层，一共有几层就代表着这是一个几层的神经网络，例如上图就是一个三层结构的神经网络。

层与层之间是全连接的，也就是说，第i层的任意一个神经元一定与第i+1层的任意一个神经元相连。虽然DNN看起来很复杂，但是从小的局部模型来说，还是和感知机一样，即一个线性关系 $神经网络构造三角函数神经网络有哪三层_神经网络构造三角函数_02$
加上一个激活函数𝜎(𝑧)。

首先我们来看看线性关系系数 $神经网络构造三角函数神经网络有哪三层_数据_03$ 的定义。
以下图一个三层的DNN为例，第二层的第4个神经元到第三层的第2个神经元的线性系数定义为 $神经网络构造三角函数神经网络有哪三层_神经网络构造三角函数_04$ 。上标3代表线性系数 $神经网络构造三角函数神经网络有哪三层_数据_03$ 所在的层数，而下标对应的是输出的第三层索引2和输入的第二层索引4。
为什么不是 $神经网络构造三角函数神经网络有哪三层_DNN_06$ , 而是 $神经网络构造三角函数神经网络有哪三层_神经网络构造三角函数_04$ 呢？这主要是为了便于模型用于矩阵表示运算，如果是 $神经网络构造三角函数神经网络有哪三层_DNN_06$ 而每次进行矩阵运算是 $神经网络构造三角函数神经网络有哪三层_神经网络_09$ ，需要进行转置。
将输出的索引放在前面的话，则线性运算不用转置，即直接为 $神经网络构造三角函数神经网络有哪三层_神经网络构造三角函数_10$ 。总结下，第𝑙−1层的第k个神经元到第𝑙层的第j个神经元的线性系数定义为 $神经网络构造三角函数神经网络有哪三层_神经网络构造三角函数_11$ 。注意，输入层是没有𝑤参数的。

神经网络构造三角函数神经网络有哪三层_神经网络_12

偏倚 $神经网络构造三角函数神经网络有哪三层_神经网络_13$ 类似于 $神经网络构造三角函数神经网络有哪三层_数据_03$ 。还是以这个三层的DNN为例，第二层的第三个神经元对应的偏倚定义为 $神经网络构造三角函数神经网络有哪三层_神经网络_15$ 。其中，上标2代表所在的层数，下标3代表偏倚所在的神经元的索引。同样的道理，第三个的第一个神经元的偏倚应该表示为 $神经网络构造三角函数神经网络有哪三层_神经网络构造三角函数_16$ 。同样的，输入层是没有偏倚参数 $神经网络构造三角函数神经网络有哪三层_神经网络_13$ 的。

神经网络构造三角函数神经网络有哪三层_DNN_18

正向传播

假设我们已经有除输出层之外所有层的所有参数，那我们就可以根据根据输入值依次得到每个神经元的值即正向传播

正向传播(forward-propagation)是指对神经网络沿着从输入层到输出层的顺序，依次计算并存储模型的中间变量(包括输出)

神经网络构造三角函数神经网络有哪三层_DNN_19

反向传播(BP)

反向传播(back-propagation)指的是计算神经网络参数梯度的方法。总的来说，反向传播依据微积分中的链式法则，沿着从输出层到输入层的顺序，依次计算并存储目标函数有关神经网络各层的中间变量以及参数的梯度。

由正向传播经过所有的隐藏层到达输出层，会得到一个输出结果 $神经网络构造三角函数神经网络有哪三层_神经网络构造三角函数_20$ ，然后根据这个 $神经网络构造三角函数神经网络有哪三层_神经网络构造三角函数_20$ 带入loss funcation中，利用SGD算法进行最优化求解，其中每次梯度下降都会使用一次BP来更新各个网络层中的参数值，这就是BP回传误差的意思。