目录

0. 前言

1. 神经网络模型

2. 前向传播(forward propagation)

3. 神经网络中的多分类


学习完吴恩达老师机器学习课程的神经网络,简单的做个笔记。文中部分描述属于个人消化后的理解,仅供参考。

如果这篇文章对你有一点小小的帮助,请给个关注喔~我会非常开心的~

0. 前言

神经网络(Neural Network),是通过模拟生物大脑的突触神经传播电信号的一系列过程,来模拟生物思考,进而解决分类问题,通常,神经网络可以用来解决一些非线性的问题。

  • 输入层(input layer):输入 
  • 隐藏层(hidden layer):对输入层作一系列“处理”,“处理”通常由系数的运算和激活函数组成,隐藏层可以有多层
  • 输出层(output layer):接受隐藏层的输出,再进行一系列处理,最终输出

给出符号的初始定义:

  •  --- 第  层到第  层之间的权重矩阵
  •  --- 为第  层的第  个激活单元所计算的值
  •  --- 第  层的第  个激活单元

1. 神经网络模型

简单神经网络模型如下所示(图源:吴恩达机器学习,更改后)。Layer1为输入层,Layer2为隐藏层,Layer3为输出层。

embedding layer 神经网络 神经网络hidden layer_神经网络

隐藏层中的每一个激活单元,都使用了来自输入层的每一个单元的数值;输出层中的每一个激活单元,都使用了来自隐藏层中的每一个单元的数值。

注: 是偏置单元(bias unit),为一常数,不接收前一层的输入。

这里 

 可以看作是 

 ,为第一层(输入层)的激活单元。

2. 前向传播(forward propagation)

对于隐藏层和输出层的激活单元的计算,我们可给出如下计算公式,其中

 仍然表示

 函数:

简单来说,这一层的每一个激活单元,都需要由上一层的每一个激活单元乘以一个系数再求和,包裹一个激活函数(此处为  函数)得到,然后为这一层增加一个偏置单元,继续进行下一层的计算。这种由输入层,逐渐向后计算,计算到输出层的方式,称为前向传播(forward propagation)。

同样,我们可以将其向量化,

 ,

 ,

 ,

 ,给出公式如下:

其中,

 的维度为 


 表示第 

 层的单元数量(不包括偏置单元)。

一般化,可得以下公式:

3. 神经网络中的多分类

在逻辑回归中,我们已经学习得知 

 表示分类至此类别的概率。所以,多分类由几个基分类器组成,计算每个类别的

 ,最大的 

 的类别即为分类结果。

同理,在神经网络中,也是运用此原理,如下图所示(图源:吴恩达机器学习):

embedding layer 神经网络 神经网络hidden layer_神经网络_02

图为一个4分类的例子,输出层不再只有一个单元,而是4个单元,每一个单元表示分类至此类别的 

,也就是概率,概率最大的即为分类结果。


如果这篇文章对你有一点小小的帮助,请给个关注喔~我会非常开心的~