多分类神经网络怎么反向传播多分类神经网络

转载

mob64ca14101b2f 2023-12-13 16:43:07

文章标签 多分类神经网络怎么反向传播吴恩达机器学习神经网络特征向量复杂度 文章分类 神经网络人工智能

为什么要使用神经网络

在笔记三中，曾提到非线性拟合的问题。当时是通过构造特征向量，即由两个或以上的变量构造一个新的变量，增加θ的维度，以拟合出更细腻的曲线。下面是课件中类似的例子：

可以看到，随着变量即数据集的维度增加，这种做法将会导致“维度灾难”，越来越不可行。就上述例子，以100维的数据集为例，二次项的构造复杂度是 $多分类神经网络怎么反向传播多分类神经网络_神经网络$ ，实际是5000；三次项复杂度是 $多分类神经网络怎么反向传播多分类神经网络_特征向量_02$ ，实际达到17000；当构造一百次项时，复杂度可能已经超出计算机所能处理的范围了。即使我们可以使用正则使假设函数简化，但正则化的过程也需要大量的数据集和大量的时间，同样不大可行。

NG的例子举到这里就戛然而止，后面就引入神经网络（Neuron Network）了。就我个人来说，把本章的视频看完后，隐约感觉到，神经网络的思想和之前提到的构造特征向量有相似之处，同时避免了维度灾难。如下：

上图是课件后面的部分。NG在这里根据各个层的特点进行分类：Layer1是输入层，Layer2是隐藏层，Layer3是输出层。对神经网络而言，输入层和输出层各只有一个，隐藏层根据实际情况可以有多个。看上去，每一个隐藏层都与上一层的输入量有关，同时根据各连接线的权值不同，实质上也是利用原有特征向量构造了新的特征向量。当然，这只是个人很主观的感觉。