稀疏自编码器

原创

wx64898f817b745 2023-06-14 21:06:18 ©著作权

文章标签 深度学习稀疏自编码器编码器神经网络无监督学习 文章分类 办公效率

©著作权归作者所有：来自51CTO博客作者wx64898f817b745的原创作品，请联系作者获取转载授权，否则将追究法律责任

1. 自编码器

前面介绍了神经网络的基本结构，并且对于监督学习，神经网络模型可以训练出模型中的参数，然后，神经网络也可以应用在无监督学习中，无监督学习是指数据集中没有类别标签，如训练样本为 $稀疏自编码器_稀疏自编码器$ ，其中 $稀疏自编码器_神经网络_02$ 。自编码神经网络是一种无监督学习算法，其模型结构与上述的神经网络一致，所不同的是其目标值等于其输入值，即 $稀疏自编码器_编码器_03$ ，其结构如下图所示：

稀疏自编码器_深度学习_04

2. 自编码器的特点

对于上述结构自编码器实际上完成了一个 $稀疏自编码器_稀疏自编码器_05$ 函数的学习的过程，本身可以说并没有什么意义，但是通过观察上述的结构中，我们发现在自编码器结果中，中间的隐含层，是从特征 $稀疏自编码器_稀疏自编码器_06$ 提取出来，同时，这提取出的特征又能还原原先的特征，简单来讲，中间层实现了对原数据的抽象，是原数据的另一种表示。对于中间的隐含层具有两种结构：

降维，即隐含层的节点个数要小于输入节点的个数。
稀疏，即在隐含层的神经元上加入稀疏性的限制。

3. 稀疏性约束

对于使用Sigmoid作为神经元的激活函数的情况下，若神经元的输出为 $稀疏自编码器_无监督学习_07$ 表示该神经元被激活，否则称为未被激活，则稀疏性的含义是指在大多数情况下神经元都是未被激活的。可以使用神经元的输出作为神经元的激活度，即对于隐含层的第 $稀疏自编码器_深度学习_08$ 个神经元，其激活度为：

$稀疏自编码器_神经网络_09$

则对于 $稀疏自编码器_编码器_10$ 个样本，其平均激活度为：

$稀疏自编码器_稀疏自编码器_11$

假设令 $稀疏自编码器_稀疏自编码器_12$ ，其中 $稀疏自编码器_神经网络_13$ 是一个常数，表示的是稀疏性参数，通常可以取一个接近于 $稀疏自编码器_编码器_14$ 的常数，如取 $稀疏自编码器_编码器_15$ 。为了使得模型比较稀疏，我们希望平均激活度能够尽可能接近稀疏性常数，通常可以取相对熵来度量平均激活度与稀疏性参数之间的差异程度。