非监督度学习-1 Unsupervised Learning-1(K-means,HAC,PCA)

非监督学习方法主要分为两大类

  • Dimension Reduction (化繁为简)
  • Generation (无中生有)

    目前我们仅专注化繁为简,降维的方法,无中生有(GAN为代表的)方法,以后关注。

1. Clustering

• K-means 算法

经典的非监督根据距离分类算法:

无监督 深度学习算法 无监督算法有哪些 知乎_特征向量

  • Hierarchical Agglomerative Clustering (HAC)
    根据数据两两间的相似度,进行建立一棵树,进行分类

2. 分布的重表示 Distributed Representation

无监督 深度学习算法 无监督算法有哪些 知乎_特征向量_02

我们主要介绍Principle Component Analysis(PCA):
需要找到W,无监督 深度学习算法 无监督算法有哪些 知乎_无监督 深度学习算法_03

(1)线性代数表示

无监督 深度学习算法 无监督算法有哪些 知乎_无监督 深度学习算法_04


使得投影的结果的方差最大化

无监督 深度学习算法 无监督算法有哪些 知乎_监督学习_05


多维度投影中w1和w2是正交的

无监督 深度学习算法 无监督算法有哪些 知乎_特征向量_06


数学化证明,PCA与协方差有关 最大化无监督 深度学习算法 无监督算法有哪些 知乎_特征向量_07

无监督 深度学习算法 无监督算法有哪些 知乎_无监督 深度学习算法_08


无监督 深度学习算法 无监督算法有哪些 知乎_无监督 深度学习算法_09


无监督 深度学习算法 无监督算法有哪些 知乎_无监督 深度学习算法_10


无监督 深度学习算法 无监督算法有哪些 知乎_无监督 深度学习算法_11


因为S是对称矩阵,是半正定,特征值非负。使用拉格朗日乘子法:

无监督 深度学习算法 无监督算法有哪些 知乎_监督学习_12


无监督 深度学习算法 无监督算法有哪些 知乎_监督学习_13


无监督 深度学习算法 无监督算法有哪些 知乎_无监督 深度学习算法_14是特征向量,无监督 深度学习算法 无监督算法有哪些 知乎_特征值_15是最大的特征值

同理:

无监督 深度学习算法 无监督算法有哪些 知乎_特征值_16


无监督 深度学习算法 无监督算法有哪些 知乎_特征向量_17是特征向量,无监督 深度学习算法 无监督算法有哪些 知乎_特征向量_18是第二大的特征值PCA去相关性举例:

无监督 深度学习算法 无监督算法有哪些 知乎_特征值_19


无监督 深度学习算法 无监督算法有哪些 知乎_监督学习_20


(2)另一种视角看PCA

举例:手写数字是由基本的图片元素组成

无监督 深度学习算法 无监督算法有哪些 知乎_特征向量_21


那么7是由以下图片元素组成

无监督 深度学习算法 无监督算法有哪些 知乎_监督学习_22

无监督 深度学习算法 无监督算法有哪些 知乎_特征向量_23


无监督 深度学习算法 无监督算法有哪些 知乎_特征值_24


我们有:

无监督 深度学习算法 无监督算法有哪些 知乎_监督学习_25


无监督 深度学习算法 无监督算法有哪些 知乎_监督学习_26


PCA可以看看做是特殊的神经网络,元素间是正交的

无监督 深度学习算法 无监督算法有哪些 知乎_无监督 深度学习算法_27