5.广义线性模型

  • 指数族

广义混合线性模型的系数是什么_机器学习

广义混合线性模型的系数是什么_多项式_02 叫做此分布的自然参数,一般广义混合线性模型的系数是什么_多项式_03

  • 伯努利分布属于指数族
    广义混合线性模型的系数是什么_指数分布_04
    广义混合线性模型的系数是什么_正态分布_05
  • 正态分布属于指数族
  • 多项式分布属于指数族
  • 伽马和指数分布属于指数族
  • 贝塔和狄利克雷分布属于指数族

构建模型

  • 前提:
  1. 广义混合线性模型的系数是什么_多项式_06,即给定 广义混合线性模型的系数是什么_指数分布_07广义混合线性模型的系数是什么_广义混合线性模型的系数是什么_08 的分布属于指数分布族,是一个参数为 广义混合线性模型的系数是什么_指数分布_09
  2. 广义混合线性模型的系数是什么_正态分布_10 输出的预测值 广义混合线性模型的系数是什么_指数分布_11 要满足 广义混合线性模型的系数是什么_正态分布_12
  3. 自然参数 广义混合线性模型的系数是什么_指数分布_09 和输入值 广义混合线性模型的系数是什么_指数分布_07 是线性相关的,广义混合线性模型的系数是什么_广义混合线性模型的系数是什么_15,或者如果 广义混合线性模型的系数是什么_指数分布_09 是有值的向量,则有广义混合线性模型的系数是什么_广义混合线性模型的系数是什么_17
  • SoftMax回归
    假设有K个分类,则分类写作向量形式 广义混合线性模型的系数是什么_正态分布_18:
    广义混合线性模型的系数是什么_指数分布_19
    向量 广义混合线性模型的系数是什么_多项式_20 中的第 广义混合线性模型的系数是什么_指数分布_21 个元素写成广义混合线性模型的系数是什么_多项式_22
    概率写作:$ p (y = i; \phi)=\phi_i ,p (y = k; \phi) = 1 −\sum ^{k−1}_{i=1}\phi_i$:
    广义混合线性模型的系数是什么_广义混合线性模型的系数是什么_23
    其中:
    广义混合线性模型的系数是什么_多项式_24
    所以:
    广义混合线性模型的系数是什么_机器学习_25
    于是我们可以以此推出:
    广义混合线性模型的系数是什么_广义混合线性模型的系数是什么_26
    下面这个函数从广义混合线性模型的系数是什么_多项式_27 映射到了广义混合线性模型的系数是什么_正态分布_28,称为 Softmax 函数:
    广义混合线性模型的系数是什么_指数分布_29
    由于前提3,也就是 广义混合线性模型的系数是什么_广义混合线性模型的系数是什么_30 是一个 广义混合线性模型的系数是什么_指数分布_31 的线性函数。所以就有了 广义混合线性模型的系数是什么_指数分布_32,其中的 广义混合线性模型的系数是什么_正态分布_33 就是我们建模的参数。因此,我们的模型假设了给定 广义混合线性模型的系数是什么_指数分布_31广义混合线性模型的系数是什么_指数分布_35 的条件分布为:
    广义混合线性模型的系数是什么_指数分布_36
    这个适用于解决 广义混合线性模型的系数是什么_机器学习_37 的分类问题的模型,就叫做 Softmax 回归。 这种回归是对逻辑回归的一种扩展泛化。
    由于前提2,可以发现:
    广义混合线性模型的系数是什么_指数分布_38
    最后我们通过极大似然拟合参数 广义混合线性模型的系数是什么_正态分布_39
    广义混合线性模型的系数是什么_指数分布_40
    其中广义混合线性模型的系数是什么_正态分布_41是样本数,广义混合线性模型的系数是什么_正态分布_42是分类数,对于每一个种类的概率广义混合线性模型的系数是什么_指数分布_43有一个相对应的参数向量广义混合线性模型的系数是什么_正态分布_39(注意:由于第广义混合线性模型的系数是什么_正态分布_42个分类的概率,可以由广义混合线性模型的系数是什么_正态分布_46得来,所以我们定义广义混合线性模型的系数是什么_机器学习_47。所以对于逻辑回归(二分类),参数向量广义混合线性模型的系数是什么_广义混合线性模型的系数是什么_48只有一个)
  • 对单个样本求导
    继续推导广义混合线性模型的系数是什么_多项式_49函数:
    广义混合线性模型的系数是什么_指数分布_50
    所以广义混合线性模型的系数是什么_多项式_49对第广义混合线性模型的系数是什么_广义混合线性模型的系数是什么_52种分类对应的参数广义混合线性模型的系数是什么_机器学习_53求导:
    广义混合线性模型的系数是什么_广义混合线性模型的系数是什么_54
  • 对参数矩阵广义混合线性模型的系数是什么_机器学习_55求导
    设:
    广义混合线性模型的系数是什么_广义混合线性模型的系数是什么_56
    广义混合线性模型的系数是什么_正态分布_57广义混合线性模型的系数是什么_指数分布_58的结果矩阵(m为样本数,k为分类总数),其中广义混合线性模型的系数是什么_广义混合线性模型的系数是什么_59是每个样本的分类广义混合线性模型的系数是什么_机器学习_60.
    广义混合线性模型的系数是什么_多项式_61
    广义混合线性模型的系数是什么_正态分布_62广义混合线性模型的系数是什么_正态分布_63的特征矩阵(m为样本数,n为特征数)
    广义混合线性模型的系数是什么_正态分布_64
    广义混合线性模型的系数是什么_机器学习_55广义混合线性模型的系数是什么_指数分布_66的参数矩阵,对于每种不同的分类有一个参数向量广义混合线性模型的系数是什么_广义混合线性模型的系数是什么_67
    则(广义混合线性模型的系数是什么_广义混合线性模型的系数是什么_68为元素全为1的广义混合线性模型的系数是什么_正态分布_69矩阵):
    广义混合线性模型的系数是什么_机器学习_70
    广义混合线性模型的系数是什么_多项式_49修改写为矩阵形式
    广义混合线性模型的系数是什么_指数分布_72
    求导:
    广义混合线性模型的系数是什么_机器学习_73
    所以:
    广义混合线性模型的系数是什么_正态分布_74