5.广义线性模型

  • 指数族

广义混合线性模型的系数是什么_多项式

广义混合线性模型的系数是什么_机器学习_02 叫做此分布的自然参数,一般广义混合线性模型的系数是什么_广义混合线性模型的系数是什么_03

  • 伯努利分布属于指数族
    广义混合线性模型的系数是什么_指数分布_04
    广义混合线性模型的系数是什么_广义混合线性模型的系数是什么_05
  • 正态分布属于指数族
  • 多项式分布属于指数族
  • 伽马和指数分布属于指数族
  • 贝塔和狄利克雷分布属于指数族

构建模型

  • 前提:
  1. 广义混合线性模型的系数是什么_多项式_06,即给定 广义混合线性模型的系数是什么_多项式_07广义混合线性模型的系数是什么_正态分布_08 的分布属于指数分布族,是一个参数为 广义混合线性模型的系数是什么_正态分布_09
  2. 广义混合线性模型的系数是什么_多项式_10 输出的预测值 广义混合线性模型的系数是什么_多项式_11 要满足 广义混合线性模型的系数是什么_正态分布_12
  3. 自然参数 广义混合线性模型的系数是什么_正态分布_09 和输入值 广义混合线性模型的系数是什么_多项式_07 是线性相关的,广义混合线性模型的系数是什么_广义混合线性模型的系数是什么_15,或者如果 广义混合线性模型的系数是什么_正态分布_09 是有值的向量,则有广义混合线性模型的系数是什么_指数分布_17
  • SoftMax回归
    假设有K个分类,则分类写作向量形式 广义混合线性模型的系数是什么_广义混合线性模型的系数是什么_18:
    广义混合线性模型的系数是什么_多项式_19
    向量 广义混合线性模型的系数是什么_广义混合线性模型的系数是什么_20 中的第 广义混合线性模型的系数是什么_指数分布_21 个元素写成广义混合线性模型的系数是什么_正态分布_22
    概率写作:$ p (y = i; \phi)=\phi_i ,p (y = k; \phi) = 1 −\sum ^{k−1}_{i=1}\phi_i$:
    广义混合线性模型的系数是什么_机器学习_23
    其中:
    广义混合线性模型的系数是什么_正态分布_24
    所以:
    广义混合线性模型的系数是什么_机器学习_25
    于是我们可以以此推出:
    广义混合线性模型的系数是什么_机器学习_26
    下面这个函数从广义混合线性模型的系数是什么_机器学习_27 映射到了广义混合线性模型的系数是什么_广义混合线性模型的系数是什么_28,称为 Softmax 函数:
    广义混合线性模型的系数是什么_正态分布_29
    由于前提3,也就是 广义混合线性模型的系数是什么_广义混合线性模型的系数是什么_30 是一个 广义混合线性模型的系数是什么_正态分布_31 的线性函数。所以就有了 广义混合线性模型的系数是什么_多项式_32,其中的 广义混合线性模型的系数是什么_广义混合线性模型的系数是什么_33 就是我们建模的参数。因此,我们的模型假设了给定 广义混合线性模型的系数是什么_正态分布_31广义混合线性模型的系数是什么_正态分布_35 的条件分布为:
    广义混合线性模型的系数是什么_广义混合线性模型的系数是什么_36
    这个适用于解决 广义混合线性模型的系数是什么_正态分布_37 的分类问题的模型,就叫做 Softmax 回归。 这种回归是对逻辑回归的一种扩展泛化。
    由于前提2,可以发现:
    广义混合线性模型的系数是什么_机器学习_38
    最后我们通过极大似然拟合参数 广义混合线性模型的系数是什么_广义混合线性模型的系数是什么_39
    广义混合线性模型的系数是什么_广义混合线性模型的系数是什么_40
    其中广义混合线性模型的系数是什么_多项式_41是样本数,广义混合线性模型的系数是什么_正态分布_42是分类数,对于每一个种类的概率广义混合线性模型的系数是什么_多项式_43有一个相对应的参数向量广义混合线性模型的系数是什么_广义混合线性模型的系数是什么_39(注意:由于第广义混合线性模型的系数是什么_正态分布_42个分类的概率,可以由广义混合线性模型的系数是什么_广义混合线性模型的系数是什么_46得来,所以我们定义广义混合线性模型的系数是什么_机器学习_47。所以对于逻辑回归(二分类),参数向量广义混合线性模型的系数是什么_指数分布_48只有一个)
  • 对单个样本求导
    继续推导广义混合线性模型的系数是什么_广义混合线性模型的系数是什么_49函数:
    广义混合线性模型的系数是什么_多项式_50
    所以广义混合线性模型的系数是什么_广义混合线性模型的系数是什么_49对第广义混合线性模型的系数是什么_多项式_52种分类对应的参数广义混合线性模型的系数是什么_多项式_53求导:
    广义混合线性模型的系数是什么_指数分布_54
  • 对参数矩阵广义混合线性模型的系数是什么_正态分布_55求导
    设:
    广义混合线性模型的系数是什么_机器学习_56
    广义混合线性模型的系数是什么_指数分布_57广义混合线性模型的系数是什么_指数分布_58的结果矩阵(m为样本数,k为分类总数),其中广义混合线性模型的系数是什么_机器学习_59是每个样本的分类广义混合线性模型的系数是什么_广义混合线性模型的系数是什么_60.
    广义混合线性模型的系数是什么_广义混合线性模型的系数是什么_61
    广义混合线性模型的系数是什么_广义混合线性模型的系数是什么_62广义混合线性模型的系数是什么_机器学习_63的特征矩阵(m为样本数,n为特征数)
    广义混合线性模型的系数是什么_广义混合线性模型的系数是什么_64
    广义混合线性模型的系数是什么_正态分布_55广义混合线性模型的系数是什么_广义混合线性模型的系数是什么_66的参数矩阵,对于每种不同的分类有一个参数向量广义混合线性模型的系数是什么_机器学习_67
    则(广义混合线性模型的系数是什么_正态分布_68为元素全为1的广义混合线性模型的系数是什么_正态分布_69矩阵):
    广义混合线性模型的系数是什么_指数分布_70
    广义混合线性模型的系数是什么_广义混合线性模型的系数是什么_49修改写为矩阵形式
    广义混合线性模型的系数是什么_正态分布_72
    求导:
    广义混合线性模型的系数是什么_指数分布_73
    所以:
    广义混合线性模型的系数是什么_正态分布_74