5.广义线性模型
- 指数族
叫做此分布的自然参数,一般
- 伯努利分布属于指数族
- 正态分布属于指数族
- 多项式分布属于指数族
- 伽马和指数分布属于指数族
- 贝塔和狄利克雷分布属于指数族
构建模型
- 前提:
- ,即给定 和 的分布属于指数分布族,是一个参数为
- 输出的预测值 要满足
- 自然参数 和输入值 是线性相关的,,或者如果 是有值的向量,则有。
- SoftMax回归
假设有K个分类,则分类写作向量形式 :
向量 中的第 个元素写成
概率写作:$ p (y = i; \phi)=\phi_i ,p (y = k; \phi) = 1 −\sum ^{k−1}_{i=1}\phi_i$:
其中:
所以:
于是我们可以以此推出:
下面这个函数从 映射到了,称为 Softmax 函数:
由于前提3,也就是 是一个 的线性函数。所以就有了 ,其中的 就是我们建模的参数。因此,我们的模型假设了给定 的 的条件分布为:
这个适用于解决 的分类问题的模型,就叫做 Softmax 回归。 这种回归是对逻辑回归的一种扩展泛化。
由于前提2,可以发现:
最后我们通过极大似然拟合参数 :
其中是样本数,是分类数,对于每一个种类的概率有一个相对应的参数向量(注意:由于第个分类的概率,可以由得来,所以我们定义。所以对于逻辑回归(二分类),参数向量只有一个)
- 对单个样本求导
继续推导函数:
所以对第种分类对应的参数求导: - 对参数矩阵求导
设:
是的结果矩阵(m为样本数,k为分类总数),其中是每个样本的分类.
是的特征矩阵(m为样本数,n为特征数)
是的参数矩阵,对于每种不同的分类有一个参数向量
则(为元素全为1的矩阵):
将修改写为矩阵形式
求导:
所以: