广义线性模型使用标准广义线性模型glm

转载

小蝌蚪 2024-04-01 17:58:15

文章标签 广义线性模型使用标准机器学习广义线性模型指数分布线性回归 文章分类 机器学习人工智能

一.指数分布族

在前面的笔记四里面，线性回归的模型中，我们有

广义线性模型使用标准广义线性模型glm_广义线性模型

，而在logistic回归的模型里面，有

广义线性模型使用标准广义线性模型glm_机器学习_02

。事实上，这两个分布都是指数分布族中的两个特殊的模型。所以，接下来会仔细讨论一下指数分布族的一些特点，会证明上面两个分布为什么是指数分布族的特性情况以及怎么用到其他的模型上面去。

如果一类分布能够写成如下的形式，那么这个分布就能够被划归到指数分布族里面。

广义线性模型使用标准广义线性模型glm_线性回归_03

其中：

η 被称为这个分布的自然参数（natural parameter）或者canonical parameter
T (y) 被称为充分统计量(sufficient statistic) (在我们暂时用到的模型里面，你可以认为他就是 that T (y) = y)
a(η) 被称为log partition function.
起到归一化常数的作用，确保这个分布累计起来为1。

当T , a，和b被选中固定之后，也就确定了一个分布的族，且以η为参数。如果我们改变η，我们就得到了不同的分布。
接下来我们看看怎么证明开始的那个伯努利分布和高斯分布是指数分布族里面的。

首先来看看伯努利分布：

伯努利分布可以写为一下的形式：

广义线性模型使用标准广义线性模型glm_指数分布_05

其中y的取值为0或者1，这个太简单了，就不多解释了。我们的目标就是选择a，b，T，使得

广义线性模型使用标准广义线性模型glm_机器学习_06

变为上面的伯努利分布的形式。下面直接给出推导。

首先伯努利分布可以写成：

广义线性模型使用标准广义线性模型glm_广义线性模型_07

看这个式子的形式，把

广义线性模型使用标准广义线性模型glm_广义线性模型_08

作为自然参数，然后a，b，T的选择如下。

广义线性模型使用标准广义线性模型glm_广义线性模型使用标准_09

可以发现，伯努利分布确实能够写为指数分布族的形式。

这里有个很重要的地方就是，因为自然参数是选择为

广义线性模型使用标准广义线性模型glm_广义线性模型_08

，那么返回来推可以得到

广义线性模型使用标准广义线性模型glm_广义线性模型使用标准_11

，你是不是看到了一丝丝sigmoid/logistic函数的样子？这个后面还会要用到。接下来就是高斯分布了。

要知道，在线性回归的例子里面，

广义线性模型使用标准广义线性模型glm_广义线性模型_12

对于参数（权重）的选择是没有影响的，所以这里为了方便起见，令

广义线性模型使用标准广义线性模型glm_机器学习_13

。

我们有：

广义线性模型使用标准广义线性模型glm_线性回归_14

从上面的式子里面已经可以看出高斯分布是处于指数分布族里面的了，其中

广义线性模型使用标准广义线性模型glm_线性回归_15

总结一下，其实除了这两个以外，还有很多的分布都是在指数分布族里面的。比如多项式分布，泊松分布，指数分布，gamma分布和beta分布等等一些。。。

二.构造广义线性模型（GLM）

对于一个回归或者分类的问题，我们希望通过x的函数预测随机变量y的值。首先我们需要作出如下几个假设：

广义线性模型使用标准广义线性模型glm_机器学习_16

,这个假设的意思是对于给定的x和θ，y的分布要隶属于以η为参数的指数分布族。（不然上面讲那么多指数分布族干嘛？）2.对于给定的x，我们的目标是得到的输出满足

广义线性模型使用标准广义线性模型glm_线性回归_17

(以logistic回归为例子，有

广义线性模型使用标准广义线性模型glm_线性回归_18

)。3.自然参数η和输入x满足线性关系：

广义线性模型使用标准广义线性模型glm_机器学习_19

。（如果η是一个向量值，那么有

广义线性模型使用标准广义线性模型glm_广义线性模型使用标准_20

）

有了上面的3个假设之后，下面来看看线性回归，logistic 回归以及新的一种很常见的softmax回归是怎么从广义线性模型得到的。

Ⅰ.线性回归

由本节开头的结论（详细过程的看上一个笔记），线性回归中有

广义线性模型使用标准广义线性模型glm_广义线性模型

。

直接用上面的3个假设，有

广义线性模型使用标准广义线性模型glm_机器学习_22

第二行的等式是高斯分布性质

第三行等式在推导高斯分布属于指数分布族里面的结果。

最后一行等式是利用的上面的第3个假设。

你看这个h函数是不是和之前的线性函数是一样的。。。。

Ⅱ..logistic回归

最开始要说的就是，这里的推导要结合上面的那几个假设来看。

对于之前提到的logistic回归，我们知道他的结果是二值的，即y ∈ {0, 1}，那么很自然的选择伯努利分布来为给定x下y的条件分布建模。

最开始我们就知道了，伯努利分布是是隶属于指数分布族的，所以我们这里就满足了上面的假设1。

如果：

广义线性模型使用标准广义线性模型glm_机器学习_23

，那么

广义线性模型使用标准广义线性模型glm_机器学习_24

（这是很简单的概率论知识啦），进而推出：

广义线性模型使用标准广义线性模型glm_广义线性模型_25

上面这个式子用到了假设2，假设3和

广义线性模型使用标准广义线性模型glm_广义线性模型使用标准_11

的性质。

然后你直接看这个函数，是不是就是logistic的函数？

这里给出一个概念：

the function g giving the distribution’s mean as a function of the natural parameter (g(η) = E[T (y); η]) is called the canonical response function(规范响应函数). Its inverse is called the canonical link function(规范连接函数).

暂时总结一下，高斯分布族的规范响应函数是恒等函数（identify function），伯努利分布族的规范响应函数是logistic函数。