逻辑回归极大似然估计罗辑回归极大似然

转载

mob64ca140a59b0 2024-03-27 08:49:50

文章标签 逻辑回归极大似然估计机器学习逻辑回归极大似然估计分类器 文章分类 机器学习人工智能

文章目录

1 前言
2 什么是逻辑回归
3 逻辑回归的代价函数
4 利用梯度下降法求参数
5 结束语
6 参考文献

1 前言

逻辑回归是分类当中极为常用的手段，因此，掌握其内在原理是非常必要的。我会争取在本文中尽可能简明地展现逻辑回归(logistic regression)的整个推导过程。

2 什么是逻辑回归

逻辑回归在某些书中也被称为对数几率回归，明明被叫做回归，却用在了分类问题上，我个人认为这是因为逻辑回归用了和回归类似的方法来解决了分类问题。

假设有一个二分类问题，输出为 $逻辑回归极大似然估计罗辑回归极大似然_机器学习$ ，而线性回归模型产生的预测值为 $逻辑回归极大似然估计罗辑回归极大似然_分类器_02$ 是实数值，我们希望有一个理想的阶跃函数来帮我们实现 $逻辑回归极大似然估计罗辑回归极大似然_逻辑回归_03$ 值到 $逻辑回归极大似然估计罗辑回归极大似然_分类器_04$ 值的转化。

$逻辑回归极大似然估计罗辑回归极大似然_逻辑回归_05$

然而该函数不连续，我们希望有一个单调可微的函数来供我们使用，于是便找到了 $逻辑回归极大似然估计罗辑回归极大似然_逻辑回归_06$ 来替代。

$逻辑回归极大似然估计罗辑回归极大似然_机器学习_07$

两者的图像如下图所示（图片出自文献2）

逻辑回归极大似然估计罗辑回归极大似然_机器学习_08

图1：sigmoid & step function

有了 $逻辑回归极大似然估计罗辑回归极大似然_逻辑回归极大似然估计_09$ 之后，由于其取值在 $逻辑回归极大似然估计罗辑回归极大似然_分类器_10$ ，我们就可以将其视为类 $逻辑回归极大似然估计罗辑回归极大似然_极大似然估计_11$ 的后验概率估计 $逻辑回归极大似然估计罗辑回归极大似然_逻辑回归极大似然估计_12$ 。说白了，就是如果有了一个测试点 $逻辑回归极大似然估计罗辑回归极大似然_极大似然估计_13$ ，那么就可以用 $逻辑回归极大似然估计罗辑回归极大似然_逻辑回归极大似然估计_09$ 算出来的结果来当做该点 $逻辑回归极大似然估计罗辑回归极大似然_极大似然估计_13$ 属于类别 $逻辑回归极大似然估计罗辑回归极大似然_极大似然估计_11$ 的概率大小。

于是，非常自然地，我们把 $逻辑回归极大似然估计罗辑回归极大似然_逻辑回归极大似然估计_09$ 计算得到的值大于等于 $逻辑回归极大似然估计罗辑回归极大似然_机器学习_18$ 的归为类别 $逻辑回归极大似然估计罗辑回归极大似然_极大似然估计_11$ ，小于 $逻辑回归极大似然估计罗辑回归极大似然_机器学习_18$ 的归为类别 $逻辑回归极大似然估计罗辑回归极大似然_逻辑回归极大似然估计_21$ 。

$逻辑回归极大似然估计罗辑回归极大似然_极大似然估计_22$

同时逻辑回归与自适应线性网络非常相似，两者的区别在于逻辑回归的激活函数是 $逻辑回归极大似然估计罗辑回归极大似然_逻辑回归_06$ 而自适应线性网络的激活函数是 $逻辑回归极大似然估计罗辑回归极大似然_极大似然估计_24$ ，两者的网络结构如下图所示（图片出自文献1）。

逻辑回归极大似然估计罗辑回归极大似然_极大似然估计_25

图2：自适应线性网络

逻辑回归极大似然估计罗辑回归极大似然_机器学习_26

图3：逻辑回归网络

3 逻辑回归的代价函数

好了，所要用的几个函数我们都有了，接下来要做的就是根据给定的训练集，把参数 $逻辑回归极大似然估计罗辑回归极大似然_机器学习_27$ 给求出来了。要找参数 $逻辑回归极大似然估计罗辑回归极大似然_机器学习_27$ ，首先就是得把代价函数（cost function）给定义出来，也就是目标函数。

我们第一个想到的自然是模仿线性回归的做法，利用误差平方和来当代价函数。

$逻辑回归极大似然估计罗辑回归极大似然_极大似然估计_29$

其中， $逻辑回归极大似然估计罗辑回归极大似然_机器学习_30$ ， $逻辑回归极大似然估计罗辑回归极大似然_机器学习_31$ 表示第 $逻辑回归极大似然估计罗辑回归极大似然_机器学习_31$ 个样本点， $逻辑回归极大似然估计罗辑回归极大似然_逻辑回归极大似然估计_33$ 表示第 $逻辑回归极大似然估计罗辑回归极大似然_机器学习_31$ 个样本的真实值， $逻辑回归极大似然估计罗辑回归极大似然_逻辑回归_35$ 表示第 $逻辑回归极大似然估计罗辑回归极大似然_机器学习_31$ 个样本的预测值。

这时，如果我们将 $逻辑回归极大似然估计罗辑回归极大似然_极大似然估计_37$ 代入的话，会发现这是一个非凸函数，这就意味着代价函数有着许多的局部最小值，这不利于我们的求解。

逻辑回归极大似然估计罗辑回归极大似然_极大似然估计_38

图4：凸函数和非凸函数

那么我们不妨来换一个思路解决这个问题。前面，我们提到了 $逻辑回归极大似然估计罗辑回归极大似然_逻辑回归_39$ 可以视为类 $逻辑回归极大似然估计罗辑回归极大似然_极大似然估计_11$ 的后验估计，所以我们有

$逻辑回归极大似然估计罗辑回归极大似然_逻辑回归_41$

$逻辑回归极大似然估计罗辑回归极大似然_逻辑回归极大似然估计_42$

其中， $逻辑回归极大似然估计罗辑回归极大似然_分类器_43$ 表示给定 $逻辑回归极大似然估计罗辑回归极大似然_机器学习_27$ ，那么 $逻辑回归极大似然估计罗辑回归极大似然_极大似然估计_13$ 点 $逻辑回归极大似然估计罗辑回归极大似然_逻辑回归_46$ 的概率大小。

上面两式可以写成一般形式

$逻辑回归极大似然估计罗辑回归极大似然_机器学习_47$

接下来我们就要用极大似然估计来根据给定的训练集估计出参数 $逻辑回归极大似然估计罗辑回归极大似然_机器学习_27$ 。

$逻辑回归极大似然估计罗辑回归极大似然_分类器_49$

为了简化运算，我们对上面这个等式的两边都取一个对数

$逻辑回归极大似然估计罗辑回归极大似然_分类器_50$

我们现在要求的是使得 $逻辑回归极大似然估计罗辑回归极大似然_机器学习_51$ 最大的 $逻辑回归极大似然估计罗辑回归极大似然_机器学习_27$ 。没错，我们的代价函数出现了，我们在 $逻辑回归极大似然估计罗辑回归极大似然_机器学习_51$ 前面加个负号不就变成就最小了吗？不就变成我们代价函数了吗？

$逻辑回归极大似然估计罗辑回归极大似然_逻辑回归极大似然估计_54$

为了更好地理解这个代价函数，我们不妨拿一个例子的来看看

$逻辑回归极大似然估计罗辑回归极大似然_逻辑回归_55$

也就是说

$逻辑回归极大似然估计罗辑回归极大似然_极大似然估计_56$

我们来看看这是一个怎么样的函数

逻辑回归极大似然估计罗辑回归极大似然_分类器_57

图5：代价函数

从图中不难看出，如果样本的值是 $逻辑回归极大似然估计罗辑回归极大似然_极大似然估计_11$ 的话，估计值 $逻辑回归极大似然估计罗辑回归极大似然_逻辑回归_39$ 越接近 $逻辑回归极大似然估计罗辑回归极大似然_极大似然估计_11$ 付出的代价就越小，反之越大；同理，如果样本的值是 $逻辑回归极大似然估计罗辑回归极大似然_逻辑回归极大似然估计_21$ 的话，估计值 $逻辑回归极大似然估计罗辑回归极大似然_逻辑回归_39$ 越接近 $逻辑回归极大似然估计罗辑回归极大似然_逻辑回归极大似然估计_21$ 付出的代价就越小，反之越大。