逻辑回归原理总结
概述
- 什么是逻辑回归?–从二分类开始说起
- 二元逻辑回归模型的拟合
- 多分类逻辑回归
1. 什么是逻辑回归?–从二分类开始说起
回顾线性回归,我们知道响应变量一般是连续的,但在分类问题中,比如常见的二分类中或是非连续的。为了依旧能够利用输入特征的线性函数来建立分类的后验概率和,可以对线性回归(的线性函数)进行如下变换
可以发现,此时。通常取临界值0.5,当,即时,;当,即时,;当,此时逻辑回归无法确定分类。也就是说,当越大,分为1的概率越大;当越小,分为0的概率越大;当越接近0,分类的不确定性越大。
逻辑回归实质上是一种“概率预测”方法,它的输出不是分类变量,而是样本属于某类的概率大小。
2. 二元逻辑回归模型的拟合
由于二分类问题的响应变量非连续,所以最小二乘方法中的误差平方和损失在这不适用,我们可以采用最大似然进行拟合。假设二分类响应变量为和,且
合并上述两式
对应的样本对数似然为
即
下面介绍两种求解上述最优化问题方法:梯度上升发、改进的随机梯度上升法
- 采用梯度上升法求解最优参数,先对上式求导
梯度上升法中每一步向量的迭代公式如下,其中为迭代步长,
- 改进的随机梯度上升法shizi:一次仅用一个严样本点来更新回归系数
因为,从 式可以看出,梯度上升法在每次更新回归系数时都需要遍历整个数据集,当样本集
3.多分类逻辑回归
构建逻辑回归模型意在利用输入特征的线性函数来建立分类()的后验概率,并要求所有类别的后验概率之和为1且都在内。该模型的形式为(称之为Logit变换或log-odds),总共个方程,
整个模型的参数为。根据可以计算出