logistic回归分析为啥绘制森林图为什么用logistic回归分析

转载

技术极客领袖 2024-03-17 13:25:59

文章标签 logistic回归分析为啥绘制森林图逻辑回归 logistic回归线性回归数据 文章分类 机器学习人工智能

Logistic回归

前边已经写到了，线性回归以及解决线性回归过拟合用到的岭回归、lasso回归和弹性网络，今天继续学习logistic回归。什么是logistic回归呢？请带着问题往下看。

线性回归和logistic回归，都带着“回归”，那么到底什么区别呢？有联系吗？

Logistic回归和线性回归最大的区别在于，Y的数据类型。线性回归分析的因变量Y属于定量数据，而logistic回归分析的因变量属于分类数据。

logistic回归是处理二分类问题的，所以输出的标记y={0,1}，是一种概率，即结果代表两种结果成功或者失败，愿意和不愿意的概率。

说说，Logistic为啥子用 sigmoid函数，因为结果是（0,1）之间的一种概率值，sigmoid函数具备了这个属性，定义域可以是（-无穷，正无穷）而值域在(0,1)之间。

logistic回归分析为啥绘制森林图为什么用logistic回归分析_logistic回归

之前的线性回归模型是这样的：

logistic回归分析为啥绘制森林图为什么用logistic回归分析_线性回归_02

写成向量如下：

logistic回归分析为啥绘制森林图为什么用logistic回归分析_数据_03

（）

这样我们将线性回归的模型套在sigmoid函数上变成了logistic回归线性模型：

logistic回归分析为啥绘制森林图为什么用logistic回归分析_逻辑回归_04

将上面的式子变形，得到了下面的等式：

logistic回归分析为啥绘制森林图为什么用logistic回归分析_逻辑回归_05

观察上式可以得出：若将y视为样本x作为正例的可能性，则1-y就是返利的可能性。二者的比值便称为“几率”，反映了x作为正样本的相对可能性，这也是logistic回归称为对数几率回归的原因。logistic回归分类模型的预测函数实在用线性回归模型的预测值的结果去逼近真实标记的对数几率，对着也便实现了将线性回归的预测值和分类任务的真实标记联系在一起。