机器学习领域线性预测

转载

clghxq 2024-07-09 15:50:05

文章标签 机器学习领域线性预测 logistic regression 数据挖掘线性模型广义线性模型 文章分类 机器学习人工智能

1. logistic regression为什么能对线性问题进行预测？

我们都知道logistic regression可以用来处理线性问题，那么问题来了，logistic regression为什么能对线性问题进行预测？

为了回答这个问题，首先要弄明白什么是线性预测。

1.1 什么是线性预测？

线性预测是通过线性模型来对样本进行的预测。线性模型是一个函数，这个函数通过属性的线性组合来对结果进行预测。线性模型分为经典线性模型

和广义线性模型
。logistic regression用到的是广义线性预测。经典线性模型：自变量的线性预测结果就是因变量的估计值。广义线性模型：自变量的线性预测值的函数是因变量的估计值。常见的广义线性模型有：probit模型，poisson模型（泊松模型）、对数线性模型等。广义线性模型形式上是线性回归，但本质上上输入空间到输出空间的非线性函数映射。

1.2 二分类问题为什么没有使用传统的线性回归模型，而是是使用logistic regression？

线性回归用于而分类，首先想到的应该是

机器学习领域线性预测_广义线性模型_03

这个公式，这里，P对应分类的类别{0, 1}，但是这个公式存在一些问题：

1）等式两边取值范围不同。等式右边的取值是整个实数集R，而左边取值是{0, 1}，所以经典线性模型在分类问题中存在问题。（线性回归不能保证预测值的范围位于[0, 1]之间。）
2）实际问题中，很多情况下，当x很大或者很小时，对因变量P的影响很小，当x达到某个值时，对因变量P的影响很大。即在实际问题中，因变量P与自变量并不是直接的线性关系。所以，不能使用经典的线性模型，需要对经典线性模型进行休整，进而产生了广义线性模型。

机器学习领域线性预测_机器学习领域线性预测_04