首先得搞懂:

回归问题->逻辑回归问题->线性逻辑回归即分类问题->线性二分类问题


回归问题可以分为两类:


线性回归逻辑回归

逻辑回归(Logistic Regression)


回归给出的结果是事件成功或失败的概率。当因变量的类型属于二值(1/0,真/假,是/否)变量时,我们就应该使用逻辑回归。

线性回归使用一条直线拟合样本数据、而逻辑回归的目标是“拟合”0或1两个数值,而不是具体连续数值,所以称为广义线性模型。逻辑回归又称Logistic回归分析,常用于数据挖掘,疾病自动诊断,经济预测等领域。

逻辑回归的应用


探讨引发疾病的危险因素,并根据危险因素预测疾病发生的概率等。以胃癌病情分析为例,选择两组人群,一组是胃癌组,一组是非胃癌组,两组人群必定具有不同的体征与生活方式等。因此因变量就为是否胃癌,值为“是”或“否”;自变量就可以包括很多了,如年龄、性别、饮食习惯、幽门螺杆菌感染等。

自变量既可以是连续的,也可以是分类的


然后通过Logistic回归分析,可以得到自变量的权重,从而可以大致了解到底哪些因素是胃癌的危险因素。同时根据该权值可以根据危险因素预测一个人患癌症的可能性。

逻辑回归的另外一个名字叫做分类器


分为线性分类器和非线性分类器,本章中我们学习线性分类器。而无论是线性还是非线性分类器,又分为两种:二分类问题和多分类问题,在本章中我们学习二分类问题。线性多分类问题将会在下一章讲述,非线性分类问题在后续的步骤中讲述。

分类问题在很多资料中都称之为逻辑回归,其原因是使用了线性模型加一个 Logistic 二分类函数共同构成了这样的分类器。神经网络的一个重要功能就是分类,现实世界中的分类任务复杂多样,但万变不离其宗,我们都可以用同一种模式的神经网络来处理。