逻辑回归多分类MNIST 逻辑回归多分类原理

转载

mob6454cc7aec82 2024-05-06 22:55:51

文章标签 逻辑回归多分类MNIST 算法机器学习逻辑回归人工智能 文章分类 机器学习人工智能

逻辑回归算法原理及用于解决多分类问题

逻辑回归算法又叫做对数几率回归，作为一种分类算法，在统计学中属于广义的线性模型。实际上逻辑回归是通过对数几率函数将线性函数的结果进行mapping，这样一来目标函数的取值空间就发生了如下的变化：
$逻辑回归多分类MNIST 逻辑回归多分类原理_机器学习$
这样一来，逻辑回归就可以用来处理分类问题。

一、逻辑回归的基本原理

在训练时，线性回归模型在整个实数域上对于异常数据点的敏感性一致，所以用于分类效果较差。对于二分类任务，逻辑回归的输出标记如下：
$逻辑回归多分类MNIST 逻辑回归多分类原理_人工智能_02$
而线性回归的预测值是实值，如下：
$逻辑回归多分类MNIST 逻辑回归多分类原理_逻辑回归多分类MNIST_03$
因此我们就需要一个特定的函数将实值映射为0/1。

直接的想法就是使用单位阶跃函数，这样一来：预测值大于零就为正例；预测值小于零就为负例；如若预测值为临界值则可以任意判别。但是这样是有问题的：单位阶跃函数不连续而且不光滑，或者说不可导，故而无法进行求解。

那么我们就看中了对数几率函数（S函数），或者说对数概率函数。两者参见下图：

逻辑回归多分类MNIST 逻辑回归多分类原理_人工智能_04

逻辑回归多分类MNIST 逻辑回归多分类原理_人工智能_05

图一为单位阶跃函数的数学表达式，图二为单位阶跃函数和对数几率函数的图像。

线性回归模型：
$逻辑回归多分类MNIST 逻辑回归多分类原理_逻辑回归多分类MNIST_06$
对数线性回归：
$逻辑回归多分类MNIST 逻辑回归多分类原理_人工智能_07$
它实际上实在试图达到如下目标：
$逻辑回归多分类MNIST 逻辑回归多分类原理_算法_08$

这里的取对数的作用是：将线性回归魔心过的预测值与真实标记联系起来。

推广：考虑单调可谓函数g(.)令：
$逻辑回归多分类MNIST 逻辑回归多分类原理_机器学习_09$
对数几率函数（Sigmoid函数）表达式：
$逻辑回归多分类MNIST 逻辑回归多分类原理_机器学习_10$
带入到上述推广之中，得到：
$逻辑回归多分类MNIST 逻辑回归多分类原理_逻辑回归_11$
两边取对数求解得到：
$逻辑回归多分类MNIST 逻辑回归多分类原理_机器学习_12$