文章目录

  • 1 什么是逻辑回归?
  • 2 逻辑回归的损失函数
  • 2.1逻辑回归为何使用Sigmoid函数
  • 2.2逻辑回归的步骤
  • 2.3 预测函数的确定
  • 2.4损失函数的构造
  • 3 逻辑回归的模型
  • 3.1模型求解与推导
  • 求解步骤如下:
  • 推导过程
  • 3.2最终模型


1 什么是逻辑回归?

逻辑回归一般指logistic回归,是一种广义的线性回归(generalized linear model),常用于数据挖掘,疾病自动诊断,经济预测等领域。虽然名字里带“回归”,但是它实际上是一种分类方法,不仅能进行分类,还能获取每个类别的概率预测值。常用于两分类问题。
logistic回归通过函数L将w‘x+b对应一个隐状态p,p =L(w‘x+b),然后根据p 与1-p的大小决定因变量的值。如果L是logistic函数,就是logistic回归,如果L是多项式函数就是多项式回归。

2 逻辑回归的损失函数

2.1逻辑回归为何使用Sigmoid函数

Sigmoid函数形式如下:

双逻辑回归方程 l逻辑回归_双逻辑回归方程


对于函数双逻辑回归方程 l逻辑回归_双逻辑回归方程_02,当z≥0 时,y≥0.5,分类为1,当 z<0时,y<0.5,分类为0。

使用Sigmoid函数原因有两个方面:

1)Sigmoid 函数自身的性质

a. sigmoid 函数连续,单调递增

b. sigmiod 函数关于(0,0.5) 中心对称

c. 对sigmoid函数求导后计算速度快

双逻辑回归方程 l逻辑回归_c函数_03

双逻辑回归方程 l逻辑回归_机器学习_04

2)指数族

logistic回归的损失函数为非指数族,逻辑回归认为函数其概率服从伯努利分布,将其写成指数族分布的形式。

2.2逻辑回归的步骤

(1)构造预测函数h
(2)构造损失函数J
(3)令J最小并求得回归参数w

2.3 预测函数的确定

逻辑回归主要用于二分类问题(即输出只有两种,分别代表两个类别),所以利用了Logistic函数(或称为Sigmoid函数),函数形式为:
双逻辑回归方程 l逻辑回归_logistic回归_05

逻辑回归从其原理上来说,其实是实现了一个决策边界
双逻辑回归方程 l逻辑回归_logistic回归_06
构造预测函数:(将回归方程写入其中)
双逻辑回归方程 l逻辑回归_损失函数_07
双逻辑回归方程 l逻辑回归_双逻辑回归方程_08

函数双逻辑回归方程 l逻辑回归_机器学习_09的值,表示结果取1的概率,所以对于因变量x,分类结果为1和0的概率分别为:
双逻辑回归方程 l逻辑回归_双逻辑回归方程_10 双逻辑回归方程 l逻辑回归_损失函数_11

2.4损失函数的构造

上边两式可改写为:
双逻辑回归方程 l逻辑回归_logistic回归_12 上式是在参数双逻辑回归方程 l逻辑回归_损失函数_13下,元组类标号为y的后验概率。假设现在已经得到了一个抽样样本,那么联合概率双逻辑回归方程 l逻辑回归_损失函数_14的大小就可以反映模型的代价。联合概率的值越大,代价函数越小。

联合概率公式中采用连乘的方法不好计算,可用极大似然估计的方法进行求解,得到最大的参数双逻辑回归方程 l逻辑回归_损失函数_13,这个最大的参数将是最佳参数,使得联合概率的值最大,代价值最小。因此就得到了逻辑回归的损失函数:
双逻辑回归方程 l逻辑回归_损失函数_16 损失函数的对数似然函数为:
双逻辑回归方程 l逻辑回归_logistic回归_17 得到的这个函数越大,证明我们得到的W就越好.因为在函数最优化的时候习惯让一个函数越小越好,所以我们在前边加一个负号.得到逻辑回归的损失函数公式如下:
双逻辑回归方程 l逻辑回归_c函数_18

3 逻辑回归的模型

对于模型的训练而言:实质上来说就是利用数据求解出对应的模型的特定的双逻辑回归方程 l逻辑回归_损失函数_13。从而得到一个针对于当前数据的特征逻辑回归模型。

3.1模型求解与推导

模型回归得到的是一个最优化模型,求解方法有梯度下降法、牛顿法等,这里求解逻辑回归的损失函数,采用最基本的方法——梯度下降法。

求解步骤如下:

1-随机一组双逻辑回归方程 l逻辑回归_损失函数_13.
2-将双逻辑回归方程 l逻辑回归_损失函数_13带入交叉熵损失函数,让得到的点沿着负梯度的方向移动.
3-循环第二步.

推导过程

对损失函数求偏导,过程如下:

3.2最终模型

待补充