文章目录

  • 1. 逻辑回归(Logistic)
  • 1. 介绍
  • 1. 逻辑函数/模型(logit model)
  • 2. Logit与二元回归
  • 3. 使用逻辑回归解决二元分类问题
  • 2. 使用Logit进行预测的模型解释
  • 1. 损失函数定义
  • 2. 损失函数的解释
  • 3. 损失函数的特点
  • 4. 计算方式
  • 5. Logit函数求梯度


1. 逻辑回归(Logistic)

用于解决二元分类问题

1. 介绍

从两个备选类中,将给定数据分到这两个类之中的一个类去。

二元回归参数估计值 二元回归函数_git

1. 逻辑函数/模型(logit model)

Logit函数 二元回归参数估计值 二元回归函数_二元回归参数估计值_02

二元回归参数估计值 二元回归函数_二元回归参数估计值_03


取值:当f(x)≥0.5,取y = 1,否则取y = 0

注意观察Logit函数导数的样子

2. Logit与二元回归

我们可以将f(x)看作是“在给定输入x下,y=1的概率”即 二元回归参数估计值 二元回归函数_二元回归参数估计值_04
于是, 可以得到二元回归参数估计值 二元回归函数_二元回归参数估计值_05

3. 使用逻辑回归解决二元分类问题

二元回归参数估计值 二元回归函数_git_06
解释:求训练得到的系数二元回归参数估计值 二元回归函数_git_07,给定x下y=1的概率。也就等于后面的二元回归参数估计值 二元回归函数_函数定义_08
二元回归参数估计值 二元回归函数_git_07为向量,二元回归参数估计值 二元回归函数_git_10
二元回归参数估计值 二元回归函数_二元回归参数估计值_11也向量,二元回归参数估计值 二元回归函数_函数定义_12 [^2]:X从1开始的原因是:线性拟合的的一个参数是二元回归参数估计值 二元回归函数_损失函数_13
二元回归参数估计值 二元回归函数_损失函数_14

【实验】2.1 使用逻辑函数 完成对购车的预测

2. 使用Logit进行预测的模型解释

1. 损失函数定义

二元回归参数估计值 二元回归函数_git_06
损失函数:二元回归参数估计值 二元回归函数_二元回归参数估计值_16

2. 损失函数的解释

对于给定第i个模型的概率,二元回归参数估计值 二元回归函数_损失函数_17表示第i个数据为1,它乘以二元回归参数估计值 二元回归函数_函数定义_18表示乘以在参数二元回归参数估计值 二元回归函数_git_07二元回归参数估计值 二元回归函数_二元回归参数估计值_20的条件下 y为1的概率,如果猜测符合实际,这个值将会=0。同理,右边二元回归参数估计值 二元回归函数_git_21在预测正确的情况下也会趋于0。故此,损失函数二元回归参数估计值 二元回归函数_函数定义_22较好的表示了预测值和真值的相差程度,因此将至用于度量模型的损失值。

3. 损失函数的特点

损失函数是凸函数,可导
二元回归参数估计值 二元回归函数_git_23

4. 计算方式

  1. 随机初始化
  2. 计算梯度
  3. 梯度下降

5. Logit函数求梯度

(过程略)关键结论如下

  1. 二元回归参数估计值 二元回归函数_损失函数_24
  2. 二元回归参数估计值 二元回归函数_函数定义_25
  3. 二元回归参数估计值 二元回归函数_函数定义_26
  4. 二元回归参数估计值 二元回归函数_函数定义_27为期望,我们需要最大化期望,这需要梯度上升法。为满足一般使用梯度下降法的习惯,故取二元回归参数估计值 二元回归函数_二元回归参数估计值_28。由此,对loss求二元回归参数估计值 二元回归函数_函数定义_29求导就为二元回归参数估计值 二元回归函数_git_30
    【实验2.2 使用Logit模型来对垃圾短信进行分类】