文章目录
- 1 什么是逻辑回归?
- 2 逻辑回归的损失函数
- 2.1逻辑回归为何使用Sigmoid函数
- 2.2逻辑回归的步骤
- 2.3 预测函数的确定
- 2.4损失函数的构造
- 3 逻辑回归的模型
- 3.1模型求解与推导
- 求解步骤如下:
- 推导过程
- 3.2最终模型
1 什么是逻辑回归?
逻辑回归一般指logistic回归,是一种广义的线性回归(generalized linear model),常用于数据挖掘,疾病自动诊断,经济预测等领域。虽然名字里带“回归”,但是它实际上是一种分类方法,不仅能进行分类,还能获取每个类别的概率预测值。常用于两分类问题。
logistic回归通过函数L将w‘x+b对应一个隐状态p,p =L(w‘x+b),然后根据p 与1-p的大小决定因变量的值。如果L是logistic函数,就是logistic回归,如果L是多项式函数就是多项式回归。
2 逻辑回归的损失函数
2.1逻辑回归为何使用Sigmoid函数
Sigmoid函数形式如下:
对于函数,当z≥0 时,y≥0.5,分类为1,当 z<0时,y<0.5,分类为0。
使用Sigmoid函数原因有两个方面:
1)Sigmoid 函数自身的性质
a. sigmoid 函数连续,单调递增
b. sigmiod 函数关于(0,0.5) 中心对称
c. 对sigmoid函数求导后计算速度快
2)指数族
logistic回归的损失函数为非指数族,逻辑回归认为函数其概率服从伯努利分布,将其写成指数族分布的形式。
2.2逻辑回归的步骤
(1)构造预测函数h
(2)构造损失函数J
(3)令J最小并求得回归参数w
2.3 预测函数的确定
逻辑回归主要用于二分类问题(即输出只有两种,分别代表两个类别),所以利用了Logistic函数(或称为Sigmoid函数),函数形式为:
逻辑回归从其原理上来说,其实是实现了一个决策边界:
构造预测函数:(将回归方程写入其中)
函数的值,表示结果取1的概率,所以对于因变量x,分类结果为1和0的概率分别为:
2.4损失函数的构造
上边两式可改写为:
上式是在参数下,元组类标号为y的后验概率。假设现在已经得到了一个抽样样本,那么联合概率的大小就可以反映模型的代价。联合概率的值越大,代价函数越小。
联合概率公式中采用连乘的方法不好计算,可用极大似然估计的方法进行求解,得到最大的参数,这个最大的参数将是最佳参数,使得联合概率的值最大,代价值最小。因此就得到了逻辑回归的损失函数:
损失函数的对数似然函数为:
得到的这个函数越大,证明我们得到的W就越好.因为在函数最优化的时候习惯让一个函数越小越好,所以我们在前边加一个负号.得到逻辑回归的损失函数公式如下:
3 逻辑回归的模型
对于模型的训练而言:实质上来说就是利用数据求解出对应的模型的特定的。从而得到一个针对于当前数据的特征逻辑回归模型。
3.1模型求解与推导
模型回归得到的是一个最优化模型,求解方法有梯度下降法、牛顿法等,这里求解逻辑回归的损失函数,采用最基本的方法——梯度下降法。
求解步骤如下:
1-随机一组.
2-将带入交叉熵损失函数,让得到的点沿着负梯度的方向移动.
3-循环第二步.
推导过程
对损失函数求偏导,过程如下:
3.2最终模型
待补充