逻辑回归可以解决分类问题,属于监督学习。

一、sigmoid函数

sigmoid后计算准确率的阈值怎么设置_数据集,其值范围为(0, 1),函数图形如下图所示:

            

sigmoid后计算准确率的阈值怎么设置_监督学习_02

    sigmoid函数有以下的性质:

sigmoid后计算准确率的阈值怎么设置_监督学习_03

sigmoid后计算准确率的阈值怎么设置_逻辑回归_04

sigmoid后计算准确率的阈值怎么设置_数据集_05

sigmoid后计算准确率的阈值怎么设置_样本集_06


二、二分类

sigmoid后计算准确率的阈值怎么设置_逻辑回归_07,可以把sigmoid后计算准确率的阈值怎么设置_数据集_08理解成某种对象,sigmoid后计算准确率的阈值怎么设置_监督学习_09是对象的特征。

sigmoid后计算准确率的阈值怎么设置_样本集_10

sigmoid后计算准确率的阈值怎么设置_逻辑回归_11,在给定sigmoid后计算准确率的阈值怎么设置_样本集_12时,sigmoid后计算准确率的阈值怎么设置_监督学习_13函数可以将sigmoid后计算准确率的阈值怎么设置_数据集_08映射到(0,1)之间,如果将sigmoid后计算准确率的阈值怎么设置_监督学习_15视为正类,sigmoid后计算准确率的阈值怎么设置_逻辑回归_16视为负类,则可以将sigmoid函数用于解决分类问题。

sigmoid后计算准确率的阈值怎么设置_样本集_17函数中,有一个sigmoid后计算准确率的阈值怎么设置_样本集_12参数,如果已知这个参数,那么该函数可以用于分类。但如果只有数据集sigmoid后计算准确率的阈值怎么设置_数据集_19,并已经数据集的分类标签sigmoid后计算准确率的阈值怎么设置_监督学习_20,那么怎样得到参数sigmoid后计算准确率的阈值怎么设置_样本集_12呢?这就是训练问题了。


三、逻辑回归训练

sigmoid后计算准确率的阈值怎么设置_数据集_22和样本对应的分类标签sigmoid后计算准确率的阈值怎么设置_样本集_23,怎样从样本集中训练得到sigmoid后计算准确率的阈值怎么设置_样本集_12参数呢?

    定义:
        极大似然函数sigmoid后计算准确率的阈值怎么设置_数据集_25,将其取对数后得到:

        极大对数似然函数sigmoid后计算准确率的阈值怎么设置_样本集_26

        条件概率sigmoid后计算准确率的阈值怎么设置_监督学习_27

    怎么理解上面的极大似然呢?考虑到分类的目的,最理想的结果是:分类器将样本集分成两类,一类包含全部的正类,一类包含全部的负类。但由于样本集存在噪声,这种理想结果是不可能达到的,在这种情况下,分类器的最优结果是:将更多的真实的正类样本标记为正类,将更多的真实的负类样本标记为负类。

    所以在优化的过程中,采用梯度上升法,对sigmoid后计算准确率的阈值怎么设置_样本集_12进行优化,让sigmoid后计算准确率的阈值怎么设置_数据集_25到达极大值。

sigmoid后计算准确率的阈值怎么设置_数据集_30写成整体得:sigmoid后计算准确率的阈值怎么设置_数据集_31,代入对数似然函数得:

sigmoid后计算准确率的阈值怎么设置_样本集_26

sigmoid后计算准确率的阈值怎么设置_逻辑回归_33

sigmoid后计算准确率的阈值怎么设置_数据集_34

sigmoid后计算准确率的阈值怎么设置_样本集_12sigmoid后计算准确率的阈值怎么设置_监督学习_36关于sigmoid后计算准确率的阈值怎么设置_样本集_12的梯度:

sigmoid后计算准确率的阈值怎么设置_样本集_38

sigmoid后计算准确率的阈值怎么设置_数据集_39

sigmoid后计算准确率的阈值怎么设置_逻辑回归_40

sigmoid后计算准确率的阈值怎么设置_样本集_41

sigmoid后计算准确率的阈值怎么设置_样本集_12的更新可写为:

sigmoid后计算准确率的阈值怎么设置_样本集_43

sigmoid后计算准确率的阈值怎么设置_监督学习_44为学习率。

sigmoid后计算准确率的阈值怎么设置_逻辑回归_45训练伪代码如下:

sigmoid后计算准确率的阈值怎么设置_数据集_46
     {
         sigmoid后计算准确率的阈值怎么设置_数据集_47

sigmoid后计算准确率的阈值怎么设置_逻辑回归_48

sigmoid后计算准确率的阈值怎么设置_数据集_49
     }

    即迭代训练样本集中的每一个样本,对其进行一次二分类,将分类的误差更新到sigmoid后计算准确率的阈值怎么设置_样本集_50上,当迭代完成时,sigmoid后计算准确率的阈值怎么设置_样本集_50达到最优。

sigmoid后计算准确率的阈值怎么设置_样本集_12后,便可以将其运用于分类了。