estimate 逻辑回归

转载

墨染青丝 2024-11-29 09:03:10

文章标签 estimate 逻辑回归逻辑斯蒂回归 WOE 风控 文章分类 机器学习人工智能

逻辑斯蒂回归

$estimate 逻辑回归_逻辑斯蒂$
其中 $estimate 逻辑回归_estimate 逻辑回归_02$ 为sigmoid函数，即值域在 $estimate 逻辑回归_逻辑斯蒂_03$ 之间的S形函数：
$estimate 逻辑回归_WOE_04$
为什么要把输出限制在0-1之间呢？因为我们通常建模时希望模型预测的是概率值。

对于逻辑回归对应的二分类问题，通常 y 指的是样本标签为正（负）的概率。

estimate 逻辑回归_逻辑斯蒂_05

sigmoid 函数有个特点：

$estimate 逻辑回归_回归_06$

故(1)式转化为：

$estimate 逻辑回归_风控_07$

$estimate 逻辑回归_逻辑斯蒂_08$ 表示的是概率， $estimate 逻辑回归_WOE_09$ 表示的是几率（odds）， $estimate 逻辑回归_estimate 逻辑回归_10$

所以逻辑斯蒂回归建模的出发点（假设）为：样本标签为正的对数几率是自变量 $estimate 逻辑回归_回归_11$ 的线性函数。

这当然是一个很强的假设，显示数据是很难符合条件的。

WOE 编码

WOE 全称叫 Weight of Evidence。

逻辑斯蒂回归中的线性假设很难满足，导致模型表现不好，但是自变量在 WOE 编码之后可以满足上述假设，即对数几率通常是自变量 $estimate 逻辑回归_回归_11$ 的WOE编码的线性函数。

假设有 $estimate 逻辑回归_estimate 逻辑回归_13$ 个自变量 $estimate 逻辑回归_WOE_14$
$estimate 逻辑回归_estimate 逻辑回归_15$
上式最后一个等式成立的条件为 $estimate 逻辑回归_逻辑斯蒂_16$ 关于 $estimate 逻辑回归_estimate 逻辑回归_17$