逻辑回归评分卡输出模型和系数逻辑回归与评分卡

转载

mob64ca1419e0cc 2024-04-24 15:37:53

文章标签 逻辑回归评分卡输出模型和系数评分卡四舍五入历史数据 文章分类 机器学习人工智能

【逻辑回归】

在建立评分模型时，我们通过使用逻辑回归进行建立模型对数据进行训练，模型给出一个分类好坏客户的一个概率值；并不是评分卡的分值。

【评分卡定义】

评分卡中好坏客户的定义，假设通过历史数据定义，近1年逾期次数为大于等于M2词作为违约客户，则将好坏客户通过数学公式表示。
假设P为坏客户的概率，则1-P则为好客户概率。

【逻辑回归–公式】

坏客户概率计算公式

好客户概率计算公式

好坏客户的占比（坏客户/好客户），几率

评分卡的分值通过以下公式计算可得，A和B是常数；其实分数是比率对数的线性表达式，式中的负号可以使得违约概率越低，得分越高。通常情况下，这是分值的理想变动方向，即高分值代表低风险，低分值代表高风险。即

计算A和B的值，需要进行两个假设

a.给某个特定的比率设定一个特定的预期分值。
b.确定比率翻倍的分数（PDO）
我们首先假设比率为x的特定点的分值为P。则比率为2x的点的分值应该为P+PDO。代入式中，可以得到如下两个等式：

假设评分刻度是1:20（违约正常比）时的分数为 100，PDO为20分，带入解的B=14.43，A=6.78

确定了A和B之后就确定了score公式。

评分卡的计算公式为

每个分项分值的计算：

a.将样本进行了WOE编码化w，带入逻辑回归模型中计算得出每个特征的系数j

b.刻度分值B已知；则分项分值为-(B
w
j)

c.最终生成完整的评分卡。

注：
1.进行交叉验证的方式提高模型的稳定性。
2.通常，该分值将四舍五入到最近的整数，以简化评分卡的表现形式和可解释性。这种四舍五入将得到分值的近似值，但其影响很小，可以忽略不计.