python 实现评分卡模型 iv python评分卡代码

转载

mob64ca1414c613 2023-10-05 22:02:32

文章标签 python 实现评分卡模型 iv python 机器学习开发语言评分卡 文章分类 Python 后端开发

本文致力于让大家彻底弄懂评分卡的原理和实现。

本文目录

评分卡原理

评分卡Python实现

2.1 根据客户违约概率计算客户得分

2.2 根据分箱WOE和特征系数计算客户得分

一、评分卡原理

python 实现评分卡模型 iv python评分卡代码_评分卡

根据逻辑回归原理，客户违约的概率p有如下式子：

其中x为客户特征,θ为特征系数，上式整理得：

python 实现评分卡模型 iv python评分卡代码_评分卡_02

即

python 实现评分卡模型 iv python评分卡代码_python 实现评分卡模型 iv_03

违约概率和正常概率的比值称为比率(Odds)，即：

python 实现评分卡模型 iv python评分卡代码_评分卡_04

所以

python 实现评分卡模型 iv python评分卡代码_开发语言_05

设评分卡的评分Score为：

python 实现评分卡模型 iv python评分卡代码_开发语言_06

或

python 实现评分卡模型 iv python评分卡代码_评分卡_07

其中A、B是正常数，在风控中一般分数越高信用越好风险越低。所以B前面取负号，让违约的概率越高分数越低。

由中学知识可知，两个方程联立可求出两个未知数。为求出A、B的具体值，有如下两个假设：

1.假设比率为θ

时的基准分为P

。

2.假设比率翻倍(2θ

)时分数的变动值为PDO。

把θ0、P0、PDO代入评分公式得：

python 实现评分卡模型 iv python评分卡代码_python 实现评分卡模型 iv_08

①-②得：

python 实现评分卡模型 iv python评分卡代码_机器学习_09

即

python 实现评分卡模型 iv python评分卡代码_python_10

最终解得：

python 实现评分卡模型 iv python评分卡代码_评分卡_11

将③代入①得：

python 实现评分卡模型 iv python评分卡代码_python_12

即

python 实现评分卡模型 iv python评分卡代码_python 实现评分卡模型 iv_13

假设θ0=0.001时，P0=600，PDO=40。

则

B = 40/np.log(2)=57.71

A=600+57.71*np.log(1/1000)=201.35

即

python 实现评分卡模型 iv python评分卡代码_python_14

或

python 实现评分卡模型 iv python评分卡代码_python 实现评分卡模型 iv_15

则

python 实现评分卡模型 iv python评分卡代码_机器学习_16

其中 x

、

等是出现在最终模型的入模变量。由于一些入模变量进行了WOE编码，可以将评分写成对应woe的形式。

python 实现评分卡模型 iv python评分卡代码_机器学习_17

其中θ

为第i个特征的系数，W

为第i个特征第j个分箱的WOE值
是0、1逻辑变量，当客户对应特征的取值落在该分箱时为1否则为0。

所以最终的评分卡形式如下：

python 实现评分卡模型 iv python评分卡代码_评分卡_18

二、评分卡Python实现从评分卡原理的分析中知，得到客户的最终得分有两个计算公式：

python 实现评分卡模型 iv python评分卡代码_python_19

或

python 实现评分卡模型 iv python评分卡代码_评分卡_20

如果已经通过逻辑回归的训练得到客户的违约概率，且只想得到客户的最终得分。可把违约概率P代入第一个式子即可以得到客户得分。

1根据客户违约概率计算客户得分

具体计算代码如下：

def Prob2Score(prob, A, PDO):#将概率转化成分数且为正整数y = np.log(prob/(1-prob))return int(A-PDO/np.log(2)*(y))A, PDO = 201.35,40score[‘prob2score’] = score[‘predict’].apply(lambda x: Prob2Score(x, A, PDO))plt.hist(X_f_1[‘score’],bins=100)plt.show()

其中

Prob2Score

是根据第一个公式写的函数，只要输入违约概率prob、A和PDO的值即可计算客户得分。

得到所有样本的得分分布如下：

python 实现评分卡模型 iv python评分卡代码_开发语言_21

2根据分箱WOE和特征系数计算客户得分

计算评分卡时先不考虑常值分A-Bθ0的值，只把每个特征对应分箱的分值算出。

根据最终评分卡形式编写Python脚本如下，可得到标准评分卡。

def var_card(cut,woe,coef,B):import warningswarnings.filterwarnings(‘ignore’)w1 = pd.DataFrame({‘cut’:cut,‘woe’:woe})w2 = w1.drop_duplicates(subset=[‘cut’,‘woe’],keep=‘first’)w2[‘name’] = cut.namew2[‘coef’] = coef[woe.name][0]w2[‘score’] = round(-w2[‘woe’]*w2[‘coef’]*B,0).astype(‘int64’)w3 = w2[[‘name’,‘cut’,‘woe’,‘coef’,‘score’]]return w3def score_card(card_name,data,B,coef):score_cards = pd.DataFrame({‘name’:[0],‘cut’:[0],‘woe’:[0],‘coef’:[0]})data = datafor i in range(card_name.shape[0]):cut = data[card_name.iloc[i,0]]woe = data[card_name.iloc[i,1]]coef = coefcard = var_card(cut,woe,coef,B)if card.shape[0]<20:score_cards = score_cards.append(card)score_cards_final = score_cards[[‘name’,‘cut’,‘woe’,‘coef’,‘score’]]score_cards_final = score_cards_final.iloc[1:,:]return score_cards_finalcard_name = pd.DataFrame({‘cut’:columns_final_cut,‘woe’:columns_final_woe})data = dataA, PDO, B = 201.35,40,40/np.log(2)coef = coef_1score_card_1 = score_card(card_name,data,B,coef)

其中

card_name

中存储每个特征对应分箱的woe值，data表示原始数据，B是公式中的常数，coef表示特征对应系数。

该计算公式只是我为了熟悉原始计算公式编写，后续会进行代码优化，请悉知。

得到结果如下：

python 实现评分卡模型 iv python评分卡代码_评分卡_22

如果想根据评分卡对应分段的值得到最终得分，可在Python中输入如下代码：

def all_score(score_card,data,A,B,θ0):var_name = score_card[[‘name’]].drop_duplicates(subset=[‘name’],keep=‘first’)names = [‘a’]for i in range(var_name.shape[0]):sub = score_card[score_card[‘name’]==var_name.iloc[i,0]]sub_1 = sub[[‘cut’,‘score’]]sub_1.rename(columns={‘cut’:sub[‘name’][0], ‘score’:sub[‘name’][0]+’_score’}, inplace = True)data = data.merge(sub_1, on=sub[‘name’][0],how=‘left’)names.append(sub_1.columns[1])names = names[1:]score_model = data[names]score_model[‘woe_score’] = score_model.apply(lambda x:x.sum(), axis = 1)data[‘TOTALSCORE’] = score_model[‘woe_score’]+A-B*θ0return datascore_1 = all_score(score_card_1,data,201.35,40/np.log(2),θ0=0.001)

其中

score_card_1

表示标准评分卡，data表示原始数据，A、B、θ

详见上文中评分卡原理。

得到结果如下：

python 实现评分卡模型 iv python评分卡代码_机器学习_23