信用评分模型是消费信贷管理中先进的技术手段,是现在金融行业常用的信用风险评估方法,本文从宏观上介绍评分模型的建模开发流程。
1. 明确问题
明确业务要解决的问题,确定时间窗口、标签的定义规则,以及模型的评价指标和数据来源。
在定义标签的时候需要注意:
- 要考虑到表现期的长短(有关表现期的定义可以参考观察期与表现期)
- 要考虑到期终表现与期中表现
- 要考虑到某些群体的不可确定性(假设3期以上为坏客户,如果有拖欠2期的,如果归为坏,这些账户在最终会还清欠款而回归好客户;如果定义为好客户,相当一部分会拖欠越来越严重成为坏账;考虑到它的两面性,可归类为‘不确定’,排除在模型样本之外)
- ‘坏’客户的定义必须简明,避免坏客户出现较大的不同质性
2. 数据获取
金融行业在多年的经营活动中积累了非常庞大的数据,在建立信用评分模型时往往不会使用全部的数据,因此就涉及到抽样。
抽样
- 随机抽样
- 分层抽样
建模样本要求
- 样本具有代表性:即样本能够代表过去和未来的总体
- 样本的充分性:总样本数量和各个类别中的样本数量充足
- 样本的时效性:观察期越近越好,要根据观察期和表现期长短及样本数量来定
- 样本的排除性:明确规定排除在业务范围内的客户不允许用来建模
- 表现推测性:申请风险评分模型的特殊问题,申请评分卡的建模样本必须包含历史上被拒绝的申请人和获得准入但是未激活卡的申请人。
3. 数据清洗
- 数据的描述性统计(单变量统计:均值、方差、众数、四分位数,偏度,峰度,最大值,最小值等)
- 变量的分布和检验正态假设
- 离群值的检测和处理
- 缺失值的处理
- 变量的相关性分析(皮尔逊相关系数、斯皮尔曼相关系数、基尼方差等)
4. 特征提取和选择
特征决定了机器学习的上限,而模型和算法只是逼近这个上限。好的特征具有明确的业务含义,且能有限的区分好坏客户。对于信用评分模型,构建特征时除了客户的历史信用状况外,还需要考虑到客户的还款能力和还款意愿等因素。
5. 模型的制定
(1)分析单变量的预测能力
以学历为例,统计不同学历的客户中坏账的比率如下(数据虚构,纯属为了解释说明)
学历 | 总账户数 | 好账户数 | 坏账户数 | 坏账户占比 |
小学及以下 | 2000 | 1720 | 280 | 14% |
初中 | 3000 | 2700 | 300 | 10% |
高中 | 3500 | 3220 | 280 | 8% |
专科 | 3200 | 2992 | 208 | 6.5% |
本科 | 4000 | 3800 | 200 | 5% |
硕士 | 2800 | 2716 | 84 | 3% |
博士 | 1500 | 1470 | 30 | 2% |
随着学历的提高,坏账率逐步降低,可以说明这个变量能有效的分辨好坏客户,其预测能力强;如果反过来,各个栏位的坏账率大体相同,或无规律可循,则说明没有多少预测能力,可以剔除。
(2)特征选择
各种机器学习的工具包中提供了丰富的接口可供使用进行特征的选择,本文不再阐述。除了从算法层面选择特征外,还要主要入选特征的合法和合理性,以及可解释性和可实施性。
(3)建模
Logistic Regression(逻辑斯蒂回归)算法因为其简单且可解释性强,通常被作为评分卡模型的首选。关于Logistic Regression原理,网上有大量文章讲解,本文不再阐述。
6. 模型评估
在模型的开发阶段,模型的评估通常采用交叉验证的方式。
常用的评估指标有:
- ROC曲线
- KS指标
- 区分度
- 拟合度曲线
- 混淆矩阵
7. 实施和监控
当完成评分模型开发,并且模型效果不错后,就要准备在风控策略上实施评分模型。在实施前需要解决一些问题。例如:评分卡的决策点的分值如何设定?是否加入人工干预等。
在评分模型实施后,还要进行跟踪和监控,这时需要根据评分卡在实际业务中的表现,制作实施前报告和实施后报告,并根据客户群体和市场的变化评估模型的稳定性,不定期调整模型。