扫描分享
本文共字,预计阅读时间。
信用评分卡模型在国外是一种成熟的预测方法,尤其在信用风险评估以及金融风险控制领域更是得到了比较广泛的运用。应用评分卡模型的目的是为了预测申请贷款用户在未来一段时间内的发生违约的概率,并且模型以分数的形式来具体衡量风险大小,通常来说,评分越高越安全。当贷款用户进行申请时,机构通过评分卡获得该用户的一个评分,评分低于某个阀值,申请就会被拒绝。同时根据使用场景的不同,有以下几种类型的评分卡:反欺诈评分卡、申请评分卡、行为评分卡、催收评分卡。
评分卡模型本质是一种二分类变量的广义线性模型,它通过将模型变量以Woe的编码方式离散化之后,运用logistic回归模型建模。评分卡不仅具有稳定的特性,模型还具有预测能力,等价于逾期概率。开发评分卡是风险控制的一个环节,主要根据已有用户的数据提供逾期概率来做指标参考,一般用来开发评分卡的模型有逻辑回归和决策树,这边我们主要探讨通过逻辑回归模型来构造的评分卡模型。
基于Logistic回归的评分卡模型开发,主要有五个步骤:
第一,收集整合已有客户的数据,定义逾期指标,排除特定样本;
第二,数据预处理,进行特征变量筛选和变量分箱、WOE转换;
第三,训练模型,让数据拟合逻辑回归模型;
第四,使用ROC、KS评估模型效果;
第五,生成评分卡模型。
数据准备阶段,主要是考虑不同的贷款用户群对建模效果的影响,我们需要对数据进行特定规则的挑选。首先我们需要排除欺诈和特殊客户,接下来根据建模目标来挑选用户,例如我们需要挑取使用分期贷款的用户且这些用户的贷款金额在某个范围,我们还需要根据客户逾期的天数来将用户标签二分类,逾期/良好。确定用户之后,我们需要将所有能够收集到的特征整合到数据中,最终确定样本数据。
第二个阶段是数据的预处理,主要有特征筛选和特征分箱。因为Logistic回归模型是一个广义的线性模型,我们需要挑选特征覆盖率比较高的特征、随着时间迁移分布稳定的特征同时具有良好的可解释性——能够对逾期状态影响最大的特征。一般我们用随机森林、GBDT、XGBOOST等方法输出变量重要性来选择排序,或者使用IV值来进行筛选,IV可以用来衡量自变量的预测能力。当特征筛选完成之后,我们需要将连续变量离散化,因为将特征离散化之后,模型会更稳定,降低了模型过拟合的风险。常用的分箱方法有等距分箱、等频分箱和卡方分箱。等距分箱就是根据最大最小值均分N等份,按照值大小分箱。等频分则是将每个区间都均等分成一样实例数量的区间。卡方分箱则是根据相邻区间卡方值来进行合并。
将变量离散化之后,我们还需要进行WOE转换,因为WOE转换可以将逻辑回归模型变为标准评分卡模型格式,WOE(weight of Evidence)就是自变量取某个值的时候对违约比例的一种影响,是对原始自变量的一种编码形式。要对一个变量进行WOE编码,首先需要对他进行分组分箱处理。它的计算公式如下:
第三个阶段是进行模型训练,当数据和特征处理好了之后,我们就可以进行模型的训练了。模型训练使用的是Logistic回归模型。模型训练完成之后的第四个阶段,就是模型评估了,对于二分类模型来说,准确率的高低就是评价模型好坏的指标,所以我们使用Roc曲线来衡量,Roc曲线显示了模型的真正例率和假正例率之间的对比,Roc曲线下的面积就是模型准确率的度量(AUC)。AUC大则说明我们的模型训练的比较好。
最后就是评分卡模型的生成了,评分卡计算方法odds为good用户概率(p)与bad用户概率(1-p)的比值。
评分卡设定的分值刻度可以通过将分值表示为比率对数的线性表达式来定义。公式如下:
设置比率为θ(0)(也就是odds)的特定点分值为P(0) ,比率为2θ(0)的点的分值为P(0)+PDO。带入上面公式可得到:
当我们P(0)、PDO的值给定时,可以得出A、B的值。
在实际的应用中,我们会计算出每个变量的各分箱对应的分值。新用户产生时,对应到每个分箱的值,将这些值相加,最后加上初始基础分,得到最终的结果。我们知道逻辑回归的计算公式为:
由此得到分值的计算公式:
以下是分箱之后,对应区间分值的计算方式。
以上步骤都完成后,假如新产生一个用户,我们只需将此用户每个变量对应到各分箱中得到其对应的WOE值,再根据上面的公式计算出这个样本在每个变量下的分数。
最后将所有变量对应的分数相加,即为最终评分结果。评分结果的好坏决定了贷款的申请与否,因此评分卡模型可以很好的为企业机构拒绝不好的客户。
非常感谢您的报名,请您扫描下方二维码进入沙龙分享群。
非常感谢您的报名,请您点击下方链接保存课件。
点击下载金融科技大讲堂课件本文系未央网专栏作者发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!首图来自图虫创意。
本文为作者授权未央网发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!首图来自图虫创意。
本文版权归原作者所有,如有侵权,请联系删除。首图来自图虫创意。