评分卡

【 4 】评分卡实例-阈值表与评分阈值

作者 : 老饼 发表日期 : 2022-06-26 10:26:19 更新日期 : 2025-03-05 15:04:57
本站原创文章,转载请说明来自《老饼讲解-机器学习》www.bbbdata.com



接上文《评分卡实例-评分卡制作



  前文提要与本文概述  


上节我们将逻辑回归模型,制作成了评分卡
 
通过评分卡,我们就可以对新进的客户进行评分
模型投产时,需要设定一个评分阈值,将低于评分阈值的客户拒绝。
评分阈值怎么设定?一般会先统计阈值表,再参考评分阈值表的相关信息后,结合业务而设定
本文讲解如何统计评分阈值表,以及如何依据评分阈值表来确定阈值





  01. 评分卡的评分阈值表  




本节讲解阈值表是什么以及如何统计阈值表




     评分阈值表的制作     


评分阈值表由建模样本的评分统计得到,它展示了不同评分阈值给业务带来的效果
阈值表的统计需要先算出各个样本的评分,再统计每个分段的统计信息
    阈值表的统计字段如下:
   
✍️说明
 阈值表的字段以第一行为例,可以这样理解:
如果以620分为阈值,将有7个客户被拒绝,其中有2个好客户,5个坏客户,共损失7个客户,即损失0.04%客户.....
阈值表的每个字段,都是为了评估以xxx分为阈值时,所带来的损失(筛掉的好客户)和收益(筛掉的坏客户),
上面统计的是一些常用字段,也可以根据自己需要,设计更多字段






  02.  如何通过阈值表确定评分阈值  




本节讲解如何通过评分阈值表来确定评分卡的评分阈值




      如何通过阈值表确定评分阈值      


如何通过阈值表确定评分阈值
评分阈值表主要用于辅助确定评分阈值,但直接看评分阈值表往往无从下手,
所以一般先通过关键信息缩小阈值范围,再进一步选择阈值
确定评分阈值的具体步骤如下:
👉1. 通过关键信息确定下限                                  
👉2. 通过关键信息确定上限                                  
👉3. 在上下限之间评估综合信息进一步确定阈值    
      通过阈值表确定评分阈值-详细说明      
下面详细说明如何通过阈值表确定评分阈值
一、确定阈值下限                                                          
    阈值下限的下限一般通过"本组坏客户占比"来确定 
                  以分组 [750-760) 为例,“本组坏客户占比”的意义如下: 
             
该字段说明[750-760)分的客户有467个,其中坏客户82个,   
                   占比17.56%(1/6),  说明该组大概切掉6个客户,会有一个是坏的  

                            根据效益均衡点,先在"本组坏客户占比"这一列确定阈值的下限    
                  例如,放款5个好客户的收益,才能抵掉1个坏客户的损失, 
                     说明17.56%这一分数是均衡点,阈值不能比760更小,否则损失大于收益
 
二、确定阈值上限                                                            
 阈值的上限一般通过“损失的客户%”来确定    
 如阈值取800,则损失 31.59%客户(6318个),   
           如果损失客户过多,业务上不能接受,所以阈值不能比800大
 
三、确定最终阈值                                                            
                              最终阈值的确定需要评估各个综合信息,在阈值上限和下限之间权衡
                              哪个阈值的综合信息最适合当前业务,就取哪个作为最终的评分阈值
 假设我们最终设定的阈值为770,那么:        
损失的客户%:14.17%(2834个)             
损失客户中坏客户占比:31.05%              
剔除坏客户%:63.63%                       
            也就是说,使用<770作为阈值,则会损失14.17%左右的客户,
                  这部分客户里有31.05%是坏客户,使用模型后,坏客户能减少63.63%






  03. 评分卡-分数分布图    




本节展示评分卡的分数分布图以及讲解分数分布图的意义




      评分卡分数分布图     


最后的最后,画出评分卡的分数分布图,如下:
 
 
分数分布图主要用于进一步了解模型的合理性与了解客群的特征
从分布图可以看出,分数越低,坏客户的占比越高,当分数大于790时,基本坏客户的占比就较少了
同时,从分布图可以看出,整体客户质量是较好的,分数基本集中在高分段
 高分段只有个别客户坏账,这可以理解为意外情况导致的逾期
备注:在实践中,分数分布图一般呈现为正态分布或二八分布,在本例中就是二八分布






至此,整个评分卡建模工作就已完成







 End 





联系老饼