近期收到同学们在学习策略或工作应用中遇到的不少业务问题,今天小篇统一整理了一下,分享给大家。我们讲师也是结合实际业务场景的经验,给了同学们细心答复。大家可以看看有没有自己遇到的相似问题?

课程干货回顾:知识星球-第6期大咖直播课:风控策略规则开发与应用

01

Q:对不同的分析场景,在实践中一般会有多少条策略规则?

A:金融不同业务场景的贷前策略规则有一定区别,比如对于不同金融机构(银行、消金、小贷、保险等)、不同产品(个人、企业)等。但一般情况下大约在30条~100条的范围。

银行的策略规则一般不会很多,因为客户群体本身大多都是优质用户,而对于消金公司,客户群体资质会差一点,策略规则数量稍多些。

一般从信息核验类(要素核验、黑名单核验等),加上基本信息、人行征信数据的策略规则加起来有几十条。当然,由于各家机构业务不同,以及风控思路不同,策略数量有时差别也会挺大,但大体情况如上所述。

02

Q:策略特征一般是怎么选择的?在实践中可能可供选择的特征有几十上百个甚至更多,策略人员怎么选择出来十几个用来建立策略和分析?

A:在实际业务场景中策略规则有很多,具体选择建议是将所有线上应用的规则都引入,当然有一类规则要除外,即“核验类规则”,比如:

这些策略规则是强性规则,不需要矩阵分析,如果用户命中直接拒绝就可以了。

此外其他规则可以采用决策矩阵,如果为了保证风控的精准度,可以将其余所有规则引入。但太多了也会造成监测调整维护起来较麻烦,因此可以进行规则筛选,这时需要考虑规则的效果,选择区分度较好的、信息维度有代表性的、业务类别有意义的、规则字段相关性比较弱的、规则字段分布稳定性较好的等。

03

Q:策略规则选用的时候会有要求么,比如较强的业务含义?

A:策略规则的选用是比较看重业务含义的,因为业务维度越多,说明识别用户风险的维度也就越多,从风控的思想来讲,这是非常重要的。但是,除了业务含义,策略规则字段的效果也是十分重要的,比如:策略规则的准确性、稳定性、解释性等,要选择区分度较好的、稳定性较好的等,这样才能保证决策矩阵的准确性能和稳定性能。

04

Q:在课程中提到模型区分度一般比策略规则区分度好,在实践中,最终等级因为规则策略影响的比例大概多少?

A:影响比例这个是无法界定的,也不需要去关注。对于风控来讲,将策略与模型的体系架构好了实现风控准确度提升的目的,这才是重点。所谓模型区分度一般比策略规则区分度要好,意思某个模型分数比某个策略规则的区分效果要好很多,理由是:

当然,一个模型和一套策略多个规则集相比,效果是不好衡量的,也没有太大意义,而且这和很多实际业务需求有关。无论怎样,策略模块的规则类别越多、每个规则的区分度越好,那策略的性能越好,同对模型也是如此,这样构建出的决策矩阵在实际应用中的综合效果会很好的,简单点说,这也是风控的思想。

05

Q:针对分区度高的规则或变量,如果命中总样本量较少(少于30)时,怎么处理?还要做成规则吗?

A:区分度高的规则或变量命中总样本的数量少,比如只有0.5%,一般情况下不是优先考虑,主要原因并不在于命中数量太少,而是担心这样的规则在后期不太稳定,波动的可能性较大,如果其他可选的规则较多,或者非常想用这条规则的话,也可以考虑的,只是要特别测试下这条规则在不同时间窗口样本下的稳定性,如果表现稳定也是可以采用的,当然还要分析下是否被其他规则覆盖、字段调用的成本等。

这个问题回归到实际业务中,其实是很少出现的情况,变量的区分度很好,要是好的话各个区间的分布有明显的差异,不仅仅局限在刚说的这种命中很少的情况,若某个区间命中很少,可以适当往前扩大点区间,假如不便于扩展而出现了问题描述的情况,那就是按照前边说的思路处理。

06

Q:考虑数据成本和策略效果,怎样对规则中使用数据源的先后顺序进行排序?

A:

这些原则不是绝对的,但都是考虑的原则,在实际部署时,在同等情况下重点排序,此外还要考虑规则之间的覆盖情况。

07

Q:原样本和新样本取数时间范围一般各是多久?

A:在课程中原样本指的是开发样本,新样本指的是测试样本,从时间窗划分,原样本在前,新样本在后。一般情况下,建议开发样本的时间窗最好取3~6个月,测试样本的时间窗最好取1~3个月,具体也得看实际业务情况,选取的时间窗口数据能否满足开发的需求,这是很重要的。

此外,开发样本与测试样本时间窗不要有重叠,且间隔时间最好是相邻。举个例子,开发样本1~3月,测试样本4~5月。

08

Q:拒绝规则按照命中个数,稳定性怎么样,后续怎么迭代

A:可以采用PSI指标来监测规则的稳定性情况,优先监测规则区间的稳定性结果,然后关注变量本身多个区间的稳定性结果,这个工作是可以一次性出结果的,只是重点看规则区间的波动情况。

如果波动性比较大,先采用阈值调整,一般是缩小占比,以保证不同时间窗样本下比较稳定,区分度还是保持好的。如果阈值不好调整,那就需要将此规则直接弃用,或者与别的规则进行组合使用。

09

Q:几个拒绝规则的变量的IV为0.2左右,且变量也不是黑名单类的强拒绝规则,那这样把这几个拒绝规则做或运算的话,拒绝的客户量就比较高?

A:在规则开发时,优先对单一规则进行通过率与区分度分析,但在部署之前,务必要对所有规则的决策效果进行整体分析,以保证最终对业务影响的通过率和坏账率符合预期。因此,在开发出多个规则之后不会直接上线,还会做整体规则的应用分析,如果得到的通过率满足预期可考虑部署上线;若得到的通过率较低或较高,那需要对某些区分度较好的规则进行阈值调整,在保证坏账表现合理的情况下,适当放宽一点拒绝阈值。

10

Q:如果规则的首逾7天指标区分度高,但首逾30天逾期率区分度低,这种该怎么处理?

A:这是由于目标变量定义口径不同,使得目标变量的分布存在很大差异,规则的区分度自然也很容易变低,但根据这种情况来说规则效果变差的话,是不太合理的,开发某条规则,是定义好了目标才进行划分阈值确定规则的,既然是确定这条规则,说明区分度是比较好的,这和目标逾期几天没有什么关系的。

如果目标定义又发生了变化,那规则自然也得重新开发,对应的阈值一般也就发生了变化。因此,问题描述的情况从客观角度说,是不存在的。要理解一点,规则是定义好目标才开发的,而不是开发好规则再去变化目标定义的,这不是随便可以双向变化的,而是一个单向的流程机制。

END

以上内容参考:知识星球-第6期大咖直播课:风控策略规则开发与应用

更多总结内容,已更新至知识星球,各位星球会员同学可以扫码登录星球解锁查看。

优质回答的经验和策略_策略精选_策略优质回答经验怎么写

感兴趣的同学

可添加科科咨询报名学习

一键加入FAL知识星球~

即刻享受

全年不少于15次的行业大咖直播分享

↓部分主题课程截图↓

优质回答的经验和策略_策略优质回答经验怎么写_策略精选

往期回顾

【第1期】经济下行时的风险应对思路和管控策略

【第2期】金融三方风控数据的测试评估

【第3期】数字化客户关系管理建模培训

【第4期】“策略+模型”组合应用之矩阵分析

【第5期】SDK数据在风险中的挖掘和应用

【第6期】信贷风控策略规则的开发与应用

【第7期】汽车金融反欺诈体系揭秘

【第8期】信贷欺诈风险识别与策略规则

【第9期】时间序列分析在风控变量预测中的应用

【第10期】央行二代征信报告的变量衍生及信贷风险策略开发

【第11期】信贷反欺诈模型的开发实现与场景应用

【第12期】基于决策树的策略挖掘和特征生成

【第13期】金融通用场景下的数据基础分析方法

【第14期】小微指标体系构建框架与大数据实践

【第15期】多元风控模型实战分析与场景应用

【第16期】拒绝推论在策略的实战应用(含实操)

【第17期】数据建模与可视化应用之PowerBI

【第18期】贷中支用模型开发讲解

【第19期】车商额度类贷款产品风险管理体系介绍

【第20期】信贷额度策略制定

【第21期】汽车金融产品风控管理中可应用外部数据介绍(一)

【第22期】下沉客群风控新思路——贷前调额

【第23期】汽车金融业务风控体系0-1建设介绍

【第24期】小微信贷策略和模型体系搭建

【第25期】外部数据源测试流程——个贷应用讲解

【第26期】随机森林反欺诈规则挖掘

【第27期】模型特征衍生框架设计与离线数仓构建

【第28期】专项人群额度策略-房贷数据

优质回答的经验和策略_策略精选_策略优质回答经验怎么写


本文由转载于互联网,如有侵权请联系删除!