联邦学习+风控,会是信贷业务的N95吗?

联邦学习+风控,会是信贷业务的N95吗?

防传染,这三个字对信贷风控而言,有着双重含义。

除了和全社会一道抗击新冠肺炎,防止病毒的扩散,信贷领域更要面对风险溢出和传染的可能性。

疫情期间,企业现金流告急之际,借贷需求显著上升,金融机构也陷入了两难境地:开闸放水,有可能逾期一路走高;收紧风控,有可能失去更多客户。

不仅放贷机构们表示贷后管理难度大幅上升,系统性风险的长剑更是在行业上方高悬。

一位来自风控行业头部企业的高层表示了对系统性风险的担忧:面向小微企业主和消费者的信贷服务,正如同中国经济的毛细血管,是金融业触达到群众的最直接管道;政府在扶持企业、解决就业经济这些根源性难题的同时,也一定要防范系统性风险从信贷领域蔓延开来。

此时,风控在某种程度上变成了信贷业务的一道“口罩”,需要更准确有效地“过滤”风险。怎样在特殊时期为信贷业务保驾护航,这一问题也排在了各大风控技术团队的任务清单榜首。

牵一发动全身,信贷风控雪上加霜

一份关注小微企业的调研报告指出,有85%的企业,现金维持时间不超过三个月。

联邦学习+风控,会是信贷业务的N95吗?

这份报告由清华大学经管学院教授朱武祥和北京大学汇丰商学院管理学教授魏炜联合发布,报告称近30%的企业估计,疫情会导致2020年营业收入下降幅度超过50%;28%的企业预计,营业收入会下降20%-50%。

个体户或小小微客群的处境,只会比小微企业更加危险。这三大群体介于传统C端消费客群和企业客户,规模体量大,抗风险能力弱,授信情况和企业主个人息息相关。

而这些情况最直接的关联影响,其中之一就是小微企业贷和个人借贷的逾期大幅攀升,放贷机构显著承压。

有业内人士透露,国内一些放贷平台的首次逾期率环比增长7-8个百分点;更有甚者,首逾率相较于过往平均数暴增了四、五倍。

“首次逾期率是贷后管理的重要指标——当一个用户连初次还款都无法完成,机构会认为贷款后续更难收回。”

其他贷后管理指标的情况也不容乐观,入催率上升超过10%的不止个别平台,回款率也和历史水平有不小偏差。

放贷机构要面对的,除了借疫情逃债的“老赖”们,还有客群的收入下降或丧失所导致的还款压力。

有报道称,不少用户主动发起因疫情误工期望延期还款的诉求,不论是资金充足的持牌机构还是非持牌的互金机构,疫情延期还款诉求在春节后普遍占每日投诉量的20%以上,有的甚至高达50%,并逐日呈上涨趋势——这样的形势,对信贷风控而言无疑是雪上加霜。

短期来看,疫情造成的整体经济下滑同样会影响客户还款能力和还款意愿;从中长期来看,若因疫情影响收缩放贷规模,势必将打击市场信心及减缓经济重振趋势,进一步影响整体不良情况。

疫情期间,数据风控的“新伤旧患”

事实上,人工智能和大数据已经广泛运用到包括贷前风控在内的信贷业务全流程,通过机器学习等手段展开更高水准的风控建模并不少见。

一位资深风控专家向雷锋网AI金融评论介绍,以个人信贷为例,原来传统的模型搭建方式,经常是基于用户的信用信息,以人行征信报告为主,通过逻辑回归来判断用户整体风险。

而现在,得益于大数据下的信贷风控技术提升,除了强关联数据,非信贷场景下的弱相关变量也开始更多地被纳入考量。她表示,除了用户本人的基本资料和借贷记录,在判断个人信贷风险时,其网络行为、社交数据、消费记录等信息都能为大数据风控模型提供判断依据。

可以看出,数据无疑是信贷风控的源头活水,但想要获得海量、多维度的数据谈何容易。

由于缺少客户外部信息综合判断风险,贷前、贷中、贷后都需要采购多种数据源来辅助了解客户情况,信审过程中数据接口的调用费用极高,孤岛效应渐显。

同时,随着监管层鼓励发展普惠金融,贷款客群逐步下沉,客户信用资质更加参差不齐,这也使得数据获取难度提升,推高了信贷风控的整体成本。

风控数据获取成本之高,正如一处久治难愈的病灶,约束了信贷风控的进一步发展与提升。

而疫情期间的风控解决方案,更要重新审视数据的使用。究竟哪些新的数据维度需要被引入,原有的数据又该怎样挖掘。

要想更准确衡量疫情带来的影响,需注意地域上的不均等,因此在个人信贷业务上,风控建模首先要确定用户所在地,包括户籍地、移动运营归属地、行为轨迹等数据都要进入到模型当中。

其次,个人近期金融属性也是必不可缺的参考依据,例如短期内多头申请、兴趣偏好、社交网络、反欺诈识别、收入等情况,以供放贷机构评估延期后还本付息计划的可行性。

在中小微企业的“重灾区”,就需要引入经营稳定性、还款表现、企业所在行业、地区、近期现金流、及近期政府和监管支持政策等数据,做综合评估预测。

探索AI风控的新选择

疫情对AI金融风控的严峻考验远不只是数据层面,原有模型的效果也受到冲击。

AI建模的一项基本原则是“模型只适用于建模样本所能有效代表的群体”——在疫情这样的突发状况之下,“单机构、单个人的样本量相当有限,单独建模效果预估不够理想。”

在风控解决方案存在同质化、少突破、数据孤岛、建模效果差、隐私安全保护难等一系列问题的情况下,微众银行用“联邦学习”这种新范式破局风控中面临的数据挑战。

联邦学习,是指多个客户端(如移动设备或整个组织)协作式地训练模型的机器学习设置,该设置同时保证训练数据去中心化。

联邦学习+风控,会是信贷业务的N95吗?

  • 基于联邦学习的信贷风控解决方案,究竟有何特别之处?

“它的优势在于数据安全及隐私保护。”微众联邦学习团队给出了这样的答案。

“在建模过程中,双方交换梯度值,类似于方向向量的概念,交换的是中间变量,不是原始数据。同时对这个中间变量还进行了同态加密,所以数据并不会出库,保证数据源和应用方的数据安全。”

而联邦学习所采用的局部数据收集和最小化原则,将降低传统中心化机器学习方法带来的一些系统性隐私风险和成本,这样的效果也正契合了信贷风控的提升方向。

总的来说,这一做法是试图通过联邦数据网络进行信贷风控增强,在贷前环节利用更丰富的数据信息综合判断客户风险,帮助信贷公司过滤信贷黑名单或明显没有转化的贷款客户,进一步降低贷款审批流程后期的信审成本。

在贷中,采用联邦学习的解决方案主要提供根据用户放款后的行为变化进行的风险评估产品,帮助放贷机构进行调额调价的辅助决策。

对于贷后风险处置,方案则提供可以根据客户的行为进行催收预测的产品,帮助放贷机构进行催收的策略评估,调整催收策略,提升催收效率。

微众联邦学习团队表示,在具体实施上,解决方案会先行使用联邦学习云服务进行业务冷启动,并通过建立业务及AI模型闭环,小样本建模,后期持续迭代优化模型的方式,实现项目数字化,便于消费金融业务方及信贷合作方能够持续积累业务数据优化联邦模型。

  • 摸清技术路上“拦路石”,逐个击破

然而,团队首先要面对的,就是放贷机构样本量不足的难点,好坏样本的区分度也并不足够。

处理办法之一是业务方持续积累业务数据,或者在有可能的情况下从信贷机构等相关合作方获取更多同类Y数据,增加样本量;解决方案也可以设立长时累积数据。

最直观的解决方案当然是业务方通过长时间积累来扩充样本量;但联邦学习提供了新的解决思路:通过与其他机构合作,引入外部的样本数据。

当样本质量低下、过于偏离正态分布的时候,业务方就需要对样本进行持续筛选和重采样,与外部数据方实时同步数据资料,例如确认时间一致,剔除18年X对应19年Y等数据参差情况,使全量数据时刻保持基本符合正态分布。

此外,团队还通过引入数据方实现ID映射关系,打通不同ID之间,避免ID异构的问题出现。

而这一解决方案也开始有实际效益显现。该团队在采访中透露,通过合法合规的多维度联邦数据建模,风控模型效果约可提升12%,相关企业机构有效节约了信贷审核成本,整体成本预计下降5%-10%,并因数据样本量的提升和丰富,风控能力进一步增强。

联邦学习+风控,会是信贷业务的N95吗?

对合作方信贷机构而言,信贷风控能力也大幅度提升。

通过初审筛选掉黑名单和不可能转化贷款客户,在“信审漏斗第一步”减去无效客户,从而在信贷预审阶段使单接口调用成本预计节省20-30%,有效控制了信贷审核成本。

联邦学习奏AI金融明日之歌

目前国内外很多企业都在进行联邦学习相关的研究,但在联邦学习研究与应用方面,尤其是金融领域,微众银行可以说是先行者。

为什么是微众银行?团队表示,在业务实践和行业观察中,他们发现训练AI所需要的大数据实际上很难获得,数据的控制权分散在不同机构、不同部门。

同时,数据有限且质量较差,在某些专业性很强的细分领域更是难以获得足以支撑人工智能技术实现的标注数据。

从更宏观的视角来看,不同数据源之间也存在难以打破的壁垒:

除了少数几家拥有海量用户、具备产品和服务优势的「巨无霸」公司外,大多数企业难以以一种合理合法的方式跨越人工智能落地的数据鸿沟,或者对于他们来说需要付出巨大的成本来解决这一问题。

另外,随着大数据的发展,重视数据隐私和安全也已经成为一种世界性的趋势,GDPR等一系列条例出台,数据保护立法不断深化,大数据合规合作的需求也更为迫切。

于是,在首席人工智能官、国际人工智能专家杨强教授的带领下,微众银行从2018年就开展了联邦学习研究,内部已投入百余人,打造了一个覆盖技术上下游的联邦学习团队,包含研究、学术、研发、商业、行业应用等多个细分队伍,全力推动产学研一体化,实现包括金融、零售、安防等多个领域的行业落地。

团队透露,他们已申请100+项相关专利,牵头推进IEEE联邦学习国际标准与联邦学习国家标准制定。

研发方面,该团队还自研并推出了全球首个工业级联邦学习开源框架FATE。团队表示,这一联邦学习开源软件FATE具备较强易用性,传统建模知识和经验都可以复用,用户体验上和传统建模差异较小。

“所提供的FATE-Board建模可视化功能,极大提升了联邦建模过程的交互体验,也有效缓解建模技术人员的缺乏现状。”

2019年初,他们开始在信贷风控领域发力。

从着手研究到输出解决方案,用时不到一年——团队表示,微众银行在风控领域累积的大量案例及数据,都成为了他们攻克风控数据难题的助力。

银行的角色,既是他们研发的动力、攻克技术难关的优势,也是检验研究成果的第一站。

“这一解决方案的落地应用也是从微众银行内部开始,经测试,模型的AUC增加了14%,显著减少了手工评审的工作量和难度。”

在金融领域,微众联邦学习团队已经瞄准了更多赛道。他们表示,信贷风险管理、核保风险评估等具体环节都是联邦学习较为适宜的应用场景,下一步将通过联邦建模,渗透到业务各环节,辅助放贷实体建立自有模型进行信贷审核、深入保险业核保风险评估,切实应用于这两大场景的相关流程。。

研究成果也将在银行、保险等多个细分领域批量落地,以协助金融机构提升风险识别能力,实现普惠金融的新目标。

当金融机构陷入资产质量下滑、保营收求增长的困境,促使风控精细化管理,加强金融科技手段的使用,全面提升风控技术水平是势在必行。

经济环境充满变数,为这场多米诺骨牌局尽可能减缓疫情的冲击,正是风控存在的意义。

雷锋网雷锋网雷锋网(公众号:雷锋网)

雷锋网原创文章,未经授权禁止转载。详情见转载须知

联邦学习+风控,会是信贷业务的N95吗?

(完)