◎易红 吴凤辉
随着互联网金融的异军突起以及传统金融向互联网+的集体转向,伴随着金融业蒸蒸日上的发展的同时,我国金融风险也正逐步扩大,如信用卡逾期率、信贷坏账率、互联网借贷坏账率等皆出现了明显的增幅。为保证我国金融体系稳定,强化金融业的风控能力,通过探究通讯大数据对金融风控的作用从而将通讯数据引入金融行业,促进金融行业的大数据风控发展。
互联网发展促使了金融业务可以服务于更广大的群体,拥有更多的受众,但与此同时也进一步加快了金融风险的增长。其主要原因便是因为互联网的便利、快捷和隐秘等特点。便利的互联网可以让高风险客户轻易的去尝试各家银行的不同业务,通过更换信息去触碰规则、识别规则、躲避规则。快捷的互联网会缩短业务审慎周期,让业务规模与风险控制失衡,虽然提高了业务量,但同时也增加了风险。互联网的隐秘性也使得金融机构无法对客户进行准确和全面的了解,从而导致高风险的产生。
随着金融业务的不断线上化拓展,在增加金融服务便利性的同时也降低了金融欺诈的操作难度。一是纯线上业务拓展方式无法100%真实确认客户的信息和需求。许多欺诈团队会采用包括技术欺诈、包装公司、信息不全等问题,规避银行现有风控规则,进行欺诈操作,如冒用个人信息、杜撰个人信息、试探风控规则并修改重要信息等。二是数字化欺诈比传统欺诈更容易形成规模效应。传统欺诈需要由人员进行人工的包装和处置,而数字化欺诈抓准了金融机构的漏洞。通过了解金融机构的系统漏洞、规则漏洞、信息漏洞等问题使用某种技术手段即可实现批量的欺诈交易。三是数字化欺诈的实时性。因为互联网金融业务的发展使得金融交易时效性大大提升,纯线上的金融服务可能仅需几秒或几分钟即可完成,大大的提高了对数字化欺诈的防控难度。许多金融机构往往只能在大规模发现欺诈后再进行相关系统、规则、信息的优化。
银行业的互联网化发展正在拓宽银行机构的客户群体,由传统的高质量低风险客户不断向低质量高风险客户进行拓展,从而加速了风险敞口的扩宽速度。传统银行业务主要集中在为高资质客户提供抵、质押业务,该类业务金额较大且需本人到场签约,总体风险较低。随着线上线下业务的融合,银行机构在满足高质量客户的业务需求的同时,也逐步推出了更多便捷的中等额度和中等风险的新型业务,不过整体风险仍属于可控范围。但为了进一步扩大客户量,挖掘新客户,许多银行机构也陆续开展了纯互联网的业务,向高风险客户进行金融服务,从而提高了整体金融风险水平。
互联网金融业务风险主要依靠大数据风控,而大数据风控则主要依赖优质的数据源和科学的建模技术来完成。目前在数据源端主要存在官方数据不完善、科技巨头垄断等问题。以我国央行征信中心为例,虽然征信中心披露其收录了约10 亿人的信息,但其中具有信贷记录等金融信息的人群渗透率不足一半且多为银行机构判定为低风险的客户为主,相较于发达国家的100%覆盖仍有很大差距。
本次研究将通过逻辑回归技术对通讯数据和外部金融机构数据进行有效的样本分析,研究分析通讯数据对金融风险的有效性。
(1)样本情况。本次研究所用样本为某银行提供的消费信贷样本,样本平均额度为25 万元,申请时间为2019 年6 月至2019 年8 月,其中有手机号的共446 条,匹配申请前3 个月通讯客户数据,匹配445 条。
我们定义成功借款且未逾期的客户为好客户,占比78.56%,逾期超过30 天的为逾期客户,占比21.35%分析技术
本次样本研究将主要采用逻辑回归分析方式,通过对样本通讯数据的清洗、特征筛选、回归建模等方式建立相关数学模型并测试通讯数据在金融风险领域的应用有效性。
(2)分析结果。本次对该行的样本分析累计建立相关风险预测模型3 个,模型包括包括风控综合模型、疑似套现模型和多头借贷模型,风险预测模型详情如下:
(3)风控综合模型。风险综合模型是通过整合通讯数据中的入网信息、月账单信息、通话详单、位置信息和上网信息的综合模型,旨在辨识金融欺诈与预期风险的强弱。通过样本分布可以看出风控综合平台越高,用户预期情况越低。
(4)疑似套现模型。目前比较主流的APP 套现方式之一是通过申请MPOS 并以虚假消费的形式进行套现。疑似套现模型则是通过对采集的市面上绝大多数MPOS 所涉及的APP 进行相关分析并建模判断用户是否存在疑似套现行为。根据验证,存在疑似套现行为的用户逾期人数占比较高,存在更高的金融风险。
(5)多头借贷模型。由于单个用户的偿还能力是有限的,向多方借贷必然蕴含着较高的风险,所以在申请时提前了解用户目前的多头借贷情况,可以有效防范客户未来的还款风险。我们凭借自身的APP识别能力,从海量的上网日志数据和话单数据中,将使用贷款类APP 的行为逐一识别并进行区分,最终形成多头借贷分,用以衡量手机用户最近三个月内使用的贷款类APP 平台家数(分值越高说明使用贷款平台家数越多)。
通过对通讯数据的分析可以发现通讯数据对于金融风险识别和控制具有较强的区分能力。虽然通讯数据不是金融属性数据,但是行为习惯数据同样可以反映用户金融业务习惯,从而规避金融风险。一方面通过简单的行为习惯标签既可以识别用户信贷逾期可能性,如工作稳定性、手机欠费停机情况、终端品牌情况等。另一方面,通过对用户行为数据的综合建模分析,也可以发现通讯数据对用户的整体金融风险有着较高区分度,可以广泛应用于金融风控领域。
在我国金融风险日益扩大以及大数据风控数据缺失的情况下,通讯数据覆盖高、维度广、周期长、信息准等特点可以较好贴合金融机构对大数据金融的需求,让金融机构安全、加速的完成互联网业务的拓展,随着5G 和移动互联网产业的不断迭代渗透,通讯数据的规模和周期也都将进行巨大增长,帮助金融机构降低金融风险。