我国P2P网贷平台大数据风控应用研究

2016-11-07 07:15江乾坤常梦瑶
财会研究 2016年8期
关键词:风控网贷信用

■江乾坤 常梦瑶

我国P2P网贷平台大数据风控应用研究

■江乾坤常梦瑶

我国P2P网贷平台正面临风险控制难题,应用大数据风控是其可持续发展的重要议题。本文从P2P网贷平台大数据风控的定义、特点与模式比较出发,回顾了大数据风控在我国P2P网贷行业的应用现状,剖析了其数据共享、真实性、制度缺失、数据处理复杂等应用不足,建议加强征信体系专业化建设进程,提高大数据真实性处理能力,完善大数据制度建设并加大风控模型的研发投入。

P2P网贷平台大数据风险控制

据网贷之家数据显示,截至2016年6月底,我国P2P网贷平台累计达4127个,网贷行业累计成交量为22075.06亿元,预计全年网贷行业成交量或将突破2万亿元,但全国网贷问题平台数累计数也超过2000家,部分P2P平台坏账率高达20%以上。虽然许多网贷问题平台属于“伪互联网金融”,其创新“异化”行为随着监管部门的专项整治而被清理整顿(江乾坤和陈文瑶,2016),但P2P网贷平台的高利率—高风险特性带来的风险控制难题却会长期存在。事实上,P2P网贷平台之所以能在国际范围内快速崛起,它本身是“互联网+”时代技术变革的产物,其创新优势在于摒弃传统的信贷风控模式,运用大数据技术深入挖掘数据建模的可行性,通过完善的数据征信来破解信贷风控难题。因此,研究如何运用大数据技术进行风险控制将是我国P2P网贷平台可持续发展的重要议题。

一、P2P网贷平台大数据风控的定义、特点与模式比较

(一)大数据风控的定义

大数据风险控制(简称“大数据风控”)是指通过运用大数据构建模型的方法对借款人进行风险控制和风险提示。大数据并不单纯指数据量的增加,最重要的是发现曾经忽略的数据的价值(刘新海,2014)。

(二)大数据风控的特点

1.风控数据维度大。大数据风控最大的优势就是丰富了信用风险评估的数据纬度,这些用户行为信息,很大程度是大数据采集和分析的结果,用户一般是不会提供给金融行业的。

2.风控数据实时有效。数据是有时间价值的,实时有效的数据对于风险评估结果影响很大,滞后的数据会影响评估结果,不能反映实时的风险变化。大数据信用评估体系更看重用户现在的信息。

3.信用评价结果精准。“互联网+”时代,只有大数据技术才能从庞大的碎片化数据中准确识别用户的信用情况。大数据风控模型将海量数据纳入风控体系,并以多个风控模型进行多角度分析,评分结果更加全面准确。

(三)模式比较

大数据不仅是一种资源,而且是一种商业思维拓展和技术方法创新。从美国借贷市场的信用风险评估模式比较来看(表1),小数据时代有经过60年打磨的传统风险评估模式—评分卡建模技术,如FICO(Fair Isaac Company,费埃哲)、Lending Club等,大数据时代则引入了大数据风险评估模式—机器学习技术,如ZestFinance、Kabbage等(张杰,2016)。

对比两类风险评估模式可知:

第一,大数据风险评估模式的服务人群更广泛。传统风险评估只能服务有丰富借贷记录的借款人,而大数据风险评估还可以服务无信用记录或信用记录不好的借款人。ZestFinace能够让信用记录不完整或不够完善的人群公平地享受金融服务。在FICO的征信体系里,有15%的人是没有信用记录的,而ZestFinace就是要给没有被传统征信体系覆盖的人群解决贷款问题。

第二,大数据风险评估模式的数据来源与数据格式更全面。FICO评分仅采用借贷数据,而ZestFinance采用了大量非传统的信用数据,包括电子商务、社交网络、搜索行为等,传统信用数据的比重仅占到40%左右。FICO信用分数所包含的贷款人的变量一般只有几十项,而Zest Finance模型包含的变量数以万计,它搜寻极多、极边缘的变量。比如申请人电子邮件所使用的用户名,申请人填写申请表时的大小写习惯,是否拥有预付款或已付全款的手机等。Zest Finance将成千上万的信息数据联系起来,就可以勾画出一个人的精确图景。

第三,大数据风险评估模式的建模方法更科学。FICO主要运用可解释性强的线性模型,不注重算法本身,将大部分精力关注在建模的过程管理和数据的预处理等方面,如响应变量定义、逾期滚动率分析、表现期时间窗选取、格式转换、缺失值处理、分箱选择、变量稳定性分析等。Zest Finance则重点关注表达能力更强、准确率更高的非线性模型,如梯度提升树、随机森林、神经网络、张量分解等。让机器代替人工去衍生更多的变量并作出筛选,从而可以利用到更多的弱变量(张杰,2016)。

第四,大数据风险评估模式的变量个数更丰富。FICO评分一般拥有500个数据项,从中提取50个变量,利用一个预测分析模型做出信用风险量化评估。而Zest Finance模型往往要用到3500个数据项,从中提取70,000个变量,利用10个预测分析模型进行集成学习或多角度学习,最终得到消费者信用评分。

第五,大数据风险评估模式的运行效率更高效。Zest Finace模型与FICO评分相比,效率能够提高90%,它在5秒钟内能对每位信贷申请人的超过1万条原始信息数据进行分析,并得出超过7万个可对其行为作出测量的指标。此外,Zest Finace在风控方面也有很好的改进,能把相关贷款人违约率降低将近50%。

表1 美国借贷市场两类信用风险评估模式的比较

二、大数据风控在我国P2P借贷行业的应用现状

(一)总体情况

2013年互联网金融兴起伊始,P2P网贷平台主要是作为传统金融的补充,服务对象瞄准的是传统金融覆盖不到的小微企业主和个人,提供的借款与传统银行信贷差异不大,只是额度更低、限制条件更宽松、期限和还款方式更灵活,在风控环节仍是延续银行的做法:以央行征信报告为主要数据源,以专家经验或专家规则为评判策略。2015年初,央行释放出了个人征信市场化的信号,“大数据”开始逐渐被P2P网贷行业的风控人员所接受,一些数据被证实可以做为征信报告的有效补充,例如移动设备信息用于识别身份冒用、黑名单灰名单用于识别多头负债、位置信息用于评估稳定性、页面行为分析用于识别欺诈、消费记录用于评估可支配收入水平,社交关系用于评估信用行为等(张杰,2016)。

目前,我国P2P网贷行业的大数据风控应用仍处于初级的“数据”阶段,“市场先行,风控滞后”的局面有待改善。不过,一些P2P网贷平台逐渐重视大数据风控技术,推出了各具特色的模式。(1)极速模式。2014年10月7日,宜人贷正式将“极速模式”添加进“宜人贷借款”APP中。该模式应用了大数据技术,通过积累的海量数据和算法模型,深入分析用户各方面的信息,以做出是否贷款及贷款额度的决策。宜人贷可做到1分钟授信,10分钟批贷,批贷额度最高可达10万元,平台月费率在0.78%。这一切都由计算机在后台完成,大大节约了线下审核时间。(2)积木盒子模式。2014年11月份,积木盒子开始组建金融大数据中心,主要在贷前审查、贷后管理上进行应用。大数据中心负责对个人数据进行采集、加工和决策。最明显的信用贷“读秒”,积木盒子大数据中心会根据用户提交的电商消费数据、银行卡信息和手机通话信息,来判断用户的信用等级,是否符合“读秒”标准,最后决定是否通过这笔借款。(3)BeeR.C.密风控。乐金所拥有自主研发的大数据风控成果—BeeR.C.密风控。首先,BeeR.C.密风控会对个人借款人以及相关企业法人的真实身份进行验证,确保借款人信息的真实可靠。其次,BeeR.C.密风控将借款方五个风控指标调查数据分数,导入企业贷款,及抵押类贷款两大产品类型8种以上的风险控制模型,计算出BAA,BA,BB,BC,BD,BF六种信用级别,分值范围在180至1100分之间,根据每个贷款产品的贷款策略和标准,以及每种产品相对应的风险水平,决定可以接受的信用分数水平。最后,风控委员会根据分值召开决策会议,决议“同意”、“否决”或“要求补充担保品”。

(二)拍拍贷的魔镜风控系统

2015年3月24日,拍拍贷正式发布其历经八年自主开发、具有自主知识产权的“魔镜风控系统”。该系统依托600万在线用户、已经积累近40亿条数据,被认为是行业内首个基于大数据的风控模型,首个能准确预测借款标的风险概率的风控系统,也是首个能基于准确风控评级、制定风险定价的风险管理系统。

在大数据采集阶段,与传统银行的风控考察借款人的70-80个数据维度相比,魔镜风控系统采用2000多个数据维度,平均使用400个数据维度来评价一位借款人(李先瑞,2015)。该系统既沿用了传统银行征信体系的决策指标,又纳入了海量互联网行为数据。多维度的大数据征信信息可对借款人从不同角度精确描述和深入量化其信用风险,其数据来源如表2所示:

表2 魔镜风控系统的大数据来源

图1 拍拍贷公司利用大数据技术构建的全自动风控系统

在大数据分析阶段,拍拍贷构建了三个完备的全自动风险控制系统(如图1):反欺诈系统、魔镜评级系统和风险定价系统服务。魔镜等级将很大程度影响到借贷人的借款成功率、最终借款利率、最高借款额度等。通常来讲,借贷人的信用等级越高,其违约率越低,贷款成功率越高。针对每一笔借款,风险模型会给出一个风险评分,以反映对逾期率的预测。每一个评分区间会以一个字母评级的形式展示给借入者和借出者。从AAA到F,风险依次上升,例如AA的目标逾期率小于0.1%,F级则大于10%。

最后,根据以上三个风险控制系统来准确把握对借款人是否放贷、放贷额度和放贷利率,有效避免违约风险。

三、我国P2P网贷平台大数据风控存在的问题

(一)信贷数据严重不足,各平台的数据彼此孤立

获取足够多的信贷数据对于提升P2P网贷平台风控能力至关重要,海量的数据才能建立更准确的风控模型。然而,我国银行业信贷风险管理起步较晚,信贷数据积累不足,没有建立一套完整、连续的基础数据库。我国央行征信系统覆盖的人群非常有限,远低于美国征信体系对人口85%的覆盖。近年来,社交数据、网购数据、通信数据等为P2P网贷平台获取并有效利用信用数据提供了新源泉。大数据真正的技术含量和价值体现在数据提取与利用上,它应该是由不同企业、不同部门共享而成,进而真实、动态地反映个人与企业的经济状况及信用等级。不过,目前各个企业对数据大多抱着封闭独享的态度,数据与平台之间彼此孤立,难以形成共享的数据链和数据网,而这恰恰是大数据风控所必须的。此外,各个信用机构的评分依据不能完全迁移,这在某种程度上也限制了数据的体量和维度。

(二)大数据质量存疑,真实性难以判断

首先,社交数据并不能准确反映个人信用评级。美国最大的P2P平台Lending Club曾尝试通过用户在Facebook上的表现来确定其信用度,最终遭遇失败。美国很多大数据征信公司的信息错误率高达50%(巴曙松,2016)。宜信曾大费周折的收集借款人的社交数据,最后发现社交数据根本不能用。其次,交易数据严重失真。目前许多电商平台的“刷单”现象严重,一种是商家找所谓的消费者进行“刷单”,卖家买快递单号,其收件人和寄件人与实际的买家、卖家不一致;另一种是快递公司发空包,但快递公司并未完成配送,而帮助商家完成平台上的物流信息(齐爱民,2015)。

(三)大数据相关制度缺失,数据泄密情况严重

中国互联网信息中心发布的《2015年第35次中国互联网络发展状况统计报告》显示,46.3%的网民遭遇过网络安全问题,我国个人互联网使用的安全状况不容客观,大规模数据泄露事件时有发生。在数据收集和使用过程中,许多数据会涉及个人隐私。美国对个人隐私的保护是有明确边界的,而目前我国关于互联网个人隐私保护和信息安全的相关法律还很薄弱,个人数据泄露事件频频发生,小微企业的商业秘密保护问题也不乐观。如何高效、适度地开发和使用大数据,不仅仅是一个技术问题,更是一个社会问题。这些泄露的数据大量流入数据黑市,造成了用户安全、企业安全甚至国家安全方面的连锁反应(齐爱民,2015)。数据的收集和使用在很多时候没有征得数据生产主体的同意,不仅导致数据滥用和隐私泄露,而且容易引起数据生产主体的抵制。

(四)大数据技术要求高,数据处理异常复杂

传统信用体系的数据处理变量相对较少,且各个变量之间彼此相关,对变量进行建模分析时可对每个变量精确分析并最终得到相对透明的结果供使用机构参考。但是,大数据时代征信机构使用的数据变量数庞大,变量之间无必然因果联系,基于大数据的数以千计的变量规模和多模型使得数据的处理和模型的解释变得异常复杂,在实际应用中带来诸多麻烦。超大规模的数据存储和云平台数据分析对计算机的存储与计算能力的要求也会越来越高。

四、完善我国P2P网贷平台大数据风控的建议

我国P2P网贷平台大数据风控的有效运用仍然存在许多障碍,但在消除障碍、解决问题中前行是其可持续发展的必然趋势。为此,本文提出如下建议:

(一)加强征信体系专业化进程

拥有优质数据资源的公司通常形成数据孤岛,并不能很好互通,而数据获取是P2P平台征信面临的首要问题。首先,应允许P2P网贷平台接入大数据信用数据库,实现各方面信用平台的有效对接,并注意建立违约披露机制。其次,鼓励设立专业化的征信数据服务机构。如蜜蜂数据建立的一站式征信服务平台,与多家P2P平台实现了对接,提供专业化征信服务,并建立网贷黑名单,提供失信人曝光等服务。第三,要精细化征信范围。

(二)提高大数据真实性处理能力

P2P网贷平台在应用大数据建模时应注意剔除无效数据,避免数据误导。对不同类型的借款人采用不同的评分细则,根据职业、借款用途等做出精准划分。尤其是对借款用途为企业经营的借款人,不应套用个人借款的信用审核模型,应就企业借款建立专用的信用审核模型,提高模型准确性和平台风控能力。

(三)完善大数据制度建设工作

应当明确个人信息的外延边界,明确区别个人信息与个人隐私。在现有国家和地方个人信息保护立法实践的基础上制定个人信息保护的专门法。设立个人信息监督管理机构,避免多头监管带来的问题,强化个人信息保护的事前监管。

(四)加大风控模型的研发投入

ZestFinance优于传统信贷机构的重要原因之一就是其强大的数据挖掘能力和模型开发能力:基于多角度学习的预测模型,模型及时更新而且不断细化。相比而言,我国P2P网贷平台需要加大对量化的信用风险分析的研发投入,适应大数据风控的垂直化、场景化发展趋势,开发适合中国国情的大数据模型,强化对数据与消费者的理解。

[1]巴曙松,侯畅,唐时达.大数据风控的现状、问题及优化路径〔J〕.金融理论与实践,2016(2).

[2]江乾坤,陈文瑶.我国P2P网贷平台创新“异化”现象探析〔J〕.商业会计,2016(11).

[3]刘新海,丁伟.大数据征信应用与启示——以美国互联网金融公司Zestfinance为例〔J〕.清华金融评论,2014(10).

[4]李先瑞.大数据征信破解小微企业融资困境探讨——以拍拍贷为例〔J〕.会计之友,2015(13).

[5]齐爱民,盘佳.数据权、数据主权的确立与大数据保护的基本原则〔J〕.苏州大学学报(哲学社会科学版),2015(1).

[6]张杰.大数据风控的场景化趋势——人人信〔EB/ OL〕.新浪网.2016(6).

[7]JinSFGZ.The Signaling Value of Online Social Networks:Lessons from Peer-to-Peer Lending〔J〕.2014.

[8]Fraiberger,Fraiberger,SamuelP.andSundararajan,Arun,Peer-to-Peer Rental Markets in the Sharing Economy[M].NYU Stern School of Business Research Paper,October 6,2015.

[9]Martina Pokorná,Miroslav Sponer.Social Lending and Its Risks〔J〕.Procedia-Social and Behavioral Sciences,2016,220:330-337.

◇作者信息:杭州电子科技大学会计学院教授

杭州电子科技大学会计学院研究生

◇责任编辑:张力恒

◇责任校对:张力恒

F275

A

1004-6070(2016)08-0059-04

本文系浙江省自然科学基金(Y15G020077):我国P2P网贷平台的风险因子挖掘与风险控制策略设计;浙江省杭电智慧城市研究中心(ZXZH1401010):数据挖掘与决策支持研究。

猜你喜欢
风控网贷信用
为食品安全加把“信用锁”
P2P网贷中的消费者权益保护
新监管框架下银行的风控和内审体系
信用收缩是否结束
网贷平台未来亟需转型
网贷十年:迎来“去伪存真” 时代
信用中国网
宁波P2P网贷发展问题研究
信用消费有多爽?
银行双录的现状和问题