P2P网络借贷中借款人违约风险影响因素测度

2018-12-06 08:52骆之彬
新疆财经大学学报 2018年4期
关键词:借款借贷状况

骆之彬

(新疆财经大学,新疆 乌鲁木齐830012)

P2P(Peer-to-Peer)网络借贷是基于互联网技术的一种新的金融模式,可以不依靠金融机构等中介直接实现个人对个人的借贷。2005年世界第一家P2P网络借贷公司Zopa在英国成立,2006年美国第一家P2P网络借贷公司Prosper成立,2007年我国第一家P2P网络借贷公司拍拍贷成立,自此我国P2P网络贷款业务逐步发展。2014年和2015年,“互联网金融”两次被写入我国政府工作报告并被纳入国家十三五规划,在政策和市场需求的共同推动下,互联网金融特别是P2P网络借贷呈现出巨大增长,据“网贷之家”数据显示,平台数量从2014年的2376家增加到2017年的6348家,交易量由2014年的2528.17亿元增长至2017年的28048.49亿元。但伴随着P2P网络借贷的迅速发展,借款用户违约率也在不断增长,2014年—2017年间,问题平台由422家增加到2310家,交易量累计达到1193.27亿元。此外,借款用户违约风险的不断上升造成了互联网金融行业信用风险的不断累积,在一定程度上影响着我国的金融安全。因此,探寻我国P2P网络借贷用户违约风险影响因素,有利于减少违约用户,规范P2P网络借贷行业的发展,并促进经济社会健康发展。

一、文献综述

国内外学者对P2P网络借贷进行了大量研究,对P2P网络借贷风险评估的研究也很充分。在对P2P网络借贷风险测度方法的研究中,Angelini[1]运用神经网络模型对意大利中小企业从商业银行和互联网金融公司借款的数据进行了分类预测,认为用这一方法评估风险准确率较高,但因复杂性和过度拟合导致其泛化能力并不突出。Bekhet[2]运用Logistic模型和径向基函数两种方法对约旦商业银行信贷数据进行对比分析,发现Logistic模型准确率更高。杨胜刚等[3]运用决策树、神经网络和决策树—神经网络三种模型对德国商业银行信贷中心借款数据进行了实证分析,认为决策树—神经网络模型在准确率方面表现得更为出色。石庆焱和靳云汇[4]运用决策树、Logistic模型、判别分析、神经网络等方法对我国商业银行借款数据进行了比较分析,发现神经网络的预测准确率最高,但神经网络和决策树因过度拟合导致其泛化能力并不突出,其第一类错误(即贷款给信用差的用户)发生率最高,会造成比第二类错误(即拒绝贷款给信用好的用户)更大的损失,只有Logistic模型在实验数据和预测数据表现为犯错误概率相近,即泛化能力比较好。顾慧莹和姚铮[5]以及黄文彬[6]运用Logistic模型对WDW和拍拍贷平台数据进行实证分析,发现无论在准确率还是整体拟合程度方面这种方法均能得到满意效果。

再如在关于P2P网络借贷借款人违约影响因素的研究中,研究者通过分析归纳出的主要影响因素包括借款人基本特征、订单信息、信用信息和网络社会资本等。Prabhala[7]认为借款人基本信息(包括性别、年龄、婚姻和学历等)能显著影响违约状况。Roslan[8]认为女性比男性更趋于风险规避,更注重自身信用水平,因而女性违约概率明显低于男性。Kleimeier[9]通过实证分析得出结论,认为已婚人士因担负家庭重担而增加了其经济压力,可能导致违约率高于未婚人士。Greiner[10]通过Prosper平台数据研究认为,房产与P2P网络借贷违约呈负相关关系。Gonzalez[11]认为借款人还款次数、照片认证、手机认证、居住地认证等信用指标均对违约状况有显著影响。Emekter[12]和Baklouti[13]通过Lending Club数据发现,借款期限、借款总额和利率等订单信息会显著影响违约状况。Yum[14]认为在传统防范违约风险的基础上,通过建立社交网络和联合借款担保机制可降低信息不对称所带来的违约风险。Prabhala[7]指出网络社会资本是反映借款人信用状况的一个重要信号,其复杂程度决定了贷款可能性的大小、利率的高低以及违约可能性的大小。顾慧莹[5]和谈超[15-16]等人通过人人贷和微贷网数据进行实证分析,认为年龄、性别、职位、收入、婚否、学历和房产等对违约状况产生显著影响,可作为平台判断借款用户是否会违约的主要依据;同时认为历史违约次数、借款次数、工作认证和实地认证等信用信息也可影响借款用户违约状况。

通过对现有文献的整理可以发现,无论采取何种研究方法评估P2P网络借贷违约风险,都要在准确率以及第一类错误发生率和第二类错误发生率之间进行平衡。笔者认为尽可能减少P2P网络借贷投资者及平台损失,降低第一类错误发生率是关键,故倾向于选择准确率相对较高且第一类错误率较低的Logistic模型。此外,现有文献中关于P2P网络借贷违约风险影响因素的定量研究较少,多数研究都集中在模式的比较、风险因素的定性以及国家和相关部门的政策监管等方面,本文拟利用真实的活跃交易数据探究P2P网络借贷违约风险影响因素,并测度其对违约发生的贡献率。

二、变量的选择及测度方法的确定

(一)变量的选择

1.违约风险的选择。本文选择违约状况作为度量违约风险的因变量。违约状况可分为违约用户和正常用户,违约用户包括借款订单死账和逾期还款用户群体,正常用户包括借款订单正常完成和正在如期还款用户群体。

2.违约风险影响因素的选择。通过国内外相关理论研究以及P2P网络借贷平台的实际操作可以发现,订单信息、信用信息和个人基本信息是P2P网络借贷违约的几个主要影响因素;同时还有一些研究者和P2P网络借贷平台也很关注借款用户网络社会资本这一因素。本文借鉴既有研究,将P2P网络借贷违约风险影响因素概括为:订单信息(包括年利率、借款期限和借款总额),信用信息(包括申请借款次数、还清笔数、手机认证、居住地认证和信用报告等),个人基本信息(包括性别、收入、学历、房产、房贷和车产等),以及借款用户网络社会资本(包括工作时间和微博认证等)。关于借款用户网络社会资本,国外研究者主要关注相关论坛,而国内研究者和P2P网络借贷平台较多关注微博这一媒介,同时本文将工作时间也归为网络社会资本因素。将以上4个方面共16个维度作为影响违约状况发生的因变量,所构建的指标体系如表1所示。

表1指标体系

(二)测度方法概述

1.模型的确定。线性回归要求因变量必须是连续型数据变量,逻辑回归要求因变量必须是分类变量,本文将借款用户分为违约和非违约两类,违约记为1,非违约记为0,故选择Logistic回归模型以完成对非连续变量的分析,用到的方法为极大似然估计法,以下对其进行简单介绍。

当违约发生(Y=1)时有:

E(Y)=P(Y=1)=P=β0+β1x1+β2x2+…+βnxn+ε

(1)

对P进行Logit变换可得:

Ln[P/(1-P)]=Logit(P)=β0+β1x1+β2x2+…+βnxn+ε

(2)

(3)

当P大于0.5时,Y更可能为1,反之Y为0。P/(1-P)表示事件发生与不发生的概率之比,因此当Xi增加一个单位时有:

Ln(A/Xi+1)=Ln(A/Xi)+β1

(4)

当其大于0时,说明Xi每增加一个单位,违约概率增加,反之违约概率减小。

极大似然估计可以弥补最小二乘导致的局部最优问题,目标函数就是对数似然函数,其结果为高阶连续可导凸函数,因此可通过一些凸优化算法求解,比如梯度下降法、牛顿法等。似然函数表达式为:

(5)

2.模型的检验。通过Logistic模型对人人贷平台用户违约风险进行验证分析,其预测准确率为96%,通过十字交叉检验分析其AUC值为98%,可见其准确率和泛化能力均满足研究及现实需要,不仅在模型复杂度相近的情况下优于其他模型,而且能平衡处理准确率和泛化能力之间的关系。因此,本文采用Logistic模型测度P2P网络借贷用户违约风险。

三、违约风险影响因素的测度

(一)数据来源

人人贷是我国P2P网络借贷平台中用户量较大且违约率较低的优质平台之一,其用户主要以中小投资者为主。本文选取近3年人人贷网站上发布的全部借款信息作为初始样本,通过数据爬虫在人人贷官方网站上抓取19123条数据,去除含缺失值和不合适的数据后,最终确定剩余18597条为有效数据,其中正常用户数据14347条,违约用户数据4250条。

(二)违约影响因素的度量

1.描述性统计。表2是运用R软件对获取的数据进行基础分析所得到的结果。由表2可知,P2P网络借贷的平均利率为12.98%,约为银行活期存款利率(0.35%)和一年定期存款利率(1.5%)的37倍和9倍,因此能吸引大批有投资需求和投资能力的投资者,但也在一定程度上增加了互联网金融的风险;平均借款金额约为58642元,借款额度较低,属于小额借贷的范畴;平均借款期限约为30个月,最短为3个月,可见总体借款期限较长;男性借款人数占总借款人数的75%,可见男性是网络借贷的主力军;借款群体的平均学历水平为中等偏高,月平均收入约为14000元;约70%的网络借贷用户有房产,但仅有30%的用户拥有车产;从申请借款次数和还清笔数来看,平均申请借款次数为1.5次,但平均还清笔数约为0.93笔,两者之间存在较大差距,可能导致投资者和网贷平台产生损失;手机认证、居住地认证、微博认证、信用报告详尽用户群体平均所占比例分别为26%、4%、2%和17%,可见网贷平台审核部门并未完全尽到严格核实用户信息责任。借款用户平均工作年限为2.56年,工作时间较短,属于相对不稳定的用户群体。

表2变量的描述性统计

续表2

变量名MeanSdMaxMinSkew还清笔数0.931.1268030.9手机认证0.260.44101.11居住地认证0.040.19104.94信用报告0.170.37101.78工作时间2.562.37811.41微博认证0.020.12107.96

2.实证分析。在对模型进行实证分析之前,需要指出的是,解释变量过多可能会产生变量之间的共线性问题,进而导致模型参数的置信区间过大,使单个系数解释起来变得非常困难,因此需进行多重共线性检验。本文使用方差膨胀因子(VIF)进行检验,在剔除是否担保和成功借款次数两个变量之后,最终所有变量的方差膨胀因子(VIF)均小于4,表明不存在多重共线性问题,可以进行Logistic回归分析。各变量的VIF值分别为:年利率1.2、借款期限2.84、借款总额1.35、性别1.05、申请借款次数3.05、还清笔数2.73、收入1.25、房产2.04、房贷2.28、车产1.41、工作时间2.33、手机认证2.32、居住地认证1.16、信用报告1.89、微博认证1.1,学历1和学历2的VIF值分别为1.56和1.68。

进一步地,将违约状况作为因变量,其余变量作为自变量,利用R软件可建立Logistic回归模型,得到的回归分析结果见表3。其中Estimate表示偏回归系数,Std.Error表示标准误差,df为自由度,p值表示显著性水平,OR值表示自变量对因变量的影响,weight表示该变量对因变量影响程度的占比。

表3 Logistic回归结果

注:***表示在1%的水平上显著;**表示在5%的水平上显著;*表示在10%的水平上显著。

由表3中的t值和p值可知,除性别和居住地认证变量之外,其余解释变量均在1%的显著水平下显著,性别变量在10%的显著水平下显著。借款期限、借款总额、性别、学历、还清笔数、房贷、车产、信用报告和微博认证等系数为负,能降低违约发生率,故对违约发生率来说是保护因素;年利率、申请借款次数、收入、房产、工作时间、手机认证和居住地认证等系数为正,能提高违约发生率,故对违约发生率来说是危险因素。此外,借款期限、手机认证、还清笔数、工作时间、申请借款次数、房贷、信用报告、居住地认证、房产等变量对违约率的影响程度较大,因而从经济性角度来说应作为重点考察项,其他解释变量可作为辅助考察项。

从订单信息(权重合计占比为28.798%)来看:借款期限(权重占比为27.903%)对违约状况是保护因素,借款期限越短的用户违约可能性越小,而借款期限越长的用户违约可能性越大。这是因为借款期限长的用户可能对其在贷款用途或者风险控制等方面较难进行全面监管,这将增大借款风险;相反,借款期限较短可能是个人或者企业出现暂时性资金紧张,借款只是用来过渡,因而大多数投资者会选择借款期限较短的用户。大多数P2P网络借贷平台都会设置借款期限的上限以控制资金使用风险,因此借款期限不会太长。另外,该变量权重较大,说明其对违约的发生起到较大影响,故平台应重点关注用户的借款期限。借款总额(权重占比为0.076%)对违约状况也是保护因素,这是因为当贷款的金额比较大时,一旦发生违约带来的损失就比较大,因此大多数P2P网络借贷平台在放款审核尤其是大额借贷审核时都会比较严格,并会设定借款额度上限以规避风险,这也在一定程度上致使P2P网络借贷具有小额贷款的性质。年利率(权重占比为0.819%)对违约状况而言属于危险因素,即年利率的增加可能导致违约概率增大。这是因为低质信用用户因借贷困难会采取提高利率的方式以吸引并麻痹投资者,而优质信用用户并不会通过提高利率的方式来获得借贷资金,这种现象长期存在可能会导致低质用户驱逐优质用户情况的发生。

从信用信息(权重合计占比为50.689%)来看:手机认证(权重占比为22.489%)和居住地认证(权重占比为2.433%)对违约状况均属危险因素,即这两个变量会加大用户违约的可能性。这可能是因为审核人员通常会对其他条件不符合标准的用户采取以上两种认证方式,只要用户其他必要条件符合放款要求,审核人员通常会直接放款,因而采用这两种认证方式的用户通常质量不高。申请借款次数(权重占比为10.042%)对违约状况同样属于危险因素,即申请借款次数增加可能导致违约概率增大。因借款次数增加可能是用户信用或资金状况持续恶化或者审核多次被拒所致,故两者呈现反向影响关系。还清笔数(权重占比为13.022%)和信用报告(权重占比为2.703%)对违约状况属于保护因素,即这两个因素能降低违约发生的概率。借款还清笔数多表明用户信用状况良好,能积极主动履约,而信用报告越完善或者等级越高则意味着用户主动履约的可能性高进而可以降低违约风险。此外,手机认证和借款还清笔数对违约状况影响较大,因而应将其纳入审核人员的重点审核范围。

从网络社会资本(权重合计占比为12.125%)来看:工作时间(权重占比为11.628%)对违约状况属于危险因素,即工作时间的增加会导致违约发生可能性的提高。这是因为随着借款用户进入社会工作年限的增长,用户对个人信用的重视程度可能会下降,或者伴随着各种开支的增加,用户还款压力增大,这些都会导致违约发生。工作时间对违约状况的影响权重相对较大,故而应引起审核人员的重点关注。已认证的微博用户相比未认证的微博用户来说其好友数量更多,而通常个人信用状况会影响朋友之间的印象和认知,进而在一定程度上影响朋友间的友情,因此微博认证(权重占比为0.497%)对违约状况属于保护因素,即已认证的微博用户通常违约发生的概率会较低,但因其权重较小,对违约状况影响并不大,因而可将其作为辅助考察项。

从个人基本信息(权重合计占比为8.388%)来看:房贷(权重占比为5.048%)对违约状况属于保护因素,即有房贷的用户发生违约的概率较无房贷者小,这是因为有房贷的用户通常已通过银行系统的信用评估,属于信用良好群体;此外,这一变量对违约状况的影响权重较大,故相关审核部门应重点关注房贷信息。房产(权重占比为1.160%)对于违约状况属于危险因素,这可能是因为拥有房产的用户认为自己日后与银行或者其他金融机构产生业务往来的可能性较小,故会降低对自身信用状况的重视程度,因此拥有房产的用户通常比无房产的用户违约可能性大。另外,性别(权重占比为0.737%)、学历(权重占比为1.330%)、收入(权重占比为0.066%)、车产(权重占比为0.047%)等变量对违约状况均存在显著影响,但其作用程度相比其他解释变量来说相对较小,故可作为辅助考察项。

此外,对于回归模型的讨论,除评价模型变量的相对重要性之外,还有一项重要内容就是评价模型的泛化能力。本文采用十字交叉检验和模型预测准确性对模型进行泛化能力检验,由表4可知,交叉检验的R2值为0.683,表明模型整体拟合程度较好。

表4检验及预测结果

对模型预测准确性进行的检验如下:随机抽取样本量的80%作为训练集,利用训练集训练回归模型,剩下的20%作为测试集来检验模型预测的准确率,即模型的泛化能力。由表4可知,该模型预测的准确率为0.96。AUC值是一个概率值,其值越大表明当前的分类算法越有可能将正样本排在负样本之前,即能够更好地进行分类。由表4可知本研究AUC值为0.98,可见该模型能够很好地区分违约用户和正常用户。

四、结论及启示

(一)结论

实证研究结果表明,订单信息和信用信息能显著影响P2P网络借贷借款用户的违约状况,其权重合计占比分别为28.798%和50.689%。各指标影响权重从大到小依次为:借款期限27.903%、手机认证22.489%、还清笔数13.022%、申请借款次数10.042%、信用报告2.703%、居住地认证2.433%、年利率0.819%、借贷总额0.076%。个人基本信息中,房贷和房产权重较大,分别为5.048%和1.160%,性别、学历、收入、车产等变量对违约状况的影响权重较小,分别为0.737%、1.330%、0.066%和0.047%。此外,借款用户网络社会资本中工作时间和微博认证均对违约状况有显著影响,工作时间影响权重较大,为11.628%,微博认证影响权重较小,为0.497%。

(二)启示

1.加强对订单信息和信用信息的审核。目前,P2P网络借贷平台普遍过分关注借款用户的基本信息,而在一定程度上忽略了订单信息和信用信息的重要性。根据实证研究结果可知,订单信息和信用信息对违约状况发生的影响权重合计达到79.487%,因此相关部门应根据实际情况及时调整审批程序和重点关注的信息,加大对订单信息和信用信息的审核力度,尽量规避违约风险。具体而言,P2P网络借贷平台可重点关注利率高、借款期限较长和借款金额较小的用户,关注用户是否完成各项认证及其借款次数和还款笔数等信息;此外,P2P网络借贷公司应建立相关的规章制度监督工作人员的各项工作,还可聘请相关领域的专家对违约风险进行防范和应对。

2.拓展借款用户网络社会资本考察路径。Prosper、Lending Club和Zopa等P2P网络借贷公司因极低的违约率成为行业标杆,完善的征信体系是其降低违约率的重要方法;同时,这些网络借贷公司非常关注借款用户的网络社会资本,除了传统的网络社交媒介之外,甚至建立了借款用户论坛,用户的论坛活跃度和社交圈大小也成为其在借款审核中的重要考量因素。我国P2P网络借贷公司应借鉴违约率较低公司的有益做法,结合自身实际,建立适合我国国情的网络社会资本媒介平台,拓展借款用户网络社会资本考察路径,充分发挥其在降低违约风险方面的积极作用。

3.完善征信体系。征信体系是影响P2P网络借贷行业发展的重要因素。我国征信体系不完善,这在一定程度上阻碍了P2P网络借贷在我国的发展,高违约率扰乱甚至阻碍了我国P2P网络借贷行业的健康发展。因而,今后应尽快完善征信体系,P2P网络借贷行业应主动推进行业自律协会建设以及行业内数据库的建立和完善,各P2P网络借贷公司也应建立失信人员黑名单系统并积极推进共享系统建设。

猜你喜欢
借款借贷状况
声敏感患者的焦虑抑郁状况调查
微信上小额借款 请务必通话确认
妻子的借款该如何认定债务关系呢
2019年中国国际收支状况依然会保持稳健
让民间借贷驶入法治轨道
第五节 2015年法学专业就业状况
信息不对称下P2P网络借贷投资者行为的实证
一张图看懂民间借贷“防火墙”
一般借款利息费用资本化金额确定之我见
民间借贷年利率超过36%无效