摘要:随着互联网金融的日渐火热,P2P网络借贷也越来越被大家所熟知。通过整理国内某借贷平台的交易数据,利用多元线性回归模型,以交易进度作为因变量,借款金额、借款利率、借入信用分和借款人的自身特征作为自变量进行数据分析。研究结果显示,投资回报率、借款人信用和借款期限是影响网络借贷交易进度的主要因素。
关键词:P2P网络借贷;交易进度;影响因素
互联网金融是借助于互联网技术提供的金融服务,而P2P网络借贷作为互联网金融的一个分支,是个体与个体之间、点与点之间的借贷方式,也是民间借贷的创新与延伸。自2007年8月国内第一家P2P网络借贷平台成立以来,这种新型的融资模式逐渐风生水起。尤其是十八届三中全会提出要大力发展惠普金融,更加助推了P2P网络借贷的迅速扩张。2013年国内P2P网络借贷平台的数量从最初的几家扩大到了目前的上千家,交易规模达到了近千亿元,无论从规模还是数量上来看,同比增长均有百倍之多。
一、P2P网络借贷模式简介
P2P网络借贷模式主要有三大类:单纯中介型,以 prosper和拍拍贷主要代表;混合中介型,以 Lengding club为主要代表;公益型,以kiva为主要代表。具体借贷模式及介绍见表1所示。
二、模型数据选取和变量分析
(一)数据选取
选择国内某借贷平台对其交易进度进行分析。考虑到时效性,在采集数据时间方面进行了严格的控制,即当天采集前一天的数据,并且采集时间均是在每天早上八点。在采集数据的方式上,利用数据抓拍软件火车采集器对数据进行采集。研究对象是网站平台上所公布的借款人的信息,从2013年10月至2014年3月之间的共5000组数据,其中发布成功的有4823组,失败的有177组,本文从所收集的4823组数据中提取了不重复的借款人信息,并剔除了部分信息不完整的数据,共得到有效数据3870组。样例详细信息见表2所示。
(二)变量介绍
1. 交易进度。该借贷平台每天都会公布借贷的完成进度等内容,以供投资者进行选择投资,并且每个借款人都会有一个所需借款的完成百分比,如果借款人已经筹集到自己所需的金额,将不再网站平台公布,所以借贷进度一般都在100%以内。
2. 借款金额。从借款人在借贷平台上所公布的金额来看,最高的金额为500000元,而最低的金额可以为3000元,仅就本文所选取的数据来看,平均借款金额为9944.76元。
3. 借款利率。该借贷平台所公布的借款利率范围在5%~26.24%,未超过银行所规定的基准利率的4倍。考虑到数据在处理时的方便性,本文在研究利率方面,对其扩大了100倍进行研究。
4. 借款期限。从该平台上所公布的数据来看,其借款期限最长为12个月,可知该平台上的借贷业务侧重于短期融资,从而可以有效降低债务风险。
5. 借款人年龄。对于借款人的年龄,该平台上将其分成了四段,分别是20~25岁,26~31岁,32~38岁,39岁以上。从年龄段的分类来看,20岁以下的借款人是不存在的,可能是考虑到这个年龄段的借款人的偿还能力的问题,所以在进行借款审核的时候并未将其纳入考虑的范围之内。
6. 借款人性别。借款人的性别也可能是影响投资者进行投资的因素之一,所以本文在研究的过程中也将其纳入了影响投资者投资的影响因素之一,考虑到此变量为名义变量,在研究的过程中需要转换为哑变量,所以将“女性”赋值为0,“男性”赋值为1。
7. 借款人身份。由于投资者进行投资,关注的是平台上所公布的借款人信息,主观性比较强,所以对于借款人的身份特征本文在研究的过程中也将其纳入考虑的范畴之内,该平台共将借款人分成了五大类:私营业主、网店卖家、工薪族、学生和其他。同样在研究的时候也将这些名义变量转换成了哑变量,分别将其赋值为1、2、3、4、5。
三、模型建立与回归分析
本文采用多元线性回归的方法,以借贷完成的交易进度作为因变量,以借款金额、利率、借款期限等指标作为自变量,从而进行多元线性回归。根据研究模型做出如下假设:H1表示借款利率越高交易进度越快;H2表示借款期限越短交易进度越慢;H3表示借入信用分值越高交易进度越快;H4表示女性借款人越多交易进度越慢。从而建立如下模型:
P=β0+β1C+β2I+β3T+β4B+β5A+β6S+β7W+ε
其中P代表交易进度,C代表借款金额,I代表借款年利率,T代表借款期限,B代表借入信用分,A代表年龄段,S代表性别,W代表身份,ε代表误残差项,β0,β1,……,β7分别代表相对应的系数矩阵。利用软件spss19.0,采用“进入”的多元线性回归方法,选择进入概率为0.05,剔除概率为0.1,得到如下回归结果,其中3870笔交易中的借款信息统计见表3。
从表3中可以看出,该借贷平台上的借款年利率的均值在16.47%,未超出银行标准年利率的四倍;借款金额在10000元左右,不属于大额款项的范畴;平均借款期限为9个月左右,未超过1年,说明在该借贷网站上的借款大多属于短期借款;就借款人的年龄段来讲,平均年龄在26-31岁左右,说明借款人大多为年轻人;性别方面,在采集的3870组数据中,有81%的借款人为男性,且身份为网店卖家和工薪族居多。其多元回归模型汇总见表4。
从表4中可以看出,模型共进行了四次迭代,并且最终DW检验值为1.514,模型的解释度为51.9%,从数据来看,DW值和解释度并不高,究其原因一方面由于网站可能所公布的数据有所误差,另一方面作为投资者,在选择投资对象的时候主观因素所占比例比较高,所以才会导致最终的结果。并且从模型预测结果看,进入模型的变量只有利率、借入信用分、金额和期限,而借款人身份、性别和年龄并未进入,说明投资者在选择借款人时,对于借款人的这三个因素并未考虑的太多。其系数统计见表5。
从表5来看,各个自变量T检验的p值均小于0.05,表明回归效果比较好,各个自变量对于因变量有显著影响,可以认定为回归系数有显著意义。从各个自变量之间的共线性容差来看,每个自变量的膨胀因子(VIF)都小于5,说明了模型中的自变量之间不存在共线性问题。就回归系数对模型进行假设检验分析,其结果是:H1支持;H2不支持;H3支持;H4不支持。
四、研究结论
本文以国内某借贷平台为例,研究了P2P网贷平台中交易进度的影响因素,从借款利率、借入信用分、借款期限、借款人年龄、借款金额、性别和身份7个解释变量出发,验证了交易进度与这些解释变量间的关系。通过建立多元线性回归模型,导入平台交易数据进行研究,得出如下结论。
从模型结果来看,借款年利率对于交易进度的完成有正相关作用,即利率越高,借款人越容易筹到钱,由此说明投资者更青睐于投资回报率高的借款人。
借入信用分值作为样本借贷平台审核借款人的信用状况的标准之一,代表了借款人所公布的个人信息的准确度,其对于促进借款进度的完成起到了积极作用,作为投资者,更愿意将钱借给信用度高的借款人。
从还款期限来说,还款期限对于交易进度的完成有负相关作用。期限越长,投资人的风险就会越大,所以,为了降低借款人的违约风险,大多数的投资人选择的是还款期限比较短的借款人。
借款人的年龄、性别和职业对于交易进度影响不大,说明其在选择借款人的时候并未过多的考虑这部分因素,当然,这部分的数据也仅仅代表了该平台在这段时间之内的投资者的一种投资状况,而不能一概而论。
参考文献:
[1]高彦彬.P2P 网络借贷投资者影响因素的博弈模型分析[J].中国集体经济,2015(21).
[2]王小丽,丁博.P2P 网络借贷的分析及其策略建议[J].国际金融,2013(03).
[3]赵乐峰,杜凯.规范发展我国P2P网络借贷平台的思考[J].福建金融管理干部学院学报,2012(01).
[4]吴小英,鞠颖.基于最小二乘法的网络借贷模型[J].厦门大学学报(自然科学版),2012(06).
[5]郭奕.P2P网络借贷市场的融资成本和融资可获得性研究[D].西南财经大学,2011.
(作者单位:河南理工大学经济管理学院)