基于大数据的P2P网络借贷平台风险评价

2020-05-07 14:30:50崔炎炎刘立新
统计与信息论坛 2020年4期
关键词:网贷均值样本

崔炎炎,刘立新

(对外经济贸易大学 统计学院,北京 100029)

一、引言

世界上第一家P2P网络借贷平台(后文简称P2P平台)Zopa于2005年3月在英国成立,P2P,即“Peer to Peer Lending”的缩写,是指具有资金需求的借款人和有资金供贷出来进行投资的贷款人以互联网为渠道进行双方交易的网络借贷模式。最先在国外发展起来的Zopa、Kiva、Prosper等具有各自特点的P2P平台为全球不同地区的资金供需双方提供了很多便利,也为全世界P2P平台的发展构建了基础[1]。

中国第一家P2P平台“拍拍贷”于2007年6月在上海成立,开创了中国P2P行业的新纪元。随着这种借贷模式逐渐被广大民众接受,中国P2P平台的数量开始大量增加,很快便具有一定的规模。人们在适应新的借贷模式带来的快捷与便利的同时增加了P2P借贷的需求,既给该行业带来了商机,也使各P2P平台间产生了激烈的竞争,良莠不齐的P2P平台在一定程度上增加了该行业的风险,给投资者带来其在发展中的诸多问题[2-3]。2015年开始,银监会等部委对P2P行业重点关注,出台了一系列整治方案,2018年3月互联网金融整治办下发的《关于加大通过互联网开展资金管理整治力度及其验收工作的通知》加速了P2P行业的监管和转型。政策的及时跟进对很多P2P平台起到了规范作用,在很大程度上改善了P2P行业的问题,但一直到今天,伴随经济下行的压力,P2P第三方资讯网站的行业报告仍显示P2P平台的停业及其他情况屡有发生。2019年3月,P2P平台团贷网暴雷,因涉嫌非法吸收公众存款被东莞市公安局立案侦查,给行业带来重大的影响[4],严重打击了投资者的信心。

在目前国内P2P平台问题频发、P2P行业陷入信任危机之际,有必要对P2P平台的风险评价进行更加深入的研究。只有掌握了良好的P2P平台风险评价体系,才能更全面、科学地判断各P2P平台的风险。一方面,有益于投资者更加理性地对P2P平台进行选择;另一方面,有助于各平台向更加健康可持续的方向发展,从而促进中国互联网金融体系的稳定。鉴于此,本文搜集整理了中国692家P2P平台和15万余条网络舆情的大数据资料来分析P2P平台的风险情况,希望基于大数据资料的全面性获得更加准确科学的结论。

本文的主要创新和特点在于:首先,综合运用了平台本身、网络舆情和P2P第三方资讯网站的评价信息对P2P平台的风险情况进行判断,在考虑数据的可获得性和变量重要性的基础上,涵盖了较为全面的P2P平台风险影响因素,使得P2P风险评价体系的构建更加科学;其次,对样本P2P平台所应用的风险判别方法既包括传统的统计模型还涵盖了新兴的机器学习模型,能够显示不同判别方法的评价效果,为进一步探究判别P2P平台风险方法的适用性提供依据。

二、文献回顾

P2P行业在中国已经发展了十余年,以“网贷之家”“网贷天眼”为首的一些业内P2P平台第三方资讯网站为P2P网贷投资者提供了客观真实的平台数据以供投资参考,也让很多关注P2P平台风险的研究人员拥有易获取的数据资料。王飞等采集了网贷之家的月度发展指数作为研究样本,选择其中的部分指标作为面板固定效应模型中的核变量,对P2P平台信任危机下品牌信任重建效果的问题进行研究[5]。叶青等采集了网贷之家、网贷天眼的变量信息,尝试对P2P问题平台的初步特征进行概括,并从平台实力、标的特征、风控能力、治理水平等方面构建模型,以提炼能够甄别P2P问题平台的风险因素[6]。孙宝文等在网贷之家搜集到861家样本平台,并从平台运营基础、平台高管背景、资金实力、平台收益和管理费用、风险控制能力、网民舆情6个维度整合出14个平台经营特征指标,采用二元变量回归模型分析陷入提现困境的P2P平台区别于正常平台的整体风险特征[7]。姜琪利用网贷之家、网贷天眼网站2014年1月至2017年11月地区、类型及代表性平台的面板数据实证检验了影响中国P2P平台成交量的因素,并运用双重差分法来测度银行存管对成交量的政策冲击效应[8]。王伟等在网贷之家采集了54家P2P样本平台信息,使用改进的CRITIC法进行评价,发现2015年5月至2016年8月样本平台风险得分和风险评级均处于严峻的低水平状态,从而进一步归纳P2P平台相关特征[9]。张文等利用网贷之家的数据实证分析了针对真实P2P平台数据的类别分布非均衡性的问题,提出了一种基于K-Means聚类和支持向量机的非均衡分类方法[10]。朱清香等利用网贷之家的数据以LAPP法的4个维度为基础、民营系P2P平台风险的特点为立足点,选取了20个指标进行实证分析[11]。

上述研究都运用了网贷之家或网贷天眼网站公布的数据资料,主要思路是从两家网站公布的网贷平台评级体系中选取部分变量,结合作者的评价思路进行再加工,从而进行网贷平台的风险评价。P2P平台第三方资讯网站提供的数据资料能够代表网贷行业的部分信息,为构建P2P平台的风险评价体系提供了变量基础。但也有文章没有用到P2P平台第三方资讯网站的数据资料。范超等运用国泰安数据库在中国444家P2P平台基本信息与交易信息基础上,综合使用了11种统计模型评估变量的重要性并讨论其经济意义[12]。范超等使用的指标信息更加原始,没有经过P2P平台第三方资讯网站的加工处理,结合评价思路进行整合,更加直观,但在一定程度上,会有涵盖影响P2P平台风险因素不全面的问题。

三、P2P平台风险评价指标体系的构建

(一)指标体系的理论分析

从已有文献研究中发现,直接从P2P平台第三方资讯网站选取一部分风险评价指标的方法具有较强的主观性,且这些直接被提取的指标含义往往比较综合且复杂[注]具体可见P2P平台第三方资讯网站网贷之家的评级指标体系的指标说明。,使得评价体系内部指标的涵盖关系难以确定;另外,P2P平台第三方资讯网站的样本数量确定有一定难度,有些指标变量的公开数据样本较少[注]P2P平台第三方资讯网站网贷之家目前只公布评级排名前100家的P2P平台定量数据资料。或者时期较短,导致数据缺失较多,给研究造成了困扰。但是,上述缺陷不能否认P2P平台第三方资讯网站信息的可靠性和其具有的参考意义,相对于定量数据的复杂性和不可获得性,可以适当参考一些P2P平台第三方资讯网站的定性以及非结构性数据资料。于是本文构建的P2P平台风险评价体系中,定量指标部分主要来自国泰安CSMAR金融经济数据库,定性指标和网络舆情部分资料则利用手动收集或网络爬虫技术爬取于P2P平台第三方资讯网站。本文借鉴相关研究并结合指标变量数据的完整性,从平台的内部信息和外部信息两个维度,考虑P2P平台的基础信息、交易信息、资金信息、产品信息、风险防控信息和评论信息六个方面构建了P2P平台的风险评价体系。具体包括以下部分。

1.基础信息。判断一家平台的好坏,离不开对平台自身基础情况的考察。在平台的基础信息部分本文选取了4个指标变量,分别是平台背景、注册资本、所处地域和运营时间。平台背景是平台的信用背书,反映平台的信誉程度,在所采集的平台样本中有国资系、民营系、上市公司系、银行系和风投系五类平台背景,为了数据处理方便,将这五类平台背景分别用1,2,3,4,5表示;所处地域是指平台所属的省级行政划分区域,根据划分标准[注]由全国人大六届四次会议通过的“七五”计划和1997年、2000年的政策变动可知,中国东部地区包括11个省级行政区,分别是北京、天津、河北、辽宁、上海、江苏、浙江、福建、山东、广东和海南;中部地区有8个省级行政区,分别是山西、吉林、黑龙江、安徽、江西、河南、湖北、湖南;西部地区包括的省级行政区共12个,分别是四川、重庆、贵州、云南、西藏、陕西、甘肃、青海、宁夏、新疆、广西、内蒙古。(台湾、香港和澳门除外)。将中国省份划分成东部地区、中部地区和西部地区,并用1,2,3表示;运营时间指的是平台正常运营时间(单位:天)。非问题平台的运营时间是平台从创立开始到本文数据采集时间截止的运营天数,问题平台的运营时间是平台从创立开始到问题发生时间截止的运营天数。

2.交易信息。交易信息能够反映一家平台的过往交易状况,对选择平台投资的投资者来说具有重要意义。在平台交易信息部分,本文采集了2015年9月27日至2019年2月26日以天为频率的数据共1 182天,由于每家平台成立时间不同,数据时间序列不一致,因此对数据进行了均值处理,得到了平均成交量(万元)、平均投资人数(人)、平均借款期限(月)、平均借款人数(人)和平均借款集中度5个指标变量。其中,平均借款集中度属于加工指标,即借款人数与出借人数比值的均值,该数值越高说明平台投资越分散,平台风险越低。

3.资金信息。这里的平台资金信息,指的是平台在业务经营上的资金信息,能够看到平台的业务经营状态,包括3个指标变量[注]平均未来60日待还金额、平均累计待还金额和平均近30日资金净流入的数据区间以及数据处理方法同平台交易信息部分的均值处理指标。。一是平均未来60日待还金额(万元),该指标越高反映平台的兑付压力越大;二是平均累计待还金额(万元),平均累计待还金额是指平台未还款项目的资金总额均值,与平均未来60日待还金额指标不同的是,平均累计待还金额指标没有还款期限的迫切要求,更多的是反映一家平台被使用的广泛程度;三是平均近30日资金净流入(万元),平均近30日资金净流入是指30日内所有投标金额减去所有还款金额(按本金计算)的均值,对于分析平台人气和规模变化情况有一定的作用。

4.产品信息。产品是平台的核心竞争力,平台产品信息能够反映平台的产品标的状况,对于判断平台质量有重要作用。本文用以下4个指标变量进行表征。首先是平台产品的平均利率[注]平均利率的数据区间及数据处理方法同交易信息部分的均值处理指标。,是数据采集区间内平均值处理后的结果。一般认为,借款人违约风险越高,利率水平越高,平台就越有风险[13];其次是业务类型数目,业务类型数目是指平台所开展的借贷业务种类的数目,一般认为平台所拥有的业务种类越多说明平台风险越低[6];第三是自动投标,自动投标是指平台是否允许选择自动投标,属于分类变量,包括不支持、支持和无公开信息三类,分别用1,2,3表示;最后是债权转让,债权转让是指债权人通过订立债权转让合同将债权的全部或部分转移给第三人,这里的债权转让指标是债权转让的时间描述,包括不可转让、有期限限制(几个月不等)、随时以及无公开信息四类,分别用1,2,3,4表示。

5.风险防控信息。风险防控信息是指平台为保障投资者资金安全和平台自我整顿所采取的主要措施,良好的风险防控能有效提高平台应对风险的能力[14],对识别问题平台具有重要作用,共选取7个指标变量进行表征。

具体而言,资金存管是指平台选择通过银行或第三方机构管理投资者的资金,做到资金和交易分开从而避免资金被挪用的风险防控措施。风险准备金就P2P行业而言,是指P2P平台在借款成交时提取一定比例资金存入所建立的独立账户,当该项目逾期时启动账户资金先行赔付投资人本息的风险防控方式。资金存管、风险准备金和投资门槛指标在样本平台中都包括有和无两类,都分别用1和0表示。

资金保障模式是指P2P平台承诺的保障平台资金安全的方法。所采集的样本中共包括自担保模式、第三方担保模式、混合担保模式、无担保模式、其他担保模式以及无公开信息六种类型,分别用1~6进行表示;业务投标保障指的是对平台的业务进行担保,包括实物抵押担保、第三方机构担保、风险准备金担保、混合模式担保、VIP担保、其他方式担保、无担保和无公开信息八种类型,分别用1~8进行表示。

担保机构是指为P2P平台提供担保服务的机构。为了吸引投资者,有的P2P平台声称有担保方式却不公布担保机构,因为一些担保公司根本就没有能力对债务进行担保,因此对于合作担保机构的信息披露也应涵盖在考察范围内[15]。担保机构指标在样本平台中包括有担保机构披露和没有担保机构披露两类,分别用1和0表示;平台信息公开程度是指所能获得的平台公开信息的程度,具体包括公开的自动投标、债权转让、风险准备金、保障模式、投标保障和担保机构定性信息的个数,数目越多说明信息公开程度越大。

6.评论信息。平台的评论信息包括两部分,一是简单的打分信息,直接从网贷之家网站爬取计算可得,共涵盖六个指标变量;二是文本信息,需要进行文本挖掘得到情感得分信息。

打分信息部分。平台的打分信息包括六个指标变量,分别是提现得分、体验得分、站岗得分、服务得分、被关注程度和用户推荐程度。其中,在P2P行业中的资金站岗通常存在两种可能,一是投资人信任平台,将资金经第三方支付工具充值给了平台账户,但平台没有及时将资金投出从而造成资金闲置的情况。二是投资人投资平台某借款标的,但标的迟迟不能满标,资金在不能满标的借款标的中空置的情况。本文打分信息部分的站岗得分就是针对上述两种情况对平台的打分,判断上述两种情况发生的状况;被关注程度由网贷之家网站的平台评论数目做代理变量,认为评论数目越多,平台就越受关注;用户推荐程度是由网贷之家网站平台的网友推荐数目与评论数目的比值,比值越大说明用户推荐程度越高。

文本信息部分。应用Python软件爬取了P2P第三方资讯网站网贷之家中样本平台的所有评论内容(共计151 376条评论数据),并对样本平台的所有评论进行了情感分析[注]本文文本挖掘应用python工具包snownlp完成,详情可查询工具包介绍。,得到每家平台的用户评论情感得分指标。

(二)风险评价指标体系

根据指标体系的理论分析,本文构建了包括P2P平台内部信息和外部信息2个一级指标、6个二级指标、30个三级指标的P2P平台风险评价体系,以判别不同P2P平台的风险情况。为了使评价体系具有可参考性,评价体系中指标的数据资料均是在P2P平台公开信息中提取而来,能够在长期进行数据跟踪;另外,指标体系同时兼顾了定量指标和定性指标,还结合研究对象的特点,引入了网络舆情的评论信息指标,以求对判别P2P平台的风险情况进行更加全面的分析。具体如表1所示。

表1 P2P平台风险评价体系

四、风险评价实证分析

(一)基于大数据背景下风险评价方法的选择

基于构建的P2P平台风险评价体系对P2P平台的风险判别模型进行实证分析。文献资料显示现有的风险评价方法可以分为两类,一类是较为传统的统计模型,另一类则是新兴的机器学习模型。借鉴范超等选取的模型,本文选择Logistic回归和朴素贝叶斯模型作为传统模型的代表,而支持向量机(SVM)和随机森林模型作为机器学习模型的代表[12]。下面对这四种模型的优缺点进行介绍。

1.Logistic回归模型

Logistic回归模型是常用的二分类模型之一,对解决现实生活中因变量是离散的两类决策问题具有优势性。就本文来看,因变量的选择有“问题平台”和“正常平台”两类。在模型变量方面,该模型对变量服从的分布没有要求,适用性较强。另外,该模型能很好地解决非线性问题,被认为是分析被解释变量是离散变量时某事件发生概率与解释变量之间关系的主流分析方法[16]。模型经过logit变换后的基本形式为:

(1)

其中,x1,x2,…,xn为解释变量。实际操作中通常需要对进入该模型的数据进行标准化处理,然后将这些标准化后的数据转化成相对应的结构化后的数值,加以简单的回归计算后进而判断所属的类别。logistic回归模型的计算方式简单易理解,但是对自变量之间的多重共线性比较敏感,而且模型容易出现欠拟合情况,所以在分类精度方面可能不理想。

2.朴素贝叶斯模型

朴素贝叶斯是一种有监督的学习算法,也常被用于解决实际问题中的分类问题,在模型实证之前一般需要对数据进行归一化处理。

在思想上,朴素贝叶斯模型源于贝叶斯理论,该理论选择对数据点计算后的结果中具有最高概率的进行判断决策,即假如用p1(x,y)表示数据点(x,y)属于类别1的概率,用p2(x,y)表示数据点(x,y)属于类别2的概率,那么对于新的数据点(x,y)来说,如果p1(x,y)>p2(x,y),那么新的数据点(x,y)就被判断为属于类别1;反之,如果p1(x,y)

朴素贝叶斯模型,简而言之,就是通过事件的先验概率由贝叶斯理论计算出后验概率,从而对最大的后验概率进行所属类别的判断。该模型对条件概率分布做出条件独立性的假设,简化了计算过程,因此被称为“朴素”贝叶斯。具体判断过程如下:假设分类结果包括c1,c2,…,cn共计n类,而ck(1≤k≤n)表示其中具体的某一类,每个样本的属性由一个n维特征向量X={x1,x2,…xn}表示,则计算属性条件下的后验概率公式为:

(2)

其中,p(X)由于不依赖于分类可以被当作是常数,那么求解上式的最大值问题就变成求解p(X|ck)·p(ck)的最大值问题,对于每一个分类c1,c2,…,cn都经过同样计算后,未知样本被判断为ci类的条件是当且仅当:

p(X|ci)·p(ci)>p(X|ck)·p(ck)

1≤i,k≤n;i≠k

(3)

经过上述过程可以看到,朴素贝叶斯模型的算法逻辑简单易懂,能够为很多分类问题提供较为清晰的解释性。且该模型对样本数量的要求不严苛,方法的学习效率较高,具有较为广泛的适用性。但是该模型的缺点也很明显,即其对条件概率分布中条件相互独立性的假设,这在实际数据中往往会有无法满足该假设的情况,从而会对分类结果的准确性造成一定程度的影响[17]。

3.支持向量机(SVM)模型

支持向量机(SVM)模型是近些年常被讨论的分类算法模型之一,优秀的泛化能力使其在非线性识别问题中表现出较强的优势。其目标函数和约束条件如下:

(4)

s.t.yi(ωTφ(xi)+b)≥1-εi

其中,i=1,2,…,l;εi(εi≥0)为松弛变量,C(C>0)为惩罚系数,φ(x)为非线性映射函数,b为偏移,ω为权重向量,yi为研究问题所对应的分类类别。在非线性问题中还会进一步由拉格朗日函数对偶化上式,将核函数进行引入从而得到最终的决策函数如下:

(5)

其中,αi为样本对应的拉格朗日乘子,K(xi,xj)为模型所选择的核函数。

实际操作中需要在众多核函数中对所研究问题适用的核函数进行选择,并结合超参数的调优找到适用于所研究问题的具体参数结构。在模型结果判断过程中,所应用的SVM模型分类器是一个超平面f(x)=ωx-b=0,若f(x)>0则该点属于类1,若f(x)<0则该点属于类-1,而SVM模型的最优分割使得这两类中的点到超平面的距离最大化[18]。

SVM模型对高维数据和低维数据都能进行良好的学习,因此被广泛应用于解决实际问题分类的研究中。但是该模型对解决多分类问题和大规模数据样本问题存在一定的困难,需要进一步改进。本文在实证部分应用Python软件sklearn包中的SVC函数对P2P平台进行风险判别,在分析之前对数据进行了标准化处理。

4.随机森林模型

随机森林模型也是一种有监督的算法模型,该模型由众多分类树组成,其结果由众多分类树预测结果汇总进而投票的方式而来。具体而言,该模型首先利用Bootstrap方法有放回地随机抽取n个样本,然后建立单棵树的具有最佳分类特征作为节点的决策树模型。重复上述过程k次,则形成了由k棵决策树组成的随机森林模型,对于每棵决策树而言都有其对研究对象所属类别的判断结果,最终随机森林会将多数决策树的判定结果作为随机森林模型的结果进行汇报。

随机森林模型集合了众多决策树的结果,属于一种集成算法。相较于传统单棵树的决策,该模型让多棵树参与决策,并选出支持率最高的分类结果,使得模型在运算量没有显著增加的前提下提高了预测精度[19],且随机森林模型实现简单、抗过拟合能力强,因此被广泛应用于分类问题的研究。但是随机森林模型的解释性不太强,当模型中的单棵决策树过多时还会使训练时间过长,需要斟酌单棵决策树的个数。应用此模型时,本文利用Python软件sklearn包中的RandomForestRegressor函数进行风险判别,并对随机森林模型中单棵决策树的数量、单棵决策树的深度等超参数进行了调优。

下面具体应用上述四种模型进行实证,并对所研究问题的不同评价结果进行对比分析。

(二)数据来源及说明

数据资料来源于国泰安CSMAR金融经济数据库和P2P平台第三方资讯网站:网贷之家和网贷天眼。限于数据可得性,本文从国泰安数据库整理得到1 027家P2P平台2015年9月27日至2019年2月26日共1 182天完整的511 568条成交数据、25 080条平台信息数据和70 356条平台产品信息数据。经过与网贷之家网站、网贷天眼网站公开的P2P平台数据进行匹配,发现共有692家相同的P2P平台信息可供采集。于是本文手动收集了网贷之家网站692家各P2P网贷平台的资金存管、风险准备金、保障模式、投标保障、担保机构信息以及网贷天眼网站问题平台问题事件发生时间的数据。最后使用python软件利用网络爬虫技术从网贷之家网站获取了692家各P2P平台打分信息、评论信息的网络舆情资料。

根据国泰安数据库和网贷之家网站的平台信息,将数据资料中显示的出现跑路、停业、提现困难、经侦介入、延期兑付、暂停发标、网站关闭、争议的平台标记为问题平台,具有高风险。而其他平台则认为截止到数据采集结束的2019年2月26日期间是没有出现问题的,属于正常平台,具有低风险。在实证分析部分利用构建的风险评价体系对这两类风险平台进行分类判别,属于二分类的判别问题。经过计算,在样本的692家平台中,共有343家问题平台和349家正常平台,样本的问题平台数量和正常平台数量比例良好。

(三)模型实证

在每次实证分析时,对所应用的模型随机分配训练集和测试集[注]每次实证随机抽取75%的数据样本为训练集,25%的数据样本为测试集。的数据样本,并通过10折交叉验证和网格搜索的方法对模型中的超参数进行调优。在对比不同模型的分类效果时,通常应更关注模型在测试集上的表现,因此对测试集上的最终结果进行10次验证,得到了平均准确率、精确率、召回率和F1-score[注]精确率、召回率和F1-score是模型准确率之外对模型进行评判的指标。其中,精确率表示预测结果为问题平台中真实为问题平台的比例,召回率表示真实为问题平台中预测结果为问题平台的比例。F1-score则是精确率和召回率的调和平均,最大值是1,最小值是0。四项对模型分类效果进行判断的评价指标。在进行模型实证之前,对指标体系中的逆指标进行了取倒数的正向化处理,并针对不同的模型要求进行了指标数据的归一化、标准化处理。且所应用的四种模型训练集效果均优于测试集,因此不存在过拟合问题。具体的测试集结果如表2所示。

表2 模型测试集结果比较

通过机器学习模型调参的过程,可以知道P2P平台的风险预测分类问题属于复杂的非线性判别问题。从上表的四个模型结果可以看到,在问题平台精确率指标上SVM模型和朴素贝叶斯模型效果更好,能在结果中更精确的判别问题平台;而在其他三个指标上SVM和随机森林模型的测试集结果更好。因此,综合来看,SVM模型对本文所研究的问题具有更强的分类判别能力。

接着,利用10次验证取平均的方式得到随机森林模型中指标变量的重要性排序如表3所示。

表3 随机森林模型三级指标变量重要性排名

表3列出了随机森林模型指标变量重要性排序得到的排名前10的指标,其中资金存管是最重要的判断指标。运营时间则是排名第二的重要指标变量,而平均利率指标的重要性位列第三。

从评价体系二级指标的六个方面来看,把各三级指标排序的结果得分加总,得到这六个方面二级指标得分加总后的总得分,结果如表4。

表4 评价体系二级指标重要性排名

从表4可知,在评价体系的二级指标重要性排序中,风险防控信息排名第一,其次是评论信息,第三是交易信息,产品信息排名最后。在排名第一的风险防控信息中资金存管指标更是位列所有30个三级指标重要性的第一位,贴合评价体系目标,符合实际;评论信息排名第二则说明了外部信息的重要性,众所周知,P2P平台是依托互联网为渠道进行双方交易的方式,很多网络舆情信息被广大投资者关注、交流,能够在主观上反映投资者的心态,客观上披露P2P平台的状态,值得重点关注;排名第三的交易信息则能够反映P2P平台的历史交易记录,从这些定量数据中可以看到资金的流动、变化情况,也具有一定的参考性;对于排名靠后的基础信息,本文认为基础信息虽然能够反映平台本身的状况,但所涵盖的指标更多地在平台建立之初就已经决定,变化可能性较小,对频繁进行交易的P2P平台而言作用不大,唯一常常产生变化的就是运营时间指标,也可以在表3中看到它在三级指标中的重要性很大,因此可以在基础信息方面多留意P2P平台的运营时间指标;资金信息和产品信息分别位列重要性排名的第五、第六位,这两部分二级指标中能够对区分问题平台和正常平台具有较强解释能力的三级指标是表3中的平均未来60日待还金额指标和平均利率指标,介于现在P2P平台已经在中国发展了十余年,它的产品同质性已经较大,所以本文认为产品信息并不如其他方面信息更具判断性是合理的。另外对于资金信息,虽然都是定量数据,但其中的三级指标平均累计待还金额和平均近30日资金净流入都属于期限较长跨度的指标,平均之后差别就不一定有其他指标差距明显,所以对判别P2P平台风险的重要性就不具有鲜明的贡献,也是合理的。

(四)重要指标的样本差异性分析

通过表3可以看到风险评价体系中重要性排名前10的指标,这些指标对判别问题平台和正常平台具有重要作用,那么这些指标在样本的两类平台(问题平台和正常平台)之间均值的情况及差异性是怎样的呢?是否具有显著的差异性能够区分两类平台?为了进一步探究P2P平台风险评价重要性排名前10指标的样本均值差异性问题,本文运用方差分析F检验,得到表5的均值差异性检验结果。为了进一步分析,本文整理了描述性统计结果得到表6的定量指标均值信息、表7的定性指标数据信息。

表5 重要性排名前10指标的均值差异性检验结果

注:***表示在1%的水平上显著,下文的表8同理。

表6 重要性排名前10定量指标的均值数据信息

表7 重要性排名前10定性指标的数据信息

由表5可知,样本数据中资金存管在正常平台和问题平台中存在显著均值差异,且通过表7计算样本平台基本数据信息可知正常平台样本中仅有14%的平台不具备资金存管,而问题平台中则有65%的平台都不具备资金存管,再次证明了资金存管的重要性。结合表5和表6可知,样本数据中正常平台运营时间指标的均值显著大于问题平台,而正常平台的平均利率均值则显著小于问题平台。

指标变量重要性第四至第10位的指标也均在样本数据中的两类平台间存在显著的均值差异。其中,重要性排名第四的平均未来60日待还金额指标在正常平台的均值显著小于问题平台,可见正常平台的待还压力较小,资金流动性较强。由评论信息文本挖掘得到的重要性排名第五的情感得分指标在样本数据的正常平台中均值为0.651,显著大于问题平台的0.542,从侧面显示评论中挖掘的情感信息能较为客观的反映平台的状态。由表6知,样本数据中正常平台的被关注程度均值为295.358,显著大于问题平台的141.761,而正常平台的用户推荐程度均值0.659与问题平台的0.485也存在显著差别。另外,正常平台平均借款人数、平均借款期限和服务得分均值都显著大于问题平台。

综上,随机森林模型指标重要性排序前10的指标均值都在样本数据中显著区别了两类平台,这些指标既具有重要性又具有样本差异性,对判别P2P正常平台和问题平台具有重要作用。

由表5可知,在重要性排名前10的指标中,共有情感得分、用户推荐程度、被关注程度和服务得分4个三级指标都属于二级指标评论信息,可见评论信息指标的重要性。因此,进一步对评论信息二级指标下的所有三级指标进行了样本的均值差异性检验,整理后得到表8的检验结果以及表9的均值信息。结果表明正常平台的所有评论信息下的三级指标均值都显著大于问题平台,更加说明了评论信息能够较为客观的反映平台状态,可见评论信息的内容具有一定的参考性,值得投资者进行关注。

表8 评论信息三级指标的均值差异性检验结果

表9 评论信息三级指标的均值数据信息

五、结论与建议

本文综合运用了平台本身、网络舆情和P2P第三方资讯网站的评价信息构建了定性定量相结合的P2P平台风险评价体系,共涵盖2个一级指标,6个二级指标和30个三级指标。选择Logistic回归模型、朴素贝叶斯模型、随机森林模型以及SVM模型对P2P平台的风险进行判别。从4个模型的实证判别结果可以看到,在问题平台精确率指标上SVM模型和朴素贝叶斯模型的效果更好,而在模型准确率、召回率和F1-score指标上SVM和随机森林模型的测试集结果更好。因此,在本文所研究的P2P平台风险评价问题中,总体而言能够更好地区分问题平台和正常平台的是SVM模型,建议在对新的P2P平台进行风险判别中应用SVM模型进行判断。另外,由随机森林模型得到的P2P平台风险评价变量指标重要性排序结果显示,在本文评价体系的三级指标中,资金存管是最重要的判别P2P平台风险的指标,其次是运营时间,平均利率指标则位列第三。在评价体系二级指标中,风险防控信息排名第一,其次是评论信息,排名第三的为交易信息。

通过上述研究,建议P2P平台向资金存管方向发展。资金存管指标作为三级指标是最重要的判别P2P平台风险的指标,且在样本平台中正常平台资金存管的数量显著大于问题平台,说明正常平台更倾向于进行资金存管。而资金存管所在的二级指标风险防控信息指标也是最重要的二级指标,资金存管又在其中的贡献最大。进一步说明了加强风险防控、向资金存管方向转变的重要性。因此,监管方应及时督促未进行资金存管的平台加快资金存管步伐,将资金存管纳入P2P行业标准,使开展借贷业务的P2P平台都有合规的、严格的资金存管渠道,而对一些未进行资金存管或资金存管不规范的P2P平台进行限期整改。其次,运营时间作为判别P2P平台风险三级指标中重要性排名第二的指标也应给予关注,建议投资者慎重选择新上线的、运营时间较短的平台,这些新平台可能为了吸引广大用户而采取一些大幅度的优惠措施欺骗投资者,使投资者遭受经济损失。通过样本平台运营时间指标的均值差异性分析可以看到,正常平台的运营时间均值都是显著大于问题平台的。因此,监管方应督促投资者优先选择运营时间长的平台进行投资,不盲目追求一些新平台提供的一时的利益。另外,三级指标平均利率作为判别P2P平台风险重要性排名第三的指标也需要进行关注,高利率因其代表的高收益而广受投资者青睐,但高利率是把双刃剑,利率高的产品也可能成为问题平台吸引投资者的噱头,在样本平台中,问题平台的平均利率指标均值就显著大于正常平台。因此,投资者需要谨慎选择高利率产品,注意产品条款中的标的内容要求,不单一追求高利率产品。监管方则应完善行业产品规范,管理P2P产品属性,对高利率的P2P产品重点监督,进行跟踪调查。

评论信息在P2P平台风险评价二级指标重要性中排名第二,且样本数据显示评论信息中的所有三级指标在正常平台中的均值都显著大于在问题平台中的结果,说明评论信息能够较为客观的反映平台的状态,鉴于这些资料也较易获得,建议投资者多关注意向平台网友的评论内容和网络舆情资料,观察后再选择是否进行投资,监管方则要维护评论等舆情资料的透明以供投资者参考,严防平台刷好评、控制评论等行为的发生。

通过对随机森林结果中重要性排名前10的指标进行均值差异性分析,可以得到正常平台的平均借款人数、平均借款期限均值都显著大于问题平台,而平均未来60日待还金额均值小于问题平台。这说明正常平台人气更高、资金流动性更强,且都偏向于提供期限长一些的借款标的。因此,建议投资者关注这些特征对平台进行选择,在平台人气方面,建议监管方要求P2P平台如实公布平台活跃用户数量,为广大投资者选择平台提供参考,避免一些平台造假用户群体意图形成用户众多的假象;在资金流动性方面,建议监管方设定行业最低可流动性资金要求,一方面为不同投资者的资金需求提供一定的便利,另一方面对平台的资金要求提供一定标准,把一些无法保证基本资金要求的平台禁止在行业之外以防范风险;在借款期限上则建议投资者选择更有把握的期限长度,如有可能可以选择借款期限稍长的标的,不要贪图短期借款标的诱惑,以防范风险。监管方也应对P2P平台上线产品的借款期限加以把控,制定出一定的行业标准进行严格监督。

猜你喜欢
网贷均值样本
用样本估计总体复习点拨
P2P网贷中的消费者权益保护
中国外汇(2019年10期)2019-08-27 01:58:18
推动医改的“直销样本”
网贷平台未来亟需转型
商周刊(2017年17期)2017-09-08 13:08:58
网贷十年:迎来“去伪存真” 时代
商周刊(2017年17期)2017-09-08 13:08:58
随机微分方程的样本Lyapunov二次型估计
均值不等式失效时的解决方法
均值与方差在生活中的应用
村企共赢的样本
中国网贷地图