基于BP神经网络的网贷借款人信用评级研究

2018-12-07 17:43
金融经济 2018年18期
关键词:借款人网贷评级

1.引言

P2P网贷(Peer-to-Peer Lending)是指从事点对点服务的网贷平台,不依靠传统的银行服务而直接通过网络平台来完成贷款业务的模式[6]。这种模式便捷高效,打造了更为直接透明的交易平台,是实现普惠金融的有效手段。P2P网贷兴起于英国发展于美国,逐渐在世界范围内得到认可和发展。2005至2007年间成立的四家P2P网贷平台(Zopa、Kiva、Prosper、Lending Club)普遍面向居民和中小企业,创造出多种资信评级方式,成为全球P2P借贷行业的引导。2007年6月,我国第一家P2P网贷公司——拍拍贷在上海成立,该模式提高了社会闲散资金的利用率,解决了借款人小额贷款的繁琐,引领我国P2P网贷事业的发展。近年来我国P2P网贷行业经历了“野蛮生长”的过程后逐步进入正轨,在政府干预市场后走向规范化。由于社会信用体系不够完善等原因,平台仍普遍存在征信问题,中国人民银行已开放个人信用查询,但全国范围内仍在试行阶段,易形成信息不对称,易造成损失。在不断的探索中,当前形成了借款人主动提供个人信息和贷款平台开展验证式调查的方式,部分情况下还会实地勘探。造成诸多人力浪费,资信评级的准确和流通也有诸多欠缺。

因此需要对借款人的信用情况进行一个合理的评估,各界学者对P2P网贷平台及其信用评级进行了广泛研究。王会娟(2014)从信息不对称的理论框架出发,发现信用评级越高,借款成功率越高且借款成本越低;杨龙光(2016)针对国内信用评级研究面临的违约率数据缺失的问题,提出了一种综合回归思路与聚类的算法[17]他们提出的方法不会因为考察对象和考察时间的变化而变化,为信用评级方法提供参考唐国雷(2016)构建了logistic模型和BP神经网络模型,进行对比分析,发现BP神经网络模型能够更好的应用于评估P2P 网络借贷中借款人的信用风险[10]。

本文通过构建BP神经网络模型来实现对借款人的信用评级,该模型可以对平台的风险管理起到一定作用,综合国内外的研究分析影响平台借款人信用优良程度的评级指标与主要因素,从信用风险的角度出发,结合我国发展较为成熟的商业银行借贷评级信用模式与我国P2P网贷平台已有的借款人信用评级指标选取合适的指标作为建模的基础,选取国内较有代表性的拍拍贷数据,采用动量项的方法进行算法优化,对于丰富和完善我国现有的信用评级方法也起到了促进的作用。

2.信用指标体系

构建P2P网贷平台的借款人信用评级是一个严谨的过程。以往P2P网贷平台使用的借款人信用评级方法大多为专家分析法,即专家通过分析借款人的财务分析、经营信息、经济环境等因素,来对借款人的资信、品质等进行评判,以确定评级结果,目前得到了世界上大多数国家的认可和采纳。在选取指标的过程中主要考虑到全面性、代表性、相对稳定性、可行性和稳定性。比如经典的年龄,性别,居住地,婚姻状况,文化水平、职业性质,行业收益,发展前景、经济实力等指标。随着P2P网贷方式和互联网的普及。部分平台开始加入历史纪录等直接可靠的指标,避免了一些信息滞留造成的重复损失。

我国运营良好的P2P网贷平台要求借款人提供的信息大致包括借款人的基本信息、资产信息和工作信息三大类,每个平台可以自行制定借款人需上传的指标数据,以能够证明借款人有能力偿还债务为目的填写相关信息,再由网贷平台使用自身的信用评价机制对其进行信用评级,将结果公布到平台上以供投资者进行放贷参考。我国传统银行要求借款人提供的个人信息相差不大,有相对较完整的指标体系。

本文通过对国内部分网贷平台进行研究和对比,根据P2P网贷线上评估,直接融资,中介把关的特点,参考中国建设银行的个人贷款信用评价指标体系,结合以前的个人信用评价指标体系的研究成果和方法,得出P2P网贷借款人的信用评价指标体系。选取六个指标作为后续建模的基础,分别为:年龄、文化程度、婚姻状况、年收入、现居地以及历史信用,并将各个指标进行科学量化。

3.基于BP神经网络的信用评级算法

3.1 BP神经网络

BP神经网络是指误差逆传播算法训练的多层前馈网络,该模型的特点是信息向前传递,误差反向传递,即每一层的神经元只会影响下一层神经元的输出状态,一般为三层感知器,所谓三层包括了输入层、隐藏层和输出层。正向传播时,输入样本从输入层传入,经各隐藏层处理后,传向输出层,如果输出层没有得到预期的输出,则进行误差反向传递,误差反传是将输出误差以某种形式通过隐藏层逐层反传,并将误差分摊给各层的所有单元,从而获得各层单元的误差信号,此误差信号即作为修正各单元权值的依据。这种信号正向传播与误差反向传播的各层权值调整过程是周而复始地进行的。权值不断调整的过程,也就是网络的学习训练过程。这一过程反复进行,直到输出值与期望值相等后训练结束,得出模型。

3.2 BP神经网络的设计与训练

拍拍贷在我国也具有代表性且口碑信誉良好。本文从拍拍贷信息平台爬取150组借款人的信息数据作为本文 P2P网贷借款人的信用评估样本,其中120组数据作为训练组,剩下的30组数据作为参照组,来对模型优化的结果进行验证,使用MATLAB进行仿真训练。

训练函数的选择。选用Sigmoid作为转移函数,其优点在于输出范围有限,为(0,1),所以数据在传递的过程中不容易发散。并且这个函数具有连续可导和非线性的特点,计算起来相对简单。

输入层和输出层的设计。输入层单元数为特征数量,本文选取了6个指标,所以输入层数为6。

输出层单元数为目标数量,本文输出层的设计为一个单元数。

隐藏层的设计。本文需要处理的数据不是很繁琐,因此建立一个隐藏层即可。隐藏层节点数的作用是从样本中提取并储蓄其内在规律,每个隐节点有若干个权值,而每个权值都是增强网络映射能力的一个参数。隐节点数目如果太少,则网络难以收敛,数目如果过多,则容易造成网络训练时间变长,网络的稳定性就会降低。本文选择试凑法来确定最佳隐节点数目,初始化隐层单元数m满足

其中n为输入层节点数,在本文中n=6。进一步确定隐藏层单元数,并进行反复验证来寻找最优隐藏单元数。在初始化隐藏层单元数的基础上,逐渐增加隐节点数,用同一样本集进行训练,从中确定网络误差最小时对应的隐节点数。

初始权值的设计。网络权值的初始化决定了网络的训练从误差曲面的哪一点开始,因此初始化方法对缩短网络的训练时间至关重要。本文对隐层初始权值设定足够小,但不全置为0,因为全置为0后每次更新权重都会是一样的结果。

如果输出层权值太小,会使隐层权值在训练初期的调整量变小,因此采用使初始值为十1和一1的权值数相等的方法。按以上方法设置的初始权值可使每个神经元一开始都工作在其转移函数变化最大的位置。

3.3 优化BP神经网络算法

增加动量项。标准BP神经网络算法在调整权值时,只按t时刻误差的梯度下降调整,而没有考虑t时刻以前的梯度方向,从而使训练过程发生震荡,收敛缓慢。为了提高网络的训练速度,可以在权值调整公式中增加一动量项。即从前一次权值调整量中取出一部分迭加到本次权值调整量中,动量项反映了以前积累的调整经验,对于t时刻的调整起阻尼作用。当误差曲面出现骤然起伏时,可减少震荡趋势,提高训练速度。

3.4 BP神经网络的训练

本文利用MATLAB软件建立BP神经网络算法模型,进行标准BP神经网络算法计算时发现模型正确率最高为74%,加入动量项优化后使模型可以自行修正权值和阈值,根据试凑法确定最佳隐藏层节点数目,选择学习率为0.1的情况下,分别设置隐藏层节点数为3、4、5、6、7、8、9、10、11、12、13、14、15,对每一种不同的隐藏层节点数进行15次训练,在确定最大训练次数为3500次的情况下记录损失函数值以及对应的正确率,根据结果可以看出当选择隐藏层节点数为3时,模型正确率最高且损失值最小,因此此模型的隐层数选择为3。由误差分析图可以看出此模型的拟合度较优。

用剩余30组数据作为对照组进行模型的检验,结果验证表明,BP神经网络模型具有良好的自适应性,能够较准确地输出期望值与实际相符,能对借款人的信用情况做出高效的评价。

4.结论

本文首先引入普惠金融的理念介绍了P2P网贷的概念,通过对国外资深网络金融平台的兴起与运作模式深入了解整个行业的发展历程。从国内P2P网贷行业真实数据出发了解到存在的征信问题,并通过爬虫技术收集网贷平台公开的真实数据,分析我国运营良好的P2P网贷平台以及我国传统商业银行的评级指标,以中国建设银行为基本,选取六个与借款人信用程度相关性强的指标。通过对BP神经网络算法的研究,对模型的整体思路有详细的阐述。BP神经网络的各层结构的确定有明确的方法,由梯度下降和误差曲面展开,通过增加动量项的方法对模型进行优化,发现可以有效减少了训练过程的震荡幅度,加快模型收敛速度,相对于传统的BP神经网络算法,有着更高效的可操作性,更适用于构建借款人的信用评级。

(中国计量大学,浙江 杭州 310018)

猜你喜欢
借款人网贷评级
P2P网贷中的消费者权益保护
乡城流动借款人信用风险与空间收入差异决定
小微企业借款人
网贷平台未来亟需转型
网贷十年:迎来“去伪存真” 时代
分析师最新给予买入评级的公司
商业银行对借贷人贷后监控与风险治理
中国网贷地图
影响P2P借贷成功率的借款人信息要素研究
创投概念股评级一览表