基于大数据的融资项目评估技术研究

2018-10-23 11:13唐向红饶雷陆见光
商场现代化 2018年12期
关键词:神经网络大数据

唐向红 饶雷 陆见光

摘 要:解决互联网融资时的项目数量多,每个融资项目中所包含的特征数量较多,但是可用于项目评价的评价特征少,筛选出相关特征而且要做到精确评估是互联网融资项目评估问题的关键。本文提出了利用神经网络来进行大数据下的融资项目评估。实验结果表明,神经网络很适合处理互联网融资项目评估,能够很准确地对融资项目进行评价。

关键词:融资项目评估;大数据;神经网络

随着网络技术的发展,国内的互联网融资也得到了飞速发展,创新模式层出不穷,打破了以往单一的融资渠道,对小微企业、个体创业者和普通百姓开辟了一条快捷的融资渠道。相对于传统融资,资金供求双方不再是一对一而是一对多或者是多对多的融资形式,融资效率要比传统融资高许多。

国内关于项目评估的研究成果有很多,但是大多集中于风险投资项目评估,如潘雄锋等提出了基于主成分分析的风险投资项目评估模型;于冬提出的基于BP神经网络的风险投资评估模型;杨哲,顾锋提出的价值工程在风险投资项目评估中成本优化的应用;陈盛双,袁正科等人提出的风险投资项目评估模型研究。然而投资和融资在本质上有所不同,投资指的是特投资者为了在未来的某个时期获得收益或是资金增值,在一段时间里向某个目标领域投入足够的资金和物资的经济行为;融资是指为支付超过现有购买力的购货贷款而进行的交易手段,或为取得资产而集资所采取的货币手段,所以投资项目评估模型不能很好适用于融资项目评估,尤其是互联网融资项目。

对于融资双方都需要面对决策问题,现在的各种互联网融资平台都存在着许多融资主体无法按时得到自己想要的资金,也有融资主体通过股联网融资平台骗取资金或者不按时归还投资人的本金和利息。本文利用神经网络进行大数据分析对融资项目进行初步判断,这样给融资人能不能按时获得资金以及投资人能不能按时收到本金和利息提供一个参考。

一、融资项目评估方法

每一个互联网融资项目所包含的特征是非常多的,如果直接将所有特征输入到神经网络会使神经网络的训练变得复杂,所以要对融资项目中包含的原始特征进行一定的筛选,对特征进行筛选的好处是可以降低特征的空间维数提高分类器的分类精度和泛化性能。因为羊群效应能够反映大众的投资心理,通过对数据的简单统计分析发现羊群效应同样适合互联网融资,所以本文利用羊群效应将一些直接影响融资项目和与融资项目相关性较大的特征筛选出来作为后面用于神经网络训练的特征,比如借款人愿意偿还的最大利率这个特征,贷款人即使知道这个融资项目的风险高但是他们还是愿意投资这种利率高的融资项目。因为BP神经网络具有非線性映射、联想记忆、自主学习的特点,所以选择BP神经网络作为融资项目评估的分类器。

二、基于BP神经网络融资项目评估模型的构建

1.BP神经网络概述

BP神经网络的基本思想是误差反向传播算法,样本从输入层正向传播,输出信号与期望的输出目标产生的误差从输出层向输入层传播,输入层和输出层之间是一层或者多层隐含层(图1),误差信号不断对各隐含层的权值进行修正,权值的修正过程就是BP神经网络的自我学习过程直到输出与期望值误差达到允许的范围,BP神经网络达到稳定停止迭代。BP神经网络适合处理非线性的问题,本文对于融资项目的评估属于非线性问题,而且BP神经网络对于大数据的处理要好过其他分类模型。

2.样本选取本

文选用的数据集是来自美国在线借贷平台Prosper①,鉴于本文研究的问题,只抽取了数据集中的Listings部分,总共提取出411847个样本数据。

3.指标选取

在每个样本数据中记录着56种特征,其中有一些信息是空白还有一些是平台没有展示隐私信息,经过对样本中56种特征的筛选,最后选择出7种特征Amount Requested,Borrower Maximum Rate,Debt To Income Ratio,Category, Credit Grade, Is Borrower Home Owner, Status(各个特征所代表的含义如表1所示)。

根据表1中所描述的七种特征的含义,本文用Status作为样本的标签,Status中所包含的特征以及对应的样本数量如表2所示。

表2中Withdraw表示借款人自己撤回了自己在Prosper平台上发布的借款项目,Active表示借款项目依然在融资过程中,这两个状态特征无法作为样本的标签,所以删除状态特征是Withdraw和Active对应的样本。从表1中可以看出负样本(借款项目的状态为Expired和Cancelled)个数为225859个,数目远远大于正样本(借款项目的状态为Completed和Pending Completion)的个数,为了防止在训练模型的时候,由于正负样本的数目差距过大而导致模型的训练结果偏向负样本这一方,所以本文在后续的模型训练之前随机抽取了与正样本个数相同的负样本组成一个原始样本。

4.模型训练和测试

将提取到的训练样本中的80%作为训练集20%作为测试集,输入到BP神经网络中对模型进行训练优化各层神经元之间的权重和偏差。将样本进行100次迭代,样本每迭代5次打印一次训练精度,测试精度和损失值(图2)。

图中红点代表训练精度,蓝点代表测试精度,黄点代表损失值。从结果图中可以看出,BP神经网络对于处理这种非线性的问题可以达到很高的精度,通100次的迭代,训练集的精度最终达到了99%而且测试精度达到了93.4%。

出现这种结果有如下两个原因:第一是因为本文从原始样本中的56个特征中挑选出了7个特征,大大地降低了样本的空间维度,使模型的收敛速度更快;第二是本文将被挑选出的7个样本中选择Status作为样本的标签,由于其余6个特征的与Status的相关性很强,所以能够达到很高的测试精度。所以当样本的数量较多时,进行合适的特征选择,应用BP神经网络进行项目评估不仅模型的收敛速度快而且准确率还很高。

三、结语

本文利用BP神经网络对借贷项目的成功性进行了评价,通过这种方法可以在借款人在平台发起借款项目前和贷款人在进行罚款前提供一个有效规避风险的评价标准,可以使借款人能够及时筹集到资金,也让贷款人能后及时收到本金和利息。BP神经网络自身具有的强学习性,自适应性与容错性等特点可以与项目评价有效地结合,给项目评估问题提供了一个新的途径。

实际中的项目评估是具有一定复杂性的工作,需要考虑的因素有很多,在BP神经网络的应用过程中,为了使模型有好的评估效果需要合理的选取用于项目评估的特征。本文的项目评估和实际的项目评估存在一定的偏差,只能为实际的项目评估提供一些想法和思路。

注释:

①原始数据网址:https://www.prosper.com。

参考文献:

[1]翁键敏,郑良琳.我国互联网融资发展及监管路径探析[J].福建金融,2014,(11):18-23.

[2]胡艾琳,罗真怡,孙舒宜,杜家豪,张丽丽.互联网融资风险分析及规避[J].经济师,2016,(6):83-87.

[3]潘雄锋,刘凤朝,王元地.基于主成分分析方法的风险投资项目评估模型[J].科技进步与对策,2004,(3):65-67.

[4]于冬.基于BP神经网络的风险投资评估模型[J].科技管理研究,2005,(9):206-208.

[5]杨哲,顾锋.价值工程在风险投资项目评估中成本优化的应用[J].价值工程,2016,(8):24-25.

[6]陈盛双,袁正科,王平安.风险投资项目评估模型研究[J].价值工程,2008,(9):151-152.

[7]姚旭,王晓丹,张玉玺,权文.特征选择方法综述[J].控制与决策,2012,27(2):161-166.

[8]Simla Ceyhan,Xiaolin Shi,Jure Leskovec. Dynamics of Bidding in a P2P Lending Service:Effects of Herding and Predicting Loan Success[C].New York:ACM Press,2011:547-556.

[9]韓立群.人工神经网络理论、设计及应用[M].2版.北京:化学工业出版社,2007:38-67.

[10]齐振国,楚秦东.基于BP神经网络的项目评估模型研究[J].沈阳师范大学学报(自然科学版),2010,28(1):109-112.

[11]高隽.人工神经网络原理及仿真实例[M].北京,机械工业出版社,2005:55-56.

猜你喜欢
神经网络大数据
基于人工智能LSTM循环神经网络的学习成绩预测
基于图像处理与卷积神经网络的零件识别
基于改进VGG-16神经网络的图像分类方法
基于自适应神经网络的电网稳定性预测
三次样条和二次删除相辅助的WASD神经网络与日本人口预测
基于BP神经网络PID控制的无刷直流电动机调速系统设计
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索