基于风险和剩余价值的在线P2P借贷投资推荐方法

2016-12-22 04:15朱梦莹郑小林王朝晖
计算机研究与发展 2016年12期
关键词:标的借款人借款

朱梦莹 郑小林 王朝晖

(浙江大学计算机科学与技术学院 杭州 310027)(mengyingzhu@zju.edu.cn)



基于风险和剩余价值的在线P2P借贷投资推荐方法

朱梦莹 郑小林 王朝晖

(浙江大学计算机科学与技术学院 杭州 310027)(mengyingzhu@zju.edu.cn)

在线P2P(peer-to-pear)借贷是一种新兴的在线个人财富分配和管理系统,它允许投资人直接对借款人创建的借款标的进行竞标和投资.在P2P借贷平台中,存在一个重要的问题即如何合理分配投资人的投资金额给合适的借款人.针对该问题,提出了一种基于风险和剩余价值最大化的投资推荐框架RTSM(risk total surplus maximize).RTSM首先对借款标的进行风险评估,然后基于经济学中的剩余价值理论,使用投资人和借款人在有风险情况下的剩余价值假设,将风险评估与投资推荐结合在一起,为投资人推荐高收益低风险的投资决策.实验在风险评估和投资推荐2个阶段对美国和中国知名的P2P借贷平台(Prosper、拍拍贷)的真实数据进行分析和验证.从实验结果可以看出:RTSM可以更好地降低风险和提高投资人与借款人的整体利益.

在线P2P借贷;风险评估;最大化剩余价值;推荐系统;投资推荐P2P(peer-to-pear)借贷是指无担保借款,借贷双方通过没有金融机构中介的网络平台进行竞标和借贷行为[1].P2P借贷作为互联网技术在金融领域的新应用[2-3],能有效地促进信息发布和搜索,并提供必要的功能来完成交易[4].

2005年第1个借贷平台Zopa成立于欧洲(英国),2006年2月美国第1个借贷平台(Prosper.com)成立.2005年以来,在线P2P借贷在许多国家,包括美国、加拿大、英国、日本、意大利和中国,以不同的形式经历了快速增长时期.最成功的在线P2P平台是英国的Zopa(Zopa.com)、美国的Prosper(Prosper.com)、Kiva(Kiva.org)、Lending Club(lendingclub.com).例如Prosper在2009年成功完成1.7亿美元的借款.到2016年7月为止,总部设在旧金山的非盈利组织Kiva通过其平台获得的借款总额已经达到8.82亿美元*http://www.kiva.org/about..

尽管起步较晚,在线P2P借贷在中国也有相当大的发展,产生了拍拍贷(PPDai.com)、宜人贷(yirendai.com)、人人贷(We.com)等具有一定影响力的平台.国内最大的P2P借贷平台拍拍贷成立于2007年,在一年半的时间里就积累了超过8万名用户,使得这种金融投资新式迅速在国内发展.而宜人贷作为中国第1家在美国纳斯达克上市的P2P平台,成为中国互联网金融在海外上市的首家公司.截止2015年年底,中国一共拥有3 858家P2P借贷平台*http://shuju.wdzj.com/industry-list.html..

P2P借贷在蓬勃发展的同时,也相应地产生了许多问题,例如借贷资金的安全仍会存在隐患,借款人的信息可信度如何保证,一笔借款产生后缺乏行之有效的对于还款的监管手段等.这其中,如何评估P2P借贷过程中借贷风险,建立一个安全有效的P2P借贷投资推荐体系也是急需解决的问题之一.

P2P借贷平台中,一部分平台直接连接借款人和投资人,而其他平台则通过第三方机构(通常是银行或其他支付机构)连接,如图1所示:

Fig. 1 The framework of P2P lending platform.图1 P2P借贷平台架构图

作为借款人和投资人的信息发布媒介,P2P借贷平台可以筛选出优质的借款标的,为投资人推荐高收益低风险的投资决策.可是,现如今P2P借贷平台往往只对借款标的进行简单的排序,推荐给投资人较高收益的借款标的.

尽管现在的P2P借贷平台都表明自己拥有专业的风险评估团队,可以对所有借款标的进行风险评估,但由于P2P借贷的风险评估环节不如银行严谨,违约风险成了P2P借贷系统中最严重的问题.

如图2所示,我们分析了拍拍贷和Prosper两个平台上借款标的期望投资收益和违约风险的关系.从图2中可以看出,违约风险随着期望投资收益的增加而增加,所以,仅仅考虑投资收益进行投资推荐是不够的.

Fig. 2 The framework of P2P lending platform.图2 收益与违约风险关系

本文将基于经济学中的剩余价值理论,结合风险评估与投资推荐解决P2P借贷过程中投资人的投资金额分配问题,为投资人推荐高收益低风险的投资决策.

1 风险评估和投资推荐相关工作

1.1 P2P借贷中的风险评估

近年来,有2类工作大量出现在关于P2P借贷的风险研究中,分别是P2P借贷风险的关键因素研究和P2P借贷的风险评估方法研究.

研究者们致力于研究P2P平台中影响违约风险的共有的因素.在P2P借贷的环境下,投资人很难对借款人获得全面的信息,导致信息不对称的问题十分严重[5].在P2P借贷中,借款人的个人信息和借款标的信息被认为是评估借款人是否违约的重要信号,可以用来评估借款人的违约风险和设置投资利率[6-7].通过分析从Prosper收集的数据,Lin[7]发现信用评级较低的借款请求不太可能被资助,并且这样的借款请求更有可能违约或以很高的利率结束.Emekter等人[8]则分析了另一家美国知名P2P平台Lending Club,得出拥有更高的FICO分数和高收入的借款人在该平台违约率更低,平台需要想办法去吸引这样的借款人.在中国,Chen等人[9]表明,对拍拍贷平台的数据分析,信用分数对获得借款的概率产生了部分影响,但利率是决定因素.然而,违约率较高的借款人信用水平要低得多.小额信贷理论表明,社交网络可以帮助减少借款过程中的信息不对称,并且可以激励借款人偿还借款[10].Freedman和Jin[11]发现有借款推荐人或是bid是由借款人的朋友提交的,很少会拖欠还款,并且有更高的回报率.他们的结论是,借款人的朋友能更好地识别风险和拥有可信赖性,因为他们拥有更多的额外信息,而且他们认为社交网络的监控为还款提供了更强大的动力.

另一类工作则是致力于降低信息不对称情况下的借贷违约风险.研究表明,机器学习算法和大数据分析可以很好地应用在不同的商业应用中.Bahrammirazee[12]通过对比3种人工智能技术:人工神经网络、专家系统、混合智能系统和传统方法在金融问题上的表现,得出人工智能技术比传统方法表现更好.Zhao等人[13]利用了Logiest Regression预测出借款标的的违约风险,并将风险利用在个性化推荐中.Baesens等人[14]使用神经网络技术分析了3个信用违约的数据集,构建了智能且可解释的风险评估系统.Byanjankar等人[15]也使用了神经网络方法预测P2P借贷中的风险,并且认为基于信用分数的神经网络在筛选违约标的时有非常有效的表现.李斌等人[16]使用了属性归纳和聚类方法对业务过程中的风险因素进行分析,并且采用Markov模型构建可传导的风险评估模型.

然而,这些研究工作大部分都只是致力于研究违约风险,却很少有将违约风险应用到其他应用场景或数据分析中,例如Zhao等人[13]利用违约风险完成投资组合的个性化推荐以及利用对贷款loan的多视角风险分析结果制订投资组合策略[17].

1.2 投资推荐

推荐系统根据用户的兴趣特点和购买行为,向用户推荐用户偏爱的信息和商品.推荐系统一般包括基于内容的推荐系统[18]和协同过滤[19].基于内容的推荐主要通过对用户交互的目标项目信息进行挖掘,为用户推荐相似度较高的目标项目;协同过滤方法则是基于相似用户对目标项目的历史交互行为来估计当前用户对目标项目的喜好程度,这种交互行为可以是点击、浏览、购买、评分.传统的推荐系统的改进是针对用户进行个性化的物品推荐,并且追求推荐准确度的提高.但是,在P2P借贷或者其他的金融领域,高准确度并不像在其他传统推荐领域那样重要,例如电子商务领域[20]、广告领域[21]、电影传媒领域[22].

在P2P借贷中,我们希望投资人可以投资高收益的借款标的,而低违约风险的借款人可以获得借款.在文献[23]中,作者提出可以引入经济学中的剩余价值,平衡生产者和消费者双方的利益,使得整个市场更有效率.

同时,我们认为风险在P2P借贷的推荐中也是非常重要的衡量因素.我们希望能推荐给投资人高收益低风险的借款标的.在文献[13]中,作者将P2P借贷的风险评估和协同过滤相结合,为投资人提供个性化的借款标的投资组合推荐.

2 经济剩余价值

在本节中,我们将介绍一些关键的概念和经济学中的定义,这些将会成为第3节中描述的推荐框架的理论基础.

2.1 经济剩余

经济剩余是经济学中的概念,用来衡量买卖商品或服务时的市场收益[24].通常,经济剩余可分为消费者剩余、生产者剩余.

消费者剩余(consumer surplus)是指购买者的支付意愿减去购买者的实际支付量.消费者剩余衡量了购买者自己感觉到所获得的额外利益.例如在P2P借贷场景中,我们将借款人发布的标的作为一项产品,消费者指的就是投资人.那么投资人希望无风险获得的收益即他的支付意愿,而借款标的实际的借款利息则是他实际支付的量.如果尊重买者的偏好,消费者剩余不失为经济福利的一种好的衡量标准.

生产者剩余(producer surplus)是指卖者出售一种物品或服务得到的价格减去卖者的成本.同样在P2P借贷系统中,生产者是借款人.那么借款标的实际借款利息为借款人出售这一服务的价格,借款人发布的最大愿意支付的借款利息为借款人出售借款标的来缓解经济负担的成本.生产者剩余衡量生产者参与市场所得到的额外利益.

总剩余(total surplus)是指消费者剩余和生产者剩余的总和.总剩余可以衡量社会的经济福利.消费者剩余是买者从参与市场活动中得到的利益,而生产者剩余是卖者得到的利益.因此,常把总剩余作为社会经济福利的衡量指标.

2.2 市场效率与总剩余价值

在微观经济学理论中,福利经济学研究资源配置如何影响经济福利.福利经济学分析市场的买者(消费者)和卖者(生产者)参与市场中得到的利益,并且考虑如何使这种利益尽可能达到最大.

假设存在一个消费者和生产者的分配矩阵Q,则生产者剩余为PS(Q),消费者剩余为CS(Q).那么,我们可以根据总剩余的定义得到总剩余价值TS:

TS(Q)=CS(Q)+PS(Q).

(1)

那么要使得市场的分配达到最有效率(efficiency),我们需要使得总剩余最大化,即:

(2)

其中,M=[M1,M2,…,Mn],Mj是商品j可以被提供的总数量,在P2P借贷系统中指借款标的j的总借款金额.

然而,在这样的市场中还存在一个问题,根据理性人假设[25]的描述,要满足充分有效的市场,每个参与经济决策的主体必须是充满理智的,他们的唯一目标就是追求自身经济利益的最大化.例如消费者追求满足程度最大化,生产者追求利润最大化.可是,在任何经济活动中,这样的完全“合乎理性的人”是不可能存在.尤其是在互联网金融的经济活动中,由于存在类似自动投标的机制,机器经济人[26]也参与了这一经济活动.Zhang等人[23]在他们的文章中引入了概率,认为消费者可能以更大概率选择最佳的分配决策,但他们也可能以一个较小的概率选择一个非理性的决策,他们定义分配矩阵Q中的每一个Qij是一个满足一定概率分布的随机变量.在这种情况下,最大化总剩余将被定义为

(3)

其中,p(Qij)是每一笔金额Qij的概率密度函数,p(Q)=[p(Qij)]m×n,Θ(Q)是所有Qij的参数集.

3 基于风险与剩余价值的投资推荐

在本节中,我们首先介绍了风险评估,然后描述了P2P借贷中投资人和借款人的剩余价值,最后提出了基于风险与剩余价值的投资推荐框架.

3.1 风险评估

在这里,我们总结了3种类型的特征:标的特征(features of listing, FOL)、借款者的用户特征(features of borrower, FOB)、借款者的社交特征(features of social, FOS),具体的特征如表1所示:

Table 1 The Feature and Properties of PPDai and Prosper

表1中标的特征指标的本身财务特征包括标的利率、募集的资金数量、借款期限、借款类型(房贷、车贷、商业贷等)、还款方式等.

借款者的用户特征分为4个部分:

1) 借款者的身份证明特征,由于P2P借贷是互联网借贷,借款者和投资人并不直接见面,所以一些验证借款者身份的必要措施被广泛使用在P2P借贷平台的流程中,例如身份证验证、照片验证、视频验证、学历证明验证等,这里我们根据Prosper和拍拍贷2个平台的特点,选取了符合它们各自平台流程的一些身份属性.在Prosper数据集中我们选取了是否有头像图片这一属性;在拍拍贷数据集中我们选择了是否有身份证验证、视频验证、学历验证、婚姻验证4个属性.

2) 借款者的财务特征,主要用于证明借款者的还款能力,在Prosper中我们选取借款者是否有房屋,借款者的收入负债比;但拍拍贷中并没有提供这方面的特征属性.

3) 借款者的人口学特征,在拍拍贷中,我们选取借款者的性别、年龄、学历、婚姻状态等;但在Prosper中我们并没有找到相关的特征.

4) 借款者的信用特征,在Prosper平台上,我们选择使用FICO给出的Credit Grade和平台自身给用户的信用分Prosper Score作为该平台的信用特征;在拍拍贷平台上,拍拍贷自己建立了信用分数评价体系,我们使用拍拍贷的用户信用分和信用评级作为该平台的信用特征.

借款者的社交特征是P2P借贷平台特有的一种特征类型.大多数P2P平台愿意在P2P借贷服务以外构建线上社区,用户在社区中存在“朋友”、“群组”等社交关系.近几年,有不少研究者研究了社交关系对P2P借贷信用体系和风险体系的影响.在这其中,我们选择Prosper的群组和朋友属性与拍拍贷的朋友属性作为借款者的社交特征.

使用历史借贷数据,我们可以根据以上这些特征,估计每个标的pj的投资风险riskj.在这里我们并不打算提出某一个具体的模型算法,而是选择提出一种风险评估的框架,不同的平台、不同的标的特征都可以选择不同的模型算法来评估投资风险,例如使用逻辑回归(logistic regression, LR)[13]、GBDT(gradient boosting decision tree)[17]、人工神经网络(artificial neural network, ANN)[15].

3.2 P2P借贷中的剩余价值

在P2P借贷系统中,我们认为借款人是一笔借款请求的生产者,而借款请求被视作是一个金融产品;投资人则作为这个金融产品的消费者,他们购买这一笔借款中的一部分或全部来获得投资收益.

在这一问题中,我们主要需要解决的是投资人怎么样将自己的资金分配到每个金融产品,即每个借款请求中去,使得整个市场达到最有效率的配置,即满足最大化总剩余价值.

3.2.1 投资人剩余价值

Fig. 3 The borrowing process of P2P lending.图3 P2P借贷平台借款流程

(4)

3.2.2 借款者剩余价值

同样地,在文献[23]中,借款者剩余价值可以定义为

(5)

因此,总剩余价值为

TSij(Qij)=CSij(Qij)+PSij(Qij)=

(6)

3.3 基于风险与剩余价值的投资推荐

在本节中,我们将风险评估的结果引入P2P借贷的剩余价值中,提出RTSM框架.

3.3.1 风险与投资人剩余价值

本文在考虑剩余价值时,考虑引入违约风险来平衡市场的效率与风险.

在不违约的情况下,即riskj=0的情况下,投资人的剩余价值如式(4)所示;而在违约的情况下,投资人的剩余价值是损失的本金减去无风险收益,所以我们认为投资人在riskj违约风险下的剩余价值为

(7)

3.3.2 风险与借款者剩余价值

同理在不违约的情况下,借款者的剩余价值如式(5);但在违约的情况下,我们认为借款者愿意支付的收益是0,即他发布的最大愿意支付的利率是一种为了骗取投资人本金的“欺诈”数据.在这种情况下,我们认为违约风险为riskj时,借款者的剩余价值为

(1-riskj)ratej+riskj)Qij.

(8)

因此,在存在违约风险的情况下,总剩余价值为

TSij(Qij)=CSij(Qij)+PSij(Qij)=

(9)

3.3.3 基于风险和最大化总剩余的推荐算法RTSM

我们假设分配矩阵Q满足高斯分布Qij~N(μij,σij),我们将TSij(Qij)带入式(3)中,可以得到最大化总剩余价值:

(10)

其中,U=[μij]m×n,Σ=[σij]m×n.

式(10)可以被化简为

(11)

我们的RTSM推荐算法表述如下:

算法1. RTSM算法.

输入: P2P数据P(feature,ratemax,rate,M);

输出: 投资人推荐金额分配矩阵Q.

步骤1. P2P借贷数据预处理.对P2P借贷数据的特征集进行归一化和标准化处理;

步骤3. 假设分配矩阵满足高斯分布Q~N(μ,σ),计算在总剩余价值最大化时的分配矩阵:

(12)

其中,U=[μij]m×n;我们使用linear programming可以得到U的最优解;

步骤4. 我们将推荐金额分配矩阵Q的期望值作为分配矩阵Q中的值,投资人推荐金额分配矩阵的期望值为

(13)

4 实验结果与分析

4.1 数据集介绍

4.1.1 Prosper数据集

Prosper数据主要分为5种表:Listings,Loans,Bids,Groups,Members.

1) Listings.借款人创建借款标的来募集贷方提供的资金.Listings表中会说明借款人的情况以及募集资金的原因.当足够多的资金被募集,Listing就会变成一笔借贷.

2) Loans.当借款标的募集到足够的资金后,借款标的将会转变成Loan.Loans表中说明了借款人的还款情况.

3) Bids.当借款人发布借款标的后,投资人可以对借款标的进行竞标,所有竞标的标的利率信息和金额信息都存在Bids表中.

4) Groups.群组是由一些拥有相同兴趣或类似好友关系的用户组建的.每个群组都有一个组长,管理群组里的人员,介绍给组员一些借款标的.群组的分数代表了群组的可信程度.

5) Members.Members表记录了在Prosper网站上注册的用户信息.用户可能拥有一个或多个身份,并且可能拥有一个或多个朋友.

Prosper数据集包含了从2005-11—2012-02的所有交易记录和用户信息.

为了分析完成借贷流程的P2P借贷数据,本文剔除了标的状态为流标的全部数据和部分不相关的特征变量,数值化了非数值的特征变量.有关时间、地理信息、个人描述等特征在本文中被忽略.而信用等级(AA-HR)被转换成数值(7~0),同样地,Group Rating(0~5 Stars)、是否拥有房产(No,Yes)被转换成数值(0,1)、Prosper Rating等特征也被转换成了相应的数值.

最终,经过数据预处理的PROSPER数据集的结构如表2描述.表3是Prosper数据集的指标性数据.

Table 2 Prosper Dataset Feature Description

Table 3 Statistics of the Selected Prosper Dataset

4.1.2 拍拍贷数据集

拍拍贷数据主要分为4张表:List Info,User Info,Bid Info,Friend Info.

1) List Info.借方创建借款标的来募集贷方提供的资金.借款标的中会说明借方的情况和募集资金的原因.当足够多的资金被募集,借款标的就会变成一笔借贷,进入还款程序,在拍拍贷数据中还款情况也记入List Info表中.

2) User Info.记录在拍拍贷网站上注册的用户信息.用户可能拥有一个或多个身份,并且可能拥有一个或多个朋友.

3) Bid Info.当借款人发布借款标的后,投资人可以对借款标的进行竞标,所有竞标的标的利率信息和金额信息都存在Bid Info表中.

4) Friend Info.在拍拍贷网站上用户可以互加好友,这张表中包含用户和他的朋友ID、创建时间等.

拍拍贷数据集包含了从2007-06—2011-06的所有交易记录和用户信息.

同样为了分析P2P借贷数据中已经完成借款流程的部分,本文剔除了标的状态为流标的全部数据和部分不相关的特征变量,数值化了非数值的特征变量.有关时间、地理信息、个人描述等特征在本文中被忽略.其中,借款类型被我们处理成一个8 b的二元组,其他变量也都被归一化.

最终,经过预处理的拍拍贷数据集的特征如表4描述,表5是拍拍贷数据集上的指标性数据.

Table 5 Statistics of the Selected PPDai Dataset

4.2 风险评估实验结果与分析

首先,我们将已经经过数据预处理的数据集分为训练样本和测试样本,这里训练样本随机取整个数据集的80%,而20%为测试样本.接着我们分别使用了KNN(k-nearest neighbor),DT(Decision Tree),NB (Naive Bayesian),LR,ANN,RF(Random Forests),GBDT等方法对训练样本进行学习训练,并对测试样本进行预测.

其中,我们将采用AUC值和Accuracy值作为风险评估实验的评价指标,具体计算方式如式(14)和式(15).

(14)

(15)

其中,M为正类样本的数目,N为负类样本的数目.

当我们得到所有模型的最优参数后,我们可以比较每一个模型的预测表现.图4和图5显示了在Prosper数据集和拍拍贷数据集上各个模型的Accuracy,AUC值.这其中,GBDT算法无论从Accuracy还是AUC来看,在2个数据集上都是最优的.

Fig. 4 The prediction performance of assessment Prosper dataset.图4 在Prosper数据集上各模型的预测表现

Fig. 5 The prediction performance of assessment on PPDai dataset.图5 拍拍贷数据集上各模型的预测表现

DatasetEvaluationProsperPPDaiAccuracy∕%AUCAccuracy∕%AUCNB69.450.7669.640.82KNN71.790.7879.330.83ANN74.890.8379.660.85LR74.960.8380.960.87DT74.830.8383.410.88RF72.160.7985.040.89GBDT75.970.8485.950.92

如表6所示,对于Prosper数据集,GBDT算法是表现最好的.在Accuracy方面,比其他模型算法提升1.3%~9.4%;在AUC方面,比其他算法提高了1.2%~10%.对于拍拍贷数据集,GBDT算法同样是表现最好的,在Accuracy方面,比其他提升了1.1%~23.4%;在AUC方面,GBDT算法比其他算法提高了3.3%~12.2%.

4.3 投资组合推荐实验结果

我们分别使用了来自中国和美国最知名的P2P借贷平台拍拍贷和Prosper的2个数据集来评价我们的推荐框架的表现.

在这里,我们使用总剩余价值来衡量市场效率.我们选取了真实的金额分配(Actual)作为基准.分别计算了RSTM算法和TSM算法[23]的结果,并且对它们进行了比较和分析.

(16)

经过计算,Actual,TSM,RTSM的市场表现(总剩余价值)的结果如表8所示.

表8的结果可以看出我们的RTSM框架在Prosper数据集中,总剩余价值和每一笔每一单位金额的剩余价值都比实际值提升了28.46%.每一单位金额可以获得的剩余价值从US$0.043 4提升到US$0.055 8,这表明我们提升了资金的效率.在拍拍贷数据集中,总剩余价值和每一笔每一单位金额的剩余价值都比实际值提升了9.44%.每一单位金额可以获得的剩余价值从CNY0.101 9提升到CNY0.111 6,同样也提升了资金的效率.而与不带风险评估的TSM框架相比,我们的RTSM显然可以更好的适应有风险时的市场,并且带来更高效的市场配置.

Table 7 Risk Free Interest Rate in China and US

Table 8 Results on Total Surplus with RTSM, TSM and Without Framework

同样,我们还分析了使用RTSM推荐框架配置资产以后,市场的风险的情况.我们计算了在TSM和RTSM框架配置下借款标的违约率.在Prosper中,实际违约率为56.7%,TSM的违约率为56.5%,而RTSM的违约率只有45.3%,比实际的违约率降低了11.4%;而在拍拍贷中,实际违约率为32.7%,TSM的违约率为32.5%,而RTSM的违约率只有25.3%,降低了7.4%,说明RTSM有效地降低了市场中的风险.

5 结束语

大部分现有的推荐系统想办法引入新的算法来提升评分矩阵的预测准确性,例如RMSE,MAE等,但是很少有论文聚焦在什么才是最好的目标矩阵,使得目标矩阵更符合市场经济,并且更有可解释性.

本文基于风险控制和微观经济学原理构建了一个新的推荐系统框架.在RTSM框架中,我们充分考虑了P2P借贷市场的特殊性,利用了金融市场最重要的2个特点——风险与收益.我们认为只是追求不考虑风险的情况下,收益最大化还不足以满足真实的市场经济的规则,所以引入了风险评估.不同于传统的风险评估使用专家经验和简单的统计结论,我们采用机器学习的思想来完成风险评估,通过实验可以看出,GBDT模型可以很好地提高风险评估的结果.在引入风险的情况下,我们首次定义了投资人剩余价值和借款人剩余价值,并且基于这一定义得出了总剩余价值.在真实的数据集上,我们也验证了考虑风险的情况下,引入风险评估对整个市场的有效配置有所提升.

P2P借贷系统作为近年来兴起的全新的投资借贷模式,它存在很多不同于传统的线下借贷的优势和特点.但由于P2P借贷平台本身的风险控制不够严谨和投资人获得的信息不对称,P2P借贷产生了不少问题和争议.我们认为3个方向值得我们进一步研究:

1) 基于大数据分析的P2P借贷金融风险控制

P2P借贷中的风险不仅仅单指借款人的违约风险,它是一个多层次复杂的风险,包括信用风险、平台风险、技术风险等.基于大数据分析构建符合P2P借贷模式的风险控制,将会是提升P2P借贷平台资产质量的重要手段.

2) 基于行为金融学的P2P借贷投资推荐

羊群行为一直是行为金融学中的重要话题,在信息不对称的P2P借贷领域,这一现象尤为典型.通过对P2P借贷中信息传递与羊群行为的分析,可以构建投资推荐模型.这一方向可以对投资人非理性投资做出很好的解释和修正.

3) P2P借贷投资组合推荐

投资组合可以很好地分散投资人的风险,经常被应用在证券资产中.但在有着较高风险的P2P借贷投资中,投资组合也许会有助于帮助投资人做出高收益低风险的投资推荐.所以,投资组合推荐将会是投资推荐中一个重要的研究方向.

[1]Bachmann A, Becker A, Buerckner D, et al. Online peer-to-peer lending—A literature review[J]. Journal of Internet Banking & Commerce, 2011, 16(2): 1-18

[2]Collier B C, Hampshire R. Sending mixed signals: Multilevel reputation effects in peer-to-peer lending markets[C] //Proc of the 2010 ACM Conf on Computer Supported Cooperative Work (CSCW 2010). New York: ACM, 2010: 197-206

[3]Lin Mingfeng, Prabhala N R, Viswanathan S, et al. Social networks as signaling mechanisms: Evidence from online peer-to-peer lending[R/OL]. Washington: Smith School of Business, University of Mayland, 2009. [2016-08-01]. http://people.stern.nyu.edu/bakos/wise/papers/wise2009-p09_paper.pdf

[4]Iyer R, Khwaja A I, Luttmer E F P, et al. Screening in new credit markets: Can individual lenders infer borrower creditworthiness in peer-to-peer lending?, 15242[R]. Rochester, NY: SSRN’s eLibrary, 2009

[5]Lin Mingfeng, Prabhala R, Viswanathan S. Judging borrowers by the company they keep 1: Social networks and adverse selection in online peer-to-peer lending[J]. SSRN Elibrary, 2009, 59(1): 17-35

[6]Herzenstein M, Andrews R L. The democratization of personal consumer loans? Determinants of success in online peer-to-peer loan auctions[J]. Bulletin of the University of Delaware, 2008, 15(3): 274-281

[7]Lin Mingfeng. Peer-to-Peer lending: An empirical study[C] //Proc of the AMCIS 2009. Atlanta, GA: AIS, 2009: 17-25

[8]Emekter R, Tu Yanbin, Jirasakuldech B, et al. Evaluating credit risk and loan performance in online peer-to-peer (P2P) lending[J]. Applied Economics, 2015, 47(1): 54-70

[9]Chen Dongyu, Hu Huiling, Lou Hao, et al. Herding behavior in online microloan markets: Evidence from China[C/OL] //Proc of the WHICEB 2015 Proceedings. Atlanta, GA: AIS, 2015: 1-14 [2016-08-01]. http://aisel.aisnet.org/whiceb2015/84/

[10]Krumme K A, Herrero S. Lending behavior and community structure in an online peer-to-peer economic network[C] //Proc of the 4th Int Conf on Computational Science and Engineering. Los Alamitos, CA: IEEE Computer Society, 2009: 613-618

[11]Freedman S, Jin G Z. The information value of online social networks: Lessons from peer-to-peer lending, 19820[R]. Cambridge, MA: National Bureau of Economic Research, 2014

[12]Bahrammirzaee A. A comparative survey of artificial intelligence applications in finance: Artificial neural networks, expert system and hybrid intelligent systems[J]. Neural Computing & Applications, 2010, 19(8): 1165-1195

[13]Zhao Hongke, Wu Le, Liu Qi, et al. Investment recommendation in P2P lending: A portfolio perspective with risk management[C] //Proc of the IEEE Int Conf on Data Mining. Los Alamitos, CA: IEEE Computer Society, 2014: 1109-1114

[14]Baesens B, Setiono R, Mues C, et al. Using neural network rule extraction and decision tables for credit-risk evaluation[J]. Management Science, 2003, 49(3): 312-329

[15]Byanjankar A, Heikkila M, Mezei J. Predicting credit risk in peer-to-peer lending: A neural network approach[C] //Proc of 2015 IEEE Symp Series on Computational Intelligence. Los Alamitos, CA: IEEE Computer Society, 2015: 719-725

[16]Li Bin, Xie Feng, Chen Zhong. A business oriented risk assessment model[J]. Journal of Computer Research and Development, 2011, 48(9): 1634-1642 (in Chinese)(李斌, 谢丰, 陈钟. 一种面向业务的风险评估模型[J]. 计算机研究与发展, 2011, 48(9): 1634-1642)

[17]Zhao Hongke, Liu Qi, Wang Guifeng, et al. Portfolio selections in P2P lending: A multi-objective perspective[C] //Proc of the 20th ACM SIGKDD Conf on Knowledge Discovery and Data Mining. New York: ACM, 2016: 2075-2084

[18]Pazzani M J, Billsus D. Content-Based Recommendation Systems[M]. Berlin: Springer, 2007

[19]Su Xiaoyuan, Khoshgoftaar T M. A survey of collaborative filtering techniques[J/OL]. Advances in Artificial Intelligence, 2009, 2009(4): 1-19 [2016-08-01]. https://www.hindawi.com/journals/aai/2009/421425

[20]Musat C C, Faltings B. Personalizing product rankings using collaborative filtering on opinion-derived topic profiles[C] //Proc of the 29th Int Conf on Artificial Intelligence. Menlo Park, CA: AAAI, 2015: 830-836

[21]Theocharous G, Thomas P S, Ghavamzadeh M. Ad recommendation systems for life-time value optimization[C] //Proc of the 24th Int Conf on World Wide Web. New York: ACM, 2015: 1305-1310

[22]Wang Ruiqin, Jiang Yunliang, Li Yixiao, et al. A collaborative filtering recommendation algorithm based on multiple social trusts[J]. Journal of Computer Research and Development, 2016, 53(6): 1389-1399 (in Chinese)(王瑞琴, 蒋云良, 李一啸, 等. 一种基于多元社交信任的协同过滤推荐算法[J]. 计算机研究与发展, 2016, 53(6): 1389-1399)

[23]Zhang Yongfeng, Zhao Qi, Zhang Yi, et al. Economic recommendation with surplus maximization[C] //Proc of the 25th Int Conf on World Wide Web. New York: ACM, 2016: 73-83

[24]Baran P. Economic progress and economic surplus[J]. Economic Review, 1954, 17(4): 289-317

[25]Coleman J S, Fararo T J. Rational choice theory: Advocacy and critique[J]. Contemporary Sociology, 1994, 23(4): 617-618

[26]Parkes D C, Wellman M P. Economic reasoning and artificial intelligence[J]. Science, 2015, 349(6245): 267-272

[27]Luo Chunyu, Xiong Hui, Zhou Wenjun, et al. Enhancing investment decisions in P2P lending: An investor composition perspective[C] //Proc of the 17th ACM SIGKDD Int Conf on Knowledge Discovery and Data Mining. New York: ACM, 2011: 292-300

[28]Garman S R, Hampshire R C, Krishnan R, et al. Person-to-person lending: The pursuit of (more) competitive credit markets[C/OL] //Proc of the 29th Int Conf on Information Systems. Atlanta, GA: AIS, 2008: 1-16 [2016-08-01]. http://aisel.aisnet.org/icis2008/160/

Zhu Mengying, born in 1992. PhD candidate. Student member of China Computer Federation. Her research interests include artificial intelligence, data mining, recom-mendation system, and Internet finance.

Zheng Xiaolin, born in 1977. PhD. Associate professor, PhD supervisor, deputy director of Institute of Artificial Intelligence, Zhejiang University. Senior member of IEEE and China Computer Federation, committee member in Service Computing of China Computer Federation. His main research interests include data mining, recommend-ation system and Internet finance.

Wang Chaohui, born in 1993. Master candidate. His main research interests include data mining, recommendation system and Internet finance (zjuwch@zju.edu.cn).

Investment Recommendation Based on Risk and Surplus in P2P Lending

Zhu Mengying, Zheng Xiaolin, and Wang Chaohui

(College of Computer Science & Technology, Zhejiang University, Hangzhou 310027)

Online peer-to-peer (P2P) lending, which is a newly personal wealth distribution and management system, has become a new type of financing mode for Internet users. P2P lending platform allows borrowers to create borrow listing and investors to bid and invest borrowers’ listing directly. In the P2P lending, there is a significant issue that is how to reasonably match borrowers and investors and then allocate the amount of investors, so as to recommend low risk and high rate investment decisions to the investors. This paper proposes a recommendation framework risk based total surplus risk total surplus maximize (RTSM), which can solve the problem of allocating the investment amount into borrowers’ listings. Specifically, we first propose to adapt various methods of regression to evaluate default risk. Then, we give the hypothesis the surplus of investors and borrowers under default risk which is based on the theory of surplus in economics. And based on this hypothesis, we combine the risk assessment and investment recommendation to maximize the total surplus under default risk. We apply the recommendation framework RTSM into two real-world datasets (Prosper and PPDai). Finally, experiments and analysis indicate that RTSM can reduce risk and improve the overall benefits of both investors and borrowers.

online P2P lending; risk assessment; total surplus maximize; recommendation system; investment recommendation

2016-08-15;

2016-10-27

国家自然科学基金项目(61379034,U1509221);国家科技支撑计划基金项目(2014BAH28F05,2015BAH07F01) This work was supported by the National Natural Science Foundation of China (61379034,U1509221) and the National Key Technology R&D Program of China (2014BAH28F05,2015BAH07F01).

郑小林(xlzheng@zju.edu.cn)

猜你喜欢
标的借款人借款
借款捆绑婚姻关系致诉讼
不一样的借款保证人
具有两个P’维非线性不可约特征标的非可解群
中东铁路与三喇嘛借款
浅论借户贷款情形下隐名代理的法律适用
乡城流动借款人信用风险与空间收入差异决定
红周刊绩优指数100只标的股一览
红周刊绩优指数100只标的股一览
红周刊绩优指数100只标的股一览
小微企业借款人