万常选 游运 江腾蛟 刘喜平 廖国琼 刘德喜
(江西财经大学信息管理学院 南昌 330013)(江西财经大学数据与知识工程江西省高校重点实验室 南昌 330013)
P2P借贷是基于因特网的一种新型金融模式,该模式将拥有闲散资金的社会成员与资金的需求方联系起来,不仅为中小企业融资和小额借贷提供了一个新的解决方案,也为社会成员提供了一种新的投资途径.由于P2P借贷市场具有能拓宽传统金融机构的融资渠道,降低借贷交易成本,提高借贷交易效率和投资者投资回报等特点,该类市场发展迅猛,也吸引着越来越多的潜在投资者.对于潜在的投资者来说,要保证其投资效益,其中关键的决策问题就是如何从众多的投资项目中选择真正符合自己投资偏好的投资项目,并在此基础上进行投资额的合理分配.
在P2P平台中,贷款人(也称为投资者)在进行投资项目的选择时,借款人和借贷项目的风险水平往往是其决策的重要市场信号.目前,关于借款人和借贷项目风险的研究较多[1-3].这些研究通过对平台中的借款人、借贷项目的风险及其相关因素进行研究,以帮助潜在的投资者进行有效决策.然而,随着平台发展规模越来越大,借贷项目品种的日益繁多,信用风险的相关信息量剧增.“信息过载”将使得投资者,特别是众多的非专业的投资者陷入决策困境.
文献[4]设计了一个基于实例的信用风险评估模型来评估每个借贷项目的风险和回报,将P2P借贷投资决策问题设计成一定约束条件下的优化投资组合问题,以提高P2P借贷市场投资者的投资性能.但该方法是根据P2P借贷市场数据驱动的投资决策总体框架,即向所有的投资者推荐若干全局最优产品,因此忽视了不同投资者在投资偏好、风险类别等方面的差异性对其投资行为的影响.
文献[5]针对不同投资者,重构投资决策过程,首先,根据借贷项目信用评估结果及投资者历史交易数据,为每一位投资者产生一份推荐投资项目列表;其次,根据投资组合理论,对该推荐列表中的每一个投资项目的投资份额进行优化.该方法考虑了不同投资者当前的投资状态的差异性,提出了基于风险管理的个性化推荐策略.然而,该方法存在2个局限性:1)在确定推荐投资项目列表时,主要是从借贷项目与投资者之间的投资关系、借款人与借贷项目之间的从属关系等角度出发进行算法设计,忽视了P2P平台在线社交网络中贷款人之间的朋友关系及其对投资者投标行为的影响,这将降低投资项目推荐的准确率和召回率,影响推荐结果的有效性;2)忽视了投资者风险偏好差异性对其投资决策的影响.
文献[6]通过在大型的P2P借贷网站上进行研究发现,朋友网络可带来管道效应、棱镜效应和羊群效应,会极大地影响相关投资者的投标行为及投资偏好,即当一个投资者的亲密朋友对项目A投标后,该投资者对项目A的投资偏好将会受到一定程度的影响,导致其可能也随之投标.
文献[7]发现投资者的投资组合与他们的投标偏好密切相关.因此,在确定推荐投资项目时可在前人研究的基础上,进一步考虑P2P平台在线社交网络中投资者之间的朋友关系及其对投资者投标行为的影响,以便准确地把握投资者真正感兴趣的借贷项目,改善投资组合推荐的最终效果;二是在进行P2P投资项目投资组合优化分析时,文献[7]与大多数P2P投资推荐相关研究类似,忽视了不同投资者风险偏好的差异性对其投资决策的影响.在金融领域中,投资者对待风险的态度一般通过投资者的效用函数来测定,在面临不确定的环境状态时,投资者往往更愿意选择使其预期效用最大化的决策方案.
基于以上分析,为了能够提高组合投资推荐的各方面性能,本文根据来自Prosper平台的相关数据,构建P2P关联网络模型,分析其中的投资者之间的朋友关系,基于朋友关系网络计算投资者的朋友投标行为影响因子,并在此基础上设计基于预期效用理论的个性化推荐方案.
本文的贡献主要包括以下4个方面:
1) 根据Prosper平台相关数据,构建了反映平台各对象之间相互关联的P2P关联网络模型,并在此基础上分别计算借贷项目和投资者的概念特征,得出相应的概念模型;
2) 分析P2P关联网络模型中投资者之间的朋友关系,并在此基础上探讨投资者直接朋友的投标行为对其投资偏好的影响,设计基于投资者朋友关系的朋友投标行为影响因子,并将之应用于投资者的项目投资兴趣度的预测,以提高投资推荐的有效性;
3) 在Prosper平台历史交易数据基础上,考察投资者风险厌恶系数及风险承受能力,结合预期效用理论,构建基于预期效用理论的P2P借贷平台投资组合优化模型,实现投资者投资额在推荐投资项目列表中的合理分配;
4) 整体设计了基于投资者朋友关系和预期效用最大化的投资组合推荐算法,并提出了新的评价指标,以评估投资推荐模型的推荐效果以及投资决策满意度、经济效益和效用.
对于P2P借贷平台来说,如何为潜在的投资者提供有效的投资信息,帮助他们进行投资项目的选择及投资额的分配,以降低他们的投资风险,提高他们的投资回报,关系到P2P借贷平台的长远而有效的发展,关于这方面的研究主要体现在以下3个阶段.
通过借贷项目违约风险评估,可在一定程度上帮助投资者摆脱由于信息不对称等信息问题所产生的不利选择困境,规避投资决策风险.目前关于这方面的研究较多,大多从2个方面着手:1)从借贷项目违约风险的相关特征出发,研究传统的财务指标[8-9]、非财务指标[10]及社会网络信息[11-13]等对借贷项目违约风险的影响;2)从借贷项目违约风险预测方法的角度展开研究.关于市场风险预测的方法有很多,大致可分为4类:1)统计模型,如逻辑斯蒂回归、k近邻方法和生存分析等;2)人工智能方法,如神经网络、支持向量机和遗传算法等;3)运筹方法,如线性规划法、二次规划法等;4)混合方法.以上这些研究工作主要集中于研究借贷项目违约风险预测,却很少有将预测结果应用到其他应用场景或投资决策分析.
随着P2P借贷市场的飞速发展,借贷项目品种变得日益繁多,而投资者非专业性及处理信息的能力有限.因此,对于投资者而言,仅拥有关于各个借贷项目违约风险的相关信息远不足以保证其投资决策的有效性,因为信息过量往往会使决策者陷入困境,因此有必要提高投资者信息分析的效率,并为之提供有效的投资策略.
文献[14]根据来自多目标项目的静态特征和动态特征,对借贷项目进行多视角风险分析,并在此基础上为投资者提供2种投资组合优化策略,即加权目标优化策略和多目标优化策略.文献[15]提出数据驱动的投资决策框架,利用投资者的投资组合理论来增强P2P投资决策性能.文献[4]通过设计一个基于实例的信用风险评估模型来评估每个借贷项目的风险和回报,并在此基础上将P2P借贷投资决策问题设计成一定约束条件下的优化投资组合问题,以提高P2P借贷市场的投资性能.以上方法是根据P2P借贷项目风险评估建立投资决策总体框架,向所有的投资者推荐若干全局最优产品,因此忽视了不同投资者投资偏好的差异对其投资行为的影响.
推荐系统按所使用的数据来分类,可以分为内容过滤、协同过滤和社会化推荐系统等.已有的推荐算法虽然取得了一定的推荐效果,但主要局限于一些特定的领域,如旅游业、电子商务、电影传媒推荐等.关于P2P借贷领域的个性化投资推荐的研究较少.
文献[16]通过对借贷项目进行风险评估,并在此基础上,结合经济学剩余价值理论,提出剩余价值最大化投资推荐框架,具有一定的有效性;但对P2P在线平台各对象之间的相互关联研究较少,同时也忽视了投资者之间的朋友关系及其对投资者投资偏好的影响,导致难以准确把握投资者的当前投资需求,影响推荐的效果.
文献[5]根据借贷项目信用评估结果及投资者历史交易数据,从借贷项目与投资者之间的投资关系、借款人与借贷项目之间的从属关系等角度出发为投资者推荐投资项目列表,并在此基础上结合投资者当前的投资环境,对推荐列表中的每一个投资项目的投资份额进行优化.该方法考虑了不同投资者投资环境的差异性,提出了基于风险管理的个性化推荐策略.但该方法忽视了P2P平台在线社交网络中投资者之间的朋友关系及其对投资者投资偏好的影响,导致难以准确把握投资者真正感兴趣的借贷项目,影响投资推荐的有效性.同时,该方法忽视了投资者风险偏好差异性对其投资决策的影响.由于不同的投资者对待风险的态度的差异,如风险厌恶程度不一样,甚至风险类别不同,在面对风险不同的同样货币预期值的投资收益时,产生的效用水平往往不同,而这很有可能会影响投资者的投资组合策略.
目前,在P2P借贷领域社交网络的研究大多集中在风险预测、融资效率及经济行为影响等方面;关于P2P借贷领域投资推荐的相关研究中,在进行个性化投资推荐算法设计时,往往忽视了投资者社交关系对投资者投标行为的影响.由于P2P借贷市场存在信息不完全与非对称、历史投资数据稀疏、投资者与投资项目特征难以有效匹配等问题,传统的推荐方案往往难以满足该市场的个性化投资需求.
基于在线社会网络的数据分析结果表明,考虑社会网络用户之间的直接或间接的社会关联信息的社会化推荐方法,可有效提高推荐系统性能[17].随着当前在线社会网络的不断发展与应用,结合投资者社交网络信息进行推荐算法设计,将有望成为提高P2P借贷市场个性化投资服务性能的重要途径之一.
因此,本文根据投资者的历史交易数据,构建反映平台各对象之间相互关联的P2P关联网络模型,分析其中的投资者之间的朋友关系及其对投资者投资决策行为的影响;同时,考虑投资者历史风险承受能力及风险系数,从投资者的预期效用最大化出发,设计个性化投资组合推荐方案,以期提高投资推荐的有效性和投资者的决策满意度.
本节将依据P2P借贷市场中各对象之间的相互关系,构建P2P关联网络模型,并在此基础上分别分析借贷项目和投资者的概念特征,得出相应的概念模型,为后续设计个性化投资推荐模型提供支持.
微观社会资本理论认为,社会网络中的个体行动者的社会地位状况及关系指向特征将影响其决策行为与经济结果.朋友网络是P2P借贷市场中的一种重要的在线社会网络,有别于传统的社会网络,该网络中的注册用户之间可以不受时空的限制自由地组织联系、快速地进行信息分享和市场交易,并由此建立各种关联.基于微观社会资本理论和P2P平台历史交易信息,通过分析P2P借贷市场中各对象之间的相互关联,构建相应的P2P关联网络模型,如图1所示,以分析其中各对象之间的关联特征.
Fig. 1 Example of P2P relationship network图1 P2P关联网络示例
图1定义了P2P关联网络中互为关联的相关对象的关系图G=(C,P,E),其中P表示借贷项目的集合,其属性特征包括借款类别、借款数量、借款期限、借款利率、信用等级等内容;C={L,B}表示P2P借贷平台贷款人(即投资者)L和借款人B的集合,其属性特征包括成员角色、关键字、债务收入比、所在城市、受教育程度等内容;E={E1,E2,E3}表示借款人、借贷项目、贷款人之间的P2P平台参与人(主要指借款人和贷款人)之间的直接朋友关系E1、借款人-项目之间的从属关系E2、贷款人-项目之间的投资关系E3的集合.
如图1示例所示,l1,l2,l3∈L,b1,b2∈B,p1,p2,p3∈P,其中,(l2,b1)∈E1表示贷款人l2与借款人b1之间的直接朋友关系,对此可用一个变量R1描述P2P平台参与人之间是否是直接朋友关系,如R1(l2,b1)=1表示贷款人l2与借款人b1之间是直接朋友关系;(l2,p1)∈E2表示贷款人l2对项目p1进行了投资,即存在贷款人-项目之间的投资关系,可用一个3维向量R2描述贷款人与项目之间的投资关系特征,如是否投资、投资数额、投资回报率,如R2(l2,p1)=(1,50,2.2%)T表示贷款人l2对项目p1进行了投资、投资额为50、投资回报率为2.2%;(b2,p1)∈E3表示项目p1属于借款人b2,即存在借款人-项目之间的从属关系,可用变量R3描述借款人与项目之间的从属关系特征,如R3(b1,p1)=0,则表示项目p1不属于借款人b1.
(1)
其中,h为调节参数.
(2)
在预期效用一定的情况下,式(2)也反映了该投资者在一定风险系数下,过去投资预期回报率与所承担的历史投资风险之间的关系:
(3)
(4)
由式(4)可知,投资者的风险厌恶系数与其单位风险溢价成正比,与投资者历史投资风险成反比.
文献[18]指出投资者进行投资决策时往往更多地受到社会资本因素引起的羊群行为的影响.文献[19]通过研究发现,在P2P借贷市场中,由于投资者面临异构偏好或者因获取及分析相关决策信息需要花费大量成本,会出现羊群行为,此时朋友投标将对其决策行为产生重要影响.因此,投资者lj是否愿意对借贷项目pi投标,除了与其初始投资偏好有关,还会受到其朋友(特别是直接朋友)投资行为的影响,一般投资者的直接朋友投资能力越强,其投资决策对该投资者的投资行为的影响会越大.
本节基于P2P关联网络模型,分析投资者之间的朋友关系,发掘用于反映投资者对某一借贷项目的投资偏好受到其直接朋友投标行为的影响程度的相关因素,称为投资者的朋友投标行为影响因子,并将其引入个性化投资推荐模型的设计中,以期能更为准确地把握投资者的当前投资偏好,提高投资项目推荐的有效性.
(5)
其中,|Lj|为投资者lj的直接朋友个数.
首先从基于用户协同过滤(user-based collabo-rative filtering, UCF)的个性化推荐方法出发,综合考虑项目投资相似度和项目投资者能力[5],结合投资者的朋友投标行为影响因子,确定每一位投资者的推荐投资项目列表;其次,考虑投资者风险厌恶系数和历史投资过程中所反映的风险承受能力,从投资者预期效用最大化出发设计投资推荐优化方案,确定其投资额在推荐投资项目列表中的分配.
在传统的UCF推荐方法中,对于借贷项目pi,投资者lj在时刻t的投资兴趣大小主要是通过计算其与截至时刻t已投资该项目pi的投资者之间的投资相似度来确定:
(6)
(7)
文献[5]综合考虑项目投资相似度和项目投资者能力对投资者投资偏好的影响,将投资者lj对项目pi的兴趣度表示为
(8)
然而,投资者的投资偏好不仅与项目投资相似度和项目投资者能力相关,而且在很大程度上还会受到其朋友(特别是有投资能力的直接朋友)投资决策的影响.因此,本文在文献[5]所提出方法的基础上,进一步考虑投资者朋友关系网络中投资者lj的直接朋友的投资能力及其对项目pi的投资情况,分析其对投资者lj的投资偏好的影响,并将投资者lj对投资项目pi的兴趣度调整为
(9)
一般认为,γt(lj,pi)越大,表示在时刻t投资者lj对项目pi的兴趣度越大,投资者lj在进行投资项目选择时越有可能选择项目pi.对于每一个投资者lj,可由γt(lj,pi)值的大小排序,产生一个粗略的推荐投资项目列表T1j.
经济学中往往将市场参加者的风险偏好分为三大类,即风险厌恶、风险中性和风险爱好.预期效用理论常用于分析在风险条件下“理性人”的决策行为,即在面临不确定性的决策环境时,投资者的决策往往是追求财富的预期效用最大化过程.在现实生活中,绝大多数的投资者是理性的风险厌恶者,但不同的投资者风险厌恶程度有所不同,因此其对应的效用函数中的风险厌恶系数将有所不同.对于一个投资者来说,其风险厌恶系数越大,一个单位的风险为其所带来的效用损失将越大,反之越小.针对不同风险厌恶程度的投资者,文献[20]引入了指数效用函数,用于对投资者行为决策过程进行分析,取得了显著的效果.在此,本文将在指数效用函数假设基础上,结合2.3节所分析的投资者风险厌恶系数及其风险承受能力,构建基于预期效用最大化的P2P借贷平台的投资组合优化模型.
对于投资者lj,假设其总投资金额为Mj,由3.1节所确定的推荐投资项目列表为T2j;并将投资者lj的总投资金额Mj在推荐投资项目列表T2j中的分配金额列表记为
vj=(vj1,vj2,…,vj|T2j|),
基于预期效用的P2P借贷平台投资优化模型的目标是:在3.1节所确定的投资者推荐投资项目列表的基础上,考虑投资者风险厌恶系数和历史投资风险,确定推荐列表中每一个投资项目的投资额,以使得该投资者预期效用最大化:
(10)
vj i≥0,i=1,2,…,|vj|.
(11)
本节描述基于投资者朋友关系和预期效用最大化的投资推荐过程,如算法1所示,包含2个输入数据集和2个参数.其中,SetH是训练数据集,由过去的是否违约已知的借贷项目组成;SetT是测试数据集,在该数据集中包含了当前潜在投资者可投标的借贷项目,这些借贷项目是否违约是未知的;r*表示投资者在无风险情况下的收益率,如购买国家公债或银行储蓄收益率,本文假设r*=0.025.
算法1. 基于投资者朋友关系和预期效用最大化的投资推荐.
输入:训练数据集SetH,测试数据集SetT,以及分别包含的借贷项目样本数量n1,n2;无风险情况下的投资收益率r*;投资者的投资能力与实际回报率之间的调节参数h(实验时设为0.05);
/*初始化及模型训练*/
/*建立SetH和SetT中各项目pi的概念模型*/
/*建立投资者集合L中各投资者lj的概念模型*/
/*确定SetT中接受投资推荐的各投资者lj(j=1,2,…,mac)的推荐投资项目列表T2j*/
/*确定SetT中各投资者lj(j=1,2,…,mac)的推荐投资项目列表T2j的投资额分配列表vj*/
基于投资者朋友关系和预期效用最大化的投资推荐过程可描述如下:
步骤4. 基于投资者朋友关系确定投资者的推荐投资项目列表(行).首先,针对每一位投资者lj,结合SetT中借贷项目pi的投标情况,分别计算在时刻t投资者lj与项目pi的其他投资者的相似度s(lj,lk),其中为截至时刻t已投标了项目pi的所有投资者的集合.其次,综合考虑项目投资相似度s(lj,lk)、项目投资者能力和基于朋友关系网络的投资者的朋友投标行为影响因子针对每一位投资者lj,计算其对SetT中借贷项目pi的投资兴趣度;最后,根据投资者lj对SetT中各借贷项目pi的投资兴趣度及投资者支持组项目,确定推荐投资项目列表T2j.
步骤5. 基于投资者风险偏好和预期效用理论,确定投资者的推荐投资项目的投资额(行).针对每一位投资者lj,根据步骤3所估计的投资者风险厌恶系数和预期投资风险从预期效用最大化出发,建立投资组合优化模型,确定投资者lj的总投资额Mj在推荐投资项目列表T2j中的分配金额列表vj.
Fig. 2 Conceptual association between lending projects and investors图2 借贷项目和投资者相关概念关联
实验数据来源于美国Prosper网络借贷平台2006-01—2012-01期间的开放数据.该数据集包含相互关联的7类对象信息,分别是项目类别、群组、注册成员、列表项目、投资项目、投标、角色,信息量巨大.其中,注册成员1 309 510个,列表项目371 896个,投标数为9 638 888.
为了便于训练和测试,首先,对该数据集进行了初步过滤,选取已完结且违约状态明确的25 229个借贷项目及与这些项目相关的列表项目、投资项目、投标和注册成员等信息,针对每一个借贷项目,根据列表项目数据、平台投标数据和注册成员数据统计计算其借款人和投资者的相关信息,同时,针对每一位投资者,根据平台投标数据、注册成员数据中的朋友属性列表分别统计其投标信息和直接朋友关联信息,以此作为构建P2P朋友关系网络的基础数据集;其次,考虑到数据的完整性,从基础数据集的25 229个借贷项目中选取了最终违约状态明确且相关数据完善的23 488个借贷项目,针对每一个借贷项目,计算传统财务指标特征值,并进行数值化、规范化处理,以此作为样本数据集;最后,将样本数据集按时间划分为2个数据集,其中,2006-01—2008-12期间的借贷项目的集合构成训练数据集SetH,在该数据集中包含了19 156个借贷项目,将2009年1月之后最终违约状态明确的4 332个借贷项目构成测试数据集SetT.拟采用文中所设计的投资推荐方法计算对应的投资者对测试数据集SetT中的4 332个借贷项目的投资兴趣度,确定其推荐投资项目列表及投资额的分配.
通过随机选取Prosper平台上的300个借贷项目进行统计分析发现,借贷项目的预期回报率与其违约风险显著正相关,如图2(a)所示,它们的Pearson相关系数为0.889.这表明对于潜在的投资者来说,如果他们想赚得越多,就需要试着选择高风险的借贷项目.根据金融经济学理论,风险厌恶系数越大,投资者则越厌恶风险,这对其风险投资的妨碍就越大.如果投资者风险厌恶系数较大,投资太过保守,则其实际投资收益往往较低,如图2(c)所示,当投资者风险厌恶系数大于2.3,其实际回报率则低于0.11.然而通过对平台投资者的投资预期风险和实际回报率进行分析发现,并非投资者承担较大的风险就一定能获得更高的投资收益,如图2(b)所示,很多的投资者所承担的风险很大,但它们的实际回报率却很低.从图2(c)中也可以发现,对于大多数P2P借贷平台的投资者,其风险厌恶系数较低,介于0.46~2.1之间,表示愿意投资风险较高的借贷项目,但是他们中仅有部分人实际回报率较高,获得较好的投资收益,究其原因,可能是由于经验不足而冒险选择了单位风险溢价较低的投资项目.
本文所提出的基于投资者朋友关系的投资推荐为FNI_OF模型,该模型按照3.1节的式(9)计算每一位投资者针对测试数据集SetT中的4 332个借贷项目的投资兴趣度,确定其推荐投资项目列表.为了检验FNI_OF模型的有效性,以LR模型[21]、UCF模型[22]、REC_G模型[5](简称为RGP模型)作为基准模型,即按照3.1节的式(8)计算每一位投资者针对SetT中的4 332个借贷项目的投资兴趣度,确定其推荐投资项目列表;其中,LR模型是依据文献[21]所用的逻辑斯蒂回归方法对SetT中的4 332个借贷项目进行违约风险评估,并在此基础上确定全局推荐投资项目列表.为了消除由于推荐投资项目数量的不同选择及随机取样所带来的偏差,保证验证结果的可信度,我们设置了不同的推荐投资项目数量,并分别计算每一位投资者的相应指标值,然后再求平均值.
首先,为了检验FNI_OF模型所确定的推荐投资项目列表与投资者实际投资决策的切合程度,本节采用投资推荐中较为常用的precision,recall,F-measure指标对上述2种方法的推荐结果进行对比,实验结果如图3所示.根据图3(a)、图3(b)和图3(c)不难发现,随着推荐投资项目数量k的增加,4种模型的推荐准确率(即precision_LR,precision_UCF,precision_RGP,precision_FNI)都随之下降,但4种模型的推荐召回率(即recall_LR,recall_UCF,recall_RGP,recall_FNI)和F-measure指标(即F_LR,F_UCF,F_RGP,F_FNI)都随之上升;与LR,UCF,RGP基准模型相比,考虑投资者朋友关系的FNI_OF模型的各项指标都要更优,这表明本文提出模型所确定的推荐投资项目列表更能符合投资者的投标兴趣和偏好,从而有助于提高推荐的有效性.
Fig. 3 Comparison about investment recommendation effect图3 投资推荐的效果比较
其次,为了检验推荐模型所推荐结果的投资决策效果,即向投资者推荐符合其投资需求的非违约项目的能力,本节提出requality1指标、requality2指标进行实验评估.一般认为,模型所确定的推荐投资项目列表中非违约的项目越多,该模型越有助于投资者规避风险;模型所确定的推荐投资项目列表中投资者最终投标且没有违约的项目越多,该模型越有助于投资者正确地选择满足自身投资需求的项目.其中,requality1指标用于反映推荐模型所确定的推荐投资项目列表中投资者最终投标且没有违约的项目数占其投资项目数的比例;requality2指标反映投资者最终投标且没有违约的项目数占推荐投资项目数的比例.
4种模型针对requality1,requality2指标的实验评估结果如图3(d)所示.根据图3(d)可以发现,与LR,UCF,RGP基准模型相比,对于不同的推荐投资项目数量k,考虑投资者朋友关系的FNI_OF模型的requality1(即requality1_FNI)、requality2(即requality2_FNI)指标都要更优,这表明本文提出模型所确定的推荐投资项目列表在提高推荐性能的同时,还有助于投资者规避投资决策风险,保证投资决策的有效性.
本节以文献[5]中所提出的REC_G模型(简称为RGP模型)作为基准模型,该模型首先通过3.1节的式(8)计算每一位投资者(即贷款人)针对测试数据集SetT中的4 332个借贷项目的投资兴趣度,确定其推荐投资项目列表,并在此基础上利用传统的投资组合推荐方法进行投资额的分配;FNI_OF模型是在RGP模型的基础上进一步考虑投资者朋友关系的投资组合推荐方法,即该方法首先利用3.1节的式(9)计算每一位投资者针对SetT中的4 332个借贷项目的投资兴趣度,确定其推荐投资项目列表,并在此基础上利用传统的投资组合推荐方法进行投资额的分配;FNI模型则是在FNI_OF模型确定的推荐投资项目列表的基础上,进一步考虑投资者预期效用最大化进行投资额的分配.针对以上3种模型,本节采用5个指标对各种模型的推荐经济效果进行对比分析,以便对本文所提出的FNI模型的推荐经济效果进行全面评价.
第1个指标是投资推荐的真实回报率,这是衡量投资组合推荐经济效果的一个重要指标.
在投资组合推荐过程中,如果投资者在推荐结果中的实际回报率与其预期回报率之间的差异越小,同时推荐的准确率和召回率越高,投资者投资的经济效益将越好.第2个指标PAQ(precision and return quality)和第3个指标RAQ(recall and return quality)是在文献[5]所提出相关指标的基础上改进得到,目的是考察投资者在推荐结果中的实际回报率与其预期回报率之间的差异对其投资满意度及经济效益的影响:
(12)
(13)
在投资组合推荐过程中,如果投资者承担单位风险所获投资实际回报率与其预期回报率之间的差异越小,同时推荐的准确率和召回率越高,投资者决策的经济效用将越好.因此,除了以上介绍的3个指标之外,本文提出了第4个指标RPAQ(under the unit risk precision and return quality)和第5个指标RRAQ(under the unit risk recall and return quality),目的是考察投资者承担单位风险所获投资实际回报率与其预期回报率之间的差异对其决策满意度及经济效用的影响:
(14)
(15)
第4个指标RPAQ定义为投资推荐准确率乘以投资者承担单位风险所获投资实际回报率与其预期回报率之间的差异.第5个指标RRAQ定义为投资推荐召回率乘以投资者承担单位风险所获投资实际回报率与其预期回报率之间的差异.这2个指标值越大,表明投资者的决策满意度越高、经济效用越大.
为了消除由于推荐投资项目数量的不同选择以及随机取样所带来的偏差,保证验证结果的可信度,我们设置了不同的推荐候选投资项目数量,并分别计算每一位投资者的相应指标值,然后再求平均值,最终结果如图4和图5所示.
Fig. 4 Actual return rate of investors under different circumstances图4 不同情况下投资者实际回报率的比较
Fig. 5 Recommendation economic performance of different models图5 不同模型推荐的经济性能比较
首先,分析各模型的推荐结果为投资者带来的实际回报率.在图4中,real_RGP,real_FNI_OF,real_FNI分别表示RGP,FNI_OF,FNI这3种模型的推荐结果为投资者带来的实际回报率.根据图4可以发现,在本文实验数据集中,对于不同的推荐投资项目数量k,3种模型的推荐结果为投资者带来的实际回报率都要高于投资者自行投资决策所获得的实际回报率.而与RGP基准模型相比,FNI模型的推荐结果为投资者带来的实际回报率最高,其次是FNI_OF模型.这表明本文所提出的基于投资者朋友关系和预期效用最大化的投资组合推荐方法能有效地提高投资者的实际收益率,使其投资组合推荐的经济效果更好.
其次,评价各模型的投资组合推荐的质量及经济意义.在图5(a)和图5(b)分别对比了在不同的推荐投资项目数量的情况下,各模型的PAQ指标和RAQ指标的性能.分析发现,FNI模型的投资组合推荐的PAQ指标和RAQ指标的性能都是最好的,其次是FNI_OF模型.这表明在投资推荐过程中,考虑投资者朋友关系对其投资偏好的影响,同时从投资者预期效用最大化出发建立投资组合优化模型,可有效地提高模型的投资组合推荐质量,使其推荐结果更具经济意义.
最后,评价各模型的投资组合推荐为投资者带来的决策满意度及经济效用.在图5(c)和图5(d)分别对比了在不同的推荐投资项目数量的情况下,各模型的RPAQ指标和RRAQ指标的性能.分析发现,FNI模型的投资组合推荐的RPAQ指标和RRAQ指标的性能都是最好的,其次是FNI_OF模型.这表明在投资组合推荐过程中,考虑投资者朋友关系对其投资偏好的影响,同时从投资者预期效用最大化出发建立投资组合优化模型,可有效提高投资者的决策满意度,使其推荐结果更具经济效用.
根据美国Prosper市场中的交易数据,在分析P2P借贷市场中各对象之间的相互关联关系的基础上构建了P2P关联网络模型,并基于P2P关联网络模型分别计算借贷项目和投资者的概念特征,得出相应的概念模型;基于多维社会资本理论,在前人研究的基础上进一步考察了P2P关联网络模型中的投资者朋友关系网络,分析了投资者的直接朋友投标行为对其投资偏好的影响;在计算投资者对借贷项目的投资兴趣度时,除了考察投资者与借贷项目已投标者的平均投资相似度和借贷项目已投标者的投资能力对投资者投资偏好的影响之外,同时还引入了基于朋友关系的投资者的朋友投标行为影响因子,并根据该影响因子调整投资者对借贷项目的投资兴趣度,结合投资者支持组中的新项目信息,以确定面向投资者的个性化的推荐投资项目列表;在指数效用函数假设基础上,考察投资者风险厌恶系数及历史风险承受能力,构建基于预期效用最大化的P2P借贷平台投资组合优化模型,确定投资者的总投资额在个性化的推荐投资项目列表中的分配,并对基于投资者朋友关系和预期效用最大化的投资组合推荐算法进行了整体设计;提出了新的评价指标,以评价投资推荐模型的推荐效果以及投资决策满意度、经济效益和效用.
实验结果表明:在投资推荐效果方面,与LR模型、UCF模型和RGP模型等基准模型相比,本文提出的考虑投资者朋友关系的FNI_OF模型,不仅在考察推荐情况与投资者实际投资决策的切合程度的传统指标precision,recall,F-measure上都要更优,而且在本文提出的考察推荐模型向投资者推荐符合其投资需求的非违约项目能力的requality1,requality2指标上也都要更优,这表明考虑投资者朋友关系的投资推荐方法更能反映投资者的真实投标偏好和投资需求,从而更有助于提高推荐的有效性;在投资组合推荐的经济性能方面,与RGP基准模型相比,考虑投资者朋友关系的投资组合推荐的FNI模型的投资者实际回报率以及PAQ,RAQ,RPAQ,RRAQ指标都要更优,这表明基于投资者朋友关系和预期效用最大化的投资组合推荐方法在优化模型投资组合推荐效果的同时,还能有效地提高投资者的实际投资收益和投资决策满意度,即其推荐的结果更具经济效益和效用.
另外,本文虽然是基于美国Prosper市场交易数据进行研究,但该研究的方法具有一般的借鉴意义.P2P作为互联网金融的主流模式之一,都存在平台信息不完全、“硬”信息质量不高、总体安全性低、平均风险性高的共性,因此,针对不同的P2P社交网络模式,只要适当地调整对应的P2P社交网络关联模型及概念特征指标的计算公式,则可将其应用于其他的P2P借贷市场中的投资项目投资组合推荐,以提升推荐的效果及推荐的经济性能.
在未来的工作中,我们打算进一步分析非P2P平台的社会资本信息,以便提取更多的影响投资者行为的社交网络特征指标,并将之应用于P2P平台的个性化投资组合推荐中,结合算法的改进,进一步提高投资推荐的效果及经济性能,为投资决策提供更好的服务.