P2P网贷市场主体信用风险生成机理的博弈仿真研究

2019-09-10 08:03:23谭中明刘媛媛

财会月刊·下半月 2019年11期

谭中明刘媛媛

【摘要】P2P网贷市场各主体产生的信用风险具有特定的生成演化机制。先采用博弈树对P2P网贷主体的信用风险生成演化进行理论分析，再基于“有限理性”的“最优反应动态”机制，建立P2P网贷过程的得益函数，对信用风险生成机理进行博弈仿真实验。研究表明，P2P网贷市场信用风险生成主体主要是借款人和P2P平台，生成大小与P2P平台年化收益率设定成正比，而与借款人通过网贷所得收益、借款人违约惩罚以及借款人长期守信所获奖励成反比。

【关键词】P2P网贷；信用风险；生成机理；博弈树；博弈仿真

【中图分类号】F830.5【文献标识码】A【文章编号】1004-0994（2019）22-0129-5

【基金项目】国家社会科学基金项目“基于生态圈视角的P2P网络借贷信用风险传导、动态评测与防控策略研究”（项目编号：16BGL049）

P2P网贷的出现为大量无法获得银行借款的小额资金需求者提供了有效的借款渠道，也有利于社会闲散资金的有效配置，进而完善金融资源配置体系。我国P2P网贷经历了最初的爆炸式发展后，近年开始进入矫正调整阶段。2016年8月颁布的《网络借贷信息中介机构业务活动管理暂行办法》，明确界定了P2P网贷平台信息中介的地位，P2P网贷平台逐渐回归互联网金融本质。相对于中心化的传统金融服务而言，P2P网贷这种脱离实体金融中介的纯线上信用审核模式会引发信息不对称问题，并由此产生逆向选择和道德风险[1]。网贷市场充斥着违约行为，潜藏着巨大的信用风险，P2P网贷平台爆雷事件频发，信用风险大有演化为社会风险之势。

本文首先对网贷市场中各参与主体的网贷行为进行博弈理论分析，建立博弈树来分析P2P网贷过程中信用风险生成节点；然后重点对借款人和投资人的得益函数进行博弈仿真，进一步探究信用风险生成的影响因素，以期对已有研究成果进行补充，为有效控制P2P网贷行业信用风险提供依据。

一、P2P网贷信用风险生成演化：基于不同主体之间的博弈理论分析

P2P网贷业务涉及多个利益主体，如借款人、P2P平台、投资人、第三方机构等，这些主体业务结构和目标各不相同，在决策过程中不可避免地存在非理性和机会主义倾向，可能导致决策失误、互相欺骗等行为，从而影响网贷市场效率，甚至引发整个P2P网贷市场的信用風险。借款人是网贷市场中的资金需求者，投资人是资金供给者，两者之间是资金再分配的关系。投资人与借款人之间的借贷过程主要依赖于P2P平台开展。P2P平台既帮助投资人对借款人进行筛选把关，也帮助中小企业等借款人获得投资。P2P平台基于长远发展和建立良好声誉考虑，会对借款人进行资质审查与筛选，可以认为P2P平台不存在协助借款人对投资人进行欺骗的行为。投资人有必要在决策前了解借款人情况，从而有选择性地借出资金。由此可以看出各主体间存在信息不对称，因此可采用博弈论进行分析。

对P2P网贷市场信用风险生成的博弈分析基于以下假设：①博弈行为主要在借贷流程中的借款人、P2P平台、投资人三方参与主体间两两发生；②P2P网贷市场借款门槛低，借款人质量不一；③对于资质良好、无虚假资料的借款人，P2P网贷平台容许其进行交易[2]。

在整个P2P网贷中，三方主体两两之间可采取的主要博弈行为如下：①借款人获得投资后可采取的措施为{守信，违约}，借款人的违约行为一定程度上会对P2P平台是否合规经营产生影响；②P2P平台针对借款人的借款申请可采取的措施为{信任，不信任}，P2P平台对投资人可采取的措施为{按时支付本息，不按时支付本息}，即平台在经营过程中可能会出现不按时支付本息、不合规履行职责，甚至卷款跑路的情况；③投资人针对借款人的借款申请可采取的措施为{投资，不投资}，投资人是否投资的决策也依赖于相关信息的搜集。

借款人与P2P平台之间的博弈主要在于P2P平台是否信任对方，若获得信任且通过平台获得投资后借款人是否守约；借款人与投资人之间的博弈借助P2P平台进行，主要在于投资人是否投资和借款人是否守约；投资人与P2P平台之间的博弈主要在于投资人是否在该平台投资，以及P2P平台是否按时向投资人支付本息。若P2P平台对借款人选择“不信任”策略，借款人丧失此借款机会，借贷交易不成立；若P2P平台对借款人采取“信任”策略，则借款人可在该平台上申请借款，有机会获得投资人的投资，此时若投资人采取“投资”策略，则借贷交易发生；若投资人采取“不投资”策略，则借贷交易不发生。获得投资后，借款人也可选择“守信”或“违约”。当借款人采取“守信”策略时，若P2P平台选择“按时支付本息”，则三方共赢，投资人达到赚取利息的投资目的，P2P平台赚取信息中介费用，借款人可解决资金不足的问题，同时也有机会在P2P平台上二次借款；若P2P平台选择“不按时支付本息”，则P2P平台获益，但投资人遭受损失，此时P2P平台就会产生信用风险。当借款人采取“违约”策略时，则借款人产生信用风险，且将风险传递至P2P平台和投资人，在下一次博弈时，P2P平台将不再信任该借款人，即使P2P平台再次给予该借款人借款机会，当其他投资人了解到借款人的信用值时，投资人将不会再次投资。

囚徒困境表明，个体会在潜在的长远利益与目前的短期利益之间进行权衡，多次博弈可能带来合作[3]。具体可用下图的博弈树表示[4]。

上述博弈分析表明，在借款人、P2P平台以及投资人的信用风险生成的博弈过程中，信用风险主要产生于借款人自身的主动与被动违约，以及P2P平台由于技术欠缺、自身财务危机、违规经营等导致无法按时支付本息。

二、P2P网贷信用风险生成演化博弈仿真分析设计

（一）有限理性下P2P网贷主体行为活动规则设计

传统的博弈论认为，经济个体具有“完全理性”的特征，但由于决策过程的非理性倾向，“完全理性”的假设是不符合实际情况的。因此本文将基于“有限理性”观点分析P2P网贷过程中的博弈主体演化规则。“有限理性”观点表明，参与主体可使用最优反应动态机制和复制者动态机制。前者一般适用于有限理性博弈者之间的策略进化，这些博弈者具有较强的学习能力和较快的反应速度，即该机制的分析总体基于一种假设：机制主体具有较强的学习能力，即使在复杂的情况下难以通过预见性进行准确判断，但整体具有很强的策略调整能力[5]。

由于主要参与者即借款人、P2P平台和投资人整体能力都相对较弱，对资源的利用有限，很难获取事件的详细信息，无法对其进行更为复杂的、具体的量化分析，因此对P2P网贷信用风险的分析主要是基于最优反应动态的博弈仿真。

根据上述博弈理论分析可知，信用风险主要来源于借款人与P2P平台两个主体。借款人是最大的信用风险来源，P2P平台主要对借款人进行信息审核，对最终借贷行为是否完成不产生决定性影响，借贷发生的主体是借款人和投资人。因此，此处基于最优反应动态建立的仿真模型主要是投资人与借款人两者的博弈仿真，通过对这两者的博弈仿真来分析P2P网贷业务信用风险生成的影响因素。本博弈仿真同样遵循前文理论分析假设，使用的软件是MATLAB R2014a。

（二）有限理性主体“预定策略”的组合配置

本次博弈仿真是以“最优反应”的“预定策略”为原则来为P2P网贷的参与主体事先制定博弈游戏规则。游戏中每个参与主体都要针对对手上次博弈选择的行为来确定此次博弈采取的策略。基于“预定策略”的游戏规则，主体通常依据“若对方……，则己方……”的行动指引来作出决策。这里需要先作出假设：设定主体只能看到对方前一次选择策略的结果（先设定参与主体通常记忆长度为一次博弈）。此次仿真规则设定需要依托美国罗伯特教授所完成的博弈论试验进行。其中，首次博弈参与者的选择是随机的，这里将借款人与投资人的策略统一称为“守信”或“违约”。当再次博弈时，参与者会依据对方上一次的策略制定相应的策略。

1.策略与反应策略假设。这里需要对参与者首次选择守信的概率、对方守信后第二次博弈时依旧选择守信的概率、对方违约后第二次博弈时选择守信的概率分别假设为三个参数P1、P2和P3，且P1，P2，P3∈[0，1]，將100%守信或违约的概率限制为非1即0，则概率为1代表“守信”、0代表“违约”。根据排列组合可以列举出所有的概率组合，如表1所示：

2.策略解释。将上述概率组合转化为策略后，根据策略和反应策略的假设，暂不考虑初始策略。按照反应策略的选择，可以把参与者的策略组合归纳成四类。这四类策略组合的意义为：①始终违约策略。参与主体在整个重复博弈中始终采用“违约”策略。②投机取巧策略。参与主体在首次博弈时采用“违约”策略，但在后续的重复博弈中，始终与对方前一次反应相反。③以牙还牙策略。参与主体在首次博弈时采用“守信”策略，但在后续的重复博弈中始终与对方前一次反应相同。④始终守信策略。参与主体在整个重复博弈中始终采用“守信”策略，保持对对方的绝对信任。

可以看出，始终违约策略组合与始终守信策略组合实际上对参与者来说并不是有效的。计算机可以把借款人与投资人这两个主体在基于“最优反应”的“预定策略”规则下的所有博弈选择情况模拟出来。

以上只分析了投资人一方的初始策略和反应策略，如果把借款人和投资人两方的策略相结合，将有64种组合策略，限于篇幅在此不进行详细讨论。

三、P2P网贷中借款人与投资人博弈的仿真分析

（一）P2P网贷中Agent、活动规则以及得益函数的定义

1. MATLAB仿真的Agent定义。在正式通过计算机实现对借款人和投资人双方博弈的仿真模拟前，先要定义本次博弈中的Agent。组成经济系统的个体被称为Agent，它具有认知与适应学习能力，通过简单的个体行为组合形成了复杂多变的经济现象[6]。根据P2P网贷有限理性主体选择分析，本次博弈仿真参与主体为借款人和投资人，因此在MATLAB R2014a中把借款人和投资人当作两种Agent。这两者可能的策略应由双方初始策略和博弈后的反应策略进行组合，即：

C={（1，1），（1，0），（0，1），（0，0）}+{始终违约策略，投机取巧策略，以牙还牙策略，始终守信策略}

2. P2P网贷中借款人与投资人得益函数的定义。假定借款人筹资额为L，P2P平台支付给投资人的年化收益率为r0，借款人通过该笔投资所得收益为R，借款人的违约惩罚（借款人由于违约导致无法再次通过P2P网贷获得融资的损失）为T，长期信用良好借款人获得的奖励为Y。由于P2P网贷提供信息中介服务，需要协助投资人对借款人进行审核，因此需要考虑P2P平台收取的费用，所以同时假定获益后P2P平台收取的投资服务费占投资人投资收益的比例为t，借款人的融资服务费和质保专款总额占筹资额的比例为y。以上各变量的约束条件为：变量均大于0，且Lr0（1-t）>0。根据投资人与借款人双方的策略选择可以得到两者的得益函数i（k）和b（k），具体如表2所示。

（二）P2P网贷信用风险生成演化的博弈数值仿真实例分析

1.博弈仿真设定。尽管理论上投资人和借款人双方可进行无限次合作（进行无限次博弈），但P2P网贷实际借贷过程存在一定期限，在现实中这种合作最多保持到4～5轮，故此次双方博弈仿真只进行到第四轮。为了对P2P网贷信用风险生成机理进行更为准确的研究，下面将对借款人和投资人的博弈矩阵给出数值实例进行分析。

2.博弈仿真样本选取。本次仿真以信融财富平台针对普通用户的P2P网贷业务中各相关指标数据作为样本，设定指标如下：筹资额L=100，年化收益率r0=10%，获益后P2P平台收取的投资服务费占投资人投资收益的比例t=10%，借款人的融资服务费和质保专款总额占筹资额的比例y=6%，借款人通过此笔投资可得到的收益R=20，借款人的违约惩罚T=60，借款人保持长期信用良好所获得的奖励Y= 0.2。

3.博弈仿真过程与结果。通过MATLAB R2014a进行四次博弈仿真后得到相应结果，如表3所示。

从表3可以看到，P2P网贷过程中，当投资人选择[1，1，1，1]策略，而借款人选择[0，0，0，0]策略时，表明在双方连续四次博弈过程中，投资人始终“信任”借款人，而借款人对此始终选择“违约”，在此情况下，投资人活动的累计得益最少；当投资人选择的策略为[0，1，1，1]，借款人对应的选择策略是[1，0，0，0]和[0，0，0，0]时，此时在投资人对借款人信任的三次博弈中，借款人都选择“违约”，投资人累计得益次少。以上分析结果符合实际现状，可见本模型仿真结果符合逻辑且具有可靠性。接下来将对其生成机理进行进一步分析。在实际P2P网贷过程中，此博弈仿真模型中的部分变量是在事先确定后保持不变的，包括：投资额L、借款人的融资服务费和质保专款总额占筹资额的比例y以及P2P平台收取的投资服务费占投资人投资收益的比例t。由此再对剩余变量的影响状况进行分析。剩余变量包括：年化收益率r0、借款人从此笔投资中得到的收益R、借款人的违约惩罚T以及借款人保持长期良好信用所获得的奖励Y。

（1）P2P网贷过程中剩余变量的变化规律。对于r0，在我国金融环境下，正常民间借贷年利率规定必须低于基准利率的4倍（约24%）。当前网贷监管下P2P网贷的年化收益率并不是随机的，正规的网贷平台参考年化率默认在7%至12%之间。通过上述博弈所得的得益函数可以看出，借款人选择“守信”所得的得益与r0变化趋势相反，此时借款人选择“违约”的概率反而提升，不利于控制信用风险。

对于R，借款人通过P2P网贷获得的投资一般有两种用途：一是普通借款人将获得的借款用于消费；二是中小型或初创企业利用获得的投资进行经营。两种情况中R都可以视为其获得的额外利润，其可能为正也可能为负，大部分情况下达到40%就被看作获得高收益。此处对R的上限进行设定，假设借款人通过借款获得的收益最高为投资额的1.4倍，即Rmax=140。

对于T，借款人的违约惩罚没有明确的范围限制。为约束其违约行为，借款人违约后受到的惩罚T越大越好。

对于Y，为了鼓励借款人长期保持信用良好，Y的值通常越大越好，且Y大于0，可以確定奖励值的增加对降低信用风险具有正向作用，此处不对Y的取值进行多次仿真。

（2）仿真分析剩余变量对P2P网贷信用风险的影响。在MATLAB R2014a中分别按照以下规则更改取值进行四次博弈仿真，就能分别得到新的仿真结果，通过四次仿真结果可以对P2P网贷过程中信用风险生成的影响因素进行分析。

将其他变量均视为常量，令R=140（原为20）。可以看出，随着R增加，投资人的得益始终没有受到影响，但借款人在获得投资额时得益明显增加。选择极端情况进行分析，当投资人选择[1，1，1，1]策略，而借款人选择[0，0，0，0]策略时，两者各自的累计得益数值为（-400，720），借款人的得益数值由初始的240增加到720。可以看出，借款人越容易获得信任和投资，就能获得越高的累计得益。为获得最大化利益，当借款人意识到保持“守信”能够获得更高收益时，会受到鼓励以获取更多投资，进一步诱导企业保持“守信”。因此，从P2P平台和投资人的角度来看，选择那些获利能力强的借款人能够使还款概率更加稳定，有利于降低信用风险。

将其他变量均视为常量，令T=100（原为60）。根据仿真结果可以发现，借款人的违约惩罚T增加带来的结果表现为：当投资人的选择策略为[1，1，1，1]，对应借款人的策略为[0，0，0，0]时，两者的累计得益数值由（-400，240）变为（-400，80），可见借款人若始终违约最终会导致其得益减少。

将其他变量均视为常量，令T=200。增加T到200时再次进行博弈仿真模拟，得到的结果表明，当投资人的选择策略为[1，1，1，1]，对应借款人的选择策略为[0，0，0，0]时，两者的累计得益数值为（-400，-320），借款人始终违约所带来的得益进一步减少，甚至变为负值，此时借款人不会再选择“违约”策略来损害自身利益。因此若对违约的借款人采取严格的违约惩罚措施，加大惩罚力度能够从借款人角度降低信用风险生成的可能性。

四、结论

本文主要采用博弈理论与博弈仿真实验相结合的方法，对P2P网贷信用风险产生的根源和产生节点进行分析。主要贡献在于将P2P网贷信用风险的生成聚焦于网贷市场各个主体之间。理论上，由于各主体之间存在信息不对称，因此从信息经济学角度，先对借款人、P2P平台以及投资人三个主体之间的关系进行博弈分析，并建立博弈树，发现P2P网贷各主体相互作用时信用风险产生的节点多数在于借款人和P2P平台。

在仿真实验中，基于“有限理性”的“最优反应动态”机制，以信融财富平台的相关指标数据作为样本，对借款人和投资人的得益函数进行四次博弈仿真，检验发现该模型所反映的关系是符合现实逻辑的。再通过几个变量做数值变化，进行多次仿真，证明当只考虑借款人、P2P平台以及投资人时，信用风险大小与P2P平台年化收益率设定成正比，而与借款人从此笔投资中得到的收益、借款人的违约惩罚以及借款人保持长期信用良好获得的奖励成反比。这也与理论分析中在不同主体间的信用风险生成影响因素相吻合。这些结论可为P2P网贷信用风险的控制提供参考。

主要参考文献：

[1]卢馨，李慧敏..P2P网络借贷的运行模式与风险管控[J]..改革，2015（2）：60～68..

[2]俞林，康灿华，王龙..互联网金融监管博弈研究：以P2P网贷模式为例[J]..南开经济研究，2015（5）：126～139..

[3]张发，宣慧玉..重复囚徒困境博弈中社会合作的仿真[J]..系统工程理论方法应用，2004（2）：112～ 115..

[4]曹宝瑞..我国P2P网贷资金存管制度影响因素研究——基于博弈理论视角[J]..技术经济与管理研究，2018（9）：69～73..

[5]刘建美，马寿峰..基于有限理性的个体出行路径选择进化博弈[J]..控制与决策，2009（10）：1450～ 1454..

[6]李群，宣慧玉..基于Agent仿真技术在经济建模中的应用[J]..系统工程理论方法应用，2001（3）：221～225..

作者单位：江苏大学财经学院，江苏镇江212013