P2P平台借款人信用风险评估模型构建
——基于模糊层次分析法

2020-03-31 07:27廖梦晗张丹丹
关键词:借款人信用风险借贷

廖梦晗,陈 晨,张丹丹

(1.武汉科技大学 恒大管理学院,湖北 武汉 430065;2.武汉工商学院 管理学院,湖北 武汉 430064)

目前,P2P(peer-to-peer lending,P2P)网络借贷进入国内尽管已经有10年时间,但各类管理系统还不够健全,仍然存在很多复制英美等发达国家平台的痕迹。在国外,运营较为成功的平台Zopa,成立于2005年3月,目前拥有超过50万注册会员;世界上最大的平台Prosper,成立于2006年,目前拥有超过220万注册会员,有超过20亿美元的借贷发生额。[1]

P2P网络借贷不是简单意义上的无抵押贷款,实质上是借贷双方通过互联网平台发生借贷,它是互联网与现代金融相结合的产物。它与传统的借贷方式一样满足了借款方的资金需求,在征信体系和闲散资金的分配方面,与传统的借贷方式相比,P2P网络借贷更加公开、透明。

我国的P2P起步较晚,没有完善的征信体系做支撑,导致借贷平台对借款人缺乏科学合理的评估方法。某些借款人利用这些漏洞,故意伪造自己的信用度来骗取资金,借款后恶意违约,这种恶意的行为给贷款人和借贷平台带来很大风险。因此,构建P2P借款人信用风险评估模型具有重要的现实意义。

一、P2P借款人信用风险评估指标体系构建

(一)信用风险评估指标体系构建原则

为了对P2P借款人信用风险的评估更加准确,同时保证评估系统能顺利地设计与实施,首先需要分析P2P借款人信用风险的影响因素,然后研究这些因素产生的原因、内在的关系和变化的机理。在建立P2P借款人信用风险评估指标体系过程中要遵循一定的原则。

1.指标的全面性与重要性相结合

P2P借款人的信用风险评估指标的全面性是指其能够反映信用风险各方面的问题,这些指标之间要有一定的逻辑性。影响P2P借款人信用风险的因素较多且复杂,所以在建立指标体系的时候,为保证各指标紧密联系,所选取的指标不仅要全面,而且需具有代表性,这样在避免重复选取的同时,还能提高评估的准确度。

2.指标内容的动态性与相对稳定性相结合

为了保证评估系统的稳定性,在建立指标体系时,所选取的指标需要有相对稳定性。这样,即使社会环境、经济环境有较大的变化,指标体系的逻辑结构也不会受到较大的影响,总体上呈现稳定的状态。但是这些指标也不是一成不变的,需要根据时间的变化而不断更新。因此,所选取的指标不仅要相对稳定,而且要具有动态性。

3.指标的可行性与有效性相结合

指标的可行性与有效性是指收集到的指标可以量化,便于分析问题,在指标体系建立之后能评估借款人的信用风险,同时,收集指标时所花费的财力物力也是可以接受的。这样,所建立的评估体系将会更加准确、有效。

4.定性指标与定量指标相结合

定量指标能够准确地定义、评价P2P借款人的信用风险,由于其量化的特点,计算出的数值也可以直接反映问题所在,更加客观、有效、有说服力。当然不是所有的指标都能够量化,还需要定性指标的辅助作用,通过这些定性指标对影响因素进行描述分析,从而反映问题的所在。两类指标相结合,使得构建的指标体系更加全面而具体。

(二)影响借款人信用的基本因素

基本属性指标包括性别、年龄、文化程度、婚姻状况、所在地等。一般认为,男性的违约率会高于女性,并且他们也不太关注信用记录;处于不同年龄段的人群,他们的经济能力与风险偏好都有所不同,接受风险和承担风险的能力也不同;婚姻状况会影响借款人的家庭收入水平与消费结构,婚后责任感的增强也会提高其信用度;不同的地域所给予的经济、政策、文化氛围、环境风气也会对借款人的信用造成影响。

偿债能力指标包括职业类型、月收入、工作年限、名下不动产属性和购车情况等。月收入能直接反映借款人的还款能力,一般来说,月收入越高,还款能力越强,但这并不代表其违约的风险就越小,因为高收入的人也更容易偏好于高风险的投资。名下不动产属性和购车情况也可以从侧面体现借款人的经济实力。

借款产品指标包括金额、用途、期限、利率、标的等。一般情况下,为得到更多的借款金额,提供较高利率的借款人信用状况相对较差;同样地,随着借款期限的延长,资金的流动性降低,违约风险也会加大。

借款人历史信用指标包括信用卡情况、逾期还款笔数占总还款笔数百分比、违约情况、央行认证信息等。这些信用指标可以为P2P网络借贷平台衡量借款人的信用度提供更为真实的参考数据。

(三)借款人违约特征分析

1.数据来源

为了较为准确地分析我国P2P网络贷款平台借款人的信用风险影响因素,本研究选取国内首家提供无担保的网络借贷平台,同时也是第一家由工商部门批准的具有金融信息服务资质的互联网金融平台拍拍贷[2]作为研究对象。

为了确保数据分析的有效性,本研究随机选取平台中4027条借贷数据,除去一些不准确、不完整的信息,最终选取2505条数据作为分析样本。

由于以互联网作为媒介展开调查有一定局限性,所以调查到的信息也比较简单。针对本研究构建借款人信用风险评估模型的目标,分别对正常还款的用户样本和违约还款的用户样本进行统计和分析。

2.样本分析

从年龄看,20~29岁的违约率达到21.20%,是违约率最高的年龄段,30~39岁、40~49岁、50~59岁、60岁及以上的违约率分别为17.11%、11.36%、10.11%、8.33%。由此可以看出,随着年龄的不断增长,借款人违约率越来越低,信用风险越来越小。这一现象的出现,不仅与每个年龄阶段对待风险的意识有关,还跟其收入和工作年限有关。此外,60岁及以上的年龄层,参与人数非常少,可以看出他们对待新鲜事物十分谨慎。

从性别看,男性借款的人数大大超过女性借款的人数,并且男性的违约率也大于女性的违约率。这反映出女性在贷款方面相对保守,并且女性对信贷的了解程度相对于男性较弱,在信贷平台的活跃度也较低。

从婚姻状况看,未婚借款人的违约率高达27.19%,居于四类人群中的首位。可以看出,未婚人士在责任感方面并不强。而已婚人群与离婚人群相差不大,这可能跟婚后家庭的消费结构及自身对于家庭的责任感有关。

从文化程度看,借款人文化水平越高,违约率越低,相对应的信用风险也越低。这说明文化水平高的人群收入更加稳定,并且接受了更加完善的诚信教育,同时,学历越高的人越能更快接受新型的借贷模式,对于信贷的认识也更为全面。

(四)其他风险评价指标分析

除借款人自身因素与信贷产品的因素之外,P2P平台的管理能力与社会环境对P2P的影响也是要考虑的因素。例如,平台对该借款人的风险控制能力与其后台的追踪能力都属于平台内部的管理风险,它与信贷人本身的特征没有关系,但信贷人会根据平台所存在的漏洞来寻找各种途径逾期或者违约。而法律因素更是这一个大环境中平台与借贷双方都必须绝对遵守的。这些指标不同于之前所提到的借款人自身基本能力指标,而是平台根据不同借款人的实际情况进行评估衡量的,当然也成为P2P借款人信用风险的关键因素指标。

二、模糊层次模型

(一)层次分析法(AHP)

层次分析法是美国运筹学家萨蒂(T.L.Saaty)于20世纪70年代初期提出的决策方法。它的出现使得定性问题的分析更为简便和灵活。其通过分析复杂系统所包含的因素及相关关系,将问题条理化、层次化,然后将每个层次的各个因素按照一定的标准进行两两比较,得到两因素的重要程度,同时得到判断矩阵。[3]

(二)模糊综合评价法(FCE)

模糊综合评价法是一种基于模糊数学的综合评价方法。该综合评价法根据模糊数学的隶属度理论把定性评价转化为定量评价。[4]

(三)模糊层次分析法(F-AHP)

模糊层次分析法是将层次分析法中的指标分层方法和模糊理论相结合,借助模糊判断矩阵实现决策由定性向定量转化,直接由模糊判断矩阵构造模糊一致性判断矩阵,使判断的一致性得到解决,然后通过模糊数矩阵和层次分析法得出的权重向量计算得到模糊综合权重,最后对其排序。[5]该方法能有效表达判断的不确定性及有效降低专家的个人偏好对打分的影响。同时,判断矩阵的模糊性弥补了AHP的缺点,简化了人们判断目标相对重要性的复杂程度。

(四)模糊层次分析法的步骤

1.风险因素层次分析结构模型的建立

在研究问题的初期,为把问题条理化和层次化,需构造出一个层次分析模型。把选出的指标按其属性进行分层分组,同一层次的元素作为准则对下一层次的某些元素起支配作用,同时又受上一层次某些元素的支配,进而建立如下结构模型[6]:

(1)目标层(A):只包含一个元素,为既定问题的目标或者理想的结果。

(2)准则层(B):包括为实现目标层所涉及的各个准则。

(3)因素层(C):准则层所阐述的一级指标细分出的二级指标。

2.模糊互补判断矩阵的构造

建立风险因素层次分析结构模型,确定因素层次之间的隶属关系,然后构造各层次元素的模糊判断矩阵。做因素间的两两比较判断,采用一个因素比另一个因素的重要程度定量比较,得到模糊判断矩阵。[7]通常用0.1至0.9九度标法做出因素间的数量标度,如表1所示。

表1 0.1至0.9九度标法数量标度

定义1:设模糊矩阵A=(aij)n×n,若矩阵中的元素满足aij+aji=1,则矩阵A被称为模糊互补矩阵。

将因素a1,a2,…,an两两比较判断,得到模糊判断矩阵A。可知矩阵A=(aij)n×n满足定义1的条件,可以判断出公式(1)是模糊互补矩阵。

(1)

3.模糊互补判断矩阵权重的计算

定义2:设模糊互补判断矩阵A=(aij)n×n,利用公式(2)对矩阵A的各行求和,再利用公式(3)做数学变换。

(2)

(3)

得到模糊一致性矩阵R=(rij)n×n,对矩阵R进行归一化处理,得到因素排序向量W=(W1,W2,…,Wn)T,其中Wi满足公式(4)。

(4)

4.模糊互补判断矩阵的一致性判断

判断由公式(4)得到的因素的重要性权重值是否合理,需要对模糊互补判断矩阵进行一致性检验。当偏移一致性过大时,表明此时加权向量的计算结果作为决策依据是不可靠的。

定义3:设矩阵A=(aij)n×n和B=(bij)n×n均为模糊判断矩阵,称公式(5)为A和B的相容性指标。

(5)

定义4:设W=(w1,w2,…,wn)T是模糊判断矩阵A的权重向量,其中W满足公式(6)。

(6)

令Wij满足公式(7)

(7)

则称n阶矩阵W*[见公式(8)]为模糊判断矩阵A的特征矩阵,对于决策者的态度α,当相容性指标满足公式(9)时,认为模糊判断矩阵A为满意一致性的。

W*=(Wij)n×n

(8)

I(A,W*)≤α

(9)

α越小,表明决策者对模糊判断矩阵A的一致性要求越高,一般可取α=0.1。

5.风险因素层次总排序

在计算出各层各因素之间的权重之后,将它们的权重对应到自身,再计算所有元素对于目标层的相对重要性的排序权重,这个过程是从最高层次开始逐层向低层次进行的。例如,第二层次准则B包含n个风险准则因素B1,B2,…,Bn,其在本层次所占的权重分别为b1,b2,…,bn,下一层次C包含m个风险因素C1,C2,…,Cm,它们对于因素Bi的层次单排序重要性权重分别为Ci1,Ci2,…,Cim。C层总权重向量(c1,c2,…,cm)可以用公式(10)来计算。

(10)

其他层次的权重也是按照这样的方法逐层计算,直至最底层为止,可以得到所有风险因素相对于目标层次的权重排序,即可以实现所有风险因素的重要性排序。

三、P2P借款人信用风险评估模型构建

(一)建立层次分析结构模型

通过对P2P网络借贷平台信贷人的信用风险进行识别和分析,列出有关借款人信用风险的一系列因素(如表2所示)。将借款人信用风险指标进行分层和分类后,得到结构模型。

表2 借款人信用风险因素表

(二)指标重要度的数据来源

本研究通过对10位熟悉P2P网络借贷平台的管理人员和金融借贷行业的从业人员进行问卷评分调查,收集评分表,得出数据。

(三)构造模糊互补判断矩阵,进行两两比较判别

第二层对第一层的互补比较判断矩阵为:

第三层对第二层的互补比较判断矩阵分别为:

(四)模糊互补判断矩阵权重的计算

根据定义2,对矩阵A、B1、B2、B3、B4、B5、B6进行权重向量的计算:

WA=(0.14,0.173,0.16,0.2,0.2,0.127)

(五)模糊互补判断矩阵的一致性判断

根据定义2,对矩阵A、B1、B2、B3、B4、B5、B6进行特征矩阵的计算:

根据定义3,分别计算模糊互补矩阵A、B1、B2、B3、B4、B5、B6与其特征矩阵WA*、WB1*、WB2*、WB3*、WB4*、WB5*、WB6*的相容性,得到如下结果:

I(A,WA*)=0.096<0.1

I(B1,WB1*)=0.081<0.1

I(B2,WB2*)=0.069<0.1

I(B3,WB3*)=0.094<0.1

I(B4,WB4*)=0.085<0.1

I(B5,WB5*)=0.065<0.1

I(B6,WB6*)=0.078<0.1

经以上检验,所给指标的相容性指标均小于0.1,可以得出经上述计算得出的模糊判断矩阵A、B1、B2、B3、B4、B5、B6是满意一致的,从而验证了其权重WA、WB1、WB2、WB3、WB4、WB5、WB6的分配的合理性。

(六)风险因素层次总排序

根据计算结果,将权重分配到每个因素中,得到表5。

根据模糊层次分析法中的理论,并应用公式(10)可以计算出最底层的每个风险影响因素的标准的排序向量:

WA=(0.0206,0.0242,0.0252,0.0234,0.0284,0.0182,0.0289,0.0341,0.0265,0.0299,0.0230,0.0306,0.0304,0.0320,0.0384,0.0352,0.0240,0.0450,0.0500,0.0600,0.0450,0.0416,0.0534,0.0484,0.0566,0.0381,0.0361,0.0528)

对以上结果进行排序,便可以识别出影响借款人信用风险的关键因素。

表4 指标评估标准表

(七)模型解例

在表2所列举出的借款人信用风险影响因素指标中,存在着一些定性指标,例如性别、婚姻状况、年龄、学历等。在前文对逾期借款人的特征分析的基础上,再对一些定性指标给予适当评估标准,如表4所示。以上标度仅做参考,基于每个平台的情况不同,可自行制定标度。

如表4所示,给出拍拍贷中三个借款人的指标数据,运用P2P借款人信用风险评估模型,便可以选出信用度较高的借款人。

表5 借款人信息表

注:数据来源于拍拍贷

把表4、表5中的数据换算出数值,如表6所示。

可以看出,借款人A、B、C的各项指标得分参差不齐,并且由于指标数量较多,无法直观分析出他们的信用度,所以将每个指标的分数与指标的权重相乘,如表7所示。

通过比较可以看到,借款人B相对于A和C来说信用度最高,最不容易逾期,而借款人A的信用度在A、B、C中是最低的。通过分析结果还可以看出,目前拍拍贷平台对于借款人的信息采集指标不够完善,指标体系中很多指标空缺,导致借款人评分较低,准确度也较低。因此,借款人的信息越完善,评估的准确度就越高,评估模型的评分也会相对较高。

表6 指标换算表

四、建议

通过对借款人信用风险影响因素的分析和模型的建立,可以得到权重位于前五位的指标是违约情况、平台贷后对借款人的追踪程度、平台对该借款人的初步信用评估准确度、借款人信息共享程度和逾期还款笔数占总还款笔数百分比,权重位于后五位的指标是户籍状况、性别、购车情况、婚姻状况、借款标的。可见,平台自身的管理制度和偿债能力的指标是决定借款人信用较为关键的因素,相对来说,借款人自身的基本情况次要得多。综合以上因素权重的排序结果,针对我国P2P借款人的信用风险问题本研究提出相应的建议。

表7 借款人信用风险计算表

(一)平台提高对借款人信息采集的真实度

提高对借款人信息采集的真实度,是准确预测借款人违约概率大小的前提。表2中的基本属性指标、偿债能力指标、借款者历史信用指标均属于对借款人信息采集类的指标。在这些指标中,违约情况位列第一,占整个指标体系权重的0.06。其次是逾期还款笔数占总还款笔数百分比,占总权重的0.05。对借款人可能违约的影响程度依次为信用卡情况、央行认证情况、收入、债务比率、名下不动产属性和单位类别等。

借款人完善信息的充分情况与评估结果正相关,也就是说,在同等条件下,提供给平台评估的数据越多,越有优势。但如果这些信息中包含大量伪造信息,不但影响评估数据的转换,而且影响评估的结果,不真实的数据源只会让评估结果不真实。

平台采集的借款人数据的来源,不能只限于借款人,还应包括政府公共部门、合作机构、其他电商平台等,这些数据的来源也体现了借款人信息共享的程度。

(二)平台加强对借款人贷后追踪力度

通过对P2P借款人信用风险影响因素的权重分析可知,平台贷后对借款人的追踪程度位于所有权重的第二位。也就是说,平台对于借款人的控制能力,也是借款人能否按时还款付息的重要原因。本研究前文提到过,借款人成功借款之后,出资人并不知道借款人是否把钱用在当初约定的项目上,不排除借款人为提高投资收益而把钱用在风险更高的项目上,这样一来,投资人收回贷款的风险可能会加大。如果这时候平台对借款人进行贷后业务追踪,让借款人提供项目的合格文件或拟办公司的许可证等可以公开的文件,则是一种比较好的方式。

平台加强对借款人借款之后的追踪力度,投资人也可以更加准确地衡量所借贷项目的风险性从而进行决策。

(三)建立大数据信息共享模式

我国个人征信系统不完善,信用共享程度也较低,造成借款人信用风险问题突出。因此,建立完整有效的个人征信体系和大数据信息共享系统是有效降低借款人违约概率的关键要素。结合前文对借款人特征的研究,应建立大数据信息共享模式,更好地管理和控制借款人信用风险问题。

大数据信息的来源可以是各大电商平台、理财平台,也可以是移动、联通等运营商数据库中的信息数据,这些大数据再结合线下借款人自身提供的数据,便可以形成一个较为全面的个人信息库。与传统的信息采集模式相比,大数据信息共享模式有一定的优点。一是信息的数据来源广泛,覆盖全面,并且对于很多在专业征信体系中没有信息的群体,大数据信息都能覆盖。数据种类丰富多样,不仅可以反映借款人借贷的数据,而且能全面地反映个人的信用情况。二是数据时效性、真实性和利用度强,不仅可以动态反映借款人的信用状态变更,而且可以在最短的时间内收集到借款人的真实信息,对于借款人在平台内部的认证也可以给其他平台一个参考。三是大数据模式降低了成本。

因此,我国可以建立大数据信息共享模式,在提高信息的真实性和有效性的同时,再利用评估模型对借款人的信用风险进行进一步评估和控制。

(四)加大对逾期还款人的惩罚力度

在国内,人们经常忽视逾期还款的后果,其实逾期还款是降低个人征信度的幕后黑手,导致这种情况普遍发生的原因是对逾期还款的惩罚力度还不够。此时就需要依靠法律的力量来对借款人进行约束,例如有的平台提出若借款人如期还款,则能享受到较低的借款资金成本,但若恶意违约,就需缴纳额外的罚息。

猜你喜欢
借款人信用风险借贷
油气贸易企业信用风险管理研究
《信用风险管理:从理论到实务》
民间借贷纠纷频发 诚信为本依法融资
浅论借户贷款情形下隐名代理的法律适用
小微企业借款人
让民间借贷驶入法治轨道
热词
京东商城电子商务信用风险防范策略
一张图看懂民间借贷“防火墙”
民间借贷年利率超过36%无效