中国互联网金融中的婚姻歧视研究
——来自“人人贷”的经验数据

2018-03-06 09:57
新疆财经 2018年1期
关键词:信用等级借款人借款

(呼伦贝尔学院 数学与统计学院,内蒙古 021008)

一、引言

P2P(Peer to Peer Lending)网络借贷属于互联网金融产品的一种,又称为点对点网络借款,是一种将小额资金聚集起来借贷给有资金需求人群的一种民间小额借贷模式(谢平、邹传伟,2012)。其最大的优越性是,突破了地域、熟人关系、贷款抵押等传统限制,使传统银行难以覆盖的借款人在虚拟世界里能充分享受到贷款的高效与便捷(Michels,2012)。近年来,P2P网络借贷平台迅速增长,迄今比较活跃的有350家左右,2016年整体成交额突破2万亿元,呈现出良好的发展前景。在这种非面对面的借贷模式中,借款人个人信息的公布成为投资人的重要决策依据。然而,借款人信息的公布也引起了严重的歧视问题,比如性别歧视、年龄歧视、地域歧视、身份歧视、种族歧视等,这些都引起了国内外众多学者的深入研究。

劳动力市场中对于婚姻歧视的定义,是指那些具有相同能力、教育、培训和经历并最终表现出相同的劳动生产率的劳动者,由于个人婚姻状况的特征所引起的在就业、职业选择、晋升、工资水平、接受培训等方面受到的不公正待遇。在互联网金融的信贷市场中,婚姻歧视通常指还款能力相同的借款人,由于婚姻状况的不同在网络借贷市场上受到了不公平的待遇。从借款角度,如果已婚借款人相比较未婚借款人,其在网络借贷中更容易获得投资人的信任而成功获得借款。那么,我们将其称为第一类婚姻歧视。从还款角度,如果未婚借款人相比较已婚借款人,其拥有更低的借款违约率,但在获得借款的可能性上却与已婚借款人没有明显差别。那么,我们将其称为第二类婚姻歧视。本文主要实证分析在中国互联网金融市场中是否存在婚姻歧视及其具体表现形式。

网络借贷平台的迅速发展目前已经引起了国内外学者的广泛关注。在借款成功率影响因素方面,Ravina(2008)和Herzenstein and Andrews(2008)发现,种族、年龄、性别、体重对于借款人的借款成功率均有显著影响;李悦雷、郭阳、张维(2013)通过对拍拍贷平台的实证分析发现,借款订单基本属性、借款人基本信息、借款人的社会资本对借贷成功率均有显著的影响;彭红枫、赵海燕、周洋(2016)和李焰等(2014)研究了借款人的描述性信息对于借款成功率的影响。在借款违约率影响因素方面,陈霄、丁晓裕、王贝芬(2013)通过对808信贷平台的借款进行分析发现,借款人信用等级、生活状况等对借款人逾期率有显著的负向影响,逾期还款次数、受教育年限等对借款人逾期率有显著的正向影响;顾慧莹和姚铮(2015)使用WDW上海直营店的运营数据研究发现,外地户籍、已婚和历史违约记录与借款违约率和违约速率均为正相关关系,同时,家人知晓借款和借款目的的真实性与借款违约率和违约速率均为负相关关系。在羊群行为研究方面,廖理等(2015)和张科、裴平(2016)分别针对人人贷平台数据研究发现,在我国P2P网络借贷中存在羊群效应,借款完成进度所引发的羊群行为呈现边际递减趋势,且信息不对称是影响贷款人羊群效应的重要因素。

在歧视研究方面,经济学中提出两种歧视:第一种是Phelps(1972)提出的有效统计歧视;第二种是Becker(1957)提出的非有效偏好歧视。关于身份歧视,吴小英和鞠颖(2012)的研究发现,投资人对于学生身份存在一定的歧视;庄雷和周勤(2015)的研究发现,如果将借款人身份细分为网店店主、私营业主、工薪阶层、学生、其他五类的话,则在网络借贷中存在身份歧视。关于性别歧视,Barasinska and Schaefer(2010)通过对欧洲最大的P2P网络借贷平台Smava进行研究,发现在网络借贷中并不存在性别歧视的现象,但是对女性借款人倾向于设定更高的借款利率;陈霄和叶德珠(2016)通过人人贷数据进行实证分析后发现,女性违约率更低,但其借款成功率与男性相比却无明显差异,但是,单身的女性借款人容易受到借款歧视。关于地域歧视,廖理等(2014)通过对人人贷平台的交易分析发现存在明显的地域歧视,同时,被歧视省份的订单违约率并未明显高于其他省份,说明属于非理性歧视行为;蒋彧和周安琪(2016)的研究发现,地域歧视具有异质性,高学历、高信用等级、认证数量多、借款金额低的借款人未受到明显的地域歧视,而低学历、低信用等级、认证数量少、借款金额高的借款人受到了投资人明显的地域歧视。关于学历歧视,廖理等(2015)的研究发现,高学历借款者如约还款概率更高,但并未明显受到投资者的青睐,说明网络借贷市场中对于学历对违约风险影响的认识还存在偏差。

以上研究成果为我们提供了很好的启示,但仍存在一些不足:一是缺少对于网络借贷中婚姻歧视的研究;二是缺少从性别和婚姻的交互效应角度来考察婚姻歧视问题;三是缺少从借款违约率角度考虑婚姻歧视是否为理性歧视的研究。基于此,本文以“人人贷”网络借贷平台的借款数据为例,从上述三个方面进行探讨。

二、研究设计

(一)数据来源

人人贷,系人人友信集团旗下公司及独立品牌。自2010年5月成立至今,服务范围已覆盖全国30余个省的2000多个地区,服务了几十万名客户。本文选取2015年1月1日至2015年6月30日期间人人贷网站的全部借贷数据作为初始样本,共287359个。借鉴相关文献的处理方式,对原始数据完成了如下预处理:一是剔除了机构担保和实地认证的借款;二是剔除了借款人年龄在18周岁以下的借款;三是剔除了信息有缺失的借款;四是港澳台三个地区由于借款数量很少,予以剔除,最终得到有效样本数100592个,其中:借款成功样本67367个,借款失败样本33225个,借款成功率为66.97%。在借款成功的样本中,借款违约331个,违约率为0.33%。

(二)变量的选择

本文将借款人信息的主要变量分为标的特征、个人特征和信用特征三部分。

1.标的特征。包括以下几个方面:

(1)借款成功(success):哑变量,借款成功时取1,否则取0。

(2)借款违约(default):哑变量,借款逾期或者已由人人贷垫付时均视为违约,违约取1,否则取0。

(3)借款期限(duration):反映借款人的还款期限。

(4)借款金额(amount):反映借款金额,文中对其取了对数(ln_amount)。

(5)借款利率(rate):反映借款人设定的借款利率。

2.个人特征。包括以下几个方面:

(1)已婚状况(marriage):哑变量,已婚取1,其他情况取0。

(2)离异状况(divorce):哑变量,离异取1,其他情况取0。

(3)已婚男性(marriage_male):考察已婚和性别交叉因素,哑变量,已婚男性取1,否则取0。

(4)离异男性(divorce_male):考察离异和性别交叉因素,哑变量,离异男性取1,否则取0。

(5)性别(gender):哑变量,是重要的解释变量,男性取1,女性取0。

(6)年龄(age):对借款人年龄进行分组处理,30岁及以下取1,31~40岁取2,41~50岁取3,50岁以上取4。

(7)教育水平(education):对借款人学历进行分组处理,高中及以下取1,大专取2,本科取3,研究生及以上取4。

(8)公司规模(scale):对借款人所在公司的规模进行分组处理,10人以下取1,10~100人取2,100~500人取3,500人以上取4。

(9)工作年限(workingtime):对借款人的工作年限进行分组处理,1年(含)以下取1,1~3年(含)取2,3~5年(含)取3,5年以上取4。

(10)所在城市(city):根据2015年《中国统计年鉴》数据,按照城镇居民可支配收入进行排序。排名前10的省级行政区取1,表示高收入地区;排名11~20名的省级行政区取2,表示中收入地区;其他省级行政区取3,表示低收入地区。

(11)房贷(houseloan):哑变量,有房贷取1,否则取0。

(12)车贷(carloan):哑变量,有车贷取1,否则取0。

3.信用特征。即信用等级(credit):反映借款人的信用评级情况,平台分为AA、A、B、C、D、E、HR共7个级别。HR取1,D和E取2,B和C取3,AA和A取4。信用评级越高,则取值越大。

(三)变量特征分析

表1

借款状态描述

从表1列示的借款状态描述可以看出,在全部借款样本中,已婚借款人占比为72.63%,离异借款人占比为7.93%。在借款成功的样本中,已婚借款人和未婚借款人占比分别为81.15%和18.85%,离异借款人和非离异借款人占比分别为9.51%和90.49%。在借款违约的样本中,已婚借款人和未婚借款人占比分别为68.88%和31.12%,离异借款人和非离异借款人占比分别为9.06%和90.94%。可以看出,已婚借款人和未婚借款人、离异借款人和非离异借款人在借款成功率和借款违约率上均有较大差异。

表2

借款人信用等级描述

从表2列示的借款人信用等级描述可以看出,在7个信用等级中,已婚借款人在最高信用等级AA中的占比最高,达到91.67%;在最低信用等级HR中的占比最低,仅为55.72%。说明在平台上信用等级越低的借款人中未婚借款人的占比越高。同时可以看出,离异借款人在信用等级A中的占比最高,达到9.96%,比其他信用等级中离异借款人的比例都高,说明在平台上大部分离异借款人的信用等级都较好。

表3

差异性检验结果

注:*、**、***分别表示在10%、5%、1%的水平显著。

表3为差异性检验结果。由于差异检验的变量为分类变量,因此采用2检验的方法。从表3检验结果可以看出,已婚借款人和未婚借款人、离异借款人和非离异借款人在借款成功率上均有显著差异,但在借款违约率上均没有显著差异。即平均来看,一方面,相比较未婚借款人,已婚借款人的借款成功率更高,同时借款利率更低、借款金额更多、期限更长、信用等级更高、年龄更大、受教育程度更低、更多人拥有房贷和车贷。另一方面,相比较非离异借款人,离异借款人的借款成功率显著更低。

(四)模型选择

由于借款成功率和借款违约率均属于0~1取值变量,因此,本文选择 Probit 模型进行实证分析。模型中包括4个重要的解释变量,分别为marriagei、divorcei、marriage_malei、divorce_malei。经过计算发现,marriagei和marriage_malei的相关系数为0.661,divorcei和divorce_malei的相关系数为0.774,且均通过1%显著性水平的检验,说明这两组变量显著相关,具有较强的共线性。为了消除共线性的影响,本文将marriagei和divorcei、divorce_malei和marriage_malei两组变量分别进行建模。

首先,利用Probit方法检验借款成功率在已婚借款人和未婚借款人、离异借款人和非离异借款人之间是否有显著差异,建立如下模型(1):

Pr(successi)=Φ(α+β1×marriagei+β2×divorcei+γ×LoanInformationi+λ×PersonalInformationi+εi)

(1)

其中,α、β1、β2、γ、 λ是模型待估参数,successi表示第i个借款的借款成功情况,marriagei表示第i个借款借款人的婚姻状况,divorcei表示第i个借款借款人的离异状况,Pr表示借款成功的概率。控制变量包括借款信息组(LoanInformationi)和个人信息组(PersonalInformationi)两部分。εi表示误差项;Φ表示标准正态分布函数。如果β1系数显著为正,则说明已婚借款人的借款成功率显著高于未婚借款人;如果β2系数显著为负,则说明离异借款人的借款成功率显著低于非离异借款人。

然后,利用Probit方法检验借款违约率在已婚借款人和未婚借款人、离异借款人和非离异借款人之间是否有显著差异,建立如下模型(2):

Pr(defaulti)=Φ(α+β1×marriagei+β2×divorcei+γ×LoanInformationi+λ×PersonalInformationi+εi)

(2)

其中,defaulti表示第i个借款的借款违约情况, Pr表示借款违约的概率,其他变量的说明与模型(1)相同。如果β1系数显著为负,则说明已婚借款人的借款违约率显著低于未婚借款人;如果β2系数显著为正,则说明离异借款人的借款违约率显著高于非离异借款人。

本文采用廖理(2014)提出的理性歧视鉴别方法,如果未婚借款人的借款成功率更低且同时借款违约率更高,则投资人对于未婚借款人的歧视属于理性歧视行为;否则为非理性歧视行为。如果离异借款人的借款成功率更低且同时借款违约率更高,则说明投资人对于离异借款人的歧视属于理性歧视行为;否则为非理性歧视行为。

进一步,为了考察婚姻和性别交互作用对于借款成功率的影响,建立如下模型(3):

Pr(successi)=Φ(α+β1×marriage_malei+β2×divorce_malei+γ×LoanInformationi

+λ×PersonalInformationi+εi)

(3)

为了考察婚姻和性别交互作用对于借款违约率的影响,建立如下模型(4):

Pr(defaulti)=Φ(α+β1×marriage_malei+β2×divorce_malei+γ×Loanlnformationi

+λ×Personallnformationi+εi)

(4)

模型(3)和模型(4)中的 marriage_malei均表示第i个借款借款人的性别和婚姻状况,divorce_malei均表示第i个借款借款人的性别和离异状况,其他变量的说明与模型(1)和模型(2)相同。

三、实证分析

(一)婚姻歧视是否存在

从表4列示的借款成功率在不同婚姻状况上的差异分析结果可以看出,在同时包含了借款信息和个人信息的模型7中,婚姻状况变量(marriage)的系数显著为正,说明已婚借款人相比较未婚借款人具有显著更高的借款成功率;离异状况变量(divorce)的系数显著为负,说明离异借款人相比较非离异借款人具有显著更低的借款成功率。在同时包含了借款信息和个人信息的模型8中,已婚男性变量(marriage_male)的系数显著为正,说明已婚男性借款人相比较其他借款人具有显著更高的借款成功率;离异男性变量(divorce_male)的系数未通过显著性检验,说明离异男性在借款成功率上与其他借款人没有显著差异。综上来看,投资人对于已婚及已婚男性借款人有明显的青睐,但对于离异借款人存在歧视。在其他变量方面,我们发现年龄越大、学历越高、信息认证个数越多、工作时间越长且信用等级越高的借款人更能获得投资人的青睐,也更容易成功获得借款。

表4

借款成功率在婚姻状况上的差异分析

注:*、**、***分别表示在10%、5%、1%的水平显著,括号中为Z统计量。

(二)婚姻歧视是否为理性歧视

表5

借款违约率在婚姻状况上的差异分析

注:*、**、***分别表示在10%、5%、1%的水平显著,括号中为Z统计量。

从表5列示的借款违约率在不同性别上的差异分析结果可以看出,在同时包含了借款信息和个人信息的模型7和模型8中,婚姻变量(marriage)的系数显著为正,说明已婚借款人相比较未婚借款人具有显著更高的借款违约率;已婚男性变量(marriage_male)的系数显著为正,说明已婚男性相比较其他借款人具有显著更高的借款违约率;离异变量(divorce)和离异男性变量(divorce_male)的系数均未通过显著性检验,说明离异借款人和离异男性借款人与其他借款人在借款违约率上均没有显著差异。在其他变量方面,我们发现年龄越大、受教育程度越低、信用等级越低的借款人越容易违约,即具有显著更高的借款违约率。

结合表4中的分析结果,已婚借款人、已婚男性借款人的借款成功率更高,但借款违约率也更高,因此,投资人对于已婚借款人和已婚男性借款人的青睐属于非理性行为。离异借款人的借款成功率更低,但并没有表现出更高的借款违约率,因此,投资人对于离异借款人的歧视也属于非理性歧视行为。

(三)稳健性检验

为了验证上述分析结果的稳健性,本文参考陈霄、叶德珠(2016)的方法,通过选取不同样本和更换计量方法来分别进行检验。

1.选取不同样本检验。为了考察表4和表5中的结论在不同的样本范围是否依然成立,此处选择借款金额为10万元以下的样本进行建模(彭红枫等,2016),样本数为92088个。从表6列示的稳健性检验结果可以看出,在借款成功率和借款违约率的模型中,各主要解释变量系数的正负号和显著性水平均没有发生显著变化,只是在具体数值上有一些差异,说明前文的结论具有较好的稳健性。

表6

稳定性检验:借款总金额在10万元以下

注:*、**、***分别表示在10%、5%、1%的水平显著,括号中为Z统计量。

2.更换计量方法检验。本文在表4和表5中使用Probit方法分析了各因素对于借款成功率和借款违约率的影响,为了排除计量方法的选择偏误,此处使用Logit方法进行回归检验,结果如表7所示。从表7结果可以看出,在更换了计量方法之后,各主要解释变量系数的正负号和显著性水平均没有发生显著变化,从而验证了本文结果的稳健性。

表7

稳定性检验:使用Logit方法检验

注:*、**、***分别表示在10%、5%、1%的水平显著,括号中为Z统计量。

四、结论及启示

随着国内互联网金融的发展,P2P网络借贷市场越来越受到学者们的关注。本文借助于“人人贷”交易平台的实际数据,实证考察了在互联网借贷行为中的婚姻歧视现象。分别建模分析了已婚借款人和未婚借款人、离异借款人和非离异借款人、已婚男性借款人和其他借款人、离异男性借款人和其他借款人在借款成功率和借款违约率上是否有显著差异。借款成功率的结果显示,投资人对已婚借款人和已婚男性借款人明显青睐、对离异借款人存在明显歧视,对离异男性借款人无明显态度倾向。而借款违约率的结果显示,相比较其他借款人,已婚借款人和已婚男性借款人均表现出更高的违约概率,但他们的借款成功率也很高,说明投资人对于已婚人士和已婚男性的青睐属于非理性行为。同时,离异借款人并未体现出更高的违约率,但他们的借款成功率却很低,说明投资人对于离异人士的投资歧视属于非理性歧视行为。最后,对于上述结论本文通过了两种方法的稳健性检验,说明本文结论是稳健的。

在P2P网络借贷市场中,投资者能否有效识别出借款人公开信息的风险和价值是非常重要的。根据本文的研究结果,一方面,投资人对于离异借款人的非理性歧视会降低市场配置的效率;另一方面,投资人对于已婚借款人和已婚男性的偏好青睐容易给自身带来投资风险,并且也会增加平台的坏账率。因此,平台监管者应注重对于网络借贷平台中婚姻歧视行为的正确引导,使得投资人尽可能摒弃对网络借款人婚姻状况的偏见,同时重视离异借款人的投资需求,从而在合理控制风险的条件下达到资金配置效率的最大化。另外,对于离异的借款人而言,平时应注重对于个人信用等级、学历水平等方面的提升,从而保障自身在网络借贷平台中获得更多的优势地位。

[1]谢平,邹传伟.互联网金融模式研究[J].金融研究,2012(12):11-22.

[2]Michels.Do Unverifiable Disclosures Matter?——Evidence from Peer -to -Peer Lending[J].Accounting Review,2012(4):1385-1413.

[3]Ravina E..Beauty,Personal Characteristics,and Trust Incredit Markets[M].New York:NY,2007.

[4]Herzenstein M.,Andrews R.L..The Democratization of Personal Consumer Loans——Determinants of Success in Online Peer-to-Peer Loan Auctions[J].Bulletin of the University of Delaware,2008(15):274-277.

[5]李悦雷,郭阳,张维.中国P2P小额贷款市场借贷成功率影响因素分析[J].金融研究,2013(7):126-138.

[6]彭红枫,赵海燕,周洋.借款陈述会影响借款成本和借款成功率吗? ——基于网络借贷陈述的文本分析[J].金融研究,2016(4):158-173.

[7]李焰,高弋君,李珍妮,才子豪,王冰婷,杨宇轩.借款人描述性信息对投资人决策的影响——基于 P2P 网络借贷平台的分析[J].经济研究,2014(S1):143-155.

[8]陈霄,丁晓裕,王贝芬.民间借贷逾期行为研究——基于 P2P 网络借贷的实证分析[J].金融论坛,2013(11):65-72.

[9]彭红枫,杨柳明,谭小玉.地域差异如何影响P2P平台借贷的行为——基于“人人贷”的经验数据[J].当代经济科学,2016(5):21-34.

[10]顾慧莹,姚铮.P2P网络借贷平台中借款人违约风险影响因素研究[J].上海经济研究,2015(11):37-46.

[11]廖理,李梦然,王正位,贺裴菲.观察中学习: P2P 网络投资中信息传递与羊群行为[J].清华大学学报(哲学社会科学版),2015(1):156-165.

[12]张科,裴平.信息不对称、贷款人类型与羊群效应[J].经济管理,2016(6):125-137.

[13]Phelps E..The Statistical Theory of Racism and Sexism[J].American Economic Review,1972(62):659-661.

[14]Becker G..The Economics of Discrimination Chicago[M].University of Chicago Press,1957.

[15]吴小英,鞠颖.基于最小二乘法的网络借贷模型[J].厦门大学学报(自然科学版),2012(6):980-984.

[16]庄雷,周勤.身份歧视:互联网金融创新效率研究——基于P2P网络借贷[J].经济管理,2015(4):136-147.

[17]N Barasinska,D.Schaefer.Does Gender Affect Funding Success at the Peer-to-Peer Credit Markets? ——Evidence from the Largest German Lending Platform[Z].Discussion Papers of Diw Berlin,2010.

[18]陈霄,叶德珠.中国互联网金融中的性别歧视研究[J].金融评论,2016(2):1-15.

[19]廖理,李梦然,王正位.地域——中国互联网金融的地域歧视研究[J].数量经济技术经济研究,2014(5):54-70.

[20]蒋彧,周安琪.P2P网络借贷中存在地域歧视吗?——来自“人人贷”的经验数据[J].中央财经大学学报,2016(9):29-39.

[21]廖理,吉霖,张伟强.借贷市场能准确识别学历的价值吗?——来自P2P平台的经验证据[J].金融研究,2015(3):146-159.

猜你喜欢
信用等级借款人借款
微信上小额借款 请务必通话确认
妻子的借款该如何认定债务关系呢
浅论借户贷款情形下隐名代理的法律适用
乡城流动借款人信用风险与空间收入差异决定
武器装备科研生产单位信用评价工作取得阶段性成果
协会圆满完成武器装备科研生产单位信用等级评价扩大试点工作
小微企业借款人
昌吉州建立事业单位法人信用等级评价体系
热词
住房抵押信贷信用等级的灰色评价方案研究