李海姣
摘要:本文通过网络问卷调查方式,收集120位“芝麻信用”用户的线上信息作为研究样本集,对样本集使用相关性检验方法,探究芝麻信用评分机制的新影响因素。结合相关理论和实际情况,确定“芝麻信用合作共享平台使用次数”为新的芝麻信用评分机制影响因素,并对潜在但尚不直接相关的“人脉关系”因素做出剖析与推断,希冀完善并改进现有分析模型,补充新的解释变量,对我国互联网征信机构信用评分机制的进一步研究提供方向。
关键词:芝麻信用 人脉关系 共享平台
一、引言
互联网征信作为预防互联网金融信用风险的重要手段,成为我国征信体系中的重要部分。“芝麻信用”是国内典型的互联网征信机构,依托互联网平台开展征信业务,通过信用评分机制完成对用户信用情况的评价。与传统征信相比,芝麻信用基于客户群采集了大量线上行为数据,覆盖面积更广。如今芝麻信用已在信用卡、消费金融、融资租赁、酒店、租房、出行、婚恋、公共事业服务等上百个场景为用户、商户提供信用服务。芝麻信用通过数据分析技术处理采集到的数据,以信用分形式呈现。“蚂蚁金服”官方虽给出了五个评价维度——信用历史、行为偏好、履约能力、身份特质、人脉关系,但具体计算过程仍不予公开,信用分产生过程不透明,加之缺乏监督,使其可靠性和公正性难以保证。因此,有必要对芝麻信用评价体系中的影响因素进行详细探寻。
目前国内学者对于个人信用风险评估理论与方法的研究大多还停留在论证大数据技术的必要性以及定性地提出利用互联网大数据完善个人征信的建议上,虽有少数学者提出优化模型用于个人征信领域,但并未涉及到对目前我国互联网征信机构信用评分机制的具象性研究。《互联网信用评分机制的潜在缺陷与改进思路——基于“芝麻信用”的调查研究》一文运用计量方法,对芝麻信用的评分机制进行了初探,但研究结论是只有淘气值、用户的工作单位性质及月平均收入对芝麻信用分有影响,这显然不能全面反应其评分机制,特别地,随着芝麻获取信息渠道不断拓展,这一结论的不足更加凸显。
本文将借鉴此文的研究思路,在其研究成果上做出完善,以网络问卷形式收集多侧面的外部信息,补充其他因素对其评分机制的影响,为我国互联网征信机构信用评分机制的进一步研究奠定基础。
二、确定芝麻信用评分机制中新的影响因素
芝麻信用评估方法是在美国FICO评分系统的基础上确立了适用于我国的信息维度,原模型主要研究了用户身份特质、履约能力及信用历史三个维度,本文认为,考虑到近年来移动支付的“全民化”与共享经济的快速发展,应将“人脉关系”与“芝麻信用合作共享平台的使用情况”两个因素纳入到研究范围中,探讨与芝麻信用评分的关联性及具体如何影响芝麻信用评分。
(一)人脉关系
人脉关系指人际来往中的影响力和好友的信用状况,如好友的身份特质、信用分数以及与好友的互动程度等。支付宝掀起的“无现金革命”,在很大程度上将现实中的人际关系平台化、数据化。除第三方支付业务之外,支付宝还加入了“好友列表”、“生活圈”等功能,旨在通过这些板块采集用户的社交信息,作为评估体系的重要部分间接衡量用户的信用水平,较为客观的反映出个体的信用状况。
“人脉关系”对芝麻信用分值的影响,可能体现在两个方面:第一,用户支付宝好友的信用水平(芝麻信用分)。第二,与好友的互动程度,含资金往来的频次与金额等。芝麻信用评分体系会对“互动”(“好友聊天”、“群聊天”等)这一动态过程进行多维度分析,如:关系强弱指数、社会关系模型、影响力指数等,故与好友稳定的、多场景下的互动,是衡量“人脉关系”的一个重要指标。
(二)芝麻信用合作共享平台的使用情况
共享经济是近年来快速发展的新兴业态,已渗透到交通出行、租房住宿、消费信贷、知识技能等各类产业中。目前,芝麻信用已与共享经济多个领域合作,均接入芝麻信用分评价机制,实行信用免押服务——若用户的芝麻信用分达到一定标准,即可享受免押金等信用福利。
用户对共享平台的使用情况与芝麻信用分、信用福利之间,存在正反馈机制——用户使用芝麻信用合作共享平台的次数越多、信用记录越好,个人芝麻信用分将越高,享有的信用福利就会越大;较高的芝麻信用分和较好的信用福利,也会无形中增强用户对自身行为的规范,促使其在共享平台上留下更优的信用记录。
由此可见,用户在共享平台(芝麻信用已接入的)上的使用频率与信用记录,可以反映用户的履约能力,可能影响个人芝麻信用评分。
三、實证分析
(一)调查问卷的设计
本文调查问卷从“人脉关系”和“芝麻信用合作共享平台的使用情况”两个维度出发,共设计了7个问题:①最近一周,与联系最频繁的好友之间的转账次数;②最近一周,与联系最频繁的好友使用支付宝聊天的次数;③最近一周,使用支付宝“生活圈”功能的次数;④最近一周,使用芝麻信用合作共享单车的总次数;⑤最近三个月,使用神州租车、一嗨租车的总次数;⑥最近一年中,使用蚂蚁短租、小猪短租、途家、未来酒店的总次数。其中,转账次数、聊天次数及使用“生活圈”次数均反映了“人脉关系”维度;使用芝麻信用合作共享单车、租车、租房平台的次数,则反映了“共享平台的使用情况”。从外部角度囊括了芝麻信用在这两个新要素中能够采集到并有可能用于信用评价的用户数据。
(二)相关性分析
1.实证检验
此次互联网调查问卷通过微信、QQ等网络平台发放和回收,调研对象多为在校大学生,少数为社会人士。问卷共回收120份。其中,有14份问卷缺失“芝麻信用分”字段信息,属于缺失样本,予以剔除。此外,另有1份问卷的“转账次数”字段信息记录为127,属于异常样本,予以剔除。经过以上清洗,最终形成105个有效观测个体,形成样本量为105的待分析样本集。
对芝麻信用分(score)与六个问题的答案做pearson相关性分析,结果如图2所示。其中,TIMESI~TIMES6分别对应问卷中的转账次数、支付宝聊天次数、使用“生活圈”次数、使用芝麻信用合作共享单车、租车及租房平台的次数。
2.实证结论与分析
(1)结论
上述相关性分析结果表明:
①“人脉关系”,含转账、聊天及使用“生活圈”次数——与芝麻信用分无显著相关性。
②“共享平台的使用情况”中,“神州租车”、“一嗨租车”使用次数与芝麻信用分具有显著相关性。
③部分解释变量间具有多重共线性,如TIMES1与TIMES2,TIMES4与TIMES6等。
(2)分析
①在“人脉关系”维度中,不止包含转账、聊天及使用“生活圈”次数,还包括较为重要的一部分——好友信用状况(好友信用分与身份特质等)。一個账户的信用评级必然影响另外一个账户的信用评级,如果好友的信用状况都较好,那么该用户信用极其低下的可能性也不大。但由于用户并不能准确获知好友的信用分数,故本次问卷调查无法采集到此项数据。因此,由于“人脉关系”维度数据采集并不全面,且无法确定“好友信用状况”对芝麻信用分的影响程度,则不能单纯判定该维度与芝麻信用评分间无相关性。本文认为,转账、聊天及使用“生活圈”次数变量与芝麻信用分数虽无直接相关性,但可能与“好友信用状况”或其他人脉关系变量相关,而该变量作为“准工具变量”可能与芝麻信用评分之间有直接相关性,并构成芝麻信用评级体系中的重要成分。
②“共享平台使用情况”与芝麻信用分之间的强相关性,则与芝麻信用与共享经济近年来的发展趋势密不可分,二者相互结合、相互促进,既顺应市场走向,同时为社会带来积极效应。一方面,芝麻信用的互联网征信属性决定了其信息来源多为用户网上行为数据,包括淘宝、支付宝和社交媒体中的记录等。当下大数据与云计算的发展,将越来越多的现实场景平台化、电子化,这要求芝麻信用应涉足更多新兴领域,以保证其征信信息来源的全面性、客观性与准确性。
另一方面,共享经济作为近年来蓬勃发展的新业态,国家政策高度支持,市场环境向好。随着共享平台用户群体的数量不断增多,用户的行为数据也愈加具有代表性,因此共享平台用户行为数据对芝麻信用评分机制有很强的参考价值;此外,由于共享经济具有“共享”、“去中介化”等特质,其健康发展高度依赖完善的信用评价机制,而芝麻信用的出现恰好在一定程度上缓解了共享经济的“信用困境”与“押金”问题。
目前芝麻信用与共享单车、租车、租房行业的一些大众化共享平台均有合作,如:ofo小黄车、神州租车、一嗨租车以及蚂蚁短租、小猪短租等。其中共享单车与租房的相关性不高,原因可能在于问卷调查的时间区间(“最近一周”、“最近一年”)设置不合理。而租车次数与芝麻分的显著相关程度可代表“共享平台使用情况”。用户在以上共享平台的使用次数越多,留下的行为数据就越多。这些行为数据能够很好的反映用户的信用历史、履约能力及行为偏好,并对用户的最终芝麻信用分提供重要补充。因此,用户在芝麻信用合作方共享平台上的使用次数,与芝麻信用评分具有较强相关性。
③部分解释变量之间具有多重共线性,说明问卷的部分问题之间相关,分别是TIMES1与TIMES2,TIMES1与TIMES6,TIMES2与TIMES3,TIMES3与TIMES4,TIMES3与TIMES5,TIMES3与TIMES6,TIMES4与TIMES6。
TIMES1与TIMES2,TIMES2与TIMES3之间的共线性,分别表示转账次数与聊天次数相关,聊天次数与使用“生活圈”次数相关。以上三者均为描述“人脉关系”的测度:一个与好友互动较为频繁的用户,应具备一定的社交影响力,故使用“生活圈”的次数偏多,因此测度之间必然具有较强的相关性。同理,TIMES4与TIMES6的共线性表示,在芝麻信用合作平台上的“共享单车使用次数”与“租房次数”具有一定相关性,由于二者均反映“共享平台使用情况”,属于同一维度的不同侧面,故也应相关。
除此之外,TIMES1与TIMES6,TIMES3与TIMES4,TIMES3与TIMES5,TIMES3与TIMES6之间的多重共线性则综合反映了“人脉关系”与“共享平台使用次数”之间的相关程度,可以从以下两方面进行解释:
首先,对支付宝业务的熟悉程度,可以分别从“人脉关系”与“共享平台使用次数”两方面进行分析。
“人脉关系”方面:除转账外,好友聊天及生活圈功能与一般社交平台具有重合性,故使用人数整体偏少。若用户在“人脉关系”维度上表现良好,说明该用户对支付宝功能可能有着特殊偏好,使用转账、互动等功能的次数较多,与一般用户群体相比,该用户对支付宝功能的熟悉程度会更高。
“共享平台使用次数”方面:与芝麻信用合作的共享平台,都会列示在支付宝页面中。但在调研过程中发现,大部分答卷人除转账外,对支付宝的其他功能并不熟悉,因此较少使用支付宝页面上共享平台。而在“人脉关系”维度表现良好的用户,面对租房、出行等需求时,由于较为熟悉支付宝附加业务,因此将更倾向使用芝麻信用合作的共享平台,其使用次数也会相应增多。综上,“人脉关系”与“共享平台使用次数”之间具有一定的相关性。
其次,高信用分好友的辐射效应与人们的趋同效应。
与好友互动程度较高的用户,也可通过好友推荐这一渠道,加强对支付宝功能的熟悉度,从而产生对芝麻信用合作共享平台的偏好,增多使用次数。如,用户的某个支付宝好友拥有较高芝麻分,对支付宝附加功能十分了解,经常使用ofo小黄车、小猪短租等平台,则用户在与该好友互动过程中,很可能了解到更多有关芝麻信用合作共享平台的信息,因此较易加入共享平台使用群体中。
四、未来研究方向及模型改进
(一)研究方向
通过对预处理后的样本数据进行相关性检验,本文发现,“芝麻信用合作共享平台的使用次数”与芝麻信用分有显著相关性,而在“人脉关系”方面,尚无法通过现有数据与芝麻信用分直接建立相关性,但仍作为芝麻评价体系的重要成分。
由于“转账”、“互动”、“使用‘生活圈次数”与芝麻信用分之间并不显著相关,故下一步研究方向是寻找“人脉关系”维度中与芝麻信用分具有显著相关性的“隐形变量”,重点研究对象为“好友信用分数”。由于在网络人际关系网中,好友的辐射效应与人们的趋同效应可以在较大程度上影响一个人的行为,故芝麻信用评分体系很可能将“好友信用分”作为“人脉关系”的重要评判标准。后续需要进行更广泛与深入的数据搜集工作,研究“好友信用分”与“转账”,“互动”,“使用‘生活圈”次数之间的关联性、对“人脉关系”维度的代表性、以及是否与芝麻信用分显著相关。
(二)模型改进
下一步将对参考文献1中的模型结论进行改进,原模型如下:
本文既已确定“人脉关系”维度中与芝麻信用分显著相关的变量后,笔者希望将该变量与“共享平台使用次数”一起作为新的解释变量加入原模型中,去掉数据量纲并进行线性回归建模估计。原模型的可决系数只有0.45,加入新解释变量后,应提高该模型的拟合优度,增强模型对于被解释变量的解释力贡献,定量分析出各解释变量与芝麻信用分的关系,从更全面的角度分析芝麻信用评分机制,发现其不足之处并给出改进意见。