□ 欧阳梦倩
(中共广东省委党校(广东行政学院) 经济学教研部, 广东 广州 510053)
[基金项目]2021年度全国党校(行政学院)系统重点调研课题(2021DXXTZDDYKT065);广州市哲学社科规划2021年度课题(2021GZQN04)。
随着我国互联网普及率不断提升,小额借款从线下走向线上,让金融发展成果更多地惠及人民群众。然而,网络小额借款存在明显的信息不对称问题,其中借款项目具有较高的信用风险。在互联网金融、传统金融体系和实体经济部门之间联系日益紧密的趋势下,网络小额借款的信用风险可能跨市场、跨地区进行传播,甚至引发系统性金融风险[1]。中国银保监会同中国人民银行等部门起草的《网络小额贷款业务管理暂行办法(征求意见稿)》要求,经营网络小额贷款业务的小额贷款公司的业务系统应“具有健全的风险防控体系,包括数据驱动的风控模型、反欺诈系统、风险识别机制、风险监测手段、风险处置措施等,评定和防控客户信用风险主要借助互联网平台内生数据信息”。这意味着,在利润最大化和风险防控的双目标下,经营网络小额贷款业务需要准确预测借款项目的收益和风险,设法在收益较高的借款项目中发掘出风险较低的借款项目,并投资这些质量较优的借款项目。
部分文献使用机器学习算法建立信用评分模型或利润评分模型[2],为评估借款项目质量提供技术性支持。信用评分模型强调借款项目是否违约的二元状态;借款项目的违约概率越低,该模型对借款项目质量的评价就越高。张卫国等[3]提出一种基于非均衡模糊近似支持向量机的信用风险评估方法,该方法对借款项目是否违约有更好的分类效果;据该方法又进一步建立了信用评分模型。利润评分模型强调借款项目所能带来的收益;无论借款项目是否违约,只要借款项目带来的收益越高,该模型对借款项目的评价就越高。Serrano-Cinca和Gutiérrez-Nieto[4]使用内部收益率衡量投资借款项目的预期利润,发现相比基于逻辑回归的传统信用评分模型,基于多元回归的利润评分模型在挑选借款项目方面有更好的表现。
然而,信用评分模型或利润评分模型不能完全满足经营网络小额贷款业务的需求。Bastani等[5]将这两个模型组合在一起,提出一种两阶段的借款项目评估方法,该方法倾向将较好的评价给予那些一定风险水平下收益较高的借款项目。Guo等[6]和Chi等[7]通过在给定预期收益条件下最小化借款项目投资组合的风险,得到最优借款项目组合,实现较好的投资业绩。这些文献的实证分析数据来源于Lending Club或Prosper平台,在这两个平台上借贷交易有较为完善的社会信用体系支撑。在我国社会信用体系仍不成熟的情况下,综合考虑风险和收益的借款项目评估方法的应用效果有待进一步探讨。
在已有文献的基础上,本文利用“人人贷”网络借贷平台数据,结合借款违约率和收益率构建基于机器学习算法的借款项目评估方法。研究设计是:第一,根据借款项目信息构造特征变量,利用机器学习算法构建借款项目违约率和收益率的预测模型,包括特征变量筛选、在训练数据上拟合模型并筛选出样本内预测效果最优的模型、评价最优模型在测试数据上的样本外推能力;第二,使用第一步得到的最优模型在测试数据上预测出借款项目的预期违约率和预期收益率,以阈值过滤和线性组合两种方式综合利用这两个指标,筛选出质量较优的借款项目,并分析筛选效果。
本文的创新点主要体现在:
第一,本文利用机器学习算法在网络小额借款项目信息中挖掘出能够有效预测借款违约率和收益率的信息,用以构建网络小额借款项目的评估方法,丰富了小额借款项目评估在我国网络环境下的研究发现。网络小额借款项目信息具有非结构化、真实度低、数量有限等特征;如何从中抽取出有效信息是网络环境下评估小额借款项目需要重点解决的问题。
第二,本文在综合考虑借款项目风险和收益的基础上建立评估方法,并与仅考虑风险或收益的借款项目评估方法进行比较,为网络小额贷款相关企业作为投资者挑选借款项目提供实践指导。以往文献多从信用评级角度出发,试图构造更精准的借款人信用评级方法,或者建立更优的借款项目违约风险评价体系,着重衡量借款项目的信用风险,为审批借款项目提供参考依据;而较少文献从投资者角度出发,评估借款项目可能带来的收益,直接给出选择借款项目的方法。
第三,本文将借款人是否填写某项信息和借款描述内容用于预测借款违约率和收益率,从增加信息含量方面提高预测准确性。借款人是否填写某项信息反映了借款人对自身信用情况的认知,借款描述内容则反映了借款人的教育程度、财务能力、借款意愿等多方面的综合情况,但仍较少文献考虑这两项信息对借款违约率或收益率的预测作用。
部分文献使用机器学习算法预测借款违约率,为评估借款项目质量提供准确参考。在银行个人贷款方面,信用评价最重要的工具就是信用评级[8],即用统计方法预测一个逾期客户逾期一个借款项目的概率。由于机器学习算法能够较精确地刻画变量之间的复杂关系,有学者将机器学习算法应用于个人借款项目的违约预测[9-11]。在网络小额借款方面,借款客户多为信用风险较高、缺乏高质量抵押品的个人或小微企业,是传统金融业务的长尾客户;客户数量庞大,但单个客户的借款金额较小。这对统计方法的大数据处理能力提出较高要求,而机器学习算法在此方面也较有优势,故有学者亦将机器学习算法应用于网络小额借款项目的违约预测,取得了较好的预测效果[12-14]。
相比借款违约率,以收益情况为预测目标的模型对投资者评估借款项目质量可能更具实际意义。在银行个人贷款方面,Barrios等[15]提出使用累计收益与未偿还债务之比衡量收益情况,并以此为预测目标构建模型;实证分析发现,此模型比以违约率为预测目标的模型有更高的组合回报。在网络小额借款方面,Serrano-Cinca和Gutiérrez-Nieto[4]认为,一方面,违约借款项目对应的借款人可能在还款日期之后补交还款;另一方面,违约风险较高的借款项目往往具有较高的借款利率,为投资者带来更高的投资收益。据此他们提出以收益率为预测目标构建借款项目的评分方法,结果发现与以违约率为预测目标的评分方法相比,该方法筛选出的借款项目的收益更高。
有文献发现,综合考虑违约情况和收益情况可筛选出质量更高的借款项目。在银行个人贷款方面,Stewart[16]将与银行利润相关的商业消费预测和FICO信用分数结合在一起,构建批准信用卡的决策模型,发现在相同坏账率下,该决策模型可通过提高收益要求来实现更高的收益。在网络小额借款方面,Guo等[6]和Chi等[7]首先预测借款项目的违约率和收益率,用以刻画借款项目的风险和收益,然后在给定预期收益的条件下最小化借款项目投资组合的风险,得到最优的借款项目组合,实现较好的投资业绩。Bastani等[5]基于Serrano-Cinca和Gutiérrez-Nieto[4]的结果提出一种两阶段评价模型,第一阶段以违约率为预测目标构建模型,筛选出违约可能性较低的借款项目,第二阶段以收益率为预测目标构建模型,在第一阶段筛选出的借款项目中挑选出最终的借款项目。结果发现,此两阶段评价模型挑选出的借款项目信用等级较低,收益率较高,适合那些风险偏好较高的投资者。相比之下,以Serrano-Cinca和Gutiérrez-Nieto[4]的评分方法挑选出的借款项目呈现信用等级多样化和收益率差异较大的特征,适合那些偏好借款项目类型多元化的投资者,而以违约率为预测目标的模型倾向挑出信用等级较高而收益率较差的借款项目。本文认为,Bastani等[5]与Serrano-Cinca和Gutiérrez-Nieto[4]的挑选结果存在差异的原因是,Bastani等[5]在模型中增加考虑了借款项目违约率,使模型更擅长于在投资回报高的借款项目中挖掘出实际违约风险低的借款项目。
学者们对借款项目违约率的影响因素进行了丰富的探讨。研究发现,借款项目信息(如借款利率等)[17]、借款人基本信息(如年龄、学历等)[18-19]、借款人工作情况(如工作行业、工作经验等)[18,20]、借款人经济情况(如月收入、房产情况等)[21]、借款人历史借贷行为(如历史成功借款次数等)[22-23]、借款人信用情况(信用等级)[24]和借款描述[20,25]等对借款项目违约率有显著影响。
借款项目收益率与违约率应存在部分相同的影响因素。因为借款项目的借款利率在借贷关系成立时就已确定,且在还款期内保持不变,所以借款项目收益率主要取决于它是否发生违约以及违约的严重程度。这意味着,影响借款项目违约率的因素也会影响其收益率。Serrano-Cinca和Gutiérrez-Nieto[4]与Bastani等[5]发现,用于预测借款项目违约率的信用等级、借款利率、借款金额、年收入、房产情况、工作时长等信息也可有效预测借款项目的收益率。
本文借助“人人贷”网络借贷平台数据,构建网络小额借款项目的评估和筛选方法。人人贷平台成立于2010年,具有较高的市场占有率,所服务的借款客户群体涵盖范围广;基于该平台数据的研究结论具有一定的代表性和广泛性。
本文选取人人贷平台2010年10月至2017年7月期间的借款项目作为研究对象,并对借款项目数据进行处理:第一,删除信息存在乱码的借款项目;第二,删去状态为不可投、申请中、已流标、还款中的借款项目,这些借款项目的违约情况和收益情况不可知;第三,排除还款方式为先息后本的借款项目,选择此还款方式的借款项目极少;第四,删去机构担保标、实地认证标和智能理财标,这三种借款项目或有第三方机构背书或有抵押担保物,违约风险远小于信用认证标,本文与廖理等[26]一样仅对信用认证标作分析。
在最终的有效样本中共有27 865个借款项目;其中51个借款项目已逾期,4 036个借款项目已由人人贷平台垫付偿还,23 778个借款项目已还清。
违约率变量由借款项目是否违约二值变量delay刻画,如借款项目违约,delay取值为1;否则为0。当借款人超过规定还款时间30天未还款,人人贷平台会将借款人的借款项目标记为“已逾期”;而当借款人超出规定还款时间90天仍未还款,人人贷平台则会将其借款项目标记为“已垫付”;当完成所有月份的还款后,则被标记为“已还清”。参考廖理等[27]和丁杰等[28],本文将“已垫付”和“已逾期”两种状态都视为违约,将“已还清”视为正常还款。在最终样本27 865个借款项目中,违约借款项目所占比例为14.67%,远小于正常还款借款项目的比例85.33%,体现出这两种类别样本的不平衡性;故在构建违约率预测模型时,有必要对样本不平衡问题进行处理。
收益率变量的构造则是参考廖理等[29]关于内部收益率的计算方法,根据借款项目的借款金额和每期实际还款金额,由式(1)求解得到:
(1)
其中,totali表示借款项目i的借款金额,Ti表示借款项目i的还款期长,repaymentit表示借款项目i在还款期内第t期的实际还款金额,irri表示借款项目i的内部收益率。
本文根据借款项目投标网页界面上的信息,构造特征变量。特征变量可分为七类:第一类是借款项目信息,包括借款金额、借款利率、还款期长;第二类是借款人基本信息,包含年龄、性别、教育程度和婚姻状况;第三类是借款人工作信息,包括所属行业、公司规模、公司所在地和工作经验;第四类是借款人财产信息,包括工资水平、房产情况、房贷情况、车产情况和车贷情况;第五类是借款人历史借款信息,包括逾期金额、逾期次数、成功借款笔数、申请借款笔数;第六类是借款人信用信息,包括信用等级;第七类是借款描述信息,包括文本长度、文本可理解性、文本复杂度和文本主题。
值得注意的是,本文还根据借款人是否填写了某项信息生成相应的二值变量,也作为借款项目的特征变量。人人贷平台允许借款人选择性填写部分信息,如婚姻状况、公司规模等。从借款人的角度看,如果他认为披露这些信息会对成功借款造成负面影响,那么他很可能选择不填写这些信息;这意味着,选择不填写某项信息在一定程度上说明借款人的违约风险较高,故借款人是否填写某项信息对借款项目违约率和收益率应有预测作用。
表1 由LDA主题模型得到的6个主题的代表性词汇
本文对连续型变量,使用平均值填补空缺值;对类别型变量,使用众数填充空缺值。为避免特征变量量纲不同对模型预测的影响,本文还对连续型变量做标准化处理。
本部分将第三部分所得数据划分为训练数据和测试数据,在训练数据上构建违约率和收益率预测模型,再将这两个模型应用于测试数据上,得到相应借款项目的违约率和收益率预测值,供第五部分评估和筛选借款项目使用。接下来,首先,阐述违约率和收益率预测模型的构建流程;然后,介绍在流程中衡量预测模型样本内外预测能力的指标;最后,按照流程顺序,分析预测模型在数据上的构建结果。
借款违约率和收益率预测模型的构建流程相似,均可分为以下三步。
第一步,筛选出重要的特征变量。如预测目标为借款违约率,则先用Smote+Tomek处理训练数据的样本不平衡问题;如预测目标为借款收益率时,则无需做此处理。然后,在训练数据上使用基于随机森林的递归特征消除(recursive feature elimination,简称RFE)方法筛选出重要性排在前20%的特征变量集F。具体过程是:利用随机森林估计全部特征变量的重要性,剔除其中重要性最低的一个特征变量,接着再次利用随机森林重新估计余下特征变量的重要性,同样剔除其中重要性最低的一个特征变量,如此重复下去直至达到期望的特征变量数量,得到最终的特征变量集F。
第二步,挑选出最优的机器学习算法来训练模型。在训练数据上,以第一步得到的F为特征变量,利用逻辑回归(logit)/线性回归(ols)、支持向量机(svm)、随机森林(rf)、梯度提升树(gdbt)和神经网络(nn)算法构建预测模型。在训练数据上,使用K折交叉验证法评估各个算法构建的模型的样本内预测效果(K=5);其中,如预测目标为借款违约率,则须在K-1个子集的并集上先使用Smote+Tomek处理样本不平衡问题,再训练模型。比较筛选出样本内预测效果最优的算法;用此算法在整个训练数据上训练得到最优预测模型。
第三步,评价模型在样本外的预测能力。利用第二步得到的最优预测模型在测试数据上做预测,评估最优预测模型的样本外推能力。
本文所使用的算法均由Anaconda3软件和scikit-learn库实现;除将逻辑回归设置为不带惩罚选项,且以牛顿法为优化算法,其余算法均使用scikit-learn库的默认参数设置。另外,借款违约率模型预测出的结果是取值范围为[0,1]的概率值,表示该借款项目违约的概率;本文将此概率值大于0.5的借款项目判为违约,而小于0.5的借款项目判为正常还款,作为最终违约预测结果。
对于违约率预测模型,本文选取正确率ACC、查准率Precision、查全率Recall、F1Score和AUC五个指标,在不同的经济意义上考察模型的预测效果。根据借款项目的真实违约情况和违约率预测模型的预测结果,可将借款项目划分为四类,如表2所示。
表2 混淆矩阵
正确率ACC是衡量模型预测效果最基础的指标,是指预测类型与真实类型相同的借款项目在全部借款项目中所占的比例,如式(2)所示,反映了模型预测结果的正确程度。
(2)
当违约借款项目数量远远小于正常还款的借款项目数量时,正确率更多地反映了模型将真实正常还款的借款项目预测为正常还款的能力。
实际上,我们更关心模型对违约借款项目的甄别效果,主要分为两方面:一方面是模型预测违约借款项目的精确程度,可由查准率Precision衡量;查准率是在被预测为违约的借款项目中真实类型也为违约的借款项目所占的比例,如式(3)所示。
(3)
如果模型查准率较低,则会错误地将部分正常还款的借款项目预测为违约,那么投资者将因为放弃投资这些借款项目而失去赚取利息的机会。另一方面是模型将全部违约借款项目甄别出来的能力,可由查全率Recall衡量;查全率是在真实类型为违约的借款项目中被预测为违约的借款项目所占的比例,如式(4)。
(4)
若模型查全率较低,则会错误地将部分违约借款项目预测为正常还款,那么投资者将因投资这些借款项目而损失本金以及投资其他借款项目的机会成本。
为综合考虑查准率和查全率,本文选取F1Score衡量模型对违约借款项目的甄别效果,计算方法见式(5)。
(5)
此外,本文还使用了机器学习中常用的模型性能衡量指标AUC值。AUC值(Area Under Curve)是ROC曲线下与坐标轴围成的面积,较全面地反映了模型的预测效果,且不受样本类别不平衡问题的影响。
(6)
(7)
(8)
(9)
MAE是预测值与真实值之间的平均距离,MSE是预测值与真实值之间的平方距离的均值,比MAE更能凸显误差;无论MAE还是MSE,取值越小说明模型预测效果越好。EVS和R2都表示特征变量对收益率方差变化的解释程度,取值越大说明解释程度越高,模型预测效果越好。
表3展示由递归特征消除法筛选出的预测借款违约率和收益率的重要特征。借款金额、借款利率、还款期长、年龄、教育程度、历史逾期金额、历史成功借款次数、历史申请借款次数、信用等级、借款描述长度和内容等特征对预测借款违约率和收益率都有重要作用。教育程度表征了借款人守信的行为特征[26],历史成功借款次数和历史申请借款次数反映了借款人在网络借贷平台上的声誉[23],借款描述长度体现了借款人的努力程度和愿意披露的信息量[30],而借款描述内容反映了借款人的品质、能力和生活状况[31],这些因素刻画了借款人的行为品格和还款能力,应能较好地预测借款项目的违约率和收益率。
公司规模、工作地点所属省份、工作经验、收入水平等工作信息未被选为预测违约率或收益率的重要特征,说明由这些特征分类的借款项目在违约率和收益率上差异较小。这可能是因为人人贷平台给借款人评定的信用等级已着重综合考虑了借款人的工作情况,使信用等级相比工作信息更能解释违约率和收益率的变化。此外,借款人是否填写某项信息也未被选为任一预测指标的重要特征,意味着借款人对是否填写信息的选择更多地出自于保护个人隐私的考虑。
从整体看,预测违约率和收益率的重要特征均涵盖借款项目特征、人口统计特征、历史借款记录特征、信用情况和借款描述等信息,而差异主要体现在房贷、车产等资产负债信息上。这侧面反映了,相比违约的严重程度,资产负债信息对预测借款人是否违约更具价值。
表3 各预测模型的特征筛选结果
图1给出基于各机器学习算法的违约率模型在训练数据上的正确率ACC、查准率Precision、查全率Recall、F1Score、AUC值。从算法看,与逻辑回归和线性支持向量机相比,随机森林、梯度提升树和神经网络在各指标上都表现更好,说明违约率与借款项目特征之间不是简单的线性关系,借助随机森林、梯度提升树和神经网络等非线性算法构建违约率模型更合适。
从衡量指标看,在正确率上,随机森林、梯度提升树和神经网络都超过了95%,这可能仅是因为它们将正常还款借款项目预测为正常还款的能力较强。但是在实际的违约预测问题中,我们往往更关心模型对违约借款项目的预测结果,因此这里要着重考察预测模型的查准率和查全率。在查准率上,随机森林、神经网络和梯度提升树依次降低;在查全率上,梯度提升树、随机森林、神经网络依次降低。本文认为,相比因错失投资正常还款借款项目损失的机会成本,投资者应更想避免投资到违约借款项目所带来的损失,即投资者期望预测模型的查全率越高越好。故这里选择梯度提升树构建违约率预测模型是最优的。再者,相比随机森林和神经网络,梯度提升树的F1Score和AUC值更高,进一步说明了在5种机器学习算法中,梯度提升树是构造违约率预测模型最优的机器学习算法。
注:作者基于人人贷平台爬虫数据计算得到。图1 违约率预测模型在训练数据上的表现
表4给出基于各机器学习算法的收益率模型在训练数据上的平均绝对误差MAE、均方误差MSE、解释方差得分EVS和可决系数R2。从数值误差的角度看,由表4的(Ⅰ)和(Ⅱ)可知,线性回归、神经网络、线性支持向量机、梯度提升树、随机森林的MAE依次降低;线性支持向量机、线性回归、神经网络、梯度提升树、随机森林的MSE依次降低。从方差解释的角度看,由表4的(Ⅲ)和(Ⅳ)可知,随机森林、梯度提升树、神经网络、线性回归方程、线性支持向量机的EVS和R2均是依次降低的。可见,无论使用何种性能度量指标,线性回归的表现都欠佳,说明收益率和借款项目特征之间的关系也很可能是非线性的。由于随机森林构建的模型在数值误差和方差解释上都具有较好的表现,本文选择随机森林构建收益率预测模型。
表4 收益率预测模型在训练数据上的表现
在分别选定构造两个预测模型的最优机器学习算法后,在全部的训练数据上,使用梯度提升树构建违约率预测模型,使用随机森林构建收益率预测模型,然后用训练好的两个模型在测试数据上进行预测。表5展示违约率和收益率预测模型在测试数据上的表现。
由表5,违约率预测模型在测试数据上的正确率ACC略小于训练数据上的0.974 7,查准率Precision、查全率Recall、F1Score 和AUC值分别大于其在训练数据上对应的指标(0.893 2、0.940 3、0.916 1、0.995 9)。这说明违约率预测模型具有较强的泛化能力。收益率预测模型在测试数据上的平均绝对误差MAE、均方误差MSE分别小于其在训练数据上的对应指标(0.138 6、0.247 0),而在测试数据上的解释回归模型的方差得分EVS和可决系数R2分别高于其在训练数据上的对应指标(0.753 5、0.753 4),说明该模型在测试数据上准确预测收益率的能力相对较弱,但能较好地解释在测试数据上特征变量与收益率之间的复杂关系。
表5 各预测模型在测试数据上的表现
前一部分已得到违约率和收益率预测模型在测试数据上的预测值,本部分参考Serrano-Cinca和Gutiérrez-Nieto[4]与Stewart[16]的研究思路,讨论如何根据这两个预测值筛选出质量较优的借款项目,为网络小额贷款相关企业作为投资者选择借款项目提供实践指导。这里将1减去违约率模型预测的概率值作为借款项目的预期还款率,将收益率模型的预测结果作为借款项目的预期收益率;使用预期还款率而不是预期违约率是为了与预期收益率保持相同的影响投资者投资意愿的方向。接下来,结合预期还款率和预期收益率构建两种借款项目筛选方法:门槛筛选法和权重筛选法,先确定这两种筛选方法的最优参数,再应用到测试数据上筛选出指定数量的借款项目,统计这些借款项目的实际违约比率和实际收益率均值,据此比较这两种方法的筛选效果。
门槛筛选方法是先对预期还款率设置过滤阈值,再根据预期收益率排序筛选出借款项目。具体地,对预期还款率设定一个阈值α(α∈{0,0.01,0.02,…,0.99}),保留预期还款率大于α的借款项目,再在这些借款项目中筛选出预期收益率最高的k个借款项目(k=5,10,15,20)。
表6 所选借款项目实际收益率均值随筛选方法系数的变化情况
从筛选结果的实际违约比率看,无论阈值α和项目数k分别取何值,被筛选出的借款项目的实际违约比率均为,即这些借款项目实际都是正常还款的,说明预期收益率可在一定程度上替代预期还款率去辨别借款项目是否违约。从筛选结果的实际收益率均值看,表6(Ⅰ)展示在不同k值下,门槛筛选法所选借款项目集合的实际收益率均值随阈值α的变化情况。可知,当k=5时,随着阈值α增加,收益率均值一直保持在0.020 0的水平不变;预期收益率较高的借款项目,其预期还款率一般也较高,此时无论预期还款率的过滤阈值取何值,预期收益率最高的5个借款项目是固定的。当k=10,15,20时,收益率均值随阈值α的变化趋势相同,随阈值α增加,实际收益率均值先保持不变而后突然增加,并在α=0.99处取得最大值。这说明,当项目数k较大时,对预期还款率设置较高的阈值有助于剔除部分风险较高的借款项目,从而实现较好的收益表现。根据实际收益率随阈值α的变化趋势,可确定门槛筛选法在k=5,10,15,20下的最优阈值均为0.99。
权重筛选法是将预期违约率和预期收益率做线性组合,再按照该线性组合值排序筛选借款项目。具体地,按照权重β和1-β(β∈{0,0.01,0.02,…,0.99,1})对预期借款违约率和调整的预期收益率(对预期收益率做归一化处理)进行加权平均;然后,根据加权平均值对借款项目进行排序,并筛选出排名前k的借款项目(k=5,10,15,20)。
从筛选结果的实际违约比率看,无论权重β和项目数k分别取何值,所筛选出的借款项目均是正常还款的,与门槛筛选法的结果相同。从筛选结果的实际收益率均值看,表6(Ⅱ)展示在不同k值下,权重筛选法所选借款项目集合的实际收益率均值随权重β的变化趋势。在不同的项目数k下,实际收益率均值都呈现相似的变化趋势,先保持在一定水平周围小幅度地变化,后约至β=0.9处转而迅速下跌。当k=5时,实际收益率均值随着权重β的增加,先保持在0.020 0不变而后迅速下降;当k=10,15时,随权重β增加,实际收益率均值先在波动中缓慢增加,之后快速下跌;当k=20时,实际收益率均值的变化趋势又有所不同,先快速达到最高点而后在波动中下跌,约至β=0.9处开始迅速下跌。这说明,在权重筛选方法下,适当放松对借款项目预期还款率的要求可能有助于在更大的风险下获得更高的收益。根据实际收益率随权重β的变化情况,确定权重筛选法在k=5,10,15,20下的最优权重β分别为0.00、0.59、0.60、0.13。
前面分别讨论了门槛筛选方法和权重筛选方法的筛选结果,本节将比较分析这两种筛选方法在各自最优参数(阈值或权重)下得到的各个借款项目,并与仅使用预期还款率和预期收益率进行筛选的方法进行对比。表7展示在不同项目数k下不同筛选法所选借款项目的实际收益率;其中(Ⅰ)是实际收益率最高的20个借款项目的排序,(Ⅱ)~(Ⅴ)分别是在项目数k=5,10,15,20时,具有最优阈值的门槛筛选法和具有最优权重的权重筛选法所得借款项目的实际收益率及其均值,(Ⅵ)和(Ⅶ)分别是预期还款率和预期收益率排名前20的借款项目实际收益率情况,以及排名前5、10、15、20的借款项目的实际收益率均值。
由表7(Ⅰ),实际收益率排名前5的借款项目的实际收益率依次为0.086 3、0.071 0、0.063 3、0.051 9、0.051 2。从表7的(Ⅱ)~(Ⅴ)可知,在k=5时,门槛筛选法和权重筛选法均挑选出实际收益率排名第5的借款项目(实际收益率为0.051 2)并将之排在第1位,且所选借款项目的实际收益率均值相同;此时权重筛选法与门槛筛选法的筛选效果一样好。当k=10时,门槛筛选法和权重筛选法也都挑选出实际收益率排名第5的借款项目,且前者给予该借款项目的排序高于后者,但是门槛筛选法所选借款项目的实际收益率均值稍低于权重筛选法。综合来看,门槛筛选法与权重筛选法的筛选效果差异不大。当k=15时,门槛筛选法挑选出了实际收益率排名5、6、14的借款项目,而权重筛选法挑选出排名2、5、14的借款项目,且与k=10时一样,门槛筛选法所选借款项目的实际收益率均值依旧低于权重筛选法;无论从借款项目的排序看,还是从实际收益率总体情况看,门槛筛选法劣于权重筛选法。当k=20时,门槛筛选法与k=15时相同,仅能筛选出实际收益率排名5、6、14的借款项目,而权重筛选法可筛选出实际排名2、5、6、14的借款项目,再考虑到门槛筛选法所选借款项目的实际收益率均值依旧低于权重筛选法,故在此情形下权重筛选法的筛选效果是更优的。
表7 不同筛选法下借款项目的实际收益率
对比表7(Ⅱ)~(Ⅶ)可得,当k=5时,门槛筛选法、权重筛选法和仅使用预期收益率的筛选法都能挑选出实际收益率排名第5的借款项目,而仅使用预期还款率排序的筛选方法未挑选出任一实际收益率排名前5的借款项目。门槛筛选法和权重筛选法的实际收益率均值都为0.020 0,大于仅使用预期还款率筛选的实际收益率均值0.011 3,同时等于仅使用预期收益率时的实际收益率均值0.020 0。当k=10,15,20时,门槛筛选法所挑选的借款项目与仅使用预期收益率的筛选方法相似,而仅使用预期还款率排序的筛选方法依旧未挑选出实际收益率排名前k的借款项目。无论门槛筛选法还是权重筛选法,挑选出的借款项目的实际收益率均值都高于仅使用预期收益率筛选的实际收益率均值,而仅使用预期收益率的实际收益率均值又高于仅使用预期违约率的情形。
从上述k=5,10,15,20的筛选情况看,各筛选方法效果的排序是:权重筛选法>门槛筛选法>仅使用预期收益率筛选>仅使用预期还款率筛选。
本文利用“人人贷”网络借贷平台数据,借助机器学习算法构建网络小额借款项目的评估筛选方法,为网络小额贷款相关企业选择投资借款项目提供技术性方法。
首先,在训练数据上挑选出重要的借款项目特征作为特征变量,利用机器学习算法构建借款项目违约率和收益率预测模型;然后,在测试数据上评价这两个预测模型的样本外推能力。
结果发现,借款项目的基本信息和借款人人口统计特征、历史行为记录、信用等级、借款描述对预测借款违约率和收益率均有重要作用;构建违约率和收益率预测模型最适合的机器学习算法分别是梯度提升树和随机森林,基于梯度提升树的违约率预测模型的样本外推能力高于基于随机森林的收益率预测模型。
最后,我们综合使用违约率和收益率预测模型的预测值构造门槛筛选方法和权重筛选方法,并将这些方法与单独使用其中一个预测值的筛选方法进行比较。
结果显示,从筛选借款项目数量为5、10、15、20的情形看,权重筛选法对借款项目的筛选效果优于门槛筛选法,而门槛筛选法又优于仅使用预期还款率或预期收益率排序的筛选方法。
在微观层面,本研究为网络小额贷款相关企业评估筛选借款项目提供一定的技术参考。第一,在评估借款项目质量时应着重考察借款项目的基本信息和借款人的历史借贷行为记录、年龄、教育程度、借款描述,这些信息对借款项目违约率和收益率有较强的预测作用;此外,在评估借款项目未来违约率时还可考察借款人的房贷和车产情况。第二,相比仅考虑预期违约率或预期收益率的借款项目筛选方法,结合两者的筛选方法能够在收益情况较高的借款项目中挖掘出违约风险较低的借款项目。故在筛选投资借款项目时,应综合考虑借款项目的预期违约率和预期收益率,更全面地评价借款项目质量。
在宏观层面,本研究为相关部门制定防范化解互联网金融风险具体措施提供一定的理论支持。在社会信用体系仍不完善的情况下,网络小额贷款业务难以借助互联网的“小额分散”特征实现分散借款项目信用风险的目的[34],这导致互联网金融行业在发展中不断累积信用风险。借款项目信息的强制披露在一定程度上能够缓解缺乏权威信用信息参考的弊端。相关部门可将借款人年龄、教育程度界定为强制披露信息,将婚姻状况等其他信息界定为自愿披露信息,进一步完善网络小额借款项目的信息披露规则;这有助于网络小额贷款相关企业及早排除风险收益不匹配的借款项目,将互联网金融风险控制在合理范围内,防范化解系统性金融风险。□