张润驰 杜亚斌 荆伟 孙明明
摘要:基于江苏北部某地区2007—2015年18万条真实农户大样本小额贷款记录,结合当地及全国CPI、GDP、第一产业产值、地区农业生产资料价格指数等宏观经济指标,采用基于最大似然估计逐步进入法的Logistic模型,筛选对农户违约概率影响较为显著的指标,之后对各指标经济含义进行了解释并对模型进行稳健性分析。研究发现:信用水平指标与农户的真实违约情况关联不显著,意味着当地信贷机构对贷款农户的贷前内部信用评级不能有效地预测农户的信用风险;利率、性别、婚姻状况、职业、教育等微观指标对信用风险有较大影响;全国范围的GDP和CPI、江苏农业生产资料价格指数、滞后一期的当地第一产业GDP等宏观指标也对信用风险具有预测作用; Logistic模型在不平衡数据集上,依然能保持较好的分类精度。
关键词:农户小额贷款;Logistic模型;违约影响因素;信用风险
中图分类号:F323.9文献标识码:A 文章编号:1009-9107(2017)03-0067-09
引言
随着我国经济的不断发展以及一系列支农、惠农政策的扶持,农户的收入及生活水平不断提高,扩大生产的积极性与消费需求日益增长。然而,尽管当前农户对资金的需求在不断提高,农户信贷市场上却存在着严重的资金供求不平衡问题:大量农户希望通过贷款实现扩大生产或者消费,但农村地区的信贷机构由于难以识别借款农户的真实还款能力与还款意愿,一般出于谨慎,采取“惜贷”策略,仅仅向资信水平十分优越的农户发放贷款。由此,一方面导致有贷款需求的农户无法得到资金,不能进一步扩大生产或进行消费;另一方面也使得信贷机构积余了大量的闲置资金,资金利用率较低。存在这一现状归根结底的原因,在于农户信贷过程中的信用风险难以衡量。
信用风险是指获得信用支持的债务人不能遵照合约按时足额偿还本金和利息的可能性。为降低信用风险管理成本提高贷款决策效率,现代信贷机构一般选择以信用评估技术[12]对贷款人的信用风险进行预测与管理。最初,信用评估模型往往由外部评估机构开发,之后随着现代商业银行的不断发展与壮大,各银行构建自己内部的信用评估模型渐成为常态。巴塞尔协议II明确提出:在满足某些最低条件和披露要求的前提下,有资格采用内部评级(IRB)法的银行可以根据自己对风险要素的估计值决定对特定暴露的资本要求[3]。
就问题性质而言,信用评估在本质上是一种分类问题:根据待评估样本的多维度属性指标,设计合适的模型将样本分为若干类。影响模型性能的因素主要有两个:一是核心分类器的选择,二是模型构建时的指标选取。现有较为成熟的分类器根据原理不同,大体可以分为基于传统统计理论的分类器与基于数据挖掘技术的分类器两类。前者主要包括线性回归模型、Logistic模型、朴素贝叶斯(NB)、判别分析(DA)等[47],后者有代表性的主要是人工神经网络(ANN)、支持向量机(SVM)、决策树、K最近邻(K-NN)等[811]。
近年来,随着上述分类器的渐渐成熟与流行,更多学者将研究重点转移到我国农户信贷发展现状及其违约影响因素方面。王定祥等以全国15个省份较贫困地区的1 156户暂时性贫困型农户为研究对象,对贫困型农户信贷需求和信贷行为进行了调查分析,发现当前农户金融需求满足率极低[12];黄祖辉等以问卷调查的方式对820户农户的借贷行为进行考察,研究发现样本地区大部分农户对正规和非正规信贷的需求均以消费性为主[13]。杨胜刚等结合我国农户信贷市场的实际情况,通过调查某农村信用社713个农户的贷款记录,挖掘出违约与否的影响因素,并进一步运用层次分析法(AHP)设计了一套包含5个准则层、17项指标的农户信用评估体系[14];杨宏玲等发现当前农村信贷机构在选择农户信用评价指标时,主要以传统的“5C”或“4C”分析法为主,方法比较单一[15]。胡愈等从我国小额信贷的实践理论出发,建立农户信用等级评价的指标体系[16],李岩等则基于山东省573户农户6年的贷款数据,全面系统地研究了农户贷款行为的发展规律及其影响因素。结果表明:农户性质、性别、区域、年龄、教育、家庭人口、家庭劳动力、家庭田地亩数均对农户贷款行为有不同程度的影響[17]。魏岚等以辽宁省300户农户的入户调查资料为样本数据,基于Logit模型建立了含10个指标的小额信贷风险评价模型,并对模型的拟合结果进行了检验[18]。
研究农户小额贷款违约的影响因素,一方面,能够帮助农村商业银行、信用合作社等信贷机构进一步提升信用风险管理能力,降低不良贷款率,维持我国以银行业为主的金融体系稳定;另一方面,通过提升信贷机构对优良借款农户的甄别率,鼓励信贷机构发放贷款,能够缓解当前我国农户融资难的问题,帮助并引导农户扩大生产或增加消费,进一步提升农户的生活水平,在提高农业产值之余,亦能扩大消费市场需求,缓解我国当前的产能过剩问题。因此,具有重要的研究意义。然而,上述现有的研究,要么单从理论角度出发,缺乏基于真实样本的实证证据;要么仅根据单一农村商业银行、信用合作社或调查问卷的小样本农户信贷数据展开研究,其结论的代表性及指导意义有待商榷。相比之下,本研究基于江苏北部某农村地区2007-2015年18万条真实农户大样本信贷记录展开研究,相比于现有研究文献所用的单一信贷机构在短期内的农户信贷数据,本研究所选数据规模大、时间跨度长,因此研究结果更具可信性与现实指导意义。
一、研究数据
本文的研究数据来自直接隶属于国务院的某金融监管机构在江苏北部某地区的农户信贷数据库。数据库搜集了该地区自1997年1月至2016年3月共292 837条辖区内各农村商业银行网点、信用合作社等贷款机构面向农户发放贷款的历史记录。从数据集的规模、来源权威性、样本完整性等角度而言,其研究价值均较大。此外,该地区在江苏省内所占GDP比重较低,同时第一产业在该地区GDP中所占比重较高,因此比较适合针对农户的相关研究。
我们首先对原始数据集进行样本清洗,删除存在缺失值的样本。其次,由于1997—2006年、2016年到期的信贷记录样本数较少,且到期当年均不存在违约样本,故我们进一步剔除上述期间到期的信贷记录。另外,由于数据库中存在部分农村、乡镇企业的贷款记录,这些记录的贷款数额一般较大,而我们无法根据脱敏后的数据库样本信息将普通农户小额贷款与农村、乡镇企业贷款主体予以明确的区分。鉴于2010年财政部、税务总局在《关于农村金融有关税收政策的通知》中将农村小额贷款明确定义为借款金额为5万元以下的农村地区贷款,本文将数据库中实际贷款金额小于等于5万元人民币的贷款,划分定义为普通农户小额贷款,以便下文的研究。最后,对于教育程度、是否有手机或电话、婚姻状况等非数值变量,我们根据该监管机构提供的数据映射字典,分别对其进行数值化映射以便后续操作。经上述各项筛选、删减、映射操作后,数据集中含有贷款到期日自2007年1月至2015年12月共180 008份样本,其中违约样本数135份。各样本指标的含义及统计描述见表1。
此外,现有研究农户贷款影响因素的相关文献,大多仅基于单一农村商业银行或信用合作社短期内的信贷样本数据,在微观层面展开研究,模型中一般并不加入宏观经济指标,因此也难以分析宏观经济因素对不同时期信用风险的影响。考虑到本文的研究数据具有描述地区信贷总体特征、跨期长、数量大等特征,我们同时搜集了该地区2005—2015年,在借款年及还款年当年、滞后1期(1年)、2期(2年)、3期(3年)的地区GDP、地区第一产业GDP、地区CPI、地区农业生产资料价格指数以及全国GDP、全国第一产业GDP、全国CPI、M2等共计64(8×2×4)个宏观经济指标相关数据来自wind资讯,从而进一步研究相应的宏观经济因素与农户小额贷款的违约状况是否存在显著的相关关系。
二、研究模型的构建及稳健性分析
(一)模型构建
在研究信用评估问题时,一般以违约概率作为因变量展开研究,而考虑到普通的线性回归模型不能保证因变量一定在[0,1]间分布,现有文献一般采用Logistic模型。Logistic模型作为信用评估领域最经典的模型之一,相比于当前流行的各类基于人工智能、机器学习技术的分类模型,拥有适应性强、迭代迅速等优势,同时也兼具对样本属性指标的解释性,故文本选择基于Logistic模型展开实证研究。
设信用评估数据集共有n个样本xi (i∈{1,2,…,n}),各样本包含m个指标Aj (j∈{1,2,…,m}),则第i个样本在第j个指标上的取值可表示为xij (i∈{1,2,…,n},j∈{1,2,…,m})。各样本的类别标签yi∈{0,1}(i∈{1,2,…,n}).若yi=0,则表示其对应的xi 为信用较好的负类(negative)样本;若yi=1,则表示其对应的xi为信用较差的正类(positive)样本。在二分类问题中,Logistic方程的基本形式为:
之后以最小化分类误差为目标,通过估计参数b0,b1,L,bm 完成模型构建。Logistic方程本质上衡量了各指标与信用水平的半线性函数关系。
使用SPSS 20.0统计软件进行Logistic回归分析。考虑到备选指标中可能存在共线程度较高,或与违约概率相关性不强的变量,本文选择基于最大似然估计(LR)的逐步进入法筛选变量,最终收敛步骤为18步,18步迭代后的模型分类结果如表2所示。模型中剩余的各显著变量、其系数及显著性检验结果见表3。
(二)稳健性分析
进一步分析模型的稳健性。一个首先值得注意的问题是:在本文研究所用数据集中,存在两类样本的数量极度不平衡的现象(即未违约的负类样本数远远大于违约的正类样本数),现有的相关研究表明:一些分类模型在面对不平衡样本时,往往会更多地将正类样本误识别为负类样本,从而导致模型的分类能力存在“多数类偏倚”[19]。现有文献提出了一些较为成熟的解决样本不平衡问题的方法,从原理上而言,这些方法大体可以分为两类:一类是根据少数类样本和与其相似多数类样本的多维指标分布特征,以一定算法生成新的少数类样本,从而实现两类样本数量的均衡,这类方法具有代表性的主要有Oversamping[20]、SMOTE[21]、RAMBoost[22]、ADASYN[23]等;另一类方法则以现有少数类样本的数量为基础,在多数类样本中根据一定算法抽取有代表性的样本,实现两类样本的平衡,这类方法具有代表性的主要包括Subsamping[20]、CNNR[24]等。为验证本文所用数据集的不平衡是否会影响模型的分类结果,我们用MATLAB分别编程实现上述各样本不平衡处理算法,之后对比在使用上述各样本不平衡处理算法按两类样本1∶1平衡化处理后,构建出的不同模型在分类性能上是否有显著差异。
表4展示了经上述6种算法分别处理后,Logistic模型分类能力的差异。从表4中可以明显看出:在使用Oversampling算法之后,Logistic模型的分类性能急剧下降,总计分类正确百分比仅有50%,相当于随机分类方法。SMOTE、CNNR、RAMOBoost、ADASYN、Subsampling5種算法,在总计百分比上不能比表2中直接使用Logistic模型情况下的分类性能更优,两类样本独立分类正确率差异并不大。此外,考虑到任何对原始样本数据的压缩、增添过程都是对原始样本集所含信息的一种抽样与扭曲,从挖掘客观、真实数据集特征的角度出发,本文选择不对不平衡样本进行任何处理是有理有据的。
此外,最终被选中的各项显著性指标,是否敏感于我们使用的LR逐步进入法?我们同时也对相同的样本数据,分别采用基于条件参数估计、基于Wald方法的逐步进入法重新构建模型,发现在这两种方法下,选择的显著性指标与表3的结果完全相同,从而表明本文构建的模型并不敏感于指标的逐步进入选择方法,稳健性较好。
三、实证结果分析
1.基准利率、浮动利率、实际利率指标。在Logistic模型中,因变量为各样本的违约概率,事实上度量的亦是各样本的信用风险。根据表3,我们首先发现基准利率、浮动利率、实际利率三个指标与信用风险呈较为显著的相关关系。具体而言,基准利率指标与因变量的回归系数为4.512,表明信用风险受借款时的基准贷款利率影响较大,当基准贷款利率较高时,借款人实际上面临着相对更重的未来还款负担,从而导致违约概率上升。而浮动利率则衡量了放贷机构在基准利率基础上可调的利率区间,当浮动利率较高时,放贷机构有一定冲动通过提高利率浮动水平以获得超额利润,但事实上这一行为也增强了借款人的违约可能性。我们也发现实际利率与信用风险亦呈显著的负相关关系,系数约为-0.216,这与常识及现有研究的一些结论相悖:违约概率应当与贷款利率正相关。对此笔者认为:对当前大多数农村信贷机构而言,由于贷款定价机制不健全,大多数贷款可能主要依据金融当局的基准利率附加一定比例的风险成本进行定价,因此实际利率可能与基准利率有较高的相关性。经计算,实际利率与基准利率的相关系数为0.43。我们同时尝试在模型中不加入基准利率与浮动利率两个指标,此时实际利率的回归系数为0.057,对应的p值为0.006,依然保持显著。正的系数与常识相符:实际利率越高,借款人的还款压力越大,从而更易出现违约。
2.5级分类、信用水平指标。5级分类指标与信用风险在1%的显著水平上显著正相关,由此可以看出,该地区的农村商业银行、信用合作社等信贷机构,已具备了一定的贷后信用风险管理能力。但信用水平这一贷前信用风险预测指标并未进入模型,我们同时计算出信用水平指标与是否违约的因变量间的Pearson相关系数为-0.008,其相关性较弱,表明当地信贷机构在贷前信用风险的管控上有待加强,其目前的贷前信用评估模型,并不能从贷款申请者之中有效识别出潜在的违约者。
3.性别、婚姻状况、职业指标。就性别因素而言,男性借款人的信用风险普遍高于女性,且差异较为显著。婚姻状况及稳定性也对违约概率有较大程度的影响。具体来说,导致离异借款人离异的原因,可能是好逸恶劳、家庭责任感不强等因素,由此可合理推测其还款能力或还款意愿也较弱,而有子女的借款者,可能因自身需要履行抚养义务导致还款能力较差,从而更易违约。对于借款人具体的身份或技能而言,退伍军人一般具有较强的责任感与使命感,生产、服务、技术人员相比于一般农户,可能更加注重自身的声誉,因而违约风险相比于普通农民更低。
4.教育指标。值得注意的是,教育因素与信用风险是显著正相关的,表面上看,接受教育的层次越高,则信用风险反而越大,这与我们预先的猜测相悖。然而,根据表1的描述性统计,该地区借款农户的平均受教育水平均值为1.45,介于小学文化与初中文化之间,因此事实上整体样本的受教育水平依然处于一个较低的水平。仅根据实证结果来看,小学文化水平的借款者违约概率反而低于初中文化水平的借款者,对此我们认为:在过去农村地区低层次的教育环境下,仅有小学文化的农户相比接受了更高层次教育的农户,可能更具乡村环境中与生俱来的淳朴、踏实、勤劳、讲信用等优良精神,在贷款时量力而为,在贷款后勤勉奋斗,从而还款能力较高;还款时,在淳朴信用觀念的驱动下,恪守贷款合约义务,从而还款意愿较强,综合使得低学历的借款者违约概率较低。
5.担保情况指标。未解决结清担保债务这一指标也与信用风险负相关。然而传统的信贷理论一般认为:担保是一种或有债务,债务水平越高的借款人,违约的可能性越大。从农村信用借贷的微观视角出发,我们猜测:首先,寻求担保的借款人,往往偏好于选择那些财力较强,且能被信贷机构认可的农户作为担保人。因此事实上,成为被信贷机构认可的担保人,本身就是资信水平的一种象征;其次,担保人一般在当地具有较好的声誉,从维护自身声誉角度出发,担保人一般也会选择履行其担保债务责任;最后,在现实操作中,担保人与借款人之间一般可能存在亲戚或邻里关系,构成一种隐蔽的“贷款团体”。在贷款时,团体成员间通过相互担保的方式,提高贷款的成功率。而一旦某一成员出现还款困难,担保人可以通过先垫付还款的方式,将该团体与信贷机构间的债务关系转换为团体内部成员间的债务关系,从而同时保证了借款人与担保人在信贷机构中的信用记录不会恶化。
6.宏观经济指标。另外,我们关注选择的宏观经济指标是否对当地总体信贷违约概率具有显著影响。从表3可以看出,借款年全国GDP、借款年全国CPI、借款年江苏农业生产资料价格指数、滞后一期的借款年当地第一产业GDP四个指标与当地平均违约概率显著相关,四个指标项系数分别为-0.000 34、-0.21、0.716与1.101。
对于系数为负的借款年全国GDP、借款年全国CPI两个指标,本文尝试从农户的生产收入角度予以分析。首先根据表1中“借款期限”一项,我们发现当地农户借款期限一般较短,平均在1年左右(369.62天)。根据古典经济学理论,当借款期间整体经济形势较好时,一般直接体现为生产扩大,GDP上升,进一步导致劳动者收入增加,消费需求增加。在农产品供应量增量不大的条件下(考虑到农产品与一般商品的生产过程不同,其生产周期一般较长,因此农产品供应量增量不大的假设是合理的),均衡价格上升,一般也伴随着总体物价水平(CPI)上升,农户因销售农产品获得的收入增加,从而在借款期内现金流较高,还款能力提升。
对于系数为正的借款年江苏农业生产资料价格指数、滞后一期的借款年当地第一产业GDP两个指标,我们尝试从农户生产决策的角度出发展开探讨。对于借款年江苏农业生产资料价格指数指标,由于农户对生产资料(如种子、鱼苗、化肥、除虫除草药剂等)的购买大多是刚性需求,而农产品销售的收入一般有限,当借款年当地农业生产资料价格普遍上升时,农户很可能因此被迫选择贷款购买,从而维持生计。由于这一贷款行为完全是由刚性需求主导的,贷款动机背后并无预期收入增加作为还款资金支持,因此信用风险相比较大。对于借款年当地第一产业GDP这一指标,我们认为农户在生产决策中,信息来源一般比较狭窄,决策主要依据自身经验、他人建议及对当地“成功者”的观察。当借款年当地第一产业产值较高时,农户可能通过多种渠道认知了“今年形势较好”这一事实,进而根据适应性预期理论,可能认为当前的良好形势能在来年延续,从而决定贷款跟风扩大生产,由此因生产经营决策风险引致出信用风险。
7.未进入模型指标。最后,我们也注意到贷款申请额度、实际贷款额度、担保方式、年龄、是否有手机或电话、健康状况、年收入、信用水平、借款期限等微观指标由于显著性不强,并未被纳入模型。可能的原因是:在农户小额贷款过程中,贷款的申请额度与实际贷款额度等指标不同个体间差异并不明显,而健康状况、年收入等指标由于信贷机构难以核实,因此其区分信用风险的作用有限。随着电子通讯产品及通信费用的逐年降低,手机或电话已成为使用成本低廉的大众化通讯工具,该指标的意义不再明显。另外,还款年的各项宏观经济指标也未被纳入模型,借款年的该地区的GDP、CPI、同期全国第一产业GDP、M2等指标及其滞后项也未纳入模型。一般认为:还款年的经济形势、物价水平等因素可能会对借款人的还款意愿与还款能力造成影响,但本文的研究并未证实这一点,原因可能在于:借款农户出于谨慎,往往未雨绸缪,在还款期之前一段时间即准备好了相应的应还账款,从而受还款期整体经济形势的影响并不大。
四、结论及政策建议
本文基于江苏北部某地区2007—2015年18万条真实农户大样本信贷记录,对影响当地农户小额贷款违约与否的宏微观因素展开研究。研究首先发现“信用水平”指标与农户的真实违约情况关联不显著,意味着当地信贷机构对贷款农户的内部信用评级不能有效地预测农户的信用风险。之后,挖掘出利率、五级分类、性别、婚姻状况、职业、教育、未解决结清担保债务、借款年全国GDP、借款年全国CPI、借款年江苏农业生产资料价格指数、滞后一期的借款年当地第一产业GDP等指标与农户小额贷款信用风险有较为显著的关联性,可以作为当地信贷机构农户小额贷款信用评估模型的指标。此外,验证发现基于LR逐步进入法的Logistic模型,在两类样本不平衡性较大的数据集上,依然能保持较好的分类精度,具有较高的鲁棒性。
最后,结合对实证结果的分析,我們为当地农村信贷机构及金融监管当局如何更好地管理信用风险提出如下几点建议:
1.研究发现当地信贷机构的贷前信用评估模型并不能有效预测贷款申请农户的真实信用风险。因此,当地信贷机构需要强化贷前内部信用评估体系的研发,构建性能较强的、符合当地实际信贷现状的内部信用评估模型,同时加强传统的非模型化信用评估方法和贷后管理。
2.在构建内部信用评估模型时,可以考虑在模型中加入全国GDP、全国CPI、江苏农业生产资料价格指数、滞后一期的当地第一产业GDP等指标,结合现有的诸如微观评估指标,从更全面的视角对贷款农户信用水平进行深度评估。对金融监管当局来说,亦可尝试基于相应的宏观经济指标,对当地农户信贷风险进行恰当的预测,从而及时向当地信贷机构提供预警。
3.鉴于农户违约概率与借款时的基准贷款利率、浮动利率、实际利率关联性较强,金融当局应当进一步推进利率市场化工作,逐渐放开利率市场管制,避免因过高的基准贷款利率限制,变相提升农户贷款成本,因农户还款能力下降导致违约概率上升。对于贷款机构,亦应从长远角度出发,对不同信用水平的贷款农户实施差别化贷款定价,对资信较好的农户提供较低的实际贷款利率,构建长期的客户合作关系,而不可“揠苗助长”,片面追求短期的利润,以较高的贷款利率将真实信用水平较高的农户拒之门外,反而吸引了信用风险较大的借款人,引致道德风险与逆向选择问题。
4.考虑到金融知识对信用风险的显著影响,建议当地金融监管当局应积极与贷款机构合作开展农户信用意识科普活动,让更多有资金需求的农户在了解小额贷款相关的金融知识之余,提高借款农户的还款意愿。同时,可以结合大数据技术,构建当地农户信用信息库,一方面,为后续的信用评估模型构建提供数据样本支持,另一方面,通过记录历史违约信息,构建违约惩戒机制,提高违约成本,激励借款农户提高自身的还款动力。此外,当地政府应当积极引导当地农户科学进行生产决策,避免因扎堆跟风、盲目扩大生产导致农户进行非理性贷款,从而降低信用风险。
参考文献:
[1] Lessmann S,Baesens B,Seow H V,et al.Benchmarking Stateoftheart Classification Algorithms for Credit Scoring:An Update of Research[J].European Journal of Operational Research,2015,247(1):132.
[2]Thomas L C,Edelman D B,Crook J N. Credit Scoring and its Applications[M].Philadelphia :Siam,2002.
[3]Decamps J P,Rochet J C,Roger B. The Three Pillars of Basel II: Optimizing the Mix[J].Journal of Financial Intermediation,2004,13(2):132155.
[4]Orgler Y E.A Credit Scoring Model for Commercial Loans[J].Journal of Money,Credit and Banking,1970,2(4):435445.
[5]Steenackers A,Goovaerts M J.A Credit Scoring Model for Personal Loans[J].Insurance:Mathematics and Economics,1989,8(1):3134.
[6]Leonard K J.Empirical Bayes Analysis of the Commercial Loan Evaluation Process[J].Statistics & Probability Letters,1993,18(4):289296.
[7]Lessmanna S,Seowb H,Baesenscd B,et al. Benchmarking Stateoftheart Classification Algorithms for Credit Scoring:A Tenyear Update[C]//Credit Research Centre,Conference Archive,2013.
[8]Chuang C L,Huang S T.A Hybrid Neural Network Approach for Credit Scoring[J].Expert Systems,2011,28(2):185196.
[9]Bellotti T,Crook J.Support Vector Machines for Credit Scoring and Discovery of Significant Features[J].Expert Systems With Applications,2009,36(2):3 3023 308.
[10]龐素琳,巩吉璋.C5.0分类算法及在银行个人信用评级中的应用[J].系统工程理论与实践,2009,29(12):94104.
[11]Henley W E.Construction of a Knearestneighbour Creditscoring System[J].IMA Journal of Management Mathematics,1997,8(4):305321.
[12]王定祥,田庆刚,李伶俐,等.贫困型农户信贷需求与信贷行为实证研究[J].金融研究,2011(5):124138.
[13]黄祖辉, 刘西川, 程恩江. 中国农户的信贷需求:生产性抑或消费性——方法比较与实证分析[J].管理世界, 2007(3):139148.
[14]杨胜刚,夏唯,张磊,等.信用缺失环境下的农户信用评估指标体系构建研究[J].财经理论与实践,2012,33(6):712.
[15]杨宏玲,郭高玲.基于BBC与价值链风险分析的农户信用评价指标体系探析[J].科技管理研究,2011,31(6):6366.
[16]胡愈,许红莲,王雄.农户小额信用贷款信用评级探究[J].财经理论与实践,2007,28(1):3033.
[17]李岩,兰庆高,赵翠霞.农户贷款行为的发展规律及其影响因素——基于山东省573户农户6年追踪数据[J].南开经济研究,2014(1):134145.
[18]魏岚.农户小额信贷风险评价体系研究[J].财经问题研究,2013(8):125128.
[19]Batista G E,Prati R C,Monard M C.A Study of the Behavior of Several Methods for Balancing Machine Learning Training Data[J].ACM Sigkdd Explorations Newsletter,2004,6(1):2029.
[20]Yap B W,Rani K A,Rahman H A A,et al.An Application of Oversampling,Undersampling, Bagging and Boosting in Handling Imbalanced Datasets[C]//Proceedings of the First International Conference on Advanced Data and Information Engineering (DaEng2013).Springer Singapore,2014:1322.
[21]Chawla N V,Bowyer K W,Hall L O,et al.SMOTE:Synthetic Minority Oversampling Technique[J].Journal of Artificial Intelligence Research,2002,16(1):321357.
[22]Chen S,He H,Garcia E A.RAMOBoost: Ranked Minority Oversampling in Boosting[J].IEEE Transactions on Neural Networks,2010,21(10):1 6241 642.
[23]He H,Bai Y,Garcia E A,et al.ADASYN:Adaptive Synthetic Sampling Approach for Imbalanced Learning[C]//2008 IEEE International Joint Conference on Neural Networks (IEEE World Congress on Computational Intelligence).IEEE,2008:1 3221 328.
[24]Gowda K C,Krishna G.The Condensed Nearest Neighbor Rule Using the Concept of Mutual Nearest Neighborhood[J].IEEE Transactions on Information Theory,1979,25(4):488490.