姚宇韬 王跃堂 张润驰
内容提要:农业经济发展与农户生活水平的提高,离不开农村金融机构的资金支持。然而近几年来,农村信用社的贷款信用风险不断积累并爆发。防范农户的贷款信用风险,首先需要明确识别农户信贷违约特征的诸多影响因素。基于2017年4月至2018年6月间1356份宿迁地区某农村信用社已到期的短期小额贷款历史信贷记录,研究了我国农户信贷的违约特征影响因素。研究发现:贷款额度越高、存在担保、申请人为女性、家庭负担越重、申请者健康状况越差、受教育水平越低、年收入越高、贷款期越长、实际贷款利率越高,贷款者的违约概率越高。此外,贷款额度越低、健康状况越差、年收入越高,贷款者的违约损失率越高。
农业经济发展与农户生活水平的提高,离不开农村金融机构的资金支持(黎和贵,2009;余新平,2010)。然而近年来,我国农村金融体系中出现了一种愈演愈烈的“怪现象”:一方面,广大农户面临着融资难、融资贵的问题,有相当多的农户和农村企业的融资需求没有得到满足;另一方面,我国农村商业银行及农村信用合作社近年来的不良贷款余额与不良贷款率指标不断出现双升,如贵阳农商行不良贷款率从2016年末的4.13%激增至19.54%,河南修武农商行2017年末不良贷款率达20.74%,山东邹平农商行被东方金诚下调主体信用评级……
信用风险(Altman,1997;Acharya,2005)是指获得信用支持的债务人不能遵照合约按时足额偿还本金和利息的可能性。当前农村金融机构无法准确而恰当地判断贷款农户的真实信用风险水平,是造就上述现象的本质原因。农村金融机构在过去错判了一部分高风险贷款农户的信用风险水平,为其发放了贷款,导致今日的不良贷款激增;同时又由于难以判断另一部分贷款农户的真实信用风险水平,出于谨慎只能选择惜贷或不贷,或通过制定高利率以抵补贷款农户的信用风险,这又导致了农户融资难与融资贵的问题。因此,有效识别农户的信用风险,是解决上述各项问题的关键。
有效识别农户的信用风险,首先需要明确农户信贷违约特征,如违约概率,违约损失率的诸多影响因素。近年来,一些学者对这一问题及相关问题展开了若干研究。
赵岩青(2007)认为农户联保贷款难以发挥应有作用,杨宏玲(2011)指出当前农村金融机构在构建农户信用评价指标体系时,所采用的方法主要以“5C”或“4C”分析法为主,方法比较单一。赖永文(2012)基于福建省部分地区农户调查数据,研究了影响农户信用的主要因素。研究结果表明农户的年龄结构、职业特征及家庭经济状况对其贷款违约有直接影响,同时农户信用观念不强也是产生违约的重要原因。苏治(2014)运用二元选择模型对2012年吉林省农户正规金融信贷记录进行了实证检验,结果显示:中国农村信贷市场中农户违约行为动机包括主动性违约与被动性违约,且以被动性违约为主导。正规金融机构对农户被动违约动机因素的信息失控以及对主动违约动机因素的信息非对称,根本上决定了中国农村信贷市场的内生性特征。李庆海(2018)基于2013年苏鲁两省农户调查数据,考察和比较了正式和非正式社会资本对农户信贷违约的影响及其差异,研究发现正式社会资本对农户信贷违约具有显著抑制作用,而非正式社会资本具有显著激励作用。
总体而言,现有相关研究在数量上相对较少,同时上述研究要么主要基于调查问卷数据或小样本历史信贷记录展开,缺乏基于真实较大样本历史信贷记录的实证证据;要么所用样本的年代较为久远,其研究结论对新时代背景下、新经济形势下、新农村金融环境下的实践指导意义有待商榷;要么仅仅对违约概率的影响因素进行了探索,而缺乏对违约损失率影响因素的进一步关注。
相比之下,本文研究的创新之处主要在于:① 基于宿迁地区近一年的当地农户小额短期贷款信贷记录展开研究,样本规模相比于现有研究文献相对较大,因此研究结果更具可信性与现实指导意义;② 不但研究了农户违约概率的影响因素,也研究了农户违约损失率的影响因素,相比于现有研究,覆盖面更广。
本文剩余章节安排如下:第二节对研究所用数据进行简单的说明及描述性统计展示,第三节阐述模型的构建方法,第四节展示了研究的实证结果,对实证结果进行详细的分析,并对实证结果的经济含义进行了分析与探讨,第五节为本文研究结论的总结,同时也提出一些有较高可行性的政策建议。
本文研究所用的数据集来自江苏宿迁地区的某农村信用社,数据集搜集了2017年4月至2018年6月间,该信用社面向农户个体发放的已到期一年期短期小额贷款的历史信贷记录,共含1356份无缺失值的样本,其中违约样本133份,未违约样本1223份,样本规模相比于现有文献较大。
数据集中包含的可用指标主要有:该笔贷款额度、贷款是否存在担保、贷款者性别、贷款者年龄、贷款者婚姻状况、贷款者受教育情况、贷款者贷款时健康状况、贷款者过去一年的年收入、贷款期月数、该笔贷款的实际利率以及贷款的欠息情况。
其中,贷款额度指标反映了各笔贷款的实际额度,单位为元;是否存在担保指标为0-1二值哑变量,揭示了各笔贷款在申请时是否存在担保人,存在担保人则取值为1,否则为0;性别指标为0-1二值哑变量,反映了贷款者的性别,其中男性为0,女性为1;年龄指标反映了贷款发生时贷款者的年龄,为连续型变量;婚姻状况指标为0-3多值离散型变量,体现了贷款者在借款时的婚姻状态,其中未婚为0,已婚为1,离异且无子女为2,离异且有子女为3;教育指标为0-9多值离散型变量,反映了贷款者的受教育程度,其取值越大,表明受教育程度越高,反之亦然。由于数据脱敏的原因,我们无法获知各取值具体的含义;健康状况,0-2二值哑变量,反映了贷款者在借款时的身体状况,其中健康由0表示,不健康由2表示;年收入指标反映了贷款者过去的收入状况,为连续型变量,单位为元;贷款月数指标测算了各笔贷款的实际持续月数,实际利率指标则测算了该笔贷款的持有人实际承担的贷款利率,单位为百分比。
表1首先对上述各项指标进行了描述性统计,列示了各指标的极小值、极大值、均值、标准差及其偏度、峰度的统计量与标准差,统计使用SPSS 20.0软件完成。
由表1可以发现,当地小额贷款农户的贷款额度均未超过50000元,且贷款额度指标的均值为22262.95,大多数贷款个体的贷款额度相对较低。同时,大多数贷款都存在着还款担保,是否存在担保指标的均值为0.795404,明显大于0,这一现象有可能表明在当地农户的生活环境中,亲戚、邻里之间相互信任的程度更高,贷款者较容易找到担保人,亦有可能反映了当地的农村信用社要求大多数信用状况不明朗的借款申请者提供借款担保人,否则不予贷款。
性别指标的均值为0.423165,表明当地贷款者中男性占据了大多数,同时贷款者的性别差异并不十分明显。年龄指标分布在18-85之间,均值为45.07,且同时偏度为-0.31327,表明均值左侧的样本较多,意味着大多数贷款者为年富力强的中年人,年轻人和老年人相对较少。婚姻状况指标的均值为0.569866,分布在0与1之间,表明大多数贷款者为未婚或已婚者,离异者相对较少。同时均值略微超过了0.5,表明已婚贷款者的数量稍占优于未婚贷款者。
受教育情况指标的均值为1.724178,在0-9的取值选择中相对处于较低位,这表明大多数贷款农户的受教育程度较低,高学历农户贷款者的数量较为稀少,同时标准差为2.11,意味着不同贷款者的受教育水平也存在一定程度的差异。健康状况指标的均值为0.363545,相对于2更接近于0,同时偏度指标为1.650331,表明大多数贷款者的健康状况是较好的,但也有一定数量身体状况欠佳的贷款者。
表1 描述性统计表
年收入指标的均值为42682.74,且最低收入贷款者的收入水平为5000元,而最高收入水平为650000,表明当地不同农户的收入间存在较大的差异,同时偏度指标为15.43398,表明多数样本在均值右侧,意味着总体而言农户的平均收入依然相对较低,但大多数农户已不再处于收入较低的状态,同时高收入者虽存在但数量寥寥。贷款月数指标的均值约为11.81,表明大多数贷款者的借款时长接近一年期,同时也存在一些短期贷款,拉低了借款时长的平均值。
在农户贷款实际承受的还款方面,实际利率指标的均值高达8.20256%,且最高利率达14%,同时偏度为1.348031,意味着均值右侧有较多样本,表明当地大多数农户承受的贷款利率是相对较高的,这无疑加重了借款农户的还款负担。同时实际利率指标的标准差为3.316354,相对较高,暗示了当地的农村信用社会根据不同贷款农户的实际信用状况,有区别地制定贷款利率。
最后,对于贷款的欠息情况指标,我们从中衍生出两个新指标:贷款违约概率和违约损失率。从贷款个体的角度而言,其真实违约概率事实上是不可观测的,能观测到的仅有该个体是否违约,故对于违约个体样本,我们令其违约概率指标取值为1,而对于未违约个体样本,令其违约概率指标取值为0。对于违约损失率指标,未违约个体的违约损失率直接赋值为0,同时对于违约个体,通过公式:违约损失率=欠款欠息金额/贷款总额,直接计算得到。
本文参照现有文献的做法,选择多元线性回归模型进行实证模型的构造。多元线性回归模型结构简单,同时不用另设额外的模型参数,具有较好的建模客观性,同时其结果的说服力较高。
首先明确构建模型需要使用的各指标变量(向量形式):
被解释变量:违约概率(PD),违约损失率(LGD)
解释变量:贷款额度(amount)、是否存在担保(guarantee)、性别(sex)、年龄(age)、婚姻状况(marriage)、教育(education)、健康状况(health)、年收入(income)、贷款月数(months)、实际利率(interest)
进而分别构建违约概率的关联模型:
PD=β0+β1×amount+β2×guarantee+β3×sex+β4×age+β5×marriage+β6×education+β7×health+β8×income+β9×months+β10×interest+μ
(1)
与违约损失率的关联模型:
LGD=β0+β1×amount+β2×guarantee+β3×sex+β4×age+β5×marriage+β6×education+β7×health+β8×income+β9×months+β10×interest+μ
(2)
其中,方程(1)使用全样本(即包括了所有违约样本和未违约样本)进行估计,而方程(2)仅使用所有违约样本(违约损失率不为零的样本)进行估计,从而避免在回归过程中含有过多的违约损失率为零的未违约样本对回归结果的影响。使用SPSS 20.0软件进行模型的参数估计,得到各方程中β0,β1,…,β10的估计量。
表2首先展示了方程1的参数估计结果,分别列出了各参数的回归系数、标准化后的回归系数(由于一些指标的量纲较大,其回归系数接近于0,需要对其进行标准化以便与实际的0值进行较好的区分)、t统计量与显著性检验结果。
表2 违约概率关联影响因素表
由表2可以发现,除年龄指标回归系数的t检验结果不显著外,其余指标均通过了不同精度的显著性检验。具体地,贷款额度、是否存在担保、性别、婚姻状况、教育、年收入与实际利率指标均在1%的显著性水平上显著,同时贷款月数指标在5%的显著性水平上显著,健康状况在1%的显著性水平上显著。
具体分析,贷款额度指标的标准化系数大于0,表明贷款的数额越大,违约的可能性也越高,这一点与违约逻辑较为符合:贷款数额越大,往往也意味着还款的本金与利息数额越高,从而还款压力增加,故违约概率提高。同时,是否存在担保指标与违约概率的关联性也显著为正,即存在担保的贷款者反而有较高的违约概率,对此我们认为:第二节描述性统计部分的研究发现,数据集中的大部分贷款者都存在担保者,这可能并非是由于当地借款农户都有极好的信用水平及社会关系,从而容易找到担保者,而是由当地农村信用社的相关政策导致的现象:对于信用水平不是很好的贷款者,当地农村信用社可能会要求其必须提供担保者,否则拒绝授予贷款。在这一情形下,信用水平较高的贷款者,往往不需要提供担保人即能获得贷款,而提供了担保人的贷款者,却反而是信用水平不佳的,这解释了为何存在担保的贷款者的违约概率反而更高。
性别指标的标准化系数为正,即女性贷款者相比于男性,在某种程度上信用风险更高。据此我们认为:由于我国大城市吸收农村地区各种资源的效应客观存在(梅金平,2002;Zhai,2015),我国大部分农村地区的青壮年劳动力纷纷选择进城打工,而留在农村地区的大多是缺乏劳动力的留守妇女与儿童。因此,女性贷款者在某种程度上可能大多是因缺乏生活所需资金而进行借款,这类性质的贷款者往往缺乏还款能力,从而导致违约概率较高。
婚姻状况指标的回归系数亦显著为正。由于婚姻状况指标的取值含义按从小到大分别为未婚、已婚、离异且无子女、离异且有子女,因此正相关意味着家庭负担越重的贷款者,其借款违约概率越大。教育与健康状况两个指标的回归系数均显著为负,表明教育程度越低、身体越不健康的农户,其违约概率越高,这与违约逻辑相符:因受教育程度低而导致的信用意识淡薄,削弱了对应贷款者的还款意愿,而因身体健康状况不佳而导致的贷款者劳动能力下降,也削弱了对应贷款者的还款能力。
年收入指标与违约概率显著存在正向的相关关系,根据常识,高收入的贷款农户应当有较强的未来现金流获取能力,从而违约概率应当下降。对此我们认为:高收入的贷款者往往应当有较大数量的自有储备资金,故借款的可能性应当较低。而许多高收入农户的收入,并非通过经营传统的农林渔牧业基本生产活动获得,而是来源于风险相对较大的农业企业经营,因此贷款实际还承担了较大的企业经营风险,从而高收入的农户往往暗示了其企业主的身份,反而因承担的经营风险较大而导致违约概率较高。
最后,贷款月数指标与违约概率呈显著正相关,即贷款期越长,违约的可能性越大。同时实际利率指标与违约概率亦存在显著的正向关系,对此我们分析:一方面,贷款利率越高,借款农户的还款负担也越重,从而违约概率也越高;另一方面,农村信用社往往根据不同贷款者的估计信用风险水平确定其对应的贷款利率,高贷款利率往往会针对高信用风险的贷款者设定,因此高信用风险的贷款者有高违约概率也就不足为奇了。
表3进一步展示了方程2的参数估计结果,同样分别列出了各参数的回归系数、标准化后的回归系数、t统计量与显著性检验结果(由于是否存在担保这一指标,在所有违约样本中都取值为1,故该指标最终未进入回归模型)。
表3 违约损失率关联影响因素表
由表3我们首先发现:就影响违约样本违约损失率的各指标回归结果而言,仅有贷款额度、健康状况、年收入三项指标的回归系数显著,其中贷款额度指标在1%的显著性水平上显著,健康状况、年收入两项指标在10%的显著性水平上显著,其它指标的显著性均未通过检验。
具体分析,标准化的贷款额度指标回归系数为-0.383,即贷款额度越低,违约后的违约损失率越高。从贷款额度与用途的关联角度分析,中大规模贷款的用途可能主要集中在生产与经营类活动中,只要生产经营活动有所盈利,这类贷款的违约风险就会相对较低。而对于小额贷款,其用途大多是生活所需资金周转,其贷款主体往往是缺乏收入来源的乡村地区留守人员。同时,信用较差的贷款农户,往往也只能获得额度较少的贷款,因此贷款额度在某种程度上也可看作是贷款农户信用风险水平的一个度量指标。综上,小额贷款违约损失率更高。
健康状况指标与违约损失率正相关,即健康状况较差的农户,其贷款违约后对农村信用社造成的损失程度越高。从还款能力的视角分析:农户主要通过体力劳动的付出获取财富,进而用以偿还贷款及其利息。而身体健康状况不佳的农户相比于身体健康的农户,难免会存在一定程度的劳动力水平不足问题,进而间接地因生产力水平低而导致劳动的收入不高,从而削弱了还款能力,最终导致违约后的违约损失率较高。
年收入指标与违约损失率呈现正向的显著关联,其与违约概率之间的关联性一致,表明高收入的借款农户不但违约概率较高,违约后的违约损失率也较高,我们同样从借款需求角度进行分析:高收入的贷款者往往应当有较大数量的自有储备资金,故借款的可能性应当较低。而许多高收入农户的收入主要来源于农业企业经营,风险相比于传统农业活动更高,因此贷款实际还承担了较大的企业经营风险,从而高收入的农户往往隐含了其企业主的身份,反而因承担的经营风险较大而导致违约损失率较高。
本文的研究发现:贷款额度、贷款是否存在担保、性别、婚姻状况、教育、年收入与实际利率指标均在1%的显著性水平上与违约概率存在显著关联,同时贷款月数指标在5%的显著性水平上与违约概率存在显著关联,健康状况在1%的显著性水平与违约概率存在显著关联。此外,贷款额度指标在1%的显著性水平上与违约损失率存在显著关联,健康状况、年收入两项指标在10%的显著性水平上与违约损失率存在显著关联,其它指标均未通过显著性检验。
就各指标对农户贷款违约概率与违约损失率的影响方向而言,贷款额度越高、存在担保、申请人为女性、家庭负担越重、申请者健康状况越差、受教育水平越低、年收入越高、贷款期越长、实际贷款利率越高,贷款者的违约概率越高。此外,贷款额度越低、健康状况越差、年收入越高,贷款者的违约损失率越高。
结合上述研究发现,我们进一步给出若干切实可行的政策建议:
(1) 农村信用社在进行贷前审核时,应当尽可能地审核贷款农户的实际贷款需求,并恰当地评估贷款农户的真实还款能力。对于将被用于风险较高的农村企业经营活动的贷款需求、生活负担较重、还款期较长、缺乏充足劳动力与足够收入来源的贷款者,应当审慎进行贷款的审核及贷款利率的制定,进而使信贷决策与实际信用风险相匹配。
(2) 高利率是导致借款农户违约的重要因素之一。农村信用社应当积极响应当局金融支农与防范系统性金融风险的号召,在信用风险水平合理、可控的前提下,适当降低为信用水平较好的农户设定的贷款利率,在为贷款农户降低还款压力之余也能提高贷款的偿还率,从而降低潜在的信用风险。
(3) 当代农村信用社要进一步提高信用风险管理水平。由于农户贷款具有贷款主体多而分散、缺乏抵押物、缺乏稳定收入、审核的人力物力资源成本较高等特征,因此可以尝试通过研究、构建并应用自动化的信用评估模型对贷款农户的真实信用水平进行低成本、高精度的评估。此外,也应当根据不同经济形势与经济环境,定期调整模型的参数设定,从而提高模型的适用性。
(4) 农村信用社与金融当局应当加强对农户信用意识的教育培养与政策宣传,让农户切实理解信用的概念与涵义,明确贷款违约会造成的各种不良后果。通过营业网点全面的海报宣传、印制并分发简单易懂的信用知识手册、对守信与失信典型事例的恰当宣传,为农户们培养充分而全面的信用意识,让农户们充分认识到恪守信用对个人信用记录的维护与获取未来贷款的重要作用,从而促使并激励当地农户提高信用意识,进而在未来的贷款活动中提升还款意愿。