王新玲
(中国社会科学院研究生院,北京 102488)
农村信贷可得性影响因素研究
——基于Adaptive Logistic Lasso Regression回归方法
王新玲
(中国社会科学院研究生院,北京 102488)
基于中国家庭收入调查项目 (CHIP) 2013年度数据的农村住户调查部分,运用Adaptive Logistic Lasso Regression模型实证研究了农村信贷市场中影响农户信贷可得性的因素。研究结果与现有文献并不完全一致,农户动产总额、金融资产总额、当年度非农业经营性固定资产对农户信贷可得性具有显著影响,农户其他的人口学特征(年龄、教育、健康程度等)、工作性质、是否购买保险和拥有土地面积等对可获得贷款不具显著影响;信贷供给端的贷款绩效风险—激励机制、贷款代理人的个人特质及职业素质等很大程度上也会影响信贷可获得性。
农村信贷;可得性;普惠金融
农村金融是我国金融体系中相对薄弱的环节,中国的农村信贷市场依然有待完善。2015年国务院发布了《推进普惠金融发展规划(2016—2020年)》,其中提到要为小微企业、农民、城镇低收入人群等提供普惠金融服务。近年来,虽然政府信贷支农助农力度不减,但中国农村居民依然面临着较为严重的金融约束问题(汪昌云等,2014)。分析农村信贷市场中影响农户信贷可得性的影响因素,有助于提高农村金融服务水平,完善农村金融,克服因金融资源分布不均衡而加大的城乡差距。
发展中国家的农村金融市场大多包括正规金融市场和非正规金融市场(Barslund等,2008),中国也是如此(张兵和张宁,2012)。在农村正规金融市场中,农户因缺少合格的抵押品和担保,且所借资金用途不够明确,偿还能力难以评估,导致正规信贷渠道融资难问题。因此,很多有信贷需求的农户可能转而选择非正规金融市场,即来自非营利性的亲朋熟人借贷,以及私人贷款、借款组织,如专业放债人、零售商和典当商等(Cheng和Xu,2004)。在农村的信贷市场上,非正规金融渠道甚至比正规金融渠道更普遍(Ghate等,1992)。
除了从两类金融市场的视角研究农村信贷行为外,现有文献也主要从信贷市场的两端,即需求方与供给方分别研究信贷可得性的影响因素,目前对前者的实证研究更多一些。关于农户信贷需求的影响因素,大都集中在农户人口学特征、家庭特征、社会经济状况等对消费需求的影响。吕德宏和朱莹(2017)将农户分为务农型、务工型和经商型三类,务农型农户信贷风险的影响因素为家庭耕地面积和年龄,务工型影响因素多为农户年龄、家庭劳动力占比和政府贴息。王曙光和王东宾(2011)通过Probit模型估计发现,家庭人口数量、平均年龄越大,获得贷款的可能性越小;家庭千元以上财产越多、房产价值越高的人获得贷款的可能性越大。目前关于收入因素与信贷需求关系的研究结论并不一致,谢昊男(2011)的研究认为,农户收入增加引致信贷需求的增加,收入的增长保证其一定的还款能力,从而激发了新资金借贷的需求。但彭克强和刘锡良(2016)持相反观点,认为伴随农户人均收入水平的提高,其非农创业意愿加强,农户感受到的正规信贷约束并无减轻,反而明显加重。秦建群等(2011)通过用Logistic模型研究认为,农户的家庭收入、家庭规模、家庭负担率以及是否购买养老保险对农户的信贷需求有显著的正向影响,样本农户的年龄与信贷需求之间成倒U形关系,且农户从事的经济活动类型也会影响信贷需求,纯农业农户对信贷需求有显著的正向影响,而非农业农户(兼业农户)对信贷需求有显著的负向影响。
从供给端来看,信贷可获得性的影响因素中,对贷款人(金融机构)来讲,农业保险可被视作一种有效的抵押品替代信号,增加农户信贷可得性和信贷额(任乐等,2017);农地产权也是影响农村金融市场的重要因素,农户农地确权和农地流转有助于显著提高农户的名义信贷需求(张龙耀等,2015)。胡枫和陈玉宇(2012)发现社交网络(“关系”)对农户信贷可得性有正向影响,户主为女性且受教育程度不高的农户不太容易获得正规金融机构贷款且贷款额较小,经济条件好的农户则更可能从正规金融机构获得较多的贷款。
现有的研究文献中,数据大都来自区域性问卷调查,时间跨度相对较小(通常1—3个月),样本代表性可能存在不足。本文采用中国家庭收入调查项目(Chinese Household Income Project)中的农村住户样本数据,时间长达12个月(2013年全年),涉及全国各省市共11013户样本农户,样本具有较强的代表性。同时在分析方法上,目前大多数研究借用传统的Logistic或Probit模型进行回归分析,难以剔除变量间多重共线性的影响,且在高维度变量情况下导致预测精度大大降低,本文采用的Adaptive Logistic Lasso Regression模型,可有效进行高维度数据回归,同时克服了数据集变量之间的多重共线性问题,极大地提高模型解释能力与预测精度。
本文使用的数据来自于北京师范大学中国收入分配研究院公布的中国家庭收入调查项目 (CHIP)2013年度数据,本研究使用的是其农村住户调查部分。CHIP2013的样本来自国家统计局2013年城乡一体化常规住户调查大样本库,覆盖全部31个省(市、自治区)的16万户居民,按照东、中、西分层,从15个省份126个城市234个县区抽样选出11013户(本文中有效样本为10490户)农村住户样本。
被解释变量:凡在2013年向农村正规金融机构申请过贷款的农户,无论是否申请到,本文都将其视为具有借贷行为的农户;在表1中因变量“农户借贷①”为二元离散变量,样本农户答案为②与③时,取值为0;而答案为③时,取值为1。需要指出的是,CHIP问卷中关于借贷问题的设计是“您或您家庭中的成员是否从银行、农村信用社、其他商业或金融机构、其他正规放贷组织或民间放贷者那里提出过借贷申请或要求”,所以本文模型中并未严格区分正规和非正规信贷市场,将问卷中不同信贷供给方统一视为信贷供给者(逐利性的)②。
解释变量:为了减少因缺少重要变量而出现的模型偏差问题,本文选取了调查中24个自变量,为了方便描述,分别列表。表1描述的大多为定类变量,包括农户的年龄、婚姻状况、政治面貌、受教育程度、健康状况、是否村干部、是否残疾,以及农户的工作类型、合同性质和养老保险福利等变量。表2的变量统计描述都是可量化变量,包括近三年的可支配收入(2011—2013),农业工作时长(从事家庭农林牧渔)、非农工作时长、金融资产总额、负债余额、农业及非农经营性资产、动产总额及拥有土地面积。
为了消除各变量不同量纲带来的影响,同时消除由于异方差性给模型造成的偏误,本文已对所有自变量进行标准化处理;且在计量分析中将农户的每一笔借款作为一个独立的借贷行为样本进行分析;对于样本中的缺失数据(数量很少),在计量处理中用该项目数据的平均值作补充。
从表3中可以粗略地看出,农村信贷市场中,向亲戚、朋友借款的农户数量比向营利性借贷机构的多,亲朋借贷中所有借贷均会被满足的比例相对高一点,这点也已被实证研究证实(Ghate等,1992);未选择向营利性金融结构提出贷款的最主要原因是农户觉得提出申请会被拒绝,这和现有文献结论相似,即除了正规金融机构的外部性约束外,农户自身存在的认知偏差和行为偏差也使得农户难以借助金融机构有效融资(王冀宁和赵顺龙,2007)。而在农户的认知中,他们觉得向银行、农信社等金融机构或其他借贷组织等贷款会被拒绝的前六大主要原因是“没有人作担保”、“收入低、信贷员担心还不起”、“有欠款未还清”、“没有抵押品”以及“与信贷员不熟悉”。
表1:农户借贷可得性变量描述(定类变量部分)
表2:农户借贷可得性变量(变量可量化部分)
表3:不同贷款渠道贷款情况统计
为了避免多重共线性而产生的可能偏差,在自变量为多维数据集的情况下,本文选取Adaptive Logistic Lasso Regression(ALLR)方法进行模型的建立和自变量的选择,这是目前计量经济学比较前沿的一种模型回归方法,具有很高的解释力和精确度。
Lasso Regression允许尽可能多地选取自变量,排除因先入为主的观念而遗漏的变量,同时可以通过对偏差估计量缩减,剔除变量之间的线性关系,最后将对因变量不具有显著影响的变量系数压缩为零,非零参数所对应的则是对因变量具有显著影响的自变量。而传统的Logistic Regression并不适合高维变量数据集,且变量之间可能存在多重共线性,在结果中很难剔除。
假设有二元变量yi,其中:
pi为yi=1时的概率并且与自变量xi相关。因此,Logistic回归模型可以被定义为:
在上式中β为(k+1)×1包含有常数项的回归系数向量。同时定义xi为长度为k+1的自变量向量。那么p(xi)可以写为:
所以当有N个观测值时,似然方程为:
对数似然方程为:
假设βj为向量β的第j个变量,那么βj的最大似然估计值的满足条件为:
Zou(2006)提出Adaptive Lasso方法的动机来源于Tibshirani(1996)提出的Lasso方法。Adaptive Lasso方法对传统Lasso的惩罚项进行改良,确保了Lasso方法在合适的惩罚项约束下具有理想性质,即:第一,变量选择的有效性;第二,系数估计具有和真实模型已知系数一致的大样本性质。
对于使用OLS估计的一般线性模型,Adaptive Lasso估计值为:
应用于Logistic回归时将Loss Function替换为异号的对数似然方程:
其中,λ为常数参数,定义为调和参数;为基于最大似然估计的自适应权重,γ>0,且一般情况下,γ=2。
另外,对于参数λ,我们假设有c个候选项。最优参数的选择基于BIC(贝叶斯信息准则):
常数z为向量β中非零的个数。显然对于不同的调和参数,估计值和β中非零的个数并不相同。在所有c个候选参数中,最优的调和参数使得BIC的值最大。
表5:ALLR模型回归结果
在ALLR模型的回归结果中,系数非零的只有常数项,金融资产总额、2013年度非农业经营性资产(非农业经营性固定资产现价估计净值)和动产总额,即农户的金融资产总额、本年度非农业经营性固定资产、动产总额以及常数项包含的可能变量(非本文所覆盖的变量)对农户信贷可得性有显著正向影响,回归结果与现有文献结论并不完全一致。
首先,从农户人口学特征来看,农户的教育水平(Nguyen,2007)以及年龄因素(Li等,2011)在先前的研究中被证实与信贷供给呈现倒U形关系,但在本文的ALLR模型中,我们并没有发现这两个变量对因变量有显著影响,且考虑到年龄对信贷可得性的影响可能非线性,我们将(户主年龄的平方/100)作为一个单独变量添加到原模型重新回归之后,结果无异。因此单从计量模型角度,笔者推测户主的教育水平和年龄很可能会与模型中的其他变量自相关,即教育水平和年龄相对较高的人,所拥有的资产总额(或可抵押物)就越多,获得信贷的可能性也许越高,而在传统的logistic模型中,这种变量的多重共线性很难剔除掉,所以使用Logistic模型所得结论可能就会是年龄或教育水平对信贷可获得性具有正向影响。农户的婚姻状况、政治面貌、健康状况、是否村干部均对信贷可得性无显著影响。
其次,本文ALLR模型估计的动产总额对信贷可得性的影响系数比较高(β=1.0894),这也符合经验结论。本文的动产总额为2013年末住户动产(包括汽车、黄金、耐用品)。农户融资难的主要原因之一就是缺少合适的抵押品或担保人,所以金融机构等信贷供给方为了降低风险,可能会转而参考农户动产情况。进一步而言,我们也注意到回归结果中“拥有土地面积”对信贷可获得性不具有显著影响,这和传统惯例中不动产抵押的不同之处是现行体制下大部分农村土地和房屋不可流转抵押,因此农户所拥有的土地数量对信贷供给者参考意义不大。
同样的,本年度非农业经营性固定资产现价估计净值对信贷可得性具有显著性正向影响(β=0.65)。在CHIP数据手册说明中,“非农业经营性固定资产指非农业生产经营户在家庭或个人从事的非农业生产经营活动中,所拥有的使用期限较长、直接参加或服务于生产经营过程的房屋建筑物、机器设备、器具工具等资产”。非农经营性活动包括非纯农业农户经营的小生意、小买卖、小店铺或小作坊等非农经营项目,一般来说,这类农户使用资金效率相对高些,以该类固定资产作抵押或担保更容易获得信贷。
再者,农户本年度的金融资产余额(包括现金、存款、股票、基金等)也对信贷可得性具有显著性正向影响(β=0.2770),尽管其参数值小于动产总额和非农业经营性固定资产;这和现有文献相似,王曙光和王东宾(2011)认为家庭千元以上财产越多,获得贷款的可能性越大。在缺少有效抵押品的情况下,农户可证实的金融资产总额越高,说明偿还能力就越高。
最后,本模型中的常数项估计值(λ=1.765)大于其他自变量的系数估测值,可以推测在本文模型所覆盖的农户家庭特征、人口学特征、社会经济条件等自变量之外,从信贷供给端来看,结合现有文献的实证研究,信贷可得性还与农户社会网络、信贷供给方信贷激励机制设计、信贷员的主观选择偏好等具有相关性。社会学家费孝通(2007)曾指出,农村社会就是一张因血缘、地缘、姻亲等关系而结成的关系网,农户的“政治关系、人际关系、组织关系”等社会关系可视作一种信用担保,对获得金融资源有正向影响,一旦农户信贷违约,也将损害其长期积累的社会资本。即便在正规金融市场中,金融机构在信贷决策时也会考虑贷款人的社会信用和社会关系(Akoten等,2006)。贷款农户如果能够认识所贷款银行的客户或银行职员,或者获得他们的推荐都将有助于获得贷款(Vaessen,2001)。同时,金融机构等信贷供给方对信贷员的绩效—风险激励机制以及信贷员本身的个人特质、职业素质会在信贷决策中施加影响(Cole等,2015)。有研究在对14名以色列银行信贷员进行深度访谈后发现,相比硬性的财务数据,信贷员更多地借助于“直觉”做出信贷决策(Lipshitz等,2007);因此,本模型中的常数项估计值所对应的变量很大程度上比农户其他的硬性财务指标对信贷可获得性的影响更大。
健全高效的农村信贷市场对缩小城乡差距具有重大意义。及时的信贷有助于农村居民平滑消费曲线,增加农户资本积累和提高收入,跳出贫穷的恶性循环。金融机构应建立适合农村信贷市场的信贷决策机制,可以深入到农村社区了解农户的社会网络和生产活动,克服信息不对称,弱化传统财务指标的参考意义,改变农户融资认知偏差。政府层面应加快推进农村土地和房屋流转抵押制度的确定和推广,盘活农村资产尤其是不动产,提高农村居民的融资能力,建立农村普惠制的金融制度。
注:
①CHIP调查有关家庭借贷方面的问题时是以家户(household)为单位的,已避免同一家庭成员之间可能出现的重复样本数据。
②区别于农户向亲戚或朋友借贷(农村社会中大多是不需要偿还利息,因此可视为非营利性的)。
③分别根据CHIP调查中变量代码n02_1、n03_1、n02_2、n03_2统计得出。
[1]Barslund,M.,Tarp,F.2008.Formal and informal rural credit in four provinces of Vietnam[J].The Journal of Development Studies,44(4).
[2]Cheng,E.,Xu,Z.2004.Rates of interest,credit supply and China’s rural development[J].Savings and Development.
[3]Zou,H.2006.The adaptive lasso and its oracle properties[J].Journal of the American Statistical Association,101(476).
[4]Tibshirani,R.1996.Regression shrinkage and selection via the lasso[J].Journal of the Royal Statistical Society.Series B(Methodological).
[5]Cole,S.,Kanz,M.,&Klapper,L.2015.Incentivizing Calculated Risk-Taking:Evidence from an Experiment with Commercial Bank Loan Officers[J].The Journal of Finance,70(2).
[6]Lipshitz,R.,&Shulimovitz,N.2007.Intuition and emotion in bank loan officers’credit decisions[J].Journal of Cognitive Engineering and Decision Making,1(2).
[7]胡枫,陈玉宇.社会网络与农户借贷行为——来自中国家庭动态跟踪调查(CFPS)的证据[J].金融研究,2012,(12).
[8]吕德宏,朱莹.农户小额信贷风险影响因素层次差异性研究[J].管理评论,2017,29(1).
[9]彭克强,刘锡良.农民增收、正规信贷可得性:与非农创业[J].管理世界,2016,(7).
[10]秦建群,吕忠伟,秦建国.中国农户信贷需求及其影响因素分析——基于Logistic模型的实证研究[J].当代经济科学,2011,(5).
[11]任乐,王性玉,赵辉.农户信贷可得性和最优贷款额度的理论分析与实证检验——基于农业保险抵押品替代视角[J].管理评论,2017,29(6).
[12]谢昊男.发达地区农户信贷需求影响因素分析——基于浙江宁海县农村调查研究[J].农村经济,2011,(7).
[13]王冀宁,赵顺龙.外部性约束、认知偏差、行为偏差与农户贷款困境——来自716户农户贷款调查问卷数据的实证检验[J].管理世界,2007,(9).
[14]张龙耀,王梦珺,刘俊杰.农地产权制度改革对农村金融市场的影响——机制与微观证据[J].中国农村经济,2015,(12).
[15]费孝通.乡土中国[M].上海:上海世纪出版社,2007年.
[16]汪昌云,钟腾,郑华懋.金融市场化提高了农户信贷获得吗?——基于农户调查的实证研究[J].经济研究,2014,(10).
[17]张兵,李丹,孟德峰.降低市场准入与缓解农户正规信贷约束[J].金融论坛,2015,(1).
A Study on Factors Affecting Rural Credit Accessibility——Based on Adaptive Logistic Lasso Regression
Wang Xinling
(Graduate School of ChineseAcademy of Social Sciences,Beijing 102488)
Based on the rural household survey data of the Chinese Household Income Project(CHIP) 2013,this paper uses the Adaptive Logistic Lasso Regression model to study the factors that affect rural credit availability in rural credit market.The results of the study are not completely consistent with the existing literature.Farmers'total amount of movable assets,total amount of financial assets,and the non-agricultural fixed assets in the current year have significant impact on the credit availability of rural households.Other demographic characteristics(age,education,etc.),the nature of work,whether to buy insurance and household land area have no significant impact on the availability of loans;seen from the credit supply side,the risk-incentive mechanism in financial agents,the loan officers'personal qualities and professional quality may also affect the credit availability to some extent.
rural credit,availability,inclusive finance
F832.43
A
1674-2265(2017)11-0018-06
2017-09-06
国家社科基金重大招标项目(第一批)“面向未来的我国大国经济发展战略研究”(项目代码11&ZD002)。
王新玲,女,山东临沂人,中国社会科学院研究生院政府政策系博士研究生,研究方向为国民经济学、农村经济、人口经济学。
(责任编辑 孙 军;校对SJ,GX)