基于岭回归模型的河北省农民人均纯收入影响因素分析

2016-11-28 22:35何仁伟李立娜刘运伟
江苏农业科学 2016年9期
关键词:相关分析河北省影响因素

何仁伟+李立娜+刘运伟

摘要:构建农民人均纯收入的影响指标,在Pearson相关分析的基础上,运用岭回归模型,对河北省农民人均纯收入的影响因素进行量化分析。结果表明,由于农业经营收入的贡献逐年减少,农业结构调整不是影响当前河北省农民人均纯收入的主要因素;农业与农村经济的发展是影响农民人均纯收入的重要内部因素,其中农业增加值对农民人均纯收入的影响最为明显;社会经济发展是促进农民人均纯收入增加的重要外部因素,其中农业增加值的比重和农业从业人员的比重对农民人均纯收入的影响最大。最后,结合京津冀协同发展战略,对河北省农民增收的路径进行简单探讨。

关键词:农民人均纯收入;影响因素;相关分析;岭回归模型;河北省;增收路径

中图分类号: F323.8 文献标志码: A

文章编号:1002-1302(2016)09-0562-05

农民人均纯收入是反映农村经济发展状况和衡量农村居民生活水平的重要指标[1]。随着国家对“三农”问题重视程度的不断提高,农民人均纯收入的有关问题越来越受到学术界的关注[2]。目前有关农民收入的研究主要体现在2方面,一是农户收入增长的影响因素分析,如张德华运用多元线性回归法对调研数据进行分析,探讨黑龙江农民收入的影响因素[3];王睿等运用超效率多阶DEA模型和对称修剪最小二乘法对农村资金投入对农民收入增长变动进行实证分析,认为农村公共产品投入以及信贷投资是影响农民收入变动的最主要因素[4];栾江采用计量经济学方法,综合分析了教育对我国西部农村居民收入的影响,预测了教育普及政策效果[5]。二是农户收入的区域差异分析,如邹薇等通过改进卢卡斯模型,分析农村的教育水平对收入差异的影响,指出应该通过加强农村教育来缩小农村各地区间的收入差距[6];薛宇峰利用基尼系数作为收入分配水平的测度指标,并采用总体收入不平等指数作为基尼系数的补充测度指标,实证分析中国各省(区、市)之间农村收入分配不平等的程度和地区差异[7]。纵观现有研究成果,就研究内容而言,从综合角度研究农民收入变化的影响因素的成果仍然不多;就研究方法而言,将岭回归模型运用于农民收入研究的成果还比较缺乏。本研究以河北省为研究对象,将影响农民纯收入的影响因素分为农业和农村经济发展的内部因素和全省社会经济发展的外部因素,运用岭回归分析方法研究河北省农民纯收入的影响因素。本研究旨在量化分析农民人均纯收入的影响因素,为河北省农民增收的政策制定提供科学依据,同时也为岭回归模型在多因素回归分析中的相关研究提供参考。

1 研究区域概况

河北省位于36°05′~42°40′N、113°27′~119°50′E,环抱北京市和天津市,总面积18.85万km2,辖11个地级市,省会石家庄市。河北省地势西北高、东南低,由西北向东南倾斜,地貌复杂多样,包括高原、山地、丘陵、盆地、平原等地貌类型,主要有坝上高原、燕山和太行山山地、河北平原三大地貌单元。2013年地区生产总值为28 301.4亿元,第一、第二、第三产业比重分别为12.4%、52.1%、35.5%。河北省是中国重要的粮棉主产区,但仍然面临着耕地资源的严重约束,根据全国第2次土地调查数据,全省耕地面积为656.14万hm2,人均耕地面积约为0.093 3 hm2,低于全国人均耕地水平(0.101 3 hm2)。2013年河北省农民人均纯收入为9 102元,仅为与之毗邻、同属京津冀区域的北京市农民人均纯收入(18 337元)的49.64%。

2 数据来源与研究方法

2.1 数据来源

本研究数据均来源于1991—2014年《河北农村统计年鉴》《河北经济年鉴》,共计24个年份的时间序列数据,即样本数n=24。

2.2 研究方法

2.2.1 变量选取 根据河北省农村发展的具体情况以及数据可获得性,构建河北省农民人均纯收入影响因素指标体系(表1)。

影响农民纯收入的因素既包括农业和农村经济内部因素,也包括全社会经济发展的宏观背景即外部因素。内部因素选取农业增加值(X1)、农业机械总动力(X2)、单位农业从业人员增加值(X3)、种植业的产值比重(种植业产值占农业总产值比重,X4)等四大指标来反映,其中X1代表农村经济的发展水平,X2代表农业生产的机械化水平,X3代表单位农民的生产效益,是农业科技水平和基础设施建设的综合体现,X4代表农业产业结构比重。外部因素选取地区生产总值(X5)、农业增加值的比重(X6)、农业从业人员的比重(X7)等三大指标来反映,其中X5用来反映研究区域社会经济发展对农民纯收入的推动作用,X6、X7分别代表研究区域的产业结构、就业结构,为了体现与研究主题的直接关联性,分别选取农业增加值的比重和农业从业人员的比重来反映。

2.2.2 Pearson相关分析 分别用因变量农民人均纯收入(Y)与其影响因素X1~X7等指标分别进行简单相关性分析,求出对应的相关性系数 (Pearson 相关系数,显著性水平为0.01或0.05)。 相关性系数的绝对值在0.8~1.0之间,则2个变量具有极强相关;位于>0.6~0.8之间,则2个变量间有强相关;位于>0.4~0.6之间,则为中等程度相关;位于0~0.4 之间,则为低度相关。将相关性不强的影响指标或从理论上无法解释的变量在进一步的分析中移除。

2.2.3 岭回归分析 岭回归岭是由Hoerl等在1970年提出,实质上是一种改良的最小二乘估计法,通过放弃最小二乘法的无偏性,获得回归系数更为符合实际、更可靠的回归方法,在存在共线性问题和病态数据偏多的研究中有较大的实用价值[8]。岭回归的原理是当自变量存在共线性时,变量的相关矩阵之行列式就近似为0,即具有奇异性。此时,X′X ≈0。如果将X′X 加上正常数矩阵kJ,则X′X+kJ 将有利于改善X′X的奇异性。因而,可将β(k)=(X′X+kI)-1X′y称为β的岭回归估计,其中k称为岭参数,此值比最小二乘估计稳定。当k=0 时,岭回归估计就是普通的最小二乘估计;而当k→∞时,β(k)就趋于0 。由于岭回归是有偏估计,k值不宜太大;一般来说都希望能尽量保留信息,即尽量能让k 值小些[9]。因此可以观察在不同k值时方程的变动情况,然后选取方程基本稳定的最小k值。

本研究拟采用SPSS 22.0软件对农民人均纯收入的影响因素进行岭回归分析。首先,对原始数据进行多重共线性诊断,阐明岭回归分析的必要性。一般而言,当自变量的容忍度(tolerance)小于0.1,方差膨胀因子大于10时,存在严重的多重共线性。如果自变量间存在严重多重共线性,则运行如下程序(程序1):

根据程序运行结果,把各变量对应的系数代入,可得未标准化的农民人均纯收入方程。

3 结果与分析

3.1 农民人均纯收入与其影响指标的相关性

根据农民人均纯收入与其影响指标的Pearson相关性分析结果(表2),农民人均纯收入与农业增加值(X1)、农业机械总动力(X2)、单位从业人员增加值(X3)、种植业的产值比重(X4)、地区生产总值(X5)、农业的比重(X6)、农业从业人员的比重(X7)等6个指标的Pearson相关系数的绝对值均大于0.9,且P<0.01,存在着极强的相关性,说明这6个指标选择合理。而种植业的产值比重(X4)与农民人均纯收入在显著性水平0.05上呈中等程度相关。

进一步分析发现,种植业的产值比重与农民人均纯收入的相关性非常模糊(图1)。1990—2013年河北省农村人均纯收入呈现逐年上升趋势,种植业的产值比重变化可划分为2个阶段,第一阶段是1990—2004年种植业产值比重呈现下降趋势,与农民人均纯收入呈负相关;第二阶段是2004年以后,由于国家对农业税收的减免,以及一系列惠农政策的实施,农民种粮积极性提高,种植业产值比重呈现上升趋势,与农民人均纯收入呈正相关。因此,从现在的统计数据上无法判定种植业的产值比重与农人均纯收入的相关性。

从另一方面而言,由于非农经营收入和工资性收入的逐年增长,河北省1990—2013年农业经营性收入占农民人均纯收入的比重由60.46%下降到22.58%,说明农业对农户纯收入的贡献正在减弱,所以农业内部结构调整对农民的收益影响将越来越小,即种植业的产值比重与农民人均纯收入的相关性正在减弱。综合以上2方面原因,在进一步的岭回归分析中移出因变量种植业的产值比重(X4),本研究将影响农民纯收入的主要影响指标确定为X1、X2、X3、X5、X6、X7。当然,这并非表明农业产业结构调整不重要,相反,随着种植业对农民收入贡献度的逐年减少,农民种粮的积极性降低,对粮食安全形成重要挑战。因此,河北省应出台相关政策,提高农民粮食生产的积极性,以稳定粮食生产。

3.2 农民人均纯收入的岭回归分析

3.2.1 自变量的共线性诊断 由表3可以看出,农民人均纯收入主要影响指标即各自变量的容忍度均小于0.1,方差膨胀因子VIF均大于10,说明自变量之间严重的共线性,采用普通最小二乘法回归无法得出合理的解释结果。因此,有必要采用岭回归来研究农民人均纯收入与其主要影响指标因素的量化关系。

3.2.2 岭回归分析

3.2.2.1 岭回归模型 根据程序1的运行结果,将不同k值时各变量的回归系数连成曲线,即岭迹线(图2)。由图2可见,当k小于0.3时,6个变量的岭迹呈现出明显的下降趋势,当k到达0.3附近时,6个变量的岭迹都开始变得平稳,没有出现明显的波动。所以本研究选取k=0.3,根据此时各变量的所对应的系数(表4),可以得到农民人均纯收入的标准化岭回归方程:

由于标准化岭回归方程只能反映自变量与因变量标准化数据的量化关系,并不能反映原始数据的量化关系。因此,需运行程序2,以得出未标准化的岭回归方程。根据运行结果(表4),农民人均收入在0.05水平下通过t检验,且模型的可决系数R2=0.979 64,说明模型拟合非常好。由表4中的系数可以得到农民人均纯收入未标准化的岭回归方程:

3.2.2.2 模型结果分析 由方程(2)可以看出,其他影响因素保持不变时,当农业增加值(X1)增加1单位即1亿元时,河北省农民人均收入将增加0.533 2元;当农业机械总动力(X2)每增加1单位即1万kW时,河北省农民人均收入将增加0.081 7元;当单位农业从业人员增加值(X3)每增加1单位即1元时,河北省农民人均收入将增加0.077 9元;当地区生产总值(X5)每增加1单位即1亿元时,河北省农民人均收入将增加0.060 5元;农业增加值的比重(X6)每减少1百分点,河北省农民人均收入将增加25.199 8元;农业从业人员的比重(X7)每减少1百分点,河北省农民人均收入将增加43.029 48元。可以进一步作如下分析,第一,农业与农村经济的发展对农民人均纯收入的影响。在农业与农村经济内部发展影响因素中,农业增加值(X1)对农民增收影响最为明显(由方程系数可以看出),说明促进农村区域经济的发展有利于农民增收。农业机械总动力(X2)与农民人均纯收入呈正相关关系,说明机械化水平提高,一方面可以提高农业生产效益,促进农业经营纯收入的增加;另一方面可以使部分劳动力得以释放,向其他产业转移,从而增加非农经营收入和工资收入,进而促使农民增收。单位农业从业人员增加值(X3)的提高可以促进农民增收,说明农业科技进步和基础设施建设可以提高农民生产效率,增加农民纯收入。第二,社会经济发展对农民人均纯收入的影响。地区生产总值(X5)对农民人均纯收入(Y)有促进作用,可以从2个方面解释,一是随着区域经济总量的增加,政府对农村财政的直接支持也会增加;二是区域经济总量越大,区域经济吸纳农村剩余劳动力的能力越强,农民就业机会越多,收入越高。由方程系数可以看出,农业增加值的比重(X6)和农业从业人员的比重(X7)分别对农民人均纯收入的影响最大,说明随着第二、第三产业增加值的增大,对农村剩余劳动力的吸纳能力越来越强,使得农业从业人员的比例越来越小,一方面,工资性收入和非农经营收入增加了农民纯收入,并逐渐由农民收入的补充变成收入的主体;另一方面,农村剩余劳动力逐步向非农产业转移,减少人口这个分母,耕地资源的负担得到减轻,从而促进农村从业人员的纯收入的提高。所以,河北省应大力发展区域经济,促进第二、第三产业的发展及其对劳动力的吸纳能力,并出台相关配套政策促使农村剩余劳动力向城镇转移。

4 结论与讨论

4.1 结论

本研究基于岭回归分析模型,对河北省的农民人均纯收入的影响因素进行量化分析,得出以下结论:(1)由于农业经营收入的贡献逐年减少,农业产业结构调整不是影响当前河北省农民人均纯收入的主要因素;(2)农业与农村经济的发展是影响农民人均纯收入的重要内部因素,其中农业增加值对农民人均纯收入的影响最为明显;(3)社会经济发展是促进农民人均纯收入增加的重要外部因素,其中农业增加值的比重和农业从业人员的比重对农民人均纯收入的影响最大。

4.2 讨论

影响农民人均纯收入的各因素之间相互作用,互为因果,共同影响农民人均纯收入。如农业机械总动力(X2)的增加有利于单位农业从业人员增加值(X3)的提高,从而增加农业人均纯收入;农业增加值的比重(X6)降低,意味着第二、第三产业比重上升,吸纳就业能力的增强,导致农业从业人员的比重(X7)减少,从而促使农民人均纯收入增加。自变量之间的这种相互反馈,纷繁复杂的多重线性关系,为岭回归模型的发挥提供了空间。本研究根据河北省的区域情况,结合统计数据来源的获得性,试着化繁为简,将影响因素分为农业和农村经济发展的内部因素和社会经济发展的宏外部因素,并最终选择6个变量对农民人均纯收入的影响进行量化分析。由于农民人均纯收入的影响因素具有复杂性和综合性等特点,因此,在以后的研究中其指标体系有待进一步完善。

对河北省农民人均纯收入研究必须放在京津冀协同发展的战略大背景下来讨论,在《京津冀协同发展规划纲要》中,河北省的定位是全国现代商贸物流重要基地、产业转型升级试验区、新型城镇化与城乡统筹示范区、京津冀生态环境支撑区。根据河北省京津冀协同发展中的定位,结合本研究的研究量化分析结果,可得出促进河北省农民人均纯收入提高的初步思路(图3)。

由于不同区域农村发展阶段和社会经济发展水平不尽相同,其农民增收思路也应有所差异,贫困区域应成为研究的重点。就河北省而言,环京津贫困带上的农村贫困问题尤其突出,可以从可持续生计的视角来探讨其农民增收路径[10](图4)。环京津贫困带属于典型集中连片生态抑制型贫困[11],其农户生计非常脆弱,农民人均纯收入不到北京市平均水平的30%(根据2013年的统计数据整理)。其农户的收入贫困来源于其发展能力的贫困,即生计资产的缺乏,可从通过改善和增加农户的生计资本,将其转化为积极、多样的生计策略,从而促进农民的持续增收。结合上述研究结论,提出以下对策:(1)涵养生态,提升自然资本,发展生态农业和生态旅游,促进农村经济和地区经济的发展;(2)加大基础教育、职业教育以及新型农民培训的支持力度,实施教育扶贫,提升农户的人力资本,增加非农产业就业机会;(3)加强财政对农村的资金扶持,增加基础设施投入和农机补贴,提升农户的物质资本;安排低息(或免息)、贴息资金,增加农户的金融资本,支持农民开展多样化经营,活跃农村经济;(4)向农户提供准确及时的务工信息,增加农户社会资本,促进农村剩余劳动力转移。

当然,环京津贫困带的形成机理非常复杂,本研究仅对其农民增收的路径进行了简单探讨,基于可持续生计的该区域贫困问题研究还有待进一步深入和细化。

参考文献:

[1]文 琦,丁金梅,纳静涛. 宁夏农民人均纯收入时空演进格局分析[J]. 干旱区地理,2014,37(3):596-600.

[2]刘彦随. 中国东部沿海地区乡村转型发展与新农村建设[J]. 地理学报,2007,62(6):563-570.

[3]张德华. 黑龙江省农民收入影响因素及对策研究[D]. 哈尔滨:东北农业大学,2008.

[4]王 睿,蒲勇健,胡 东. 资金投入对农民收入变动的影响及相关因素分析[J]. 经济科学,2009(6):28-39.

[5]栾 江. 中国西部地区农村居民受教育程度对收入水平的影响研究[D]. 北京:北京林业大学,2014.

[6]邹 薇,张 芬. 农村地区收入差异与人力资本积累[J]. 中国社会科学,2006(2):67-79.

[7]薛宇峰. 中国农村收入分配的不平等及其地区差异[J]. 中国农村经济,2005(5):26-34.

[8]Hoerl A E,Kennard R W.Ridge regression:biased estimation for nonorthogonal problems[J]. Technometrics,2000,42(1):80-86.

[9]张文彤,董 伟. SPSS统计分析高级教程 [M]. 2版.北京:高等教育出版社,2013.

[10]何仁伟,刘邵权,陈国阶,等. 中国农户可持续生计研究进展[J]. 地理科学进展,2013,32(4):657-670.

[11]赵 弘,何 芬,李 真. 环京津贫困带减贫策略研究——基于“可持续生计框架”分析[J]. 北京社会科学,2015(9):21-28.

猜你喜欢
相关分析河北省影响因素
2020年河北省对外经济
国家开发银行河北省分行
河北省
河北省
城乡居民医疗费用的相关性与回归分析