基于多元线性回归的山东省粮食生产影响因素分析

2021-01-10 00:23张涛田东林杨进敏
粮食科技与经济 2021年2期
关键词:粮食生产主成分分析法多元线性回归

张涛 田东林 杨进敏

摘要:根据山东省粮食生产的实际环境,结合学者相关研究,从自然资源、社会经济环境、农业生产条件三方面归纳出山东省粮食产量增长各影响因素,用多元线性方程分析其贡献值。用SPSS 22.0软件对原始数据进行相关性分析,去掉极弱相关因素后检查多重共线性,选择主成分分析法解决多重共线性问题,得出粮食单产影响因素的方程以及各影响因素的贡献值。根据结论,为稳定粮食产量,保障粮食安全提出相关建议。

关键词:多元线性回归;主成分分析法;粮食生产;影响因素

中图分类号:F326.11 文献标识码:A DOI:10.16465/j.gste.cn431252ts.20210205

粮食安全问题关乎国家发展和国计民生,十九大报告中指出“要把饭碗端在自己手中”。粮食产能安全是把“饭碗端在自己手中”的关键,明晰粮食生产的影响因素有利于针对性地提高粮食产量,预测粮食的生产量可以保障粮食安全,促进粮食产业的发展。现代化农业技术的进步以及经济水平的提高,粮食生产面积减少,一方面是当地农民将粮食耕种区转为经济作物规模化生产;另一方面是二三产业经济收入的提高,农民放弃粮食作物的耕种。因此,粮食生产数量受到耕地数量、经济收入、农业机械化水平等综合因素的影响,应多角度选取指标定量分析。山东省作为我国粮食主产区之一,粮食生产是经济社会发展的基础,对影响因素分析有助于进一步改善粮食生产环境,提高粮农收益。

学者对粮食生产影响因素的研究资料较为丰富,研究重点主要集中在粮食生产影响因素指标选取和定量分析的研究方法两个方面。选取粮食生产的影响因素的指标分类:按照粮食总产量贡献因素以及间接因素分类,贡献因素分为种植面积、单产及种植结构,间接因素分为城镇化水平(非农人口/总人口)、人均 GDP、化肥施入强度、单位面积农机动力、作物价格或替代作物价格[1];从资源投入、气候变化、技术进步、制度政策四大方面筛选与粮食产量相关性较强的要素[2];总的影响因素分为自然因素和社会经济因素,自然因素包括温度、日照、降水在生育期变化、自然灾害,社会因素涉及品种技术推广、农业生产资料投入、耕作方式、作物收益、出售情况、农业引导政策[3];直接选择影响粮食生产的重要指标,收集数据进行量化分析,主要指标有粮食播种面积、有效灌溉面积、农业生产资料价格指数、农业机械总动力、农业从业人员、家庭农业支出、农村用电量、化肥施用量、政府财政支农支出和成灾面积[4]。在粮食生产影响因素的分析中,使用计量经济和空间经济模型对粮食生产的影响因素进行分析:用平稳性检验方法对粮食生产因素进行排序[5],得出影响因素的重要程度;采用一元线性回归方程的影响粮食生产单个因素的方程式,根据系数的正负反映影响关系以及影响的重要性程度[6-7];采用地理加权回归模型对空间区域的粮食生产影响因素的影响程度进行分析[8];先用Pearson 相关分析法筛选出与粮食生产关系密切的影响因素,用熵权灰色关联分析法对粮食产量主影响因子进行排序,根据排序得出各影响因素的重要性[2]。本文以山东省为研究单元,综合运用Pearson 相关分析法、多元线性回归以及主成分分析法,对山东省2000—2019年的粮食产量以及相关影响因素定量,根据山东省粮食生产特点,提出相应建议。

1 数据来源与指标选取

数据主要来源于2001—2020年《山东省统计年鉴》、山东省各年统计公报。粮食生产是多因素综合作用的结果,既受到自然环境的制约,也与经济、社会条件直接相关。根据指标选取的科学性、综合性以及数据的可得性,结合专家学者对粮食生产的影响因素分析以及山东省粮食生产的实际特点,选定了自然资源、社会经济环境、农业生产条件三个一级指标。粮食生产的自然资源要素主要包括阳光、降水、气温;经济社会的发展影响到农民粮食种植的机会成本,限制粮食生产;农业生产条件是粮食产量的重要保障。数据指标体系见表1。

2 研究方法

2.1 多元回歸模型建立

为研究山东省粮食生产的影响因素,采用SPSS 22.0软件的主成分分析法降维,用多元回归模型分析粮食产量与各影响因素的关系[5]。建模步骤为:① 构建粮食产量影响因素模型,为消除数据异方差对原始变量取对数;② 数据标准化,消除量纲和数量级的影响;③ 指标之间相关性判断,运用相关分析方法作单因素筛查,去掉极弱相关影响指标,进行多元线性回归检验;④ 主成分分析法降维,确定主成分因子的表达式;⑤ 主成分因子多元线性回归,得出贡献值及其表达方程;⑥ 根据主成分因子的表达式以及回归方程,得出自变量的多元线性回归方程。

2.2 多元线性回归

式中:Y为人均粮食产量,kg/hm2;C为常数数值;βi为第 i个解释变量的系数数值;ln Xi为原始变量数据取自然对数;Xi为第i个解释变量数值,各解释变量单位见表1;μ为误差项数值。

2.3 主成分分析法

3 结果与分析

3.1 单因素筛查

采用Z-SCORE函数对34个三级指标数据分别进行无量纲化和标准化处理。对选定的13个变量进行相关性检验,根据表2中Person相关系数分析影响因素与粮食产量的相关性强弱,以及各影响因素之间的相关性。经验表明相关系数的值:[0.0,0.3]为极弱相关,[0.3,0.5]为弱相关,[0.5,0.7]为中度相关,[0.7,0.9]为高度相关[2]。

2001—2020年山东省人均粮食产量逐年增加,结合区域实际状况以及社会发展,部分影响因素的影响力发生变化。从表2可以看出,标准化后的数据年降水量(X2)、年平均气温(X3)、农药施用量(X10)、农用化肥施用量(X11)、地膜使用量(X12)5个影响因素与粮食产量(Y)的相关性为极弱相关。由于山东省位于北纬34°47.5′ ~ 38°24.01′,东经114°47.5′ ~ 122°42.3′,经纬度跨度不大,属于暖温带季风气候类型,年平均气温11 ~ 14 ℃,年平均降水量一般在550 ~ 950 mm,全省历年降水量和平均气温变化不大,所以年降水量(X2)、年平均气温(X3)、地膜使用量(X12)与粮食产量(Y)波动之间的相关性不大。原始数据表中,山东省地膜使用量在2000—2007年数量增加,2007—2019年地膜使用量下降到2001年的使用量,地膜数量基本稳定在121 014 ~ 151 014 t,变动不大,但粮食单产量逐年增加,因此地膜使用量(X12)与粮食产量(Y)的相关系数不高。近几年来山东省积极响应生态农业的号召,减少化肥和农药的使用量,提倡有机肥的使用,因此农药施用量(X10)、农用化肥施用量(X11)与粮食产量(Y)的相关性极弱。

3.2 多元线性回归相关性检验

去掉年降水量(X2)、年平均气温(X3)、农药施用量(X10)、农用化肥施用量(X11)、地膜使用量(X12),对剩下的指标数据进行多元线性回归,分析变量之间是否存在共线性以及序列相关性[10-11],分析结果如表3。

由表3可知,除了日照时数(X1)之外方差膨胀系数VIF均大于10,人均地区生产总值(X4)、农林牧渔业总产值(X6)、有效灌溉面积(X9)VIF值大于100,经验表明,当VIF>10时R2>0.9,说明自变量Xi与其他自变量之间有较高的多重共线性。为解决多重共线性问题,准确衡量各个影响因素对粮食产量的影响程度,选用主成分分析法进行降维。

3.3 主成分分析降维

对标准化的指标进行主成分分析,经KMO 和Bartlett球形检验,KMO统计量为0.784,Bartlett球形检验的 P值为0.000,数据取自正态分布,原有变量适合做因子分析,研究样本通过因子分析的适用性检验。根据表4中因子特征值和累计方差贡献率的数值,提取前两个公因子即可解释91.539%的结果,大于85%,说明这两个公因子能够充分解释8个变量对粮食产量的影响。

由表5可以看出,通过选取的两个主成分因子对各指标解释程度,可以分析得出第一主成分因子主要解释了人均地区生产总值(X4)、年末总人口(X5)、农林牧渔业总产值(X6)、农村用电量(X8)、有效灌溉面积(X9)、农业机械总动力(X13)等經济社会因素以及农业生产动力,因此第一主成分主要反映了粮食生产环境条件。第二主成分主要解释了日照时数(X1)和粮食播种面积(X7)两个自然要素对粮食产量的影响,因此第二个主成分因素为自然要素。

式中:Z1、Z2为降维后的主成分因子。

3.4 主成分回归计算

回归分析模型作为分析多变量间相互关系的常用方法[13],适用于粮食产量的预测分析。由表6可知,粮食产量Y与Z1、Z2的Person相关系数分别为0.888和-0.200具有较好的相关性。在表6主成分多元回归系数结果中可决系数R2为0.828,则主成分可解释82.8%的问题,各因素的显著性P值为0,显著性强且VIF值为1,不存在多重共线性。表6中多元回归系数可计算出粮食产量Y用Z1,Z2表示的多元线性回归方程。

通过式(13)可以看出日照时数(X1)、年末总人口(X5)与粮食单产呈负相关,尤其是年末总人口相关系数绝对值较大,主要原因:① 经济社会发展较快,人口数量增多,但是农民数量减少,第二产业和第三产业发展迅速,青壮年外出学习和打工,粮食种植多为中老年人。多数农村居住人口通过粮食购买满足自身需求,因此粮食单产数量与农村居住人口规模呈反比关系;② 山东省年日照时数基本在稳定的范围内,日照时间的增加会导致干旱,尤其是在粮食生长时期,如果没有有效的灌溉措施以及充足的水源,会导致粮食的大量减产,因此,日照时数与粮食单产呈负相关关系。人均地区生产总值(X4)、农林牧渔业总产值(X6)、粮食播种面积(X7)、农村用电量(X8)、有效灌溉面积(X9)、农业机械总动力(X13)与粮食单产呈正向关系,主要原因:① 人均地区生产总值和农林牧渔业总产值在一定程度促进了粮食产业的发展,提高农民种粮的积极性以及粮食加工行业的水平,尤其是在粮食产量大的区域;② 在没有自然灾害的年份粮食播种面积扩大会提高粮食产量,有效灌溉满足粮食作物的生长水分需求,会提高粮食产量;③ 农村用电量的增加在一定程度表明农村生活条件的改善以及农业机械总动力的增加,提高了粮食生产效率,扩大了粮食的种植规模。

4 结论与建议

4.1 结论

研究结果表明,山东省粮食生产生态化程度较大,在单因素筛查中年降水量、年平均气温、农药施用量、农用化肥施用量、地膜使用量与粮食产量相关性极弱。粮食播种面积、有效灌溉面积规模的扩大有助于提高全省的粮食产量,人均地区生产总值以及农林牧渔业地区总产值的增加会带动粮食生产,农村用电量、农业机械机械总动力的增加会提高粮食生产效率。有效灌溉措施的修建对粮食生产具有重要作用。

4.2 建議

适度增加粮食播种面积,加强土地质量检测。为保证粮食安全,国家提出守住18亿亩耕地红线的号召。一定数量的耕地面积是保障山东省粮食量的基础,稳定耕地面积,粮食生产形成规模化管理,一方面充分利用土地资源,另一方面规模化生产有利于提高粮食单产量。在城市化建设中,减少对耕地面积的占用,实现经济建设与粮食生产的平衡[14-15]。

兴建水利设施,增加有效灌溉面积。政府根据当地粮食产业的发展,鼓励农业生产技术专家走进田间地头对当地百姓进行种粮指导和培训,适量使用农药和化肥,提高粮食产量。对易干旱地区兴建水利设施进行有效灌溉,保障粮食生长所需水分,提高粮食产量。

推进粮食生产机械化,提高粮食生产效率。山东省平原地区占有一半的面积,是粮食生产的主产区。机械化能减轻农民的负担,提高农民的种粮积极性,实现粮食生产的规模化和集约化。

参 考 文 献

[1] 杨春霞,郑华,欧阳志云.2000—2015年三江平原粮食生产时空变化特征及驱动因素分析[J].水利水电技术,2020,51(6):21-29.

[2] 张贞,马赛,汪权方.基于Pearson灰色关联熵的粮食产量主影响因子识别:以河南省为例[J].干旱区资源与环境,2017,31(9):43-48.

[3] 李明杰,王国刚,张红日.山东省县域粮食生产格局演变及其影响因素[J].农业现代化研究,2018,39(2):248-255.

[4] 杨月锋,徐学荣.福建省粮食产量影响因素主成分分析与产量趋势预测[J].南方农业学报,2014,45(4):697-703.

[5] 屈艳辉,李二玲,范訸嘉.河南省县域粮食生产格局演化及影响因素[J].地域研究与开发,2017,36(3):148-153.

[6] 余文涛,石淑芹,孙晓丽,等.基于Logistic模型的东北地区粮食生产能力影响因素研究:以宾县为例[J].中国农业资源与区划,2017,38(12):124-129.

[7] 李福夺,杨兴洪.贵州省粮食产量影响因素的偏最小二乘回归分析[J].四川师范大学学报(自然科学版),2016,39(1):151-158.

[8] 卢新海,柯楠,匡兵.中国粮食生产能力的区域差异和影响因素[J].中国土地科学,2020,34(8):53-62.

[9]王莺,王静,姚玉璧. 基于主成分分析的中国南方干旱脆弱性评价[J].生态环境学报,2014, 23(12):1897-1904.

[10] 周永生,肖玉欢,黄润生.基于多元线性回归的广西粮食产量预测[J].南方农业学报2011,42(9):1165-1167.

[11] 陈锋,孟凡生,王业耀,等.基于主成分分析-多元线性回归的松花江水体中多环芳烃源解析[J].中国环境监测,2016,32(4):49-53.

[12] 崔宏轶,潘梦启,张超.基于主成分分析法的深圳科技创新人才发展环境评析[J].科技进步与对策,2020,37(7):35-42.

[13] 方大春,裴梦迪.我国新旧动能转换测度及影响因素研究[J/ OL].当代经济管理.(2020-08-07)[2021-02-20].http://kns. cnki.net/kcms/detail/13.1356.F.20200806.1551.010.html.

[14] 段其政,田佳辰.黑龙江省粮食产量的影响因素分析[J].粮食科技与经济,2020,45(12):52-55.

[15] 孟梅兰.山东省粮食经济发展问题研究[J].粮食科技与经济,2020,45(12):37-38.

Analysis on Influencing Factors of Grain Production in Shandong Province Based on Principal Component - Multiple Linear Regression

Zhang Tao1, Tian Donglin2, Yang Jinmin1

( 1. School of Economics and Management, Yunnan Agricultural University , Kunming, Yunnan 650201;

2. School of Foreign Languages, Yunnan Agricultural University, Kunming, Yunnan 650201 )

Abstract: According to the actual environment of grain production in Shandong Province, combined with the related research of scholars, the factors influencing the growth of grain output in Shandong Province were summarized from the three aspects of natural resources, social and economic environment and agricultural production conditions, and their contribution values were analyzed with multiple linear equations. The SPSS 22.0 software was used to analyze the correlation of the original data, check the multicollinearity after removing the extremely weak correlation factors, and choose the principal component analysis method to solve the multicollinearity problem. The equation of the influencing factors of grain yield per unit area and the contribution value of each influencing factor were obtained. According to the conclusion, some suggestions are put forward to stabilize grain output and ensure food security.

Key words: multiple linear regression, principal component analysis, food production, factors affecting

猜你喜欢
粮食生产主成分分析法多元线性回归
基于组合模型的卷烟市场需求预测研究
基于多元线性回归分析的冬季鸟类生境选择研究
中国装备制造业阶段竞争力研究
陕西省各地区人力资本水平综合评价与分析
中原经济区农业的可持续发展之路
我国上市商业银行信贷资产证券化效应实证研究
云学习平台大学生学业成绩预测与干预研究
郑州市粮食生产能力分析
基于主成分分析法的高校财务风险评价指标体系构建
浅论雷州市广垦东西洋米业粮食产业经济发展