基于OLS的中国农作物投入产出关系研究

2021-04-14 15:48蔡康
商场现代化 2021年4期

蔡康

摘  要:为了让我国农产品更好更健康地种植与生长,需要科学地分析影响我国农产品产量的主要因素,对我国2005年-2016年的农作物产品的相关统计数据进行讨论和分析,利用Eviews软件进行回归预测,由此建立了农作物产品产出量与相关投入要素的线性回归模型并对模型进行了简单预测分析,最后对模型进行检验,验证其可行性。

关键词:Eviews软件;多元线性回归分析;投入产出关系;多重共线性;White检验

从古至今我国的农业发展水平在世界都是首屈一指,我们农产品的生产发展环节已经渗透到了其他相关产业。虽然新时代下新的矛盾已经改变,但是农产品问题仍然需要循序渐进。因此为了更好地发挥农业生产水平,我们应该使用农产品相关的投入与产出分析理念,了解农作物的生产规律,从而更好地把握影响农产品的产量水平的主要因素。

一、数据来源与模型建立

从《中国统计年鉴》和中国种植业信息网中取得1995年-2016年中国农作物主要农产品产量、化肥施用量、农药使用量、农产品播种面积、耕地灌溉面积、农业用电量以及农业劳动人口等6个统计数据,其中设定Y:农产品产量(万吨),X1:化肥施用量(万吨),X2;农药使用量(万吨),X3:农产品播种面积(千公顷),X4:耕地灌溉面积(千公顷),X5:农业用电量(万千瓦),X6;农业劳动人口(万人),Y为被解释变量,X1~X6均为解释变量,数据见表1。

可以看出,农产品总产量及各相关投入因素差异明显,其变动方向基本相同,相互间可能具有一定的相关性,从而可以把输出结果设定为如下线性回归模型:

二、OLS估计结果

X2,X3,X5,X6并没有通过T检验,并且符号与预期明显方向不一致,说明该模型可能存在严重多重共线性。

三、检验多重共线性

1.简单相关系数检验

X1,X2,X3,X4,X5,X6的简单相关系数矩阵如表3所示:

在上述简单相关系数矩阵中不难看出>0.8,表示该回归模型存在一定程度的多重共线性问题。

2.逐步回归

为了认清解释变量的重要程度,我们必须用Y分别对X1,X2,X3,X4,X5,X6做一次一元线性回归分析得表4:

由表4可知,各解释变量的重要程度依次为X2,X1,X6,X4,X3,X5,为进一步了解其多重共线性的出处,可以通过上述R2值算出方差扩大化因子。因此,需要先删除VIF最大的解释变量X4,然后将各变量进行对数变换再对以下模型lnYt=B1lnX1t+B2lnX2t+B3lnX3t+B5lnX5t+B6lnX6t+e进行估计,对Yt,X1,X2,X3,X5,X6分别取对数,分别生成lnY,lnX1,lnX2,lnX3,lnX5,lnX6的数据,采用OLS方法估计模型参数,得到以下回归结果:

四、自相关性分析

通过最小二乘法的计算估计以及一阶滞后对上一步得到的回归方程=0.7665+0.9826lnX1-0.0973lnX2+0.2891lnX3-0.2669 lnX5+0.1507lnX6做序列相关性分析,并采用LM法检验。对样本量为22,解释变量的个数为5个,显著水平为5%的模型里,查DW统计表可知,dL=0.863,dU=1.940,模型中dU>DW>dL,不能明显判定模型中是或否有自相关,但是这一点可以从残差图中看出,残差的变动连续为正和连续为负,说明残差可能存在一阶正自相关问题。使用Eviews得到残差图,如下图:

再用BG检验做自相关检验,根据得出的BG检验结果,构建统计量LM=TR2,其中T为辅助回归实际样本容量,p为自回归阶数。在大样本条件下,即T服从自由度为p的χ2分布。在此模型中样本量为22,5个解释变量,5%的解释水平下,LM=TR2=22*3.2341=71.1502>12.5916,其p值為0.00756,表明存在自相关,因此需要采取补救措施。

为解决自相关问题,需要采用广义差分法,方程经过一二阶滞后得出:

(2)=5.99由于LM>χ2(0.05)(2),并且et-1,et-2,的回归系数没有明确表示为零,说明此模型存在一阶自相关和二阶自相关。因此对方程进行三阶滞后:

在此模型中,R2=0.8234,N=22,P=3,K=6(包含常数项),LM=(22-3)*0.8234=15.6446>χ2(0.05)(3)=7.81,说明自相关问题未能避免;可是反观et-3的回归系数不显著,因此不能有效说明模型中存有三阶序列相关性。利用广义差分方程处理自相关,模型结论为DW=2.3465>dU=1.66,已不存在序列相关性,最后得出的回归方程为:

五、异方差分析

利用White检验,辅助回归方程的估计结果为nR2~χ2(k),k=5,k表示解释变量的个数。nR2=24.7798,显著性水平为α=0.05,χ2(0.05)(5)=11.0705,因为n=24.7798>χ2(0.05)(5)=11.0705,所以拒绝原假设,表明模型存在异方差。运用WLS法消除异方差,可以分别选用并比较各种权数,从中选择较为合理的权数。经验发现利用效果较好并进行加权最小二乘估计,得到估计结果如下:

R2=0.9998,相比刚开始的模型,拟合优度和t值都明显有了提高和改进。

六、模型经济意义的分析

综上所述,经过一系列的分析与纠正最终得出的回归模型为:

此时R2=0.9998足够大,说明农作物产量基本上可以完全由化肥施用量、农药使用量、农产品播种面积、农业用电量和农业劳动人口来解释:X1的系数β1=6.5894说明:在其他外在条件稳固的前提下,化肥施用量每增加1万吨,农作物产量增加6.5894万吨;X2的回归参数β2=0.467说明:在其他外在条件稳固的前提下,农药使用量每增加1万吨,农作物产量增加4670吨;X3的回归参数β3=0.366说明:在其他外在条件稳固的前提下,农产品播种面积每增加1000公顷,农作物产量增加3660吨;X5的回归参数β5=0.799说明:在其他外在条件稳固的前提下,农业用电量每增加1万千瓦时,农作物产量增加7990吨;X6的回归系数β6=1.332说明:在其他外在条件稳固的前提下,农业劳动人口每增加1万人,农作物产量增加13320吨。

七、检验和预测

用该回归模型分析并预测2016年的农作物产量程度,由前文可知,2016年各相关要素的数值为:X1=5984.1,X2=175.40,X3=166650,X5=77889.6,X6=37662.5。代入模型中得:Y=65000.23。而2016年实际粮食总产量为61625.2万吨,误差率为5.67%,与客观误差率要求相差甚微。简而言之,通过该模型在知道2018年我国农产品相关投入的客观条件下,该模型能够被运用于2018年的农作物产量的预测。

参考文献:

[1]庞皓.计量经济学[M].北京:科学出版社,2014.

[2]孙敬水.计量经济学[M].北京:清华大学出版社,2004.

[3]赵卫亚.利用Eviews软件检验和处理模型的多重共线性[J].统计与决策,2008(6):147-148.

[4]铁梅.计量经济分析方法和建模[M].清华大学出版社,2006.

[5]石莲.基于Eviews软件对我国城镇居民消费和支出的计量分析[J].市场经济与价格,2015(11).