我国粮食种植面积模型构建及研究

2017-12-14 05:30:17

福建质量管理 2017年22期

(国防科技大学湖南长沙 410000)

我国粮食种植面积模型构建及研究

杨文尧

(国防科技大学湖南长沙410000)

粮食不仅是人们日常生活的必需食品，而且还是维护国家经济发展和政治稳定的战略物资，具有不可替代的特性。而粮食种植面积是影响粮食产量的直接原因，因此，研究影响粮食种植面积的因素对粮食政策的制定有着重要的指导意义。影响粮食种植面积的因素比较多，它们之间的关系错综复杂而且可能存在着粮食品种和区域差异。本文通过分析影响粮食种植面积的指标和关于粮食种植面积的数学模型，讨论、评价指标的合理性，并研究它们之间的关系，并对得出的相应结果的可信度和可靠性给出检验和分析。

种植面积；模型；评价指标

一、影响粮食种植面积的指标分析

文章选取山东省2005-2014年的小麦种植面积，统计数据源于国家统计局，见附件。文章通过查阅资料，整理影响粮食种植面积的因素如表1中第一列所示。然而，在数据分析的过程中，影响粮食种植面积的指标不一定是可测的，因此需要将指标转换为可测变量，如表1中第二列所示。

表1 影响粮食种植面积的指标以及转化变量

二、指标变量相关性分析和主成分分析

(一)指标变量相关性分析

由于指标数量较多，指标之间的关系比较复杂，因此，首先对指标进行相关性分析，分析结果如图1所示。

由图11可以看出：(1)小麦单位面积产量、农业机械总动力、平均出售价格、小麦生茶价格指数、最低收购价、城镇单位就业人员平均工资、居民消费水平和农村军民家庭人均纯收入与小麦种植面积之间的相关性较强；(2)虽然剩余的变量和小麦种植面积的相关性较低，但是在多元回归分析中，自变量发生的作用不是独立的，而是与其他自变量一起联合发挥作用，每个自变量的影响都是在控制了其他自变量的基础之上的分析。因此，如果一个自变量与因变量相关性较低，但它与其他自变量一起时，是可以对因变量产生显著影响的，所以本文在回归分析中依旧选入相关性不显著的变量。

图1 指标相关性分析图

另一方面，当两个变量之间的相关性很高，说明两个变量之间存在完全线性关系。为了降低变量的维度，可从相关性很高的变量中选取具有代表性的变量进行回归分析。在9个相关性很高的变量中，通过分析可以发现，一些变量之间是完全线性相关的，而且其内涵是类似的，可以对这些变量进行归约，如表2所示。

表2 变量规约

通过对变量进行删除和归约，得出最终作为自变量进入回归分析的变量，如表3所示。

表3 最终变量选取

(二)指标变量主成分分析

主成分分析是利用降维的思想，在损失很少信息的前提下，设法将原来众多具有一定相关性(比如P个指标)，重新组合成一组新的互相无关的综合指标来代替原来的指标。

由于选取的变量数量依旧较多，且之间具有一定的相关性，因此，采用主成分分析法将相关的指标组合为一组不相关的主成分。首先，通过因子特征值确定主成分的个数，如图3所示，本文将特征值gt;0.6的因子可作为主成分。

图3 主成分分析—碎石图

图中横坐标表示因子序号，纵坐标为因子对应的特征值，根据因子的特征值可确定是否作为主成分。根据图3可以看出，因子1、2的特征值gt;0.6，说明因子1、2可作为主成分。进而继续分别用y1、y2表示。

确定主成分个数之后，进而通过成分矩阵可以描述每个变量与主成分的相关程度，如表4所示。

表4 指标与主成分的相关程度

图5更加直观地展示变量与主成分之间的影响关系。

图5 变量与主成分的相关程度

由表5和图5可以看出：变量x1、x2、x3、x4、x5、x6和主成分y1之间相关性较强，x6和y1之间是负相关，其他是正相关；x7、x9、x10和主成分y2之间相关性较强，且x7和y2之间是负相关，其他为正相关；x4和两个主成分都有一定的相关性。

仅仅获取变量和主成分之间的相关性不足以描述它们之间的影响关系，通过成分得分系数矩阵，可以获取指标在对应主成分中所占的比重系数，如表5所示。

表5 成分得分系数表

根据表5，可以获取变量和主成分之间的函数关系如下：

y1=-0.081x1+0.17x2-0.01x3-0.151x4+0.167x5+0.012x6+0.164x7+0.168x8+0.032x9+0.169x10

y2=0.322x1+0*x2-0.323x3+0.017x4+0.075x5+0.299x6-0.056x7+0.049x8+0.2740x9+0.011x10

三、回归分析

回归分析是研究一个因变量或多个因变量与一个自变量之间是否存在某种线性或非线性的关系，并确定自变量与因变量之间的回归方程式。本文的因变量为小麦种植面积z1，自变量为主成分y1、y2，首先根据主成分对其进行回归分析。

表6 主成分取值表

(一)确定回归类型

首先对主成分y1、y2和种植面积z1进行偏相关分析，如图6所示。

图6 因变量和自变量之间的偏回归图

图6中，a图表示y1和z1之间的偏相关分析，b图表示y2和z1之间的偏相关分析。由图可知可知y1和z1之间是完全正线性相关的，y2和z1之间是近似负线性相关的。因此，适用于采用多元线性回归的方式进行回归分析。

(二)多元线性回归分析

选取小麦种植面积为因变量z1，主成分y1、y2为自变量，采用步进的方法进行多元线性回归分析，结果如表7所示。

表7 多元线性回归分析结果

由表可以看出，由于y2对种植面积的影响不显著，在回归模型中被自动消除，自变量y1的显著性0，说明模型回归效果良好，y1自变量可以有效预测因变量。根据表X的标准化系数，可确定影响粮食种植面积的多元线性回归方程为：

=gt;z1=3088.62-0.0083x1+0.0173x2-0.001x3-0.0154x4+0.017x5+0.012x6+0.0167x7+0.0171x8-0.0033x9+0.0172x10

(三)回归方程检验

为了验证方程的合理性以及可靠性，进行模型拟合度、显著性和适合性检验。

1.模型拟合度检验

拟合度是指回归直线对观测值的拟合程度，首先进行模型拟合度检验，结果如表8所示。

表8 拟合度检验

表中R称为多元相关系数，R方代表着模型的拟合度，一般而言，两者大于0.4即可，由表8可以看出该模型的拟合优度良好。

2.模型显著性检验

首先进行所有自变量的回归系数的一个总体检验，即F检验，如表9所示。

表9 回归系数的检验

F的值较大，代表着该回归模型是显著的，由表可知，F的值足够大，且显著性小鱼0.05，说明回归模型总体上是显著的。

3.模型适合性检验

模型适合性检验主要是进行残差分析，如图7所示。

图7 标准化残差图

通过图7，可以看出实测累计概率和预期累计概率基本上一致，说明模型满足适合性。

[1]李岳云等著.中国粮食波动论[M].中国农业出版社,2001.

[2]黄益平,宋立刚著.应用数量经济学[M].上海人民出版社,2001.

[3]娄峰,张涛.中国粮食价格变动的传导机制研究——基于动态随机一般均衡(DSGE)模型的实证分析[J].数量经济技术经济研究.2012(07).

[4]温涛,王小华.财政金融支农政策对粮食价格波动的影响——基于中国1952-2009年的经验验证[J].东南大学学报(哲学社会科学版).2012(03).

[5]车巧怡.中国粮食产品进出口情况与国内粮食价格的相关性分析[J].吉林金融研究.2012(05).

[6]秦志勇,许建新.国内外粮食市场互动关系的局部均衡模型分析[J].重庆科技学院学报(社会科学版).2012(07).

[7]何蒲明,朱信凯.我国粮食价格波动与CPI关系的实证研究[J].农业技术经济.2012(02).

[8]吴娟,王雅鹏.我国粮食储备调控体系的现状与完善对策[J].农业现代化研究.2011(06).

[9]高帆,龚芳.国际粮食价格的波动趋势及内在机理:1961-2010年[J].经济科学.2011(05).

杨文尧(1994.01-)，男，汉族，湖南临澧人，研究生，国防科技大学，公共管理。