基于多元回归对粮食产量的研究

2017-06-23 13:20陆玉玲谢钱姣朱家明李德政
关键词:使用量预测值利用率

陆玉玲,谢钱姣,朱家明,李德政

(安徽财经大学 统计与应用数学学院,安徽 蚌埠 233030)

基于多元回归对粮食产量的研究

陆玉玲,谢钱姣,朱家明,李德政

(安徽财经大学 统计与应用数学学院,安徽 蚌埠 233030)

为建立关于粮食产量的模型,并运用模型计算安徽省2020年化肥、农药使用量零增长时化肥利用率提高的百分点,利用时间序列分析预测得到了2015-2020年粮食产量、农药和化肥使用量,建立粮食产量与有效化肥使用量和农药使用量的回归模型,并利用其解决化肥、农药使用量零增长时化肥利用率提高的百分点,运用MATLAB进行求解,得出化肥利用率提高的百分点为7.3%。

粮食产量;多元回归;时间序列;MATLAB

粮食产量是我国第一产业的重要组成部分,是国家经济发展的基础,受到多重因素的影响,比如农药使用量以及化肥使用量。有效的粮食产量预测可以为政府决策提供科学依据,同时,在减少农药和化肥使用量下,如何实现粮食的高产出也是我们一直追求的目标。

近年来,随着科技的不断发展,粮食产量的预测方法也得到了不断的发展。文献[1]225-228+267采用了灰色预测模型预测粮食产量的变化趋势,然后运用BP神经网络对灰色预测模型所得到的结果进行了修正,从而提高了预测精度。但是,此方法仅能提高单一的粮食产量预测精度。文献[2]6-10利用支持向量机模型对粮食产量进行预测,提高了小样本粮食产量预测精度。但此方法仅考虑粮食历史产量数据,没有考虑到其他影响因素。文献[3]429-433利用灰色预测和马尔可夫预测模型相结合来对粮食产量进行预测,从而大大提高了粮食产量的预测精度。

1 模型假设

为了便于解决和研究问题,提出以下几条假设:(1)假设所有数据的来源真实可靠,具有科学性;(2)假设粮食产量只与化肥、农药的使用量及其利用率有关,不受其他因素的影响。

2 预测2015-2020年安徽省的粮食产量、化肥和农药使用量

2.1 研究思路

首先,收集安徽省2005—2014年粮食产量、化肥施用量、农药使用量数据,其次根据所收集到的数据建立时间序列的预测模型,并利用MATLAB软件进行求解,从而得到安徽省在2015—2020年粮食产量、化肥施用量、农药使用量的具体数值。

2.2 研究方法

(1)数据收集

①根据国家统计局公布的官方数据,将其倒入Excel中得到2005—2014年安徽省的粮食产量、化肥使用量、农药使用量指标的具体数据见表1。

表1 2005-2014年农业相关数据 (单位:万吨)

②根据安徽省农业委员会公布的数据,我们可以得到2005—2014年安徽省的化肥利用率和农药利用率数据,见表2。

表2 2005-2014年化肥、农药利用率

为了反映化肥与农药利用率变动的情形及其好坏趋向,根据表2中的数据,做出化肥和农药利用率的雷达图,如图1所示。

图1 化肥与农药利用率的雷达图

(2)数据预处理

有效化肥使用量:指化肥使用量与化肥利用率的乘积。假设用H表示有效化肥使用量,则H=π1·π2,π1表示化肥使用量,π2表示化肥利用率。

根据化肥使用量和化肥利用率的数据,运用EXCEL软件计算得到2005—2014年安徽省各年的有效化肥使用量,见表3。

(3)模型的建立与求解

根据安徽省2005—2014年的粮食产量及化肥、农药的使用量,建立时间序列预测模型,[4]并结合MATLAB软件,得到了2005—2014年的粮食产量及化肥、农药使用量的预测值,具体数据见表4。

表3 2005-2014年有效化肥使用量 (单位:万吨)

表4 粮食产量、化肥和农药使用量预测值(单位:万吨)

表5 2005-2014年粮食产量、化肥使用量和农药使用量实际与预测值(单位:万吨)

2.3 结果分析

一般来说,相对误差的绝对值在0.2以内说明模型有较高的合理性,且相对误差越小,模型的精度越高由表5中的数据可知,相对误差的绝对值均在0.2以内,这说明建立的模型是相对合理的,可靠性较高。

3 粮食产量模型

3.1 研究思路

首先,根据表1中2005-2014年间各年的粮食产量、农药使用量和表3中2005-2014年间各年的有效化肥使用量的具体数据,以粮食产量为因变量,有效化肥使用量和农药使用量为自变量,建立多元线性回归模型,[5]利用MATLAB软件进行求解得到回归方程,并对模型进行检验。其次,根据方程,以2015年的化肥使用量为基准,在二者用量保持不变的情况下,求解2020年化肥利用率所提高的百分点。

3.2 具体过程和结果

(1)以2005年为第1年,分别用xt,yt,gt(t=1,2,…16)表示第t年的安徽省粮食产量、农药使用量,有效化肥使用量,它们之间的关系用公式表为:

xt=a0+a1yt+a2gt+εt

(2)矩阵形式

X=(x1,x2,…x10),

B=(β1,β2,…β10),

N=(ε1,ε2,…ε10)

则粮食产量与各变量的关系可用矩阵表示为:

(3)未知参数的估计值可以由最小二乘来估计,表示为:

所以可得回归方程:

根据相关数据,并结合MATLAB软件得到第t年的粮食产量xt与第t年的农药使用量yt和有效化肥使用量gt之间的二元线性回归方程为:

xt=1748.6985+14.1856gt-0.1075yt

可决系数为0.9665。

表6 多元线性回归预测值相对误差

由表6可知,相对误差的绝对值均小于0.03,故模型的可靠度较高。

(5)对残差进行正态性检验和t检验:由MATLAB运行结果可以知道,正态性检验的测试结果为0,说明残差通过正态性检验,且t检验的测试结果为0,说明残差通过t检验。因此模型的建立是比较合理的,利用此模型得到的数据和结论比较真实可靠。

(6)由表4可知2020年的粮食产量的预测值为3864.8万吨,2015年的农药使用量的预测值为12.4107万吨,2015年的化肥使用量预测值为351.0127万吨,以2015年的粮食产量,农药、化肥使用量为基准,来求解2020年的化肥利用率。[6]

由于农药使用量零增长,将2020粮食产量和2015年农药使用量具体数值代入方程:

x16=1748.6985+14.1856g16-0.1075y11

求解得到2020年的有效化肥使用量为149.2666万吨。

根据第t年化肥利用率ft、化肥使用量yt、有效化肥使用量gt之间的关系,即第t年化肥利用率为:

通过查阅中国农业委员会公布的数据,得到2015年化肥利用率为35.2%,所以2020年化肥利用率提高的百分点为42.5%-35.2%=7.3%。

结束语

在安徽省2020年实现化肥、农药使用量零增长的前提下,为了预测化肥利用率提高的百分点,本文建立了时间序列预测模型,根据相关数据预测得到了安徽省2015-2020年间各年的粮食产量、农药使用量以及化肥使用量的预测值,同时引入了有效化肥使用量这个概念,建立了粮食产量关于农药使用量和有效化肥使用量的二元线性回归方程,并对模型进行了相对误差检验,对残差进行了正态性检验和t检验,从而可知模型具有较高的可靠性,但是本文只考虑了农药和化肥使用量对粮食产量的影响,没有考虑其它因素的影响,故结果具有一定的误差。此外,本文使用的时间序列预测模型不仅可以预测粮食产量,还可以与当前先进的科学技术相联系应用于测量领域,比如多时相遥感图像数据分析,即遥感时间序列分析,用于监测各种资源动态,通用性较强。

[1]林芳.灰色神经网络在粮食产量预测中的应用[J].计算机仿真,2012(4):225-228+267.

[2]向昌盛,周子英,武丽娜.粮食产量预测的支持向量机模型研究[J].湖南农业大学学报(社会科学版),2010,(1):6-10.

[3]陈焕珍.基于灰色马尔科夫模型的青岛市粮食产量预测[J].计算机仿真,2013(5):429-433.

[4]罗凤曼.时间序列预测模型及其算法研究[D].四川大学,2006.

[5]李莹.基于时间序列与多元线性回归综合模型的农村卷烟销量预测[D].云南大学,2015.

[6]李亮科.生产要素利用对粮食增产和环境影响研究[D].中国农业大学,2015.

Class No.:F323 Document Mark:A

(责任编辑:蔡雪岚)

Study on Grain Yield Based on Multiple Regressions

Lu Yuling, Xie Qianjiao, Zhu Jiaming, Li Dezheng

(School of Statistics and Applied Mathematics, Anhui Finance and Economics University, Bengbu, Anhui 233030,China)

In order to establish the food production model and calculate the percentage increase of fertilizer utilization when the use of chemical fertilizers and pesticides achieve zero growth in Anhui Province in 2020, we used the time series analysis approach to predict the grain yield and the use of pesticide and fertilizer in 2015-2020. We established a regression model of grain yield and use of fertilizers and pesticides. Based on the model, we concluded that the utilization ratio of fertilizer is 7.3% solved by MATLAB.

grain yield;multiple regressions;time series;MATLAB

陆玉玲,本科学生,安徽财经大学统计与应用数学学院。研究方向:数学与应用数学。 朱家明,硕士,副教授,安徽财经大学统计与应用数学学院。研究方向:应用数学与数学建模。

国家自然科学基金(编号:11301001); 国家级大学生创新训练计划(编号:201510378470)。

1672-6758(2017)06-0090-4

F323

A

猜你喜欢
使用量预测值利用率
减少#1炉再热器减温水使用量
加拿大农业部下调2021/22年度油菜籽和小麦产量预测值
“以虫吃虫”这家大棚农药使用量减少30%
±800kV直流输电工程合成电场夏季实测值与预测值比对分析
AI讲座:ML的分类方法
2019年全国煤炭开采和洗选业产能利用率为70.6%
化肥利用率稳步增长
浅议如何提高涉烟信息的利用率
В Китае снизился объем использования пластиковых пакетов 中国塑料袋使用量减少
未来汽车的塑料使用量将呈倍数增长