基于GM-Markov模型的苹果产量预测及影响因素分析

2023-05-30 02:02郭华王勇武曦王越
山西果树 2023年1期
关键词:山西省影响因素预测

郭华 王勇 武曦 王越

摘 要: 利用山西省2000-2019年的苹果产量数据、气象数据及社会经济数据,分析了气象因素和社会因素的变化趋势及对苹果产量的响应特征,并建立了GM-Markov模型,对2020-2024年的苹果产量进行了预测分析,为有关部门的决策提供了有效依据:1)苹果产量总体增加,其气象因素呈波动状态。2)地方GDP和人均GDP变化均为总体上升趋势;第一产业比例逐年下降,第二、三产业比例变化趋势相反,第二产业比例在2009年之前呈上升趋势,在2009年之后呈下降趋势;苹果园面积逐年下降,在2010年之后呈向下抛物线状态;城镇人口逐年上升,乡村人口逐年下降。3)通过Spearman分析,苹果产量与降雨量、年平均温度呈正相关,与相对湿度、日照时数呈负相关;与地方GDP、人均地区生产总值GDP、城镇人口、第三产业比例呈正相关,与苹果园面积、第一产业比例、第二产业比例、乡村人口呈负相关。4)未来5年,山西省的苹果产量呈现上升趋势。

关键词: 山西省;苹果产量;GM-Markov模型;影响因素;预测

文章编号:2096-8108(2023)01-0085-06  中图分类号:F326.1  文献标识码:A

Apple Yield Prediction and Influencing Factor

Analysis Based on GM-Markov Model

GUO Hua, WANG Yong, WU Xi, WANG Yue

(Shanxi Agricultural University Polomogy Institute,Taiyuan 030031, China)

Abstract: Based on the apple yield data, meteorological data and socio-economic data of Shanxi Province from 2000 to 2019, this paper analyzed the change trend of meteorological and social factors and the response characteristics to apple yield, and established a GM Markov model to predict and analyzed the apple yield from 2020 to 2024, which provides an effective basis for the decision-making of relevant departments:1) The overall yield of Apple increased, and its meteorological factors fluctuated. 2) The change of local GDP and per capita GDP were an overall upward trend; The proportion of the primary industry was decreasing year by year, and the change trend of the proportion of the secondary and tertiary industries was opposite. The proportion of the secondary industry showed an upward trend before 2009 and a downward trend after 2009; The area of apple orchard decreased year by year and showed a downward parabola after 2010; The urban population was increasing year by year, and the rural population was decreasing year by year. 3) Spearman analysis showed that apple yield was positively correlated with rainfall and annual average temperature, and negatively correlated with relative humidity and sunshine hours; It was positively correlated with local GDP, per capita GDP, urban population and the proportion of tertiary industry, and negatively correlated with apple orchard area, the proportion of primary industry, the proportion of secondary industry and rural population. 4) In the next five years, the apple production in Shanxi Province will show an upward trend.

Keywords: Shanxi Province;

apple yield; GM-Markov model; influencing factors; forecast

水果產业是关系民生的产业,也是我国传统特色优势产业[1]。近年来,随着经济的发展和人民生活水平的提高,水果成为不可或缺的消费对象,然而,在气候因素和社会经济因素的作用下,水果在产量上呈现一定波动。因此,科学、合理的产量预测,不仅可以保证水果有效供给,对农业及农村经济发展、居民食物安全健康等有重要作用,而且可以对有关部门的政策决策提供依据。

国内外学者对小麦、玉米等粮食产量预测的研究较多,Nyéki, A.、 Kerepesi, C.等利用时空训练数据的人工智能预测玉米产量[2];Y. A. Garde、V. S. Thorat等利用气象参数对哈里夫水稻产量进行收获前预测[3]。国内学者多采用RGB、神经网络、马尔可夫等模型对产量进行预测。刘峻明、周舟等[4]基于NDWI和卷积神经网络对冬小麦产量进行预测,提高了冬小麦预测的准确性和可靠性;李晔、白雪等[5]通过对3种模型的对比分析,发现新维无偏灰色马尔可夫模型更适合中长期的小麦产量预测;胡雪冰和陈文宽[6]为研判粮食安全形式,采用GM模型,对四川省的粮食需求量和产量进行分析,结果显示,“十四五”期间四川省粮食存在一定产需缺口;张佩、陈郑盟等[7]探索了RGB模型在大豆预测上的可行性,并验证了其在不同品种、不同施肥模式下的通用性。任嘉颖[8]采用灰色马尔可夫模型,对山西运城的苹果产量及其影响因素进行分析;亓雪龙、孙洪雁等[9]基于1995-2008的水果产量,运用灰色系统理论,对山东省2009-2010的产量进行了预测。由此可见,国内学者对粮食产量的预测研究丰富,对水果产量预测趋势的研究较少。

山西省是我国苹果主产区之一,掌握苹果产量对气候因素和社会经济因素的响应情况,便于全面了解该地区苹果生产与气候资源和社会经济资源的协调程度,并且,科学、准确的研判苹果产量变化趋势,可有效保证山西省苹果供给,可为政府、企业、果农等进行决策提供有效信息。因此,本研究以2000-2019年苹果产量、气象因素和社会经济因素为基础,在对苹果产量影响因素变化因素分析的基础上,采用GM-Markov模型,对山西省的未来苹果产量进行预测。

1 苹果产量影响因素分析

苹果产量对气候因素较为敏感,主要受气温、降雨量、湿度和日照时数的影响。适宜的气温有益于苹果树的生长,在全球气候变暖的情况下,总体有利于我国北方平均气温较低地区的苹果树在10月至3月中旬的开花和生长[10],且气温因素对黄土高原地区苹果产量的影响较环渤海地区更为敏感[11];苹果生长所需雨量500~800 mm,开花坐果期,对水量需求大,若降水减少,会出现落花现象,影响苹果产量;适宜的空气湿度能促进苹果光合作用的增强,湿度过大,会导致苹果病虫害严重,且其耐貯性、着色、光洁度等都会降低[12];苹果树生长需要充足的光照,若日照不足,则会出现花芽分化少、枝叶徒长等现象,导致开花坐果率低,并且会影响作物根系及果实品质。

作为营养成分比较丰富、受大众喜爱程度比较高的水果,苹果的生产与消费除了受气象因素影响,还与GDP、农村人口数量、产业结构等社会因素有关。随着城镇人口的增多,消费的升级,苹果的需求量也增大;农村土地资源虽然多,但农村人口不断减少,导致劳动力减少,种植成本增加,限制了苹果的生产;苹果作为山西省农业的主导产业,影响着山西的经济发展,对GDP的贡献影响深远,不仅推动了山西整个省份的经济结构,而且带动了第二、三产业的发展。

2000-2019年,苹果产量总体增加,其气象影响因素呈现波动状态,且苹果产量与降雨量、年平均温度呈正相关,与相对湿度、日照时数呈负相关。降雨量的增大和年平均气温的上升有助于苹果产量的增加,而相对湿度和日照时数的增加对苹果产量具有抑制作用。

苹果产量的社会影响因素中,地方GDP和人均GDP变化趋势一致,呈总体上升趋势;第一产业比例逐年下降,第二、三产业比例以2009年为转折点,第二产业比例在2009年之前呈现上升趋势,在2009年之后呈现下降趋势,第三产业比例变化趋势则相反,在2009年之前呈现下降趋势,2009年之后呈现上升趋势;苹果园面积逐年下降,直到2010年开始上升,然而2014年之后又开始下降;城镇人口和乡村人口呈现相反趋势,城镇人口逐年上升,乡村人口逐年下降。通过Spearman相关性分析,苹果产量与地方GDP、人均地区生产总值GDP、城镇人口、第三产业比例呈正相关,与苹果园面积、第一产业比例、第二产业比例、乡村人口呈负相关。

2000年初,乡村人口数远超于城镇人口,农村从事苹果种植的人员也相对较多,从而苹果园面积也比较大,但由于天气、种植技术等原因,导致苹果产量不高。随着城镇化的发展,乡村人口流失严重,苹果园面积也随之下降,但苹果种植技术的提升和生产机械化的普遍,使得苹果产量与苹果园面积不存在必然的正相关性。第三产业即服务业,其比例的提高对逐年上升的GDP贡献比例增大,人们生活水平提高,消费品市场活跃,带动了苹果产业的发展。

2 GM-Markov模型的建立

2.1 数据预处理

采用移动平滑法对原始系列数据X(0)={x(0) 1,x(0) 2,…,x(0) n}(x(0) i≥0,i=1,2,…,n)进行预处理,以减少异常数据的影响,降低预测误差,提高预测精度,平滑处理后的数据序列为X′(0)={x′(0) 1,x′(0) 2,…,x′(0) n}。

x′(0) 1= 3x(0) 1+x(0) 2 4  (1)

x′(0) i= x(0) i-1+2x(0) i+x(0) i+1 4    (2)

x′(0) n= x(0) n-1+3x(0) n 4   (3)

2.2 GM(1,1)模型

2.2.1 对预处理后的数据累加

对平滑处理后的数据X(0)累加,生成序列X(1)={x(1) 1,x(1) 2,…,x(1) n}。

2.2.2 确定数据矩阵B和Y

B=   - 1 2 (x(1) 1+x(1) 2) 1 - 1 2 (x(1) 2+x(1) 3) 1   - 1 2 (x(1) n-1+x(1) n) 1  ,Y n=  x(0) 2 x(0) 3x(0) n     (4)

2.2.3 计算参数a和u

采用最小二乘法,获得参数a和u。

a u  =(BTB)-1BTY n   (5)

2.2.4 计算参数b和A

利用下式,获得灰色模型参数b和A。

b= ln  2-a 2+a ,A= 2u 2+a   (6)

2.2.5 建立预测模型 (1)

(1) 1=x(1) 1, (1) k+1=Aebk   (7)

2.2.6 模型精度的检验

对 GM(1,1)模型进行后验差比值(C)检验。

残差序列

ε(k)=x(1) k- (1) k,(k=1,2,…n)  (8)

相对误差

α= 1 n ∑ n k=1  Δ k, Δ k=  ε(k) x(1)(k)     (9)

预处理数据的标准差

S 1=  1 n ∑ n k=1 [x(1) k- ]2 , = 1 n ∑ n k=1 x(1) k    (10)

残差标准差

S 2=  1 n ∑ n k=1 [ε k-ε ]2 ,ε = 1 n ∑ n k=1 ε k   (11)

后验差比值

C= S 2 S 1   (12)

表1 模拟检验等级表

模型精度等级 C 模型精度等级 C

好(一级) <0.35 勉强合格(三级) <0.50

合格(二级) <0.45 不合格(四级) ≥0.65

2.3 Markov模型

2.3.1 划分状态

本研究选用相对值将状态划分为n个,状态空间E=[E 1,E 1,…,E n],E i∈[Q i,S i]。

2.3.2 狀态转移概率矩阵

某时间段内有n个状态,从状态E i出发的数据个数为m i,经过1步转移到状态E j的数据个数为m ij(1),则状态E i经过1步转移到状态E j概率为p(1) ij= m(1) ij m i ,则1步转移概率矩阵为

P(1)=  p(1) 11 p(1) 12 … p(1) 1n p(1) 21 p(1) 22 … p(1) 2n   p(1) m1 p(1) m2 … p(1) mn

若状态E i经过k步转移到状态E j,则k步转移概率为p(k) ij= m(k) ij m i ,其中m ij(k)表示状态E i经过k步转移到状态E j的数据个数,P(k)=(P(1))k。

2.3.3 马氏检验

选用离散序列的马尔可夫链来对变量具有随机性的序列进行“马氏性”检验,检验常用卡方分布统计量。

χ2=2∑ m i=1 ∑ n j=1 m ij  ln  p ij p ·j   (13)

边际概率为:

p ·j= ∑ m i=1 m ij ∑ m i=1 ∑ n j=1 m ij   (14)

在显著水平α下,当n充分大,χ2>χ2 α((m-1)2)时,则满足马氏性,否则不能用Markov预测。

2.3.4 自相关系数

γ k= ∑ n-k i=1 ( (1) 1(i)- (1) 1)( (1) 1(i+k)- ^(1) 1) ∑ n i=1 ( (1) 1(i)- (1) 1)2   (15)

W k= |γ k| ∑ m k=1 |γ k|   (16)

r k为滞后k步的自相关系数,对其进行归一化,获得各阶步长的权重W k。

2.3.5 模型预测

初始状态为之前时刻的随机序列,则预测概率p i为

p i=∑ m k=1 W kp(k) i(i∈E,E(i)∈[Q i,S i])  (17)

max (p i,i∈E)所对应的状态i为该时刻的预测状态,则预测值为:

′(1)(t)=  1 2 (Q i+S i) (1)(t) 100    (18)

3 产量预测

3.1 研究区概况及数据来源

山西,位于中国华北地区(110°14′~114°33′E,34°34′~40°44′N),面积1 567 hm2,涵盖太原、晋中、大同等11个地级市。作为我国重要的苹果产区之一,山西是典型的西北黄土高原,地势东北高西南低,属温带大陆性季风气候,四季分明,冬冷夏热。

苹果产量数据采用山西省全省以及各地市2000-2019年的逐年苹果产量统计数据,数据来源于《山西省统计年鉴》(2000-2019)(shanxi.gov.cn)。

3.2 实例分析

本研究通过MATLAB软件和SPSS软件,采用GM-Markov模型,在对原始产量平滑处理得基础上,对山西省苹果产量(2000-2019年)进行预测分析。

3.2.1 GM(1,1)模型预测

为了减少数据波动的影响,使预测结果更为准确,对苹果产量进行了平滑处理。在数据预处理的基础上,对苹果产量进行GM(1,1)预测,预测结果如表2所示。

根据2.3构建状态转移概率矩阵:

P(1)=  0.800 0 0.200 0 0.000 0 0.000 0 0.285 7 0.571 4 0.142 9 0.000 0 0.000 0 0.666 7 0.333 3 0.000 0 0.000 0 0.000 0 0.2500 0.750 0

P(2)=  0.697 1 0.274 3 0.028 6 0.000 0 0.391 8 0.478 9 0.129 3 0.000 0 0.190 5 0.603 2 0.206 3 0.000 0 0.000 0 0.166 7 0.270 8 0.562 5

P(3)=  0.636 1 0.315 2 0.048 7 0.000 0 0.450 3 0.438 2 0.111 5 0.000 0 0.324 7 0.520 3 0.155 0 0.000 0 0.047 6 0.275 8 0.254 7 0.421 9

P(4)=  0.598 9 0.339 8 0.061 3 0.000 0 0.485 4 0.414 8 0.099 8 0.000 0 0.408 4 0.465 6 0.126 0 0.000 0 0.116 9 0.336 9 0.229 8 0.316 4

在顯著性水平α=0.05,对随机序列(2016-2019)进行马氏检验,经过公式(13)χ2=26.90>χ2 α(9)=16.92,检验结果表明,该序列通过马氏检验。

在马氏检验的基础上,通过式(15)-(16)得到各阶自相关系数,并通过归一化,获得各步长的权重,如表5。

以2016-2019年的产量所属状态为初始状态,在获得其状态转移概率矩阵和各步长权重的基础上,对2020年的苹果产量所属状态进行预测,结果如表6。

由表6可看出,2020年苹果产量预测概率max {p i,i∈E}=0 .642 9,则其产量状态属于E1(80~90),经过公式(18),计算得到2020年山西省苹果产量为4 424 444.65t,与“中国果品流通协会”公布的山西省苹果产量(4 366 485.9 t)的误差仅为1.3%。在此基础上,采用等维新信息方法,对未来4年的苹果产量进行预测,结果如表7。

预测结果显示,山西省2021-2024年苹果产量为上升趋势。

4 结论

本文依据2000—2019年的气象数据、社会经济数据及苹果产量数据,分析苹果产量受气象因素和社会经济因素的影响,并对未来苹果产量进行了预测分析。

1)2000—2019年的苹果产量总体增加,其气象影响因素中,降雨量和年平均气温对苹果产量有促进作用,相对湿度和日照时数的增加不利于苹果产量的增加;社会经济因素与苹果产量为相互作用的关系,随着社会的发展,乡村人口流失,苹果园面积减少,但GDP的提高促进了第三产业的发展,人们生活质量提高,对苹果产量需求增大,种植技术和生产技术随之提升,带动了苹果产业的发展。

2)通过GM-Markov模型,对山西省2020年的苹果产量进行预测,预测结果与“中国果品流通协会”公布的苹果产量误差仅为1.3%,由此说明,GM-Markov模型在苹果产量预测方面具有可靠性和合理性。

3)在GM-Markov模型基础上,采用等维新信息方法,预测出2021-2024年山西省苹果产量不断上升。

参考文献

[1]  王刘坤. 中国水果产业转型升级:评价及影响因素研究[D].华中农业大学,2018.

[2] Nyéki A, Kerepesi C, Darczy B, et al. Application of spatio-temporal data in site-specific maize yield prediction with machine learning methods[J]. Precision Agriculture, 2021:1-19.

[3] Y. A. Garde, V. S. Thorat, R. R. Pisal, et al.Pre Harvest Forecasting of Kharif Rice Yield Using Weather Parameters for Strategic Decision Making in Agriculture[J]. International Journal of Environment and Climate Change, 2020:162-170.

[4] 刘峻明,周舟,和晓彤,等.基于NDWI和卷积神经网络的冬小麦产量估测方法[J/OL].农业机械学报:1-16.

[5] 李晔,白雪.基于新维无偏灰色马尔可夫模型的小麦产量预测[J].江苏农业科学,2021,49(15):181-186.

[6] 胡雪冰,陈文宽.基于GM模型的四川粮食产量影响因素及“十四五”供需预测分析[J].中国农机化学报,2021,42(6):130-136.

[7] 张佩,陈郑盟,马顺登,等.用冠层叶色偏态分布模式RGB模型预测大豆产量[J].农业工程学报,2021,37(9):120-126.

[8] 任嘉颖. 山西运城苹果产量预测及影响因素分析[D].山西农业大学,2017.

[9] 亓雪龙,孙洪雁,陈进展.基于灰色系统理论的山东省水果产量预测模型[J].山东农业科学,2010(3):16-19.

[10]  刘璐,郭梁,李曼华,等.中国北方主产地苹果冷热积累变化及其对始花期的影响[J].应用生态学报,2020,31(7):2457-2463.

[11] 白秀广,陈晓楠,郑少锋.气候变化对苹果主产区单产及单产增长的贡献研究[J].中国农业大学学报,2015,20(4):82-91.

[12] 段晓凤,张磊,金飞,等.气象因子对苹果产量、品质的影响研究进展[J].中国农学通报,2014,30(7):33-37.

猜你喜欢
山西省影响因素预测
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
山西省右玉县的生态建设及其启示
山西省秋收已完成93.44%
山西省打开农产品供深通道
不必预测未来,只需把握现在
山西省大水网工程建设如火如荼
农业生产性服务业需求影响因素分析
村级发展互助资金组织的运行效率研究