基于气候变量的苎麻产量SSA-BP预测模型

2024-04-29 00:42王辉付虹雨岳云开崔国贤佘玮
中国农业科技导报 2024年1期
关键词:气候因子BP神经网络

王辉 付虹雨 岳云开 崔国贤 佘玮

摘要:苎麻产量与生长期间的气候因子具有极高相关性,基于气候变量构建的苎麻产量预测模型能够有效精准预测最终产量。BP(back propagation)神经网络具有强大的数据分析能力,在作物产量预测建模中得到广泛应用,然而传统BP 神经网络存在精度低、鲁棒性差等问题,可采用麻雀搜索算法(sparrow searchalgorithm,SSA)对BP神经网络模型进行优化。基于2010—2019年苎麻长期定位试验采集的纤维产量、鲜皮产量和气候数据,分析气候因子在10年内的变化趋势及其对多年生苎麻产量的影响,对比构建的BP神经网络模型及优化后的SSA-BP神经网络模型预测苎麻产量的性能,确定最佳的苎麻产量预测模型。结果表明,苎麻产量与季平均气温、季极端最高气温均值、季极端最低气温均值、季日照时数均值4项气候因子具有极显著相关关系。SSA算法能有效优化BP神经网络,基于SSA-BP的苎麻纤维产量预测模型和鲜皮产量预测模型的R2分别为0.591 3和0.679 1,高于BP神经网络的苎麻纤维产量预测模型(R2=0.405 7)和鲜皮产量预测模型(R2=0.551 8)。因此,SSA-BP模型能够更加科学、合理地预测苎麻产量,对于苎麻生产的田间管理及统筹规划具有重要指导意义。

关键词:产量预测;气候因子;麻雀搜索算法;BP神经网络

doi:10.13304/j.nykjdb.2023.0557

中图分类号:S126;S563 文献标志码:A 文章编号:10080864(2024)01011009

苎麻(Boehmeria nivea L.)是具有中国特色的纤维作物和水土保持作物[1],其产量预测对于生产过程精细管理、纤维棉纺市场风险管理具有重要意义[2]。然而,由于影响苎麻产量的因素复杂,其产量预测极具挑战性[34]。

作物产量具有强烈的空间变异性,与田间环境、大气温度、湿度、光照强度、降雨量等因素密切相关[5-7]。以往研究表明,苎麻对不同地区环境的适应性差异明显,而气候因素,尤其是降水量、日照时间、相对湿度3个气候要素,是导致苎麻产量在不同生态区域存在差异的重要原因[8]。除了空间变异外,气候因素的时间变异也同样重要[9],但对其在产量预测研究中的关注有限。在当前全球极端天气事件高频发生的情况下,了解气候因素的多变性对农业生产的影响显得尤为重要,因此有必要探究苎麻产量随气候变化的规律,以及时预测产量信息并调整生产管理。

经验模型是当前作物产量估测常用的方法,该方法通过建立变量因子与产量之间的经验模型来监测不同情景下的作物生长[10]。徐敏等[11]结合温度、日照、降水适宜度等气象因子,采用最优相关和逐步回归等方法构建了水稻年景综合指数的预测模型,为水稻产量分析预测提供依据。刘振洋等[12]使用关联规则算法确定了云南省甘蔗产量的5个主要影响因子,基于此构建了各大主产区的多元线性回归产量预测模型,准确率较单一回归模型分别提升了14.3%、3.5%、30.1%、8.7%、17.7%。在利用经验模型进行作物产量预测研究时,可选择线性回归方法(线性回归、多元线性回归等)或非线性回归方法(随机森林、支持向量机、神经网络等)[13-18]构建模型。相比于线性回归模型,基于机器学习技术的非线性回归模型在解决复杂的非线性问题上具有独特优势,为包含不同气候因素、基因型信息的数据建模提供了解决方案。BP(back propagation)神经网络具有强大的数据分析能力,广泛用于作物产量预测建模。但是它也需要先进的训练技术来优化以提高其模型学习的效率和精度。麻雀搜索算法(sparrow searchalgorithm,SSA)是受麻雀觅食和反捕食行为启发而提出的一种新的优化算法,具有较强的全局寻优能力,为进一步优化估产模型初始权重和阈值提供了新的解决方案[1920]。为探究不同时间气候因素的变异对苎麻产量的影响,分析导致产量差异的关键气候要素,本文基于2010—2019年连续采集的苎麻产量数据及对应年份气象因子,构建了SSA-BP苎麻产量预测模型。该模型能较为精确地预测苎麻产量模型,为苎麻生产管理措施调整及决策提供技术支撑。

1 材料与方法

1.1 试验设计

试验于2010—2019年在湖南农业大学国家麻类长期定位试验基地进行(113° 04'E,28°10'N)。试验品种包括中苎1号、多倍体1号、湘苎3号3个苎麻品种,材料由湖南农业大学苎麻研究所提供。2009年6月7日,将育好的麻苗(幼苗生长约20~30 cm)移栽到长期定位试验小区,每个品种4个重复,小区面积约20 m2。

1.2 数据采集

1.2.1 产量数据采集 于苎麻成熟期收割每个小区地上部分,然后将苎麻鲜皮从苎麻茎秆上剥离后,采用电子秤(TCS- 永彩防水秤,承重150 kg,精度0.01 kg)称重获取其鲜皮产量。采用剥麻机获取苎麻纤维,干燥后称其重量记为纤维产量。

1.2.2 气候数据获取 选取长沙市区季平均气温、季极端最高气温均值、季极端最低气温均值、季降水量均值、季日照时数均值、季相对湿度均值6项气候指标作为气象因子,数据来源于2010—2019年《中国气象年鉴》。

1.3 数据处理方法

1.3.1 BP神经网络 基于BP的苎麻产量预测模型拓扑结构如图1所示。将6项影响苎麻产量的气象因子(季平均气温、季极端最高气温均值、季极端最低气温均值、季降水量均值、季日照时数均值、季相对湿度均值)和实测产量数据作为输入层,确定输入层、隐含层和输出层各层的节点数并采用误差反向传播对网络中每个权重系数进行更新,最终输出预测苎麻产量。

1.3.2 SSA搜索算法 在麻雀搜索算法中,发现者的位置更新如下。

式中,xbest (t)为全局中最佳位置;β 和K 均起到控制参数步长的作用,前者为标准正态分布的随机数,后者为?1到1之间的随机数,代表麻雀的移动方向;ε 为常数项,其作用是确保分母不为0;fi为第i 只麻雀适应度值;fg和fw分别为当前全局适应度的最佳值和最差值。

1.3.3 基于SSA-BP 的苎麻产量预测模型构建 基于麻雀搜索算法改进的SSA-BP苎麻产量预测模型具体构建步骤如下。

①利用获取的90份样本数据,按2:1的比例划分为训练集和预测集,对训练集全体数据以及测试集的输入指标数据进行归一化处理。

②对BP神经网络模型的结构参数进行确认,例如隐含层的层数及节点个数、层与层之间的传递函数等。本研究采用的BP神经网络包含2个隐含层和1个输出层,共3层人工神经网络结构。其他参数设置如下:传递函数为tansig,包含神经元15个;输出层传递函数为purelin,包含神经元1个。模型学习率0.01,学习函数trainscg,最大训练次数为10 000次,神经模型的训练收敛于3.12×10?4。

③输出BP神经网络的预报结果,并在反归一化后依据评估指标进行后续评估。

④设置SSA中麻雀种群的相关参数。确定麻雀种群规模为100只,麻雀之间信息交换100次,发现者占总麻雀规模的比例为0.20,同时设置预警值和警戒者数量。

⑤确定每只麻雀的初始位置。

⑥依据公式(1)~(3),对每只麻雀的位置分别进行更新。

⑦输出最优的麻雀个体位置和全局最优解,分别作为BP神经网络各层之间的权值和阀值;完成BP神经网络各参数的优化。

⑧使用优化后的 BP 神经网络进行训练,并比较各项评估指标。根据误差指标的符合度来确定是否结束计算,若符合则停止计算并输出结果,若不符合则返回到步骤④重新执行直至符合要求。

算法具体流程见图2。

1.3.4 模型性能验证 为定量评估SSA 优化后BP 神经网络预测模型的准确性,采用决定系数(R2)、均方根误差(root mean square error, RMSE)、均方误差(mean square error, MSE)、平均绝对误差(mean average error, MAE)和平均误差(meanabsolute percentage error, MAPE)加以评价作为评价指标。通常R2越接近于1,RMSE越小,说明模型预测能力越好[18]。

式中,yi 为苎麻产量参数实测值,?i 为苎麻产量参数预测值。? 为苎麻产量参数平均值,n为样本个数。

2 结果与分析

2.1 苎麻产量描述

图3和表1展示了苎麻纤维、鲜皮产量的统计结果。苎麻纤维产量集中分布在500~1 100 kg·hm?2,最小值为493 kg·hm?2,最大值为1 228 kg·hm?2,变异系数为3.32%,整体分布符合正态分布。鲜皮产量也是衡量苎麻纤维产量的重要参数之一,集中分布在5 000~9 000 kg·hm?2,最小值为2 570 kg·hm?2,最大值为10 520 kg·hm?2,变异系数为2.98%。综上,2种苎麻产量均具有较大变异幅度,数据具备建模所需的差异要求。

2.2 变量相关性分析

为分析气候因子与苎麻纤维、鲜皮产量之间的相关性,将相关变量分别归一化到[?1,1]之间,以消除变量大小差异带来的误差。图4与表2分析了各季苎麻产量及最佳气候因子的变化趋势和相关系数,可以看出,头麻产量性状与季平均气温的变化趋势一致性最高,与纤维产量的相关系数为?0.27,与鲜皮产量的相关系数为0.45。二麻产量因素与季极端最低气温的变化趋势一致性最强,与纤维产量的相关系数为?0.33,与鲜皮产量的相关系数为?0.37。三麻产量参数与季日照时数相关性最高,纤维产量与季日照时数的相关性系数为0.32,鲜皮产量与季日照时数的相关性系数为0.54。

结合连续10年数据,分析6项气候因子与苎麻纤维、鲜皮产量的相关性(表3)。除季降水量均值和季相对湿度均值2项指标外,其他气候因子与苎麻纤维、鲜皮产量均呈极显著相关,相关系数绝对值均高于0.42,说明利用气候因子预测苎麻产量具有可行性。

2.3 苎麻纤维产量估测

将苎麻纤维产量分别采用BP网络和SSA-BP组合模型进行预测,并对得到的结果进行拟合分析。由图5可知,BP网络模型的R2仅为0.405 7,拟合程度差,而采用SSA优化后的SSA-BP网络模型的拟合程度明显优于BP神经网路,模型R2达到0.591 3。

由表4 可知,采用SSA 优化后,模型MSE 由1.93降低到1.33,RMSE由1.39降低到1.15,MAE由1.06 降低到0.89,MAPE 由12.61% 降低到10.73%,表明SSA算法优化后的SSA-BP神经网络模型对于苎麻纤维产量的估测能力优于BP神经网络模型。

2.4 苎麻鲜皮产量估测

将苎麻鲜皮产量分别采用BP 网络和SSABP组合模型进行预测,并对得到的结果进行拟合分析(图6),SSA-BP网络模型与期望值的拟合程度优于BP神经网络,回归拟合性较好,SSA-BP神经网络模型决定系数R2 从0.551 8 增加到0.679 1。

由表5 可知,采用SSA 优化后,模型MSE 由1.32降低到0.94,RMSE 由1.15降低到0.97,MAE由0.83 降低到0.77,MAPE 由12.10% 降低到11.43%,表明SSA算法优化后的SSA-BP神经网络模型对于苎麻鲜皮产量的估测能力优于BP神经网络模型。

3 讨论

苎麻是喜温、短日照和充足水分的作物,苎麻产量与田间环境的气温、降水量、光照强度、湿度等因素密切相关。本研究采用相关性分析及趋势分析方法探究气候因素时间变异对苎麻产量的影响,结果表明,苎麻产量参数(苎麻纤维、鲜皮产量)与气候因子之间存在较高的相关性,季平均气温、季极端最高气温均值、季极端最低气温均值、季日照时数均值4项因子与苎麻纤维、鲜皮产量的相关系数绝对值均高于0.42。刘头明等[8]研究发现,苎麻的产量与其生长期间降水量、日照时间和相对湿度均呈显著相关性,其中日照与降水量呈正相关关系,而相对湿度则呈负相关关系,这与本研究结果存在差异,导致的原因可能与苎麻对不同的生态区域适应能力不同有关[21];袁晋琰等[22]研究也表明苎麻生长期间的温度和降雨量是影响产量的重要因素。

BP神经网络是一种按照误差逆向传播算法训练的多层前馈神经网络,由输入层、隐含层和输出层组成,含多层神经元。当前,BP方法在产量预测应用上取得了极大进展,但是它仍然需要先进的优化技术来提高其学习的效率和精度。本研究采用BP神经网络构建的苎麻纤维产量、鲜皮产量预测模型效果均较差,预测精度R2 分别为0.405 7和0.551 8,为此,引入麻雀搜索算法对BP神经网络阈值与权值进行优化,结果表明,SSA的引入有效地提高了苎麻估产模型精度,基于SSA-BP网络的苎麻纤维产量估测模型精度达到0.591 3,而SSA-BP网络的苎麻鲜皮产量估测模型精度达到0.679 1。SSA算法能有效提高BP神经网络模型预测的准确性和稳定性,这与前人[23]研究结果一致。

总体来说,本文提出的基于气候变量和SSA算法优化神经网络的苎麻产量预测模型预测效果较好,能够满足苎麻生产的实际需要,对提高苎麻的生产效率具有指导作用与参考依据,后续研究还需在不同地域、田间动态监测等条件下对苎麻产量预测模型进行优化。

参 考 文 献

[1] 杨洁, 唐昀, 申香英, 等. 我国苎麻产业现状与振兴发展[J].中国麻业科学, 2022, 44(4): 253-256.

YANG J, TANG Y, SHEN X Y, et al .. Current situation anddevelopment of ramie industry in China [J]. Plant Fiber Sci.China, 2022, 44(4): 253-256.

[2] 付虹雨, 崔国贤, 李绪孟, 等. 基于无人机遥感图像的苎麻产量估测研究[J]. 作物学报, 2020, 46(9): 1448-1455.

FU H Y, CUI G X, LI X M, et al .. Estimation of ramie yieldbased on UAV remote sensing image [J]. Acta Agron. Sin.,2020, 46(9): 1448-1455.

[3] 王辉, 付虹雨, 王继龙, 等. 基于多元回归和BP神经网络的苎麻产量估测模型比较研究[J]. 中国麻业科学, 2020, 42(5):227-238.

WANG H, FU H Y, WANG J L, et al.. Comparative study of ramieyield estimation models based on multiple regression and BPneural network [J]. Plant Fiber Sci. China, 2020, 42(5): 227-238.

[4] 王辉, 白玉超, 付虹雨, 等. 3个苎麻品种三年间产量及其构成因子的变化研究[J]. 中国麻业科学, 2020, 42(2): 76-82.

WANG H, BAI Y C, FU H Y, et al .. Study on changes of yieldand component factors of three ramie varieties in three years[J]. Plant Fiber Sci. China, 2020, 42(2): 76-82.

[5] 于珍珍, 邹华芬, 于德水, 等. 融合田间水热因子的甘蔗产量GA-BP预测模型[J]. 农业机械学报, 2022, 53(10): 277-283.

YU Z Z, ZOU H F, YU D S, et al .. GA-BP prediction model ofsugarcane yield with field hydrothermal factors [J]. Trans.Chin. Soc. Agric. Mach., 2022, 53(10): 277-283.

[6] 张文婧, 赵锦, 崔文倩, 等. 气候平均态和极端态变化对东北玉米气象产量的影响[J]. 中国农业科学, 2023, 56(10):1859-1870.

ZHANG W J, ZHAO J, CUI W Q, et al .. Effects of climatemean and extreme changes on meteorological yield of maize inNortheast China [J]. Sci. Agric. Sin., 2019, 56(10): 1859-1870.

[7] 刘焕才, 史书琦, 李曼, 等. 疏勒河流域中游地区玉米性状及单产的影响因子研究[J]. 干旱区地理2023, 46(9): 1453-1466.

LIU H C, SHI S Q, LI M, et al .. Study on influencing factors ofmaize character and yield in Middle reaches of Shule RiverBasin [J]. Arid Land Geography2023, 46(9): 1453-1466.

[8] 刘头明, 汤清明, 朱四元, 等. 长江流域5个地区间苎麻产量差异的气候影响因素分析[J]. 安徽农业科学, 2011, 39(25):15559-15562+15734.

LIU T M, TANG Q M, ZHU S Y, et al .. Analysis of climaticfactors affecting the difference of ramie yield in five regions inthe Yangtze River Basin [J]. J. Anhui Agric. Sci., 2011, 39(25):15559-15562, 15734.

[9] MELILLO J M, RICHMOND T C, YOHE G W. Climate changeimpacts in the United States [R].The Third National ClimateAssessment, 2014.

[10] 唐俊, 赵成萍, 周新志, 等. 基于EVI-RBF的玉米长势监测及产量预测[J]. 江苏农业学报, 2020, 36(3): 577-583.

TANG J, ZHAO C P, ZHOU X Z, et al .. Maize growthmonitoring and yield prediction based on EVI-RBF [J]. JiangsuJ. Agric. Sci., 2019, 36(3): 577-583.

[11] 徐敏, 吴洪颜, 张佩, 等. 基于气候适宜度的江苏水稻气候年景预测方法[J]. 气象, 2018, 44(9): 1200-1207.

XU M, WU H Y, ZHANG P, et al .. Annual climate predictionmethod for Jiangsu rice based on climate suitability [J].Meteorol. Monthly, 2018, 44(9): 1200-1207.

[12] 刘振洋, 赵家松, 胡仁傑, 等. 基于关联规则与多元线性回归的云南省甘蔗产量预测模型[J]. 广东农业科学, 2022, 49(12):160-166.

LIU Z Y, ZHAO J S, HU R J, et al .. Sugarcane yield predictionmodel based on association rules and multiple linearregression in Yunnan Province [J]. Guangdong Agric. Sci.,2022, 49(12): 160-166.

[13] XUE J K, SHEN B. A novel swarm intelligence optimizationapproach: sparrow search algorithm [J]. Syst. Sci. Control Eng.,2020, 8(1): 22-34.

[14] E A P, D. B. D, Narendra K, et al .. A comprehensiveinvestigation of Genotype-Environment interaction effects onseed cotton yield contributing traits in Gossypium hirsutum L.using multivariate analysis and artificial neural network [J/OL].Computers Electron. Agric., 2023, 211:107966 [2023-09-06].https://doi.org/10.1016/j.compag.2023.107966.

[15] SONG S, XIONG X, WU X, et al .. Modeling the SOFC by BPneural network algorithm [J]. Int. J. Hydrogen Energy, 2021, 46(38):65-77.

[16] 娄高中, 谭毅, 白二虎. 主成分分析与改进PSO-BP神经网络的下沉系数预测[J]. 测绘科学, 2023, 48(2): 124-130, 147.

LOU G Z, TAN Y, BAI E H. Principal component analysis andsubsidence coefficient prediction of improved PSO-BP neuralnetwork [J]. Sci. Survey. Map., 2023, 48(2): 124-130, 147.

[17] 郭倩, 魏嘉豪, 张健, 等. 基于无人机多光谱影像和随机森林的蔬菜识别[J]. 中国农业科技导报, 2023, 25(2): 99-110.

GUO Q, WEI J H, ZHANG J, et al .. Vegetable recognitionbased on UAV multi-spectral image and random forest [J]. J.Agric. Sci. Technol., 2023, 25(2): 99-110.

[18] 薛建凯. 一种新型的群智能优化技术的研究与应用[D]. 上海: 东华大学, 2020.

XUE J K. Research and application of a new swarm intelligenceoptimization technology [D]. Shanghai: Donghua University, 2020.

[19] 顾清华, 姜秉佼, 常朝朝, 等. 求解大规模优化问题的改进麻雀搜索算法[J]. 控制与决策, 2023, 38(7): 1960-1968.

GU Q H, JIANG B J, CHANG C C, et al .. An improved Sparrowsearch algorithm for large-scale optimization problems [J]. ControlDecision, 2023, 38(7): 1960-1968.

[20] 胡建华, 黄宇龙, 张坚, 等. 基于麻雀搜索算法优化双隐含层BP神经网络的张力减径钢管壁厚预测[J]. 塑性工程学报, 2022, 29(8): 145-151.

HU J H, HUANG Y L, ZHANG J, et al .. Prediction of wallthickness of tension reduced steel pipe by double-hidden layerBP neural network based on sparrow search algorithm [J]. J.Plasticity Eng., 2022, 29(8): 145-151.

[21] 刘头明, 汤清明, 朱四元, 等. 6个不同生态区域苎麻产量及环境影响因素分析[J]. 耕作与栽培, 2011, No.178(1): 30-32.

LIU T M, TANG Q M, ZHU S Y, et al .. Analysis of ramie yieldand environmental impact factors in six different ecologicalregions[J]. Tillage Cultivation, 2011, 178(1): 30-32.

[22] 袁晋琰, 吴春燕, 阮启亮, 等. 分宜气象因子对苎麻生长的影响及种植区域的划分[J]. 中国麻业科学, 2013, 35(4): 210-213, 218.

YUAN J Y, WU C Y, RUAN Q L, et al . Influence ofmeteorological factors on ramie growth and division of plantingarea [J]. Plant Fiber Sci. China, 2013, 35(4): 210-213+218.

[23] 崔兴华, 靳晟, 姚芷馨, 等. 基于麻雀搜索算法和广义回归神经网络的玉米产量预测[J]. 数学的实践与认识, 2022,52(7): 88-96.

CUI X H, JIN S, YAO Z X, et al .. Maize yield prediction basedon sparrow search algorithm and generalized regression neuralnetwork [J]. Math. Practice Theory, 2022, 52(7): 88-96.

(责任编辑:温小杰)

猜你喜欢
气候因子BP神经网络
气象因子对冬小麦品质影响作用探析
气候因子对烤烟质量风格特色的影响
就bp神经网络银行选址模型的相关研究
基于DEA—GA—BP的建设工程评标方法研究
复杂背景下的手势识别方法
BP神经网络在软件质量评价中的应用研究 
BP神经网络算法在数值预报产品释用中的应用
四川水稻产量及其构成要素对不同生育期气候因子的响应分析
天山北坡NDVI对气候因子响应的敏感性分析
沙漠地区微波地表发射率年内变化规律与气候因子的关系分析