卢德全,刘书慧*,康 健,李嘉乐,李 梦
(1.四川省南充市气象局,四川 南充 637000; 2.四川省大数据中心,四川 成都 610000; 3.成都信息工程大学,四川 成都 610225)
【研究意义】目前,我国存在大量低成本、体积小、易于安装、高密度的农田小气候站,主要用于农业园区的实时气象监控,但由于其数据可靠性低,无法替代国家自动气象观测站的数据作为可靠的气象数据进行分析,所以,庞大的农田小气候站数据应用被忽视。为充分发挥农田小气候站数据在农业农村发展中的重要功能和巨大潜力,有力支撑和服务农业现代化,推进“十四五”农业农村发展显得至关重要[1-2],怎样高效利用农业数据成为重要环节。因此,农业数据质量的提高显得尤为重要。【前人研究进展】BP神经网络模型具有较强的自学习能力和处理非线性问题能力,近年来在农业相关领域得到广泛应用。金志凤等[3]基于BP神经网络构建杨梅生产大棚内最高和最低气温的预测模型,并根据逐时转化系数计算棚内相应的逐时气温,以达到逐时预报大棚内气温的目的。张漫等[4]利用空气温湿度、光照强度和 CO2浓度为输入参数,建立基于BP神经网络的光合速率预测模型,预测不同 CO2浓度下的光合日动态。【研究切入点】目前,国内气象行业已建成5~10 km的国家区域自动气象站,且形成了网格化标准气象要素收集能力。若能发挥该网络化气象信息采集模式的优势,建立农田小气候站数据同化算法模型,对提升小气候站数据精度和质量,满足农业园区精细化气象服务要求具有重要意义。但目前应用BP神经网络模型将农业与气象领域有机结合的研究成果较少。【拟解决的关键问题】以四川省温江国家气象观测站及农田小气候站2013年的日最高气温数据为研究材料,基于BP神经网络设计利用国家气象观测自动站的高精准度数据校正农业气候站数据精度的算法模型,以期为提升智慧农业数据库的数据量及智慧农业的发展提供数据支撑。
四川省温江国家气象观测站及观测场内农田小气候站2013年1月1日至12月28日共360 d的日最高气温数据资料,来源于四川省温江区气象局。选取国家气象观测站数据作为期望值,农田小气候站数据作为输入值;将数据前180 d的数据作为训练数据,后180 d的数据作为测试数据。
1.2.1 研究要素选择 温度是对作物生长影响最大的因素之一,作物的光合作用、呼吸作用、蒸腾作用都受其影响。在农业观测中,一般气象站对气温的观测只显示日最高、最低、平均气温值的大小,日最高、最低气温的高低和出现时间与水汽蒸发凝结等大气物理过程的关系十分密切,是判断高温、寒潮、冷害及霜冻等极端气候事件强度的重要指标。全球变暖也是气候变化研究领域关注的核心问题,特别是“城市热岛”的影响[5-10]让气温成为影响气候变化的重要因素。其中,日最高气温一般出现在14:00—15:00,也是最强光照后的2~3 h,此时作物刚结束每日最高速率的光合作用,是作物补充太阳辐射重要时间段。故采用同一环境下,农田小气候站和国家气象观测站的日最高气温作为研究要素,用于探索数据分布的规律。
1.2.2 BP神经网络误差校正 根据区域内大气热力学原理和大气运动模型,以温度日数据为研究对象,建立BP神经网络误差校正模型及日极温变化率滑窗二次校正模型[11-14]。研究选取国家气象观测站与同时段就近区域的农田小气候站日最高气温作为数据质量控制分析的参考要素,比对同一环境条件下的数据,以农田小气候站的日最高气温数据作为输入值,国家气象观测站日最高气温数据作为期望值,通过BP神经网络方法(图1)建立相关算法模型。利用训练好的模型对后180 d的数据进行测试标定,然后分析标定数据的日变化率;结合原始日最高气温日变化率对数据进行再拟合。基于温度误差补偿原理,建立农田小气候站与国家气象观测站的日最高气温误差补偿模型,并利用其对农田小气候站的气温数据进行补偿,以此达到补偿后的输出结果,使得输出结果趋近于国家气象观测站的数据精度。该研究输入层和输出层神经元都为1,分别对应农田小气候站和国家气象观测站传感器的日最高气温数据。BP神经网络建模步骤:
图1 BP神经网络用于农田小气候站数据质量控制的算法整体框架Fig.1 The whole framework of data quality control algorithm for farmland microclimate stations based on BP neural network
1) 数据归一化处理。数据输入前先采用线性函数归一化,将原始数据转换到[0,1]的范围。
式中,Tnorm为归一化后的日最高温度,T为原始日最高温度,Tmax为所有测量值中的最大值,Tmin是所有测量值中的最小值。
2) 数据BP神经网络训练。在同一个区域内农田小气候站传感器日最气温数据和标准站与区域站日最高气温差值作为输入数据,180 d形成2种180个序列的输入数据,在以同区域内国家标准气象观测站传感器日最高气温数据作为期望数据的3层BP神经网络输出数据,进行训练并输出训练参数。在同一个区域内利用大气背景趋同的原则,训练出来的参数基本上只与传感器及采集器本身性能相关。利用国家标准数据、训练出来的网络参数建立农田小气候站的日最高气温数据误差修正模型。
3) 数据反归一化处理。采用反归一化对训练后要输出的数据进行处理。
T=Tn×(Tmax-Tmin)+Tmin
式中,h为隐含层节点的数目,m和n分别是输入层和输出层节点的数目,a为1~10的调节常数。
5) 数据误差补偿校正。经BP神经网络校正后的数据,由于采集站的地形地貌、下垫面往往区别较大,导致误差补偿的数据不足或错误。为此,根据热力学原理,建立日极高气温变化率和时间窗口算法对BP网络误差补偿后的数据作更进一步的差错控制和质量提升。
1.2.3 日极温二次校正算法设计 采用国家标准日最高气温变化率对农田小气候站经BP网络校正后的数据进行再一次同比检验。△t是原始数据的前一日最高气温与当日最高气温的差值,△T是经过BP神经网络误差补偿后的前一日最高气温与今日最高气温的差值。当|△t-△T|>C时(C是设定的判决门限),则需要进行二次校正,其他的情况不需要进行二次校正。二次校正的数据T’是由BP神经网络误差补偿后的前一天日最高气温与△t求和得到。
将测试数据代入1—6月数据训练出的BP神经网络模型中提取误差校正参数。利用提取的误差校正参数,结合BP神经网络对7—12月原始数据进行校正即可得到校正后的中间数据,即统计分析的结果,但该结果存在一些偶然因素的影响。为消除不确定因素的影响,再采用日最高气温变化率进行频率特征的数理分析进行二次校正。最后输出的是日最高气温数据日变化率特征进行二次误差校正后的最高气温数据。
从图2看出,将1—6月的农田小气候站和国家自动气象观测站的日最高气温数据作为训练数据,训练出BP神经网络模型,其温度为2~35℃,农田小气候站(输入值)和国家自动气象观测站(期望值)的日最高气温数据基本一致;7—12月的日最高气温数据训练出BP神经网络模型,其温度分布范围与1—6月的基本一致,温度为6~36℃,涵盖全年98%以上的温度。表明,选取的测试数据能够让模型更准确。
图2 2013年1—6月和7—12月温江农田小气候站和国家自动气象观测站日最高气温的BP模型Fig.2 The BP model of daily maximum temperature of Wenjiang farmland microclimate station and National Automatic Meteorological Observation Station during Jan.—June and July—Dec. in 2013
从图3和图4看出,误差补偿前1—12月农田小气候站与国家自动气象观测站测量数据的原始误差为-0.1~0.5℃,大部分分布在0.4℃。质量控制后,7—12月农田小气候站与国家自动气象观测站测量数据的误差为-0.1~0.2℃,大部分分布在0.1℃和0℃。与质量控制前的误差相比,控制后的误差从-0.1~0.5℃降至-0.1~0.2℃,误差范围缩小,且出现次数最多的误差值从0.4℃降至0.1℃和0℃。表明,在经过本方法误差补偿后的数据质量误差得到极为有效的控制。
图3 1—12月温江农田小气候站日最高气温原始误差的分布 Fig.3 The original error distribution of daily maximum temperature in Wenjiangfarmland microclimate station during Jan.—Dec.
图4 7—12月温江农田小气候站经过BP神经网络误差补偿及日最高气温变化率二次校正后的误差值Fig.4 The error value of Wenjiang farmland microclimate station after BP neural network error compensation and the daily maximum temperature variation rate after quadric correction from July—Dec.
对误差补偿前、第1次BP神经网络误差补偿后及日最高气温变化率特征二次校正后3组数据的误差数据与整体数据进行相关性分析发现,其相关显著性系数分别为0.04、0.002和0,表明,3组数据均与整体数据显著相关,说明选取的该部分数据能够推广到整体。从表1看出,在进行质量控制前误差大多在0.4℃左右,平均误差为0.28℃。经过BP神经网络误差补偿后平均误差为0.07℃,但出现了个别跳变数据,使最大误差和最小误差更大,不能达到质量控制的要求;在对此数据进行日最高气温变化率二次校正后误差全部控制在-0.1~0.2℃,未出现偏离特别大的误差值,平均误差为0.05℃,数据质量控制达到要求。由此得出,农田小气候站数据经过此算法进行质量控制后能够大大减小数据的误差,数据质量达到国家气象观测站的精度要求。
表1 部分样本数据质量控制前后的差异 Table 1 The differences of some sample data before and after quality control ℃
研究将BP神经网络运用到农业数据质量控制上,建立了通过国家气象观测站数据误差补偿修正农田小气候站数据的神经网络补偿模型。同时,为解决BP神经网络自身带来的误差,使数据精度更为准确,提出了日最高气温变化率特征二次校正的方法,利用气象数据具有时间连续性的特点,对神经网络误差补偿的数据进行二次校正。
研究结果表明,四川省温江地区2013年1月1日至12月28日农田小气候站数据未进行质量控制前的误差平均在0.3℃,最大达0.5℃;质量控制后的误差大多能达±0.1℃。即经质量控制后农田小气候站数据的误差减小至质量控制前的50%。农田小气候站的测量数据在经过BP神经网络误差补偿模型及二次校正提升后基本达到国家气象观测站对数据质量的要求,不仅可以节约气象观测的成本,为农业小气候环境提供更为准确的监测数据,避免农作物由于监测数据误差过大造成的损失,同时也为我国农业大数据提供了更多满足数据质量要求的农业数据。