郭建平,陈玥熤,2,庄立伟
(1.中国气象科学研究院,北京 100081;2.广东省气象局,广东广州 510080; 3.国家气象中心,北京 100081)
东北玉米热量指数预测方法研究(Ⅳ)*
——均生函数预测方法
郭建平1,陈玥熤1,2,庄立伟3
(1.中国气象科学研究院,北京 100081;2.广东省气象局,广东广州 510080; 3.国家气象中心,北京 100081)
均生函数预测方法是开展环境要素变化趋势预测的有效方法之一。通过对东北地区玉米热量指数的分析,建立了热量指数时间变化趋势的均生函数预测模型,各模型预测的平均精度基本都达到95%以上,与逐步回归统计模型一致,但普遍要好于G M(1,1)模型,同样可以应用该模型的预测结果指导农业生产。
东北地区;玉米;热量指数;预测;均生函数模型
在时间序列预测模型中,制作多步预测时,如AR、ARMA和TAR等模型的预测值会趋于平均值,对极值的拟合效果欠佳;而指数平滑模型和灰色模型等的结果表示的是一种指数增长,对呈起伏变化的序列拟合也不太理想。针对这样的问题,魏凤英等[1-4]拓宽了数理统计中算术平均值的概念,定义了时间序列的均值生成函数(Mean Generating Function,简称均生函数),提出了视均生函数为原序列生成的、体现各种长度周期性的基函数的新构思。在基函数的基础上,给出新的建模方案,借助多元分析的手段,作为解决时间序列预测问题的一种尝试。均生函数的提出,在气象领域的预测研究方面获得了广泛的应用[5-15],使预测技术得到了进一步的发展。
本文利用1961-2000年的资料建立模型,并进行模型回代检验,2001-2005年的资料用于模型的试报检验。
设热量指数序列为:F(t)={F(1),F(2),…, F(n)},其中n为样本数,1≤t≤n。F(t)的算术平,拓展此式,定义F(t)的均值生成函数为:
式中:i=1,2,…,l;1≤l≤m;nl= INT(n/l); m= INT(n/2); INT表示取整。
根据式(1),可以得到m个均生函数:
由此可见,均生函数是由时间序列按一定的时间间隔计算均值而派生的。对做周期性延拓:
式中:t=1,2,…,n,且t=i[mod(l)],这里的mod表示同余,即表示mod(t-i,l)=0。由此构造出热量指数的均生函数延拓矩阵: (X(l,t))n,m,即:
引入1961-2000年东北3省玉米热量指数序列,按照上述计算方法得到各省3个典型站F5~F8的均生函数。将均生函数视为备选因子,原始序列作为预报量,依照通常的逐步回归步骤进行计算。为了能选取随机性较小、稳健性较大的均生函数建立方程,在方差贡献上添加“惩罚”系数。
设长度为l的均生函数的方差贡献为Ul,则令
当l较小时,αl较大,即对方差贡献施加较大权重。随着l不断增大,αl逐渐变小,以期筛选出隐含于序列中的周期,进行F检验时,再将方差贡献复原。
设作q步预报,将入选的均生函数作q步外延,则得到预报方程:
式中:Yi为5-8月逐月的热量指数预测值;b0和bj为逐步回归技术估计的系数;Xj为入选的延拓均生函数。
利用1961-2000年的热量指数资料从5月份开始逐月建立模型(表1),并作5步外延,预测2001-2005年5年的热量指数。
表1 东北玉米逐月预报模型
注:X下标即表示周期长度,如X12表示周期长度为12年的热量指数的延拓均生函数。
表2给出了各模型预测的精度检验。由表2可见,各预测模型回代的平均准确率都在95%以上,仅有海伦个别年份的回代准确率<90%,但也都在87%以上。2001-2005年试报的平均准确率也基本都达到90%,仅海伦少数年份的试报准确率<90%,说明逐月建立的模型可以较准确地预测各个地区的玉米热量指数,完全能满足实际使用的需求。此外,由于采用了逐月滚动预报的方法,玉米后期生长阶段的热量状况预测加上之前可以得到的逐月热量指数的实际值,随着逐月滚动建立的模型,越到生育阶段的后期,各个地区的预测准确率都在逐渐升高,更能准确地预测各地区玉米5-9月全生育期的热量指数。
从对3种预测方法相比较可看出,逐步回归统计模型与均生函数预测模型的准确率相当,而G M(1,1)预测模型的准确率稍低,但也都能满足使用需求。由此可见,逐步回归预测方法、灰色G M(1,1)方法和均生函数方法都能较好地预测东北不同地区玉米的热量指数,为今后进一步开展低温冷害的预测奠定了基础。
表2 各模型滚动预测的准确率%
(1)利用均生函数建立了东北3省典型站玉米热量指数的预测模型,各预测模型回代的平均准确率基本都在95%以上,2001-2005年试报的平均准确率也基本都达到90%以上,说明利用均生函数逐月建立的模型可以较准确地预测各个地区的玉米热量指数。
(2)对3种预测方法相比较可看出,逐步回归统计模型与均生函数预测模型的准确率相当,而G M(1,1)预测模型的准确率稍低,但也都能满足使用需求。由此可见,逐步回归预测方法、灰色G M(1,1)方法和均生函数方法都能较好地预测东北不同地区玉米的热量指数,为今后进一步开展低温冷害的预测奠定了基础。
(3)上述建立的均生函数模型可以较好的预测玉米的热量指数,既可以作多步预测,又可以较好地把握预报量的变化趋势和极值,达到预测所要求的精度。另外,除了文中用到的逐步回归筛选方案,还有在均生函数的基础上,采用双评分准则、正交筛选、最优子集回归建模方案、模糊均生函数模型等等,可以提高预测模型的预报效果和增强其适用性。
[1] 魏凤英,曹鸿兴.模糊均生函数模型及其应用[J].气象,
Study on Forecast ingMethods of Corn Heat Index in Northeastern Ch ina(Ⅳ)——M ean Generating Function ForecastingM odel
Guo Jianping1,Chen Yueyi1,2and Zhuang Liwei3
(1.Chinese Academ y of M eteorological Sciences,B eijing100081,China;2.Guangdong M eteorological B ureau, Guangzhou510080,China;3.N ationalM eteorological Center,B eijing100081,China)
Mean generating function forecasting method is one of the effective methods to forecast changing tendency of environmental factor.On the basis of an analysis on corn heat index in northeastern China,the mean generating function forecasting model of corn heat index changing tendency is set up.The mean precision of each model is higher than 95%,which is identical to the result of stepwise regression model and better than that of G M(1,1)model.The forecasting results of mean generating function model can be used to instruct agricultural production.
northeastern China;corn;heat index;forecast;mean generating function model
S426
A
1000-811X(2010)01-0027-03
2009-05-31
“十一五”国家科技支撑计划课题(2006BAD04B02)
郭建平(1963-),男,江苏昆山人,博士,研究员,主要从事农业气象灾害、气候变化影响等研究. E-mail:gjp@cams.cma.gov.cn