凌立文,张大斌,2
(1.华南农业大学 数学与信息学院,广州 510642;2.广东白云学院 大数据与计算机学院,广州 510450)
组合预测是预测领域的重要研究分支,自1969年Bates和Granger首次提出组合预测理论体系后,该方法随即得到国内外学者广泛关注。单项预测模型通常仅包含预测对象的部分信息,通过一定规则组合各单项模型,可通过包含更全面的预测信息从而提高预测精度[1]。特别地,时间序列分析中真实数据生成过程通常具有区制转换或参数漂移等特性,组合预测方法的引入,可减少由参数或模型错误识别带来的预测误差[2];甚至在单项预测结果存在有偏性的情况下,通过组合能产生具有无偏性的预测结果[3]。因此,将不同预测模型进行有效组合,可视为对无限逼近真实数据生成过程的有效补充[4]。
尽管组合预测的实证研究文献数量繁多,但绝大多数是对已有方法的简单套用,缺乏针对组合预测模型构建方法的系统研究。这涉及是否应该进行组合、应该选取多少模型进行组合以及选取哪种方法进行组合等影响组合预测性能的关键问题。为此,本文对组合预测领域相关文献进行梳理,围绕以上三个关键问题展开述评,简介组合预测模型的主要应用领域,在此基础上提出今后的研究方向,以期为该领域学者提供参考与借鉴。
面对当今数量繁多的单项预测模型,是否应该进行组合预测成为学者决策的首要问题。尽管大量文献均报道组合模型预测性能优于单项模型[5-8],但也存在个别例外情况[9,10]。为证明组合预测模型的普遍性优势,Hibon和Evgeniou[11]选择M3竞赛数据库中3003个时间序列和14种预测方法展开实验研究,运用全体样本计算各预测方法的平均预测误差(sMAPE),针对每一样本穷尽所有可能的组合方式,基于海量实验数据得到以下结论。
(1)随着组合模型个数的增加,最大预测误差也随之下降,这表明组合模型确实有助于改进预测性能。但是,组合模型个数增加所引起预测误差减小的边际效应会逐渐减弱,最优组合数目通常为7个。
(2)从数据上看,组合模型的最小预测误差略小于单项模型的最小预测误差。但基于DM检验框架发现不同方法最小预测误差之间并不存在显著性差异,表明组合模型中最佳策略的效果与最佳单项预测模型相当。
(3)若以预测误差的方差表征预测风险,实验中随着组合模型个数增加,预测误差的方差随之减少。这说明,虽然组合模型未必是最优模型,但总体而言,选择组合模型的预测风险要小于选择单项模型。
该研究基于大样本实验,论证了组合预测模型的普遍性优势,由此解决组合预测中的首要问题。但最佳单项预测模型未必逊色于组合模型,这表明当前绝大多数组合模型都是非劣性模型而非最优模型。并特意指出,“是否应该进行组合预测”这一表述应被替换为“如何选择最佳的组合策略”,即如何进一步提高组合预测精度。
如何提高组合预测精度,使其从非劣性模型转为最优模型,是预测领域专家学者长久以来的努力方向。从现有研究看,进一步优化单项模型选择策略和组合权重确定方法,为改进组合预测性能提供了可能性。
选择哪些单项模型进行组合是组合预测领域的一大难题[12]。实践中大多将本领域应用较为成熟的单项模型全部纳入组合模型,这看似大而全,但缺少模型选择依据、导致计算工作量巨大,且对预测性能提升效果不明显。此外,学者还发现若引入不恰当的单项模型,甚至可能降低组合模型预测精度[13],由此可见正确选择单项模型的必要性与重要性。
2.1.1 基于模型裁剪的视角
模型裁剪(model trimming)本质上是一种收缩策略,即按照一定准则(通常以预测精度为标准)缩小备选模型数量。Aiolfi和Timmermann(2006)[14]依据单项模型在训练集的预测表现,依次在备选模型中选取表现最好的前75%、50%和25%进行组合,发现这种外生性固定裁剪方法可显著提升组合预测性能,即以更少模型产生更好效果。然而,该方法并未考虑不同备选模型预测结果的统计性差异,Samuels和Sekkel(2017)[15]在此基础上提出基于模型置信集(Model Confidence Set,MCS)的裁剪方法,筛选出统计意义上的最佳模型进行组合,并对美国GDP、新建住房量和工业产出等宏观经济指标展开预测。通过对比简单平均组合法、外生性固定裁剪法和基于MCS的模型裁剪法,发现经模型裁剪的组合预测性能普遍优于简单平均法;同时,基于MCS的模型裁剪方法比外生性固定裁剪方法具有更好的鲁棒性以及更大的预测性能提升空间。此外,有学者认为基于模型裁剪的组合预测法仅在原始数据包含极值时才显现出优越性,因为通过裁剪可以对极端数据/信息赋予零权重,减少组合模型的噪声,从而提高预测准确度。然而,需要进行多大程度的裁剪值得探讨,Granger等[16]建议裁剪5%或10%的最差模型,Aiolfi等[17]则认为裁剪R2排序后80%的模型能取得最佳效果,总体而言,当前研究并未给出通用的判断标准[18]。
2.1.2 基于信息论的视角
Colino等[19]就如何提高生猪价格预测精度展开研究,其中的关键问题即为是否要组合不同预测模型。文中设定1个基准模型和15个备选模型,其认为,是否进行组合取决于新模型能否提供额外信息。就信息的完备性而言,若新模型与基准模型相比能够提供额外信息,将其进行组合则可降低预测误差,新模型能否提供额外信息通过公式(1)判断实现。
其中,e1t表示基准模型预测误差,e2t表示备选模型预测误差。原假设β=0,意味着e1t与( )e1t-e2t的协方差为0,即基准模型已包含备选模型的信息,无需进行组合。若拒绝原假设,则需要进行模型组合。并通过验证不同预测模型所包含信息量的差异,为判断是否进行组合预测提供通用的决策方法。
此外,Cang和Yu(2014)[20]同样基于信息论视角,提出以互信息(mutual information,MI)为判断准则的组合预测最佳子集选择算法。其中,互信息可度量随机变量间的统计相关性[21],而最佳子集是指该集合中的组合模型能提供充分有效的预测信息,其预测性能优于包含所有备选模型的集合。实验证明,由MI算法确定的最佳子集具有更高的预测精度和更好的鲁棒性,且最佳组合模型数量为2~5个,再次印证数量更少的组合策略具有与包含所有备选模型的组合策略相当、甚至是更优的预测表现。但是只考虑了3种线性组合预测方法,并未涉及非线性组合。
筛选出待组合的单项模型后,进一步需明确使用哪种组合方法。组合方法选择是否恰当、有效,直接影响组合预测效果。以下从线性组合及非线性组合视角出发,介绍各种常用的组合方法。
2.2.1 线性组合方法
(1)等权重法
等权重法是一种最简单的权重确定方法,也称简单/算术平均法,即赋予每个预测模型相同权重。假设一共有n个预测模型,则每个预测结果的权重为1/n。等权重法看似没有过多的数理依据,但在实践中,等权重的预测精度往往高于通过复杂数学估计过程所确定的权重,这一现象也因此被称为“组合预测之谜”[22,23]。
(2)最小方差法
该方法从组合预测结果方差最小化的角度给出权重确定的准则与方法。假设有两种具有无偏预测结果的单项模型,其方差分别为,协方差为σ12,则方法1的权重方法2的权重ω2=1-ω1。
(3)误差倒数法
误差倒数法是一种直观且便于理解的权重确定方法,若模型在训练中具有较小误差,则在组合模型中赋予其更大权重,均方根误差(RMSE)、均方误差(MSE)是常用的误差衡量指标。假设两个单项模型在训练集内的均方根误差总和分别为RMSE1和RMSE2,则模型1的权重ω1=
(4)优势矩阵法
假设两个单项模型,令Z1表示研究期限内模型1预测效果优于模型2的次数,同理,Z2表示模型2预测效果优于模型1的次数,则模型1的权重,模型2的权重该方法可推广到包含多个单项预测模型的情形中,最终得到一个确定权重的优势矩阵。Aiolfi和Timmermann(2006)[14]的研究证明该方法与误差倒数法相比具有更好的鲁棒性。
(5)最小二乘估计法
通过实施最小二乘得到的β1和β2即为模型1和模型2的组合权重,若设定β1和β2之和为1,则回归方程中只有1个待估参数,从而可得到更小的估计误差εt。在此基础上式(2)可拓展为多元回归形式,但是,各待估参数之间的高度共线性有可能导致参数估计不稳定,即样本数据的细微变动引起参数估计量的显著变化。为解决该问题,学者提出使用最小一乘法(Least Absolute Deviation,LAD),即以误差绝对值之和取代误差平方和作为回归方程的损失函数。此外,回归得到的参数有可能为负,为使参数更具解释性,可限定所有参数为正。
(6)权重收缩法
鉴于等权重法具有良好的样本外预测性能,有时甚至接近于最优模型,因此通过施加一个随机约束,将组合权重趋近于等权重,可减少组合权重抽样中的波动性[13]。假设某组合模型共包括m个单项模型,其中模型i的最小二乘权重为ωi,通过引入收缩参数γ,得到模型i的组合权重收缩参数γ∈(0,1),取值越大,说明组合权重越趋向于等权重。收缩至等权重的组合权重确定方法应用较广,此外,近年来随着贝叶斯方法的普及,也有学者尝试使用基于贝叶斯的收缩权重确定方法。
2.2.2 非线性组合方法
尽管非线性组合方法提出时间晚于线性方法,且实际应用较少,但在有限的研究中仍被证明是一种有效的组合方法,有时甚至能取得比算术平均更好的预测结果[2,24]。
(1)加权几何/调和平均
假设存在m个单项预测模型,其对应预测值为fi,每个模型在组合模型中权重为li,且具有非负和归一化特性。若组合预测值,则称其为加权几何平均组合预测模型。若满足则为加权调和平均组合预测模型。陈华友(2008)[25]将权重求解过程转化为线性规划问题,以误差平方和为决策目标给出几何平均和调和平均的权重求解算法。
(2)人工神经网络
人工神经网络模拟人脑对信息的加工处理过程,能够反映输入数据和输出数据之间高度的非线性映射关系。将m种预测方法得到的预测结果yit(i=1,2…m)作为网络输入层,实际值yt作为网络输出层,神经网络通过正向与反向传播过程进行权重学习,最终各层神经元确定的权值相当于各种方法在组合模型中的权重[26]。相关学者的研究均证实基于神经网络的非线性组合预测方法具有优良的特性和更高的预测精度[27-29]。
尽管线性组合方法应用广泛,但学者提出,如果仅考虑线性组合,则会削减组合预测的意义,甚至只能称其为合成模型(composite model)。因此有必要纳入非线性组合方法,以增强组合方法的全面性。Andrawis(2011)[2]的研究中构建了6种线性组合和4种非线性组合策略,分别选取2个最佳线性方法和2个最佳非线性方法,对这4种组合方法所取得预测结果进行简单平均后得到最终的预测结果,从而实现具有层级性的组合预测。
2.2.3 组合方法遴选标准
尽管存在多种组合方法,但如何依据模型自身特点选择恰当的方法,相关研究还较为空白。蒋传进(2015)[30]基于预测误差的分布形态(即偏度)提出组合方法遴选准则,并以M3竞赛中N115季度宏观数据序列为样本进行实验。实验的控制变量包括单项模型的偏度、预测误差的序列相关性ρ和误差方差比∅,考虑包括线性与非线性方法在内共6种组合方法,得到表1。
表1 组合方法遴选准则
实验证明,简单平均法在中长期(提前3~8步)预测中表现优异,原因是当数据序列发生结构突变时,简单平均法具有比其他方法更高的外推预测精度。鉴于大多数单项模型预测结果都具有有偏性,短期预测中选择线性回归或人工神经网络的组合方法可消除单项模型的有偏影响。此外,文章还就简单平均法的适用条件展开理论分析,结论是当∅≥2,即较差模型预测标准差为较好模型预测标准差的2倍及以上时,简单平均组合预测法并不能提高预测精度,此时更应选择单项最佳模型,这在一定程度上回应了“组合预测之谜”。
组合预测理念一经提出随即引起学者高度重视,现已广泛应用于各类预测问题研究中。从形式上看,可分为同质组合模型和异质组合模型,以下简要介绍组合预测在能源、宏观经济等领域的应用情况。
电力与原油价格预测是能源领域传统研究热点,Nan(2009)[31]在19个单项模型基础上构建组合模型预测英国地区提前一天的电力价格,发现组合模型仅在电力需求较为平稳的春季取得较好效果。Weron(2014)[32]认为其预测效果不佳的根本原因在于19个单项模型中有大量相似模型,它们都源于ARIMA、线性回归、马尔科夫区制转移模型的变型。该结论似乎否定了同质组合模型的作用,但Nowotarski等(2016)[33]以回归模型为基准建立8个同质模型对国际能源竞赛和ISO两个公开数据集进行实验,不同模型具有相似结构,但包含变量个数以及变量滞后期有所区别。结果表明尽管只采用简单的组合策略,但组合模型预测准确度明显高于基准模型。由此看来,组合模型的同质性或异质性并不是影响模型性能的绝对因素。
原油价格时间序列具有非线性、非平稳性和多尺度特征,普通的组合模型难以取得理想结果[34]。学者研究发现,基于一种先分解后集成的组合预测方法论可有效提高原油价格预测精度[35,36]。该方法论首先对原始价格数据进行多尺度分解,得到相对简单但具有不同波动频率和含义的分量;然后基于一定规则重构各分量,并根据各分量数据特征选择适合的预测方法;最后将各分量预测结果进行组合。实证研究均证实该方法论在原油价格预测中的适用性以及与其他预测方法相比的优越性[37-39]。此外,随着人们对清洁能源关注度不断提升,近年来组合模型也开始应用于风速、风电功率预测等相关问题的研究中[40-43]。
Hubrich和Skudelny(2010)[44]对欧元区居民消费价格指数展开研究,以AR模型为基准模型,VAR模型和非线性模型为对比模型。通过多对象和多周期对比实验证明,几乎所有组合模型预测精度都高于备选单项模型,且对时间序列转折点识别准确度较高。Melo等[45]对哥伦比亚通货膨胀率的研究证实,通过引入贝叶斯收缩方法,单项模型预测精度得以提高;并且基于滚动贝叶斯组合策略,可减少预测所需数据量并提高预测精度,该结论与Kapetanios等[46]对英国通货膨胀率的研究相符。国内方面,于志军等[47]在指数平滑法、偏最小二乘法和灰色预测法基础上构建税收收入组合预测模型,通过算例证明组合模型具有较优预测性能。薛倩等[48]基于方差倒数法、残差倒数法和最小二乘法确定组合预测模型权重以预测重庆市GDP。皮进修等[49]基于自组织数据挖掘理论构建SARIMA-GMDH组合模型,通过拟合优度检验和预测性能检验,证实组合模型具有更好的鲁棒性和抗随机干扰能力。
组合预测模型还应用于金融资产、交通工程、农产品市场等领域研究。Pai和Lin[50]基于ARIMA和SVM构建组合模型预测10家公司的股票价格,结果显示,就单项模型预测性能而言,SVM与ARIMA相比并无明显差异;但组合模型能显著降低预测误差。周荣喜等[51]构造静态利率期限结构组合优化模型,以解决单个静态利率期限结构模型在拟合收益率曲线时的不足。耿睿等[52]将SVM与多项式和鲁棒自回归预测模型相结合对北京空中交通流量进行预测。沈国江等[53]构建包含卡尔曼滤波、人工神经网络和模糊综合模型在内的智能组合模型预测短时交通流量,实验证明组合模型在众多评价指标中都具有领先优势。平平[54]、王川[55]等将组合预测方法应用于猪肉、苹果等农产品的价格预测中,进一步拓宽组合预测的应用领域。
近年来,学者们在完善单项模型筛选方法和单项模型组合形式等方面展开了许多有益尝试,丰富了组合预测的理论内涵。同时,还就预测模型结构设定、参数估计和模型检验方法进行修正和扩展,推动组合预测方法快速发展。在此基础上,本文认为今后该领域还有以下值得进一步研究的问题。
(1)基于模型裁剪的单项模型筛选方法简单易操作,但裁剪比例具有较大主观性。此外,个别预测精度较差的单项模型可能包含独特信息,若依据预测误差将其排除在外,有违组合预测本质。相比之下,基于信息论的单项模型筛选准则更为科学,然而,当前文献对基准模型的选择大多较为随意且缺乏依据,如何科学地确定基准模型值得进一步探讨。
(2)当前社会经济系统结构日趋复杂,传统线性预测模型难以捕捉复杂系统的变化特征,预测效果不甚理想。自引入对复杂系统具有更好自适应性和学习能力的人工神经网络方法后,模型预测性能显著提升。然而,当前组合权重的确定仍以线性方法为主,为更好适应数据的非线性特征,采用非线性权重确定方法并将其与线性方法进行层级性组合,是今后值得尝试的一个方向。
(3)先分解后集成的组合预测方法论基于对原始复杂时序数据的多尺度分解,在不同尺度上剖析复杂系统的波动特征及趋势规律,在掌握系统内在运行规律的基础上展开预测研究,显著提升预测性能。该方法论的核心是选择有效的数据分解工具,除传统的季节分解、小波分解、经验模态分解法外,如何将现代信号处理领域的新技术,如压缩感知等,应用到复杂时序数据预测,是今后研究中具有挑战性的一个问题。
(4)实验数据的样本量与规范性是国内外研究的主要差异之一。国外研究多基于公开的竞赛数据集(如M3、NN3、国际能源预测竞赛等)进行某种方法或模型的性能检验,首先通过大样本数据实验筛选出优性模型,再将模型用于特定数据集的预测研究,遵循从一般到特殊的研究过程,结论可信度高。反观国内,实验数据选取的主观性及差异性较大,样本量小且不具有普遍性,局限了研究方法的推广与应用。此外,国外研究通常包括多步长(提前1月、3月、6月、12月)实验方案,可验证模型对不同预测周期的适用性;国内研究相对简单,通常只有一种步长设计。由此可见,完善实验方案设计并选用公开数据集进行模型验证,是进一步提高模型普适性的有效途径。