张同钰
摘要:文章选取纽约商品交易所共计205天的黄金期货价格数据和相应的影响因素指标数据,结合欧氏距离将样本数据合理分组为训练样本、检验样本和测试样本三类,建立广义回归神经网络(GRNN)模型用于预测黄金价格。建模结果表明:建立的黄金价格模型预测精度高,对未来5天黄金价格的预测相对误差绝对值都在1%以内,模型的泛化能力、可靠性和鲁棒性均较强,具有实用价值。
关键词:神经网络;黄金价格;预测
一、引言
黄金具有商品和货币的双重属性,作为一种投资品种,黄金价格的预测更是众多投资者和学者讨论的热点话题。国内外学者在黄金价格预测研究方面做出了众多成果,主要可以分为三类,第一类采用定性分析方法,通过理论分析预测黄金价格未来一段时间的整体走向,此类方法无法得出具体的预测数值,实用性不强。第二类是建立时间序列相关模型预测黄金价格,此类模型仅以黄金价格本身作为建模基础,而黄金价格的变化是众多因素作用下的结果,其变化过程是非线性的复杂系统,因此时间序列模型在预测受众多因素影响的黄金价格方面具有局限性。第三类采用多变量关系的预测方法建模,将黄金价格及其主要影响因素共同纳入建模过程中,弥补了时间序列模型的不足。该类模型又分为线性多变量关系预测模型和非线性多变量关系预测模型, BP神经网络模型具有良好的自学习性、非线性逼近能力和泛化能力,但这些特性并不是网络模型本身固有的,而是在满足建模条件的情况下特有的,BP神经网络训练过程中极易出现“过训练”现象,为避免该现象的发生,需从总样本中随机抽取检验样本来实时监控训练过程,但以上研究建立的BP神经网络模型均没有采用检验样本,训练过程中是否发生“过训练”不得而知,同时,BP神经网络建模要求训练样本数量必须大于模型的连接权重,在3~5倍以上才可以取得较好的效果,以上BP神经网络模型均不满足该建模要求,模型泛化能力和可靠性有待商榷。
相较BP神经网络,广义回归神经网络(GRNN)在逼近能力、分类能力和学习速度方面都具有较强的优势,且达到相同的预测精度所需的训练样本较BP神经网络少的多,模型训练过程中也不会发生“过训练”现象,因此将GRNN引入黄金价格预测的建模中,以期得到更可靠更有效的模型。
二、GRNN的基本结构
广义回归神经网络(Generalized Regression Neural Network, GRNN)最早由Specht于1991年提出,它建立在数理统计的基础上,通过激活神经元来逼近函数。人为调节的参数只有一个阈值是GRNN网络的特点,网络的学习全部依赖数据样本,并且即使样本数据较少,网络的输出结果也能够收敛于最优回归表面,因此一旦学习样本确定,则相应的网络结构和各神经元之间的连接权值也随之确定,网络训练过程实际上只是确定光滑因子的过程,这个特点决定了网络得以最大限度地避免人为主观假定对预测结果的影响。
σ是 GRNN模型中唯一需要确定合理值的光滑因子,对模型的预测性能影响较大,光滑因子过大或过小都不能将所有样本观测值计算在内,降低模型预测性,只有适中的光滑因子,能将所有样本观测值计算在内。光滑因子的合理值可以通过采用逐步增加或者减小其值, 根据测试样本均方根误差大小来判定。
三、黄金价格预测的GRNN模型及实例分析
(一)建模样本数据选取
黄金价格的变化是多重因素共同作用下的结果,其中包括政治局势变动等不可量化的因素,而预测时间间隔越长此类因素的影响就越难以控制,因此为了尽可能降低不可量化因素对预测结果的影响,选择黄金日价格作为建模和预测样本,预测滞后期选择1天,即模型中输入样本数据的日期比输出样本数据提前1天。从纽约商品交易所黄金期货日价格历史数据中随机选取一个时间段的数据用于预测模型的建立,所选数据日期为2013年12月24日至2014年9月30日(周末及节假日休市除外),共205天的数据作为GRNN模型的样本。
图1所示为2013年12月24日到2014年9月29日的黄金期货价格,可以看出,黄金价格的变化为非线性变化,无周期性及规律性,因此建立线性模型预测黄金价格具有局限性。
GRNN模型的输入变量为若干影响黄金价格的因素,根据已有对黄金价格影响因素的研究成果,本文选取以下指标作为GRNN的输入变量:美元指数X1,原油期货价格X2,美国十年期国债收益率X3,银价格X4,黄金期货价格X5,(建模数据来源: http://www.resset.cn/cn/、http://cn.investing.com/)。
调用SPSS软件,分析得出选用的输入变量与黄金期货价格的相关性,结果表明所选各影响因素与黄金价格均显著相关,黄金价格影响因素的选择是合理的。
(二)建模数据预处理
选取的205组样本数据中,200组作为建模数据, 5组用于预测。为了提高模型的可靠性,将200组建模样本分成三类,即训练样本(Tr)、检验样本(Ve)和测试样本(Te),训练样本根据误差平方和最小的原则调整GRNN模型的权重,从而训练GRNN模型,检验样本和测试样本用于判断和评价选取的光滑因子是否合理,同时也是判断模型泛化能力的依据。本例中设定训练样本的比例为60%,检验样本和测试样本比例各为20%,对于GRNN模型,其训练样本不同,得到的建模结果通常也不同。为了使样本数据的分组更合理,将样本之间的欧氏距离作为分组的依据,具体分组步骤见文献。分组之后的样本具有相似的统计特性,可以提高模型的预测精度,为使数据分组的计算更便捷精准,调用Matlab软件编写分组程序,运行程序得到分组结果。
(三)建立GRNN模型
本文采用StatSoft公司的神经网络软件Statistic Neural Network(以下简称SNN)建立GRNN模型,由于该软件本身自带数据归一化功能,因此可以直接将所选数据输入SNN软件中用于模型建立。依照GRNN建模原理及本例的数据样本情况,设定GRNN模型的输入层节点个数为5,模式层节点个数为120,求和层节点个数为2,输出层节点个数为1。
对于GRNN模型,光滑因子σ值是唯一需要人为确定的值,因此模型的训练过程即是确定光滑因子的过程,建模训练过程中,在0.01~0.5范围内以0.01为单位依次递增取值作为光滑因子σ值,通过训练样本,检验样本和测试样本的绝对误差平均值(AAE)以及均方根误差值(RMSE)判断模型的可靠性,三类样本的AAE和RMSE越接近,表明模型的可靠性越强。
图2所示是GRNN模型训练过程中,σ取不同值时,训练样本、检验样本和测试样本的AAE和RMSE(由于σ>0.3时,三类样本的AAE和RMSE均过大,因此图中未列出),从图3可以看出,σ>0.22时,三类样本的AAE和RMSE 明显过大,模型的预测精度过低,当σ<0.15时,虽然三类样本的AAE和RMSE数值小但相差过大,模型的可靠性得不到保证,只有在0.15≦σ≦0.22时,模型同时具有较高的预测精度和可靠性,其中,当σ=0.18时,三类样本的AAE分别为8.78、8.86和8.47, RMSE分别为10.98、11.28和11.11,此时三类样本的AAE和RMSE均最为接近,因此取0.18为本例GRNN模型的合理光滑因子值。
(四)基于GRNN模型的黄金价格预测结果
基于上述GRNN模型,对2014年9月24日至2014年9月30日周末除外共5天的黄金价格进行预测,结果如表1所示。从表1可以看出,建立的GRNN模型具有很好的预测精度,在未来5天的黄金价格预测结果中,绝对误差最大值为7.602美元,绝对误差最小值为1.822美元,相对误差绝对值最大值为0.626%,最小值为0.149%,预测误差绝对值平均为4.729美元,平均相对误差绝对值为0.388%,充分说明建立的GRNN模型能够很好地预测黄金价格,具有实用性。
四、结果和讨论
(一)关于建模数据分组
虽然根据GRNN建模原理,即使样本数据较少,网络的输出结果也能够收敛于最优回归表面,然而样本数据较少时,无法随机选取部分样本作为训练样本来进行建模,若固定某些样本作为训练样本,则模型的可靠性和预测精度取决于样本数据中的训练样本是否合理,这种情况下根据样本数据间的欧氏距离对样本数据进行合理分组,可以保证最大程度避免了因训练样本的选取不合理对建模预测结果造成的影响,保证了预测模型的可靠性。
(二)GRNN模型用于黄金价格预测的精度及其适用性
图3所示为训练样本、检验样本和测试样本的相对误差,训练样本的相对误差绝对值平均为0.68%,120个训练样本中,64个样本的预测误差大于0,118个样本的相对误差绝对值小于2%,23个样本的相对误差绝对值介于1%和2%之间,检验样本的相对误差绝对值平均为0.67%,40个检验样本中,19个样本的预测误差大于0,39个样本的相对误差绝对值小于2%,7个样本的相对误差绝对值介于1%和2%之间,测试样本的相对误差绝对值平均为0.63%,40个测试样本中,21个样本的预测误差大于0,39个样本的相对误差绝对值小于2%,5个样本的相对误差绝对值介于1%和2%之间,可见建立的GRNN模型不仅具有相当高的预测精度,而且可靠性和鲁棒性均较好,具有较高的实用价值。
实证研究结果表明: GRNN模型可以很好地预测黄金价格,预测相对误差绝对值可以控制在3%以内,其中有97.5%的样本预测相对误差在2%以内,同时模型的泛化能力和鲁棒性也较好,模型具有实用价值,可以运用到对黄金价格的经济及投资预测中。
参考文献:
[1]楼文高,乔龙.基于神经网络的金融风险预警模型及其实证研究[J].金融论坛,2011(11).
[2]王雨,刘国彬,屠传豹.基于遗传-GRNN在深基坑地连墙侧斜预测中的研究[J].岩土工程学报,2012(34).
[3]SPECHT D F. A general regression neural network[J].IEEE Trans on Neural Networks,1991(06).
[4]RONALD D S. Validation of regression models: methods and examples[J].Technometrics,1977(11).
[5]Statsoft Inc. Electronic Statistics Textbook[EB/OL],Tulsa(http://www.statsoft.com
/textbook), 2011.
(作者单位:咸阳职业技术学院)