基于Lasso-PSO-BP方法的中国黄金期货价格短期预测

2022-02-02 01:11
关键词:相空间收盘价期货

尹 晨 曦

(兰州财经大学 统计学院, 甘肃 兰州 730020)

黄金不同于其他金属,它是一种兼具货币和金融属性的特殊贵重金属,拥有高流动、高安全和低收益的特性。由于黄金自身的多重属性且影响黄金价格变化的因素繁多复杂,难以准确地对黄金期货收盘价的走势进行预测。国内外众多学者对此开展了广泛且深入的研究,从选择变量的角度,可以将模型分2种。一种是单变量法,许贵阳[1]基于灰色预测方法对中国黄金现货价格进行短期预测。另一种是多元变量法,相较于单变量法,计算复杂,但模型预测精度高。Pierdzioch等[2]在随机森林中引入多元变量对黄金等4种贵金属进行样本外预测,引入多变量构建预测模型的精度要高于单变量预测的精度。针对多元变量法,如何选择合适的变量也是提升预测效果的关键问题。贾尚晖等[3]选用Lasso回归方法从定性分析所选的10个变量中选取与对伦敦现货黄金价格收益率有关的4个变量进行分析。张文等[4]考虑到变量之间并非都是同期的关系,利用时差相关分析法确定影响国际原油价格多元变量的滞后期以提高模型的预测效果。乔宏图[5]验证黄金价格序列的混沌性并利用相空间重构法确定神经元中的节点个数,并利用相关分析法筛选重要变量,最终选用BP神经网络与RBF神经网络进行比较分析。

预测方法大致分为基于传统统计预测模型和以神经网络为主的智能预测方法2类。传统统计预测模型有灰色预测[1]等,智能预测模型主要包括随机森林[2]、BP神经网络[6]、支持向量机(SVM)[7]、多层感知机[8]等。单个模型无法有效捕捉到时间序列的主要特征,人们提出了组合方法来分析时间序列。Alameer等[8]考虑汇率、油价、铜价、银价及黄金历史价格等10个变量作为输入变量,建立由鲸鱼算法优化的多层感知器神经网络预测黄金月度价格。

综上所述,在构建模型中加入外生变量能够有效提升模型的预测性能。本文选用16个变量对中国黄金期货收盘价进行研究,以其所属金融市场可分为4大类:现货市场因素、期货市场因素、能源价格因素和其他因素。本文基于Lasso对影响黄金收盘价的变量进行筛选,考虑到变量之间的关系并非都属同期,采用时差相关分析和相空间重构确定不同变量的滞后期,同时引入PSO优化BP神经网络初始权值与阈值,以达到更好的预测效果。

1 研究方法

1.1 Lasso变量选择方法

Lasso(Least absolute shrinkage and selection operator,Lasso)即最小绝对值压缩选择算法,是一种基于绝对系数降低数据维度的方法。本质就是在传统目标函数的基础上添加惩罚项来压缩变量的系数,强制类系数绝对值之和小于某个特定值,同时设定一些变量的回归系数为零并将这些变量剔除,达到降维的目的,未被剔除的变量视为显著变量。通过Lasso回归分析进行特征提取可以有效降低神经网络输入变量的维度,解决变量之间存在多重共线性的问题,从而提高模型的有效性。假设有n组自变量为Xi(i=1,2,…,n),所选取因变量为Yi(i=1,2,…,n),Lasso回归公式:

(1)

等价于:

(2)

1.2 时差相关分析及相空间重构

1.2.1 时差相关分析法

(3)

当l=0时,r0表示xt和yt之间的皮尔逊相关系数;当l>0时,x和y之间的关系为超前;当l<0时,x和y之间的关系为滞后。本文将黄金期货收盘价作为基准指标,提取后的影响因素分别视为被分析指标,根据计算结果调整模型中相关变量的滞后阶数。

1.2.2 相空间重构

相空间重构(Phase Space Reconstruction,PSR)通过对时序数据重构吸引子把数据的时间相关性转换成更高维的空间向量。时间序列x(i),i=1,2,…,N的相空间重构

X(t)=(x(t),x(t+τ),…,x(t+(m-1)τ)

(4)

式中:t=1,2,…,N-(m-1)τ;m为嵌入维度;τ是延迟参数;X(t)表示为延迟向量。本文选取C-C算法[9]寻找最佳嵌入维度m和延迟参数τ。

1.3 PSO优化的BP神经网络

1.3.1 PSO-BP神经网络

粒子群优化算法(Particle Swarm optimization,PSO)是由Eberhart和Kennedy提出的一种基于鸟群觅食时群体与个体之间的合作与信息共享来寻找最优解的智能优化算法。本文利用PSO优化BP神经网络中的初始连接权值与阈值以提高模型的准确率。主要步骤如下:

步骤1 初始化一粒子群并确定相关参数。设置本文PSO-BP模型中相关参数,粒子群规模大小为20;最大迭代进化次数为100;学习因子C1=1.5,C2=1.2。

步骤2 计算粒子相应的适应度值。适应度函数选用BP神经网络所得的均方误差,即所得适应度函数值越小所选粒子适应度越强。

步骤3 更新迭代过程。粒子通过计算适应度更新个体极值与群体极值从而寻找到个体局部最佳位置与群体中的全局最佳位置,更新公式

(5)

(6)

步骤4 判断是否为最优解。若达到网络预先设定的训练次数或训练误差到达设定范围内,则为最优解停止网络训练,输出最终结果。

1.3.2 评判准则

选取平均绝对百分比误差(MAPE)、均方根误差(RMSE)和平均绝对误差(MAE)3个统计指标对模型样本外预测性能进行客观的评价:

(7)

(8)

(9)

所构建的预测流程图如图1所示。

图1 Lasso-PSO-BP模型预测流程图

预测模型的主要步骤:

步骤1 确定主要变量,利用Lasso回归分析找到黄金期货收盘价的主要影响因素。

步骤2 确定各变量的滞后期,利用时差相关分析法确定主要影响因素的滞后期,相空间重构法确定收盘价自身的滞后期。

步骤3 预测,确定网络的拓扑结构,采用PSO-BP神经网络等模型进行预测。

步骤4 预测效果评价,选用MAPE、RMSE和MAE这3个统计指标分别对模型进行客观评价。

2 实证分析

2.1 数据处理与预测评价准则

2.1.1 数据选取

2015年8月11日,汇改后形成了以供求关系为基础,结合一篮子货币进行定价的汇率机制,使汇率更加合理化、国际化与市场化。黄金期货作为一种金融衍生品,汇改制度的变化会在一定程度上对金融产品产生影响。为了消除不同汇率制度对黄金期货收盘价的影响,选用上海黄金交易所自2015年8月11日汇改后到2021年4月1日的黄金期货收盘价格日度数据,如图2所示。考虑到影响黄金价格的相关因素,宏观经济指标大多数都以月度、季度或者年度为主,利用多变量预测黄金期货收盘价日度数据,如表1所示,由于时差及国内外节假日等因素,对所有数据选取了有公共交易日的区间进行分析,最终得到1 182条样本数据。数据均来自于Wind数据库。

图2 黄金期货收盘价趋势图

表1 价格影响因素

2.2 预测结果及对比分析

2.2.1 Lasso变量选择

利用Python进行编程可以实现特征提取,参数λ的取值范围会影响到所选取变量的数目,当设定λ的取值过大时,会剔除某些重要变量,不利于预测模型的构建。最终本文选定的最优参数λ=0.000 509 4,并得到影响黄金期货收盘价的7个因素,即上海金交所Au9995黄金现货收盘价、美元兑人民币汇率、英国布伦特原油现货价(Dtd)、中债国债到期10年收益率和黄金期货的成交量、最高价、最低价。选取的变量以及相对应的回归系数如表2所示。

表2 Lasso选取的变量及回归系数

2.2.2 滞后期确定

充分了解影响因素与收盘价之间的数据特征,能够有效提高后续预测模型的准确率,利用时差相关分析法确定被提取变量的时间序列滞后期,采用C-C相空间重构法确定黄金期货收盘价最佳嵌入维度m=4,延迟参数τ=2,即收盘价最佳滞后期为4期。根据公式(3)计算各变量滞后5期的时差相关系数,对比5期的时差相关分析系数,选取系数最大值所对应的期数,上海金交所Au9995黄金现货收盘价、黄金期货的最高价和最低价最佳滞后期均为1期;美元兑人民币汇率、原油现货价(Dtd)、中债国债收益率和成交量所选最佳滞后期均为5期。

表3 变量相关系数表

2.2.3 PSO-BP神经网络预测结果

将滞后1期上海金交所Au9995黄金现货收盘价、黄金期货最高价与最低价;滞后4期的黄金期货收盘价;滞后5期的美元兑人民币汇率、原油现货价(Dtd)、中债国债收益率和黄金期货成交量共27个变量作为PSO-BP神经网络的输入层,下一天的黄金期货收盘价格为输出层。训练集与测试集划分比为9∶1,即1 059个训练样本,118个测试样本。本文所用对比模型参数设置如表4所示,通过神经网络进行仿真训练,得到测试集上的预测结果如图3~图5所示。

表4 对比模型参数设置

BP神经网络与其单一神经网络的预测效果图如图3所示,ELM的预测效果好于BP与LSSVR神经网络,这是由于ELM随机设定神经网络输入层与隐含层之间参数值;BP神经网络与经PSO优化的BP神经网络在测试集上的预测结果如图4所示,可以明显看出PSO-BP神经网络的走势更贴近真实值;PSO优化BP、ELM与LSSVR模型的结果如图5所示。不同模型的评判指标数据如表5所示,利用IR公式(10)计算提出模型与基准模型各指标的提升率,相对于其他模型的提升率结果如表6所示,可见PSO-BP神经网络的预测效果要明显优于其他模型。

(10)

图3 BP金价预测模型拟合结果图 图4 PSO-BP金价预测模型拟合结果图

图5 PSO-BP、PSO-ELM与PSO-LSSVR金价预测模型拟合结果图

表5 各模型评判指标及对比

表6 PSO-BP指标提升率

3 结 语

本文选用多变量对黄金期货收盘价建立了Lasso-PSO-BP预测模型,并针对“811”汇改后的黄金期货价格数据进行了实证分析与预测。通过Lasso对所选取的影响因素进行降维,在模型中选入与收盘价更加相关的变量,从而有效减少模型的训练时间,提高模型的预测精度。从时间滞后的角度分析相关变量与收盘价之间的滞后关系,利用相空间重构法最大程度地寻找收盘价本身的数据特征,最终确定模型的拓扑结构。利用PSO优化传统BP神经网络的2个重要参数,捕捉收盘价非线性的特征。Lasso-PSO-BP神经网络的预测效果要好于单一神经网络预测模型,也要好于Lasso-PSO-ELM和Lasso-PSO-LSSVR模型。

猜你喜欢
相空间收盘价期货
美棉出口良好 ICE期货收高
国内尿素期货小幅上涨
相干态辐射场的Husimi分布函数在非对易相空间中的表示
尿素期货上市又近一步
股神榜
股神榜
股神榜
中粮期货 忠良品格
股神榜
非对易空间中的三维谐振子Wigner函数