李新尧
摘要:利用SSA降噪技术对沪深 300 指数股票价格进行降噪并建立 LSTM 模型,发现在预测性能方面,奇异谱分析能够进一步提高模型预测的精度,优化算法对于模型的优化或许也能间接提高模型的预测性能。通过将原始时间序列构建轨迹矩阵,将轨迹矩阵进行奇异值分解、重构,由此提取出时间序列中代表不同成分的信号,有效、准确地运用数学模型预测股票价格。
关键词:SSA-LSTM;股票;预测
一、前言
股票市场作为市场经济的重要组成部分,在市场经济中始终发挥着经济状况“晴雨表”的作用。如何有效、准确地运用数学模型预测股票价格早已成为当下国内外学者们研究的热点话题,采用传统的时间序列方法很难描述股票的非线性特征并准确预测出价格的变动趋势。伴随着神经网络的发展,更多的研究学者把视线转移到机器学习上。如杨小平[1]基于主成分和BP神经网络的方法对股票价格进行了预测分析;耿晶晶等[2]基于CNN-LSTM组合模型预测股票指数变动;张杰[3]对具有马氏链的股票价格预测提出了长短时记忆神经网络LSTM预测模型。
本文考虑对原始数据进行降噪处理。奇异谱分析(SSA)是一种非常适合研究非线性时间序列数据的降噪分解方法。该方法通过将原始时间序列构建轨迹矩阵,将轨迹矩阵进行奇异值分解、重构,由此提取出时间序列中代表不同成分的信号,比如噪声信号、周期信号、整体趋势信号。
二、方法介绍
(一)奇异谱分析
奇异谱分析是由Colebrook[4]于1978年提出的一种方法,该算法的目的是将原始序列分解为少量独立的可解释分量的和[5]。奇异谱分析包含了分解和重构两个阶段,具体见下文。同时,本文将综合考虑奇异值的奇异熵和累计贡献率,由此准确提取出含有主要趋势信号的部分。
1.分解
2.重组
三、实证分析
(一)数据来源及预处理
实验数据来源于investing(https://cn.investing.com)网站,数据包括2012年8月1日至2022年7月31日期间沪深300指数股票价格的收盘价(Close)、开盘价(Open)、最高价(High)、最低价(Low)、出售量(Volume)和涨跌幅(Chg)。部分数据展示如表1所示。
(二)实验结果及分析
结合数据的周期性和奇异谱分析的嵌入过程中的参数的原则,选取窗口长度为720。根据奇异熵和累计贡献率决定奇异值的提取阶数并作为原始时间序列的主要信息,奇异熵增量和累计贡献率的变化情况如下:
结合图2,考虑选择前250阶奇异值重构序列。归一化处理的部分结果展示如表2所示。
实验将数据按照9∶1进行训练集和测试集的划分,模型参数学习率设置为0.01,batch_size为32,epoches为100。评价指标结果如表3所示。
图3为整体模型图,结合评价指标可看出LSTM模型对于股票数据的预测具有不错的效果,同时奇异谱分析能一定程度上提高模型预测的精准度。
四、总结与展望
本文利用SSA降噪技术对沪深300指数股票价格进行降噪并建立LSTM模型。结果表明,在预测性能方面,奇异谱分析能够进一步提高模型预测的精度。股票会持续成为学者们关注的热点,运用更为科学且复杂的组合模型对其进行预测,或许可以进一步提高预测精度,同时,更为精准的。优化算法对于模型的优化或许也能间接提高模型的预测性能。
参考文献
[1]杨小平.基于主成分与BP神经网络的股票价格预测分析[J].统计与决策,2004(12):42-43.
[2]耿晶晶,刘玉敏,李洋,等.基于CNN-LSTM的股票指数预测模型[J].统计与决策,2021,37(05):134-138.
[3]张杰.基于LSTM的股票预测实证分析[D].济南:山东大学,2020.
[4]Colebrook J M.Continuous plankton records:Zooplankton and environment.North Atlanticand North-Sea,Oceanologica Acta,1978,1(1):9-23.
[5]Hassani H.Singular spectrum analysis:methodology and comparison[J].Journal of Data Science,2007,5(2):239-257.
[6]杨文献,任兴民,姜节胜.基于奇异熵的信号降噪技术研究[J].西北工业大学学报,2001(03):368-371.
作者单位:南京审计大学统计与数据科学学院