卫海军
如果把股票价格图表看成图像,则可以使用深度学习神经网络(DLNN)进行图像建模。DLNN 可以模仿技术分析师的工作,通过价格图表和股票基本面(如市盈率)预测短期股价波动。本文运用2014—2019 年A 股股票数据进行研究,结果发现在我国股票市场价格的预测中,深度学习模型比单层模型表现更好。DLNN 能够提供可定制的统计工具,有效分析价格图表。更重要的是,过去不同时期的收盘价所形成的价格趋势,在预测未来价格走势时,主宰着股票基本面。因此本文提出建议,股市技术分析师应该通过DLNN 模型将价格趋势纳入他们的预测方法。
深度学习(DL)模型和人工神经网络(ANN)模型最早于20 世纪50 年代在计算机科学中提出(Rosenblatt,1958)。DL 模型可以用神经网络近似任何复杂函数,能够达到无限维,具有很高的拟合能力。深度学习神经网络(DLNN)采用多级信息提取过程,每个连续的层或非线性模块将一个层的表示转换为更高层的表示(LeCun等,2015)。与单层神经网络(SLNN)不同,DL 模型可以通过构成足够的变换来学习复杂的函数。DLNNs 显著改善了语音识别、视觉物体识别等领域(Schmidhuber,2015)。
神经网络以其可拟合高度复杂的非线性系统、拥有灵活并且可以根据自身情况进行自调节的拓扑结构、高度并行的处理机制以及具有自组织、自学习能力的特点受到了国内外研究者及行业从业人员的青睐和重视。国外方面,Gu 等人(2020)将神经网络用于预测美国股票价格,并表明神经网络优于其他模型,如广义线性模型、主成分回归和回归树。Bianchi 等人(2021)用神经网络预测债券超额回报,并报告显著的经济收益。国内方面,周佩玲(2006)将神经网络算法应用于道琼斯股票指数预测中,增强了神经网络的实用性。邓凤欣(2018)利用LSTM 模型对美港股票中市值较大的四只股票进行预测并获得较好的效果,认为LSTM 在美港股市中具有较好的适用性。韩莉(2016)将LM-BP 算法运用到股票预测中,对美股上市的智联招聘进行预测,取得了较好的成绩,但其认为不能仅仅根据股价变化决定投资,并对多种指标进行了计算和分析,以此辅助投资者做出更好的决策。梁夏(1999)在神经网络预测模型中加入自纠错功能来预测股票滚动。李晓静(2008)通过遗传算法优化神经网络的初始连接权并确定网络隐节点个数进行预测建模,有效提高了模型预测精度。魏立龙、许东方(2011)把小波神经网络和遗传算法相结合,建立了基于遗传算法的小波神经网络股票预测模型GA-WNN,解决了收敛速度慢、易陷入局部极小值问题。杨青、王晨蔚(2019)构造深层LSTM 神经网络模型对全球30个股票指数三种不同期限的预测研究,结果发现与SVR、MLP、和ARIMA 三种预测模型相比,LSTM 神经网络模型具有更好的预测和稳定性。这些研究表明,神经网络模型可以更好地预测未来的价格走势。与以往的研究不同,本文引入了在图像识别方面具有显著优势的DLNNs,实现了对股票价格趋势的准确预测,也有助于经验扩展技术分析与股票基本面分析。
DLNN 模型对图像建模具有强大的统计能力,而股票价格图表实际上是图像。因此,可以使用DL 算法来分析股票价格趋势。在图1 中演示了DLNN 模型的基本结构,输入层、隐藏层和输出层。神经网络是一组相互连接的节点(用圆圈表示),其灵感来自人脑中神经元的简化,它通过激活函数将一层神经元与另一层神经元连接起来。激活函数是输入信号的非线性变换,变换后的输出作为输入发送到下一层。这个功能决定了一个神经元是否应该被激活。通过这种多层神经网络,输入变量最终可以得到相应的输出结果。
本文扩展了以往关于我国股票价格趋势预测的文献。首先,引入具有图像识别能力的DL 模型,并将股价趋势作为预测短期价格行为的解释向量。其次,本文比较了DLNN 和SLNN,并阐明了DL 的实质优势。最后,本文研究趋势或股票基本面是否对未来股票价格有重要影响。使用价格趋势作为输入的结果和同时使用价格趋势和股票基本面的单层模型的结果几乎相同,证实了在预测价格走势时价格趋势在股票基本面中占有主导地位。
多因素模型的流行使学术界的注意力从绝对定价模型转向了相对定价模型。目前,许多基于因子排序原则的因子检验和依赖因子模型间比较优势的互跨检验变得不那么显著。由于DL 模型的发展,本文研究可以聚焦于基本的价格趋势,从时间序列中提取出可以确定股票价格的信息。
本文选取2014 年1 月4 日至2019 年12 月31 日期间上海证券交易所和深圳证券交易所的所有A 股的交易价格。样本包含2809 个股票。从Wind 数据库收集了Fama和French(2015)使用的每日收盘价和5 个股票基本面——PE(价格/收益)、PB(价格/账面)、PS(价格/销售)、PCF(价格/现金流)和TR(营业额)。TR 是一个每日变量,在每个交易日更新。其他四个股票基本面(PE,PB,PS 和PCF 比率)也是每日变量,变化来自两个部分。第一部分是每日股票价格的分子比率,第二部分是每季度更新的分母。对于股票价格趋势分析,数据频率越高,信息量越大。如果使用每周或每月的数据,将无法捕捉到一周或一个月内的股价变化,不利于模型的训练。每小时或更高频率的数据比较嘈杂,可能会导致一些市场微观结构问题。
本文使用DLNN 模型来预测2014—2019 年中国股票的价格变动。结果显示DLNN 模型在验证集的平均准确率为55.46%。与单层模型不同,DL 侧重于学习不断增加的有意义表示的连续层。它是一种能够有效分析趋势图的高级统计模型,反映变量随时间的变化趋势。只要训练数据包含足够的概率关系就可以用于预测,DLNN 可以挖掘它们并提供良好的预测。
结果表明,DL 为学习价格趋势和图表表示提供了一个数学框架,这有利于图像建模。DLNN 的预测能力几乎完全基于对股价趋势的分析。基本面和技术分析师应该通过DLNN 模型将价格趋势纳入他们的预测方法。