基于LSTM与BL模型的资产组合策略收益预测

2019-10-21 13:24张鸿洋于冲冲
商讯·公司金融 2019年21期

张鸿洋 于冲冲

摘要:本文主要探讨了深度学习算法LSTM的特点及对于处理有时间序列属性数据的优点,并应用于预测股票趋势的研究。与传统的预测股票的股价,ikiRJ股票的收益率等最终通过回归的方法得出股价的方法不同,本文采用的方法是把结果通过一个Sigmoid函数转换成一个二分类问题,用以预测股票的上涨下跌的概率。主要通过选取相应的股票的一些基本面及技术指标统计量,并进行标准化处理。得出股票预测概率矩阵,再通过Black-Litterman模型进行投资资产配置。通过两种方法结合能够均衡收益率与风险的关系,在最小化风险的情况下,实现收益的最大化。

关键词:LSTM;BL;算法原理

一、引言

预测股票的走势与预测股票的价格指數,由于涉及的各种不稳定因素,是非常困难的。股票的投资者在买人或者卖出股票之前一般会有两种类型的投资偏好。第一种是基本面分析方法,采用这种分析方法的投资者通过分析股票的内在价值,公司效益,当前主要经济的表现和国内国际的政治环境等,决定是买入还是卖出。第二种投资偏好是技术分析,投资者通过研究统计市场活动,形成各种基于市场活动的统计指标,比如过去的价格,成交量,异同移动平均线(MACD),随机指标(KDJ)等。

目前大部分的量化手段是通过分析挖掘股市历史数据以及各项技术指标,发现当前阶段股票市场的风格及特点。由于股票市场作为复杂且时变的巨系统,其价格波动往往表现为较强的非线性,因此如何从海量的市场数据中获取有价值的信息为决策服务是一个难点。另外,市场走势十分复杂且引发波动性原因各式各样,政治事件,市场新闻,财务报表等因素均对股市有所影响,即使有这些指标,仍然很难预测股票走势。

目前的价格股票预测方法主要是将数据特征提取和模型预测过程相结合来进行研究。比如Xu等人采取改进的经验模态分解算法(EEMD)对股票时间序列进行模态分解,并根据分解得到的模态信息成功预测市场价格趋势;而Jonathan L.Ticknor则提出运用基于贝叶斯正则化的人工神经网络进行预测金融市场的走势行为,利用每日价格及相关的金融技术指标作为特征来预测个股未来的收盘价。YangWendong,LouZhengzhen只因影响股市价格因素较多,提出以GA和SVM组合的方法进行多因子分析,用分类的方法进行股市预测。Mann将动态模态算法(DMD)用于证券市场这个高维非线性系统的信息提取上,并利用时空相干性结构信息来表征系统动态特征,准确的描述了市场价格变化和形态走势;史文静对股指期货价格序列采用EMD算法得到IMF本征模函数,并结合RBF神经网络对提取出高低频IMF进行建模来实现价格预测。王钧、张鹏、袁帅使用上证A股50的历史交易数据作为研究对象,对其进行短期价格趋势预测分析。依照交易数据各自特点,选取递归神经网络(RNN)、长短时间记忆网络(LSTM)和Seq2Seq及其优化模型4种神经网络结构,进行验证比较。经过实证研究,结合误差指标和交易绩效等展示模型预测精度和预测效果,最后得出基于Seq2Seq的深度神经网络模型具有较好的预测精度。杨青、王晨蔚构造了一个深层LSTM神经网络并将其应用于全球30个股票指数三种不同期限的预测研究,并得出LSTM神经网络具有很强的泛化能力,且对比其他模型(SVR、MLP、ARIMA)具有更优秀的预测精度Guosheng Hu,Yuxin Hu等人提出了一种新的投资决策策略,通过模仿人类交易员的行为,去编撰相应算法,利用卷积自编码器(CAE),利用深度学习以及股票的夏普比率等指标进行相应测算。朱业春利用数只股票的日数据,将信息贿补偿方法与BL方法相结合,其主要创新点集中在得到综合收益向量后的再次优化部分,将传统的效用函数增加了信息俯项,替代方差来衡量风险,将正负偏离用信息馈捕捉,从而得到新的下一期资产权重。

以上方式通常选取以统计学理论为基础的时间序列分析方法和机器学习方法,所选特征也相对较为单一。即使基于风险收益权衡做股票预测时,确不能有效结合股票本身的时间序列特性来做决定。而本文中将两者有效结合一起,经LSTM模型处理后,最后一层会把结果通过一个Sigmoid函数转换成一个二分类问题,用以预测股票的上涨的概率,再通过Black-Litterman模型进行投资资产配置。两种方法结合能够均衡收益率与风险的关系,在最小化避免风险的情况下,实现收益的最大化。

二、算法原理

(一)LSTM神经网络

循环神经网络(RNN)是目前较为流行的应用于时间序列预测的神经网络模型。而传统RNN模型容易产生梯度消失的问题,至于股票类长序列数据,相对无能为力。而造成梯度消失的原因,本质上是因为隐藏层状态h(t)的计算方式导致梯度被表示为连乘积的形式,而ISTM则可利用特定记忆单元缓解RNN梯度消失问题。

LSTM结构主要由门和记忆单元组成,其中门结构包含遗忘门、输入门、输出门三种,通过控制信息的增加与去除,实现记忆细胞的保持和更新。

其中遗忘门主要负责以一定的概率控制是否遗忘上一层的隐藏细胞状态,数学表达式为:

此图要更结合实验特征来画,输入的特征时……

(二)Black-Litterman模型

Black-Littennan模型是高盛的Fisher Black和RobertLitterman在他们的工作发现的,是对马科维茨的MPT模塑的一种改进。其主要做法就是通过加入投资者自己的观点,并进行量化且给予一定的置信度,通过条件概率的计算,在构建收益的时候通过一定的方式对市场的隐含收益率与主观预期收益进行加权平均。

模型的主要公式如下;

s.t.风险约束,预算约束声亡如约束,做空约束

重要参数解释:

E[R]:新的加权后的收益向量(n*1列向量)

τ:比例系数(常数)

P:涉及主观看法资产矩阵(k*n矩阵)

Ω:看法置信度矩阵(K*K矩阵)

Π:隐含均衡收益率向量(N*1列向量)

Q:看法向量(K*1列向量)

具体步骤为:

(1)W每个资产的均衡权重

按照CAPM假设,最优的风险资产组合即为现有的整个市场,所以均衡权重应该是按照现有的资产之间的总市值占比求得。

W是为了求初始的均衡收益,求均衡收益的方式有很多,比如CAPM估计,历史平均来计算等。

(2)∑资产之间的协方差矩阵

通过日度历史数据计算得到,或用协方差矩阵进行估计预测等,本文使用前者。

(3)δ風险厌恶系数

可以假设,一般取值范围为[1,3],也可以通过计算得到,计算公式是

(4)τ均衡收益方差的刻度值

通常取值比较小,在0.025~0.05之间。

假设认为,先验分布均衡收益的方差是和实际收益率的方差成比例的,而B-L模型是将市场均衡收益和个人观点整合到一起的,那么先验分布的均衡收益方差越大的话,其准确率越低,所占的权重也就越小,个人观点权重越大,所以τ也可以看成是观点权重。

(5)用反向求解的方式计算得到先验的均衡收益

Π=δ*∑*ω(9)

(6)个人观点模型化

观点可以涉及单个资产,也可以涉及多个资产乃至所有资产最后按照一定的规则将所有观点构建成矩阵P、Q和Ω。

考虑有K个观点n个资产的例子,此时,P就是k*n矩阵,每一行代表一个观点,Q为K*1矩阵,存放每个观点的超额收益。Ω是k*k对角矩阵,对角线上的每一个元素代表该观点的方差,与对该观点的置信程度成反比,在学术界常用的公式是:

Ω=P

(三)LSTM与BL模型的融合

首先,本文使用LSTM模型进行股票预测,在我们实验中的LSTM模型中对于时间序列的定义取决于未来预测的需要的时间窗口的数据集的序列集合。在我们的实验中我们选取的是日K数据,并且对于数据的选择需要具有时间序列的学习功能,同对应剔除具有未来函数作用的特征。这一点在模型的预测中非常重要,否则会发生严重的过拟合现象。具有时间学力学习功能的特征如:前一天的收盘价,其中某一天的交易量等特征。同时为了让模型具有更强的鲁棒性,防止模型过拟合,对模型做了如下的优化方法:

使用dropout:经过多次实验测试,我们发现模型经常会出现过拟合的现象。实际效果检验发现,使用dropout这一神经网络的正则化技术,可以将隐藏层的一些参数按照概率p随机置为0,能有效地防止模型过拟合。

在隐藏层中加入L1/L2正则项:经过多次实验,单单使用dropout方法不能非常有效地防止模型过拟合。再加入L1/L2正则项能更加有效地解决模型过拟合问题。

对于训练数据需要进行标准化处理:神经网络普遍是使用随机梯度下降等方法来对损失函数进行优化的。在使用梯度下降法学习参数的时候,认为不同特征对参数的影响程度是一样的。因此,当原始数据不同维度上的特征的尺度(单位)不一致时,需要标准化步骤对数据进行预处理。在训练神经网络的过程中,将数据标准化,能够加速权重参数的收敛,且能够避免当数据的标准差非常大时,反向梯度传播导致的梯度爆炸或梯度消失等问题。

对于LSTM模型的Labe的确定,我们是根据收益率来进行标记时间序列的表现。收益率是通过比较序列的3天移动窗口的收盘价与当前序列的最后一天的收盘价来进行计算的。对于3天移动窗口的收盘价与当前序列的最后一天相减再除以最后一天的收盘价。如若标签移动窗口收益率大于1%-5%,则标记为1,否则标记为0。对于1%-5%可根据回测的实际情况的资产组合收益进行设定。

对于LSTM神经网络结构的设计,我们的模型主要包括一个单一的输入层及5个LSTM隐层层,两个dropout层和一个输出层组成及最后一个激活函数层。其中最后一个LSTM的隐藏层需要加入L1正则项。最后的激活函数层是一个sigmoid激活函数用以将预测问题转换成二分类问题。

LSTM模型的输出结果,输出结果为一个股票与概率的列表。将序列表的概率结果作为BL模型的输入。

三、实验

(一)模型指标特征

在LSTM中,序列学习特性的选择至关重要。股票数据至少有四种类型:(1)股票的历史价格数据(如成交量、高点、低点、开盘价等);(2)由(1)计算得到的技术分析数据(如移动平均收敛/发散(MACD));(3)市场指数和/或其他有关股票的历史价格数据;(4)经济基本面(如国内生产总值(GDP)、油价等)。我们的序列学习特性使用了第1和第3种类型的股票数据,但没有使用第3种类型的股票数据,以避免共同创建陷阱,即类似机器学习中常提到的多重共线性。由于是短线操作因此也不包括第4种类型的数据。我们期望LSTM的序列学习能力能找到最优的参数。在目前的研究中,一个时间序列长度取3天的数据,每个日数据有36个特征。

针对一些技术指标,由于每个指标计算的时间区间可能会导致不同的预测结果,因此针对参数选择需要选择多个自由度。具体参数的设置及参数的解释如下所示。

(二)模型架构

采用的LSTM架构为一个9层结构的循环神经网络,其中第一层为32个LSTM神经元,第二层为64个LSTM神经元,第三层为防止过拟合的Dropout层,第四层为128个LSTM神经元,第五层也为128个LSTM神经元,第六层为64个个LSTM神经元,第七层为一个Dropout层再次防止模型过拟合,第八层为一个输出层一层的神经元,第九层为一个Sigmoid激活函数,用以将结果转换成一个二分类问题。

(三)数据源

数据源为每只股票的上市直到今天为止的所有数据。为了防止特征与标签有线性关系,影响模型效果,在进行训练的时候。会将最高价,开盘价,最低价,收盘价特征剔除。

(四)结果

通过回测历史数据,模型的准确率达到68%。

参考文献:

[1]Mengjia Xu,Pengjian Shang,Aijing Lin.Cross -corre-lation analysis of stock markets using EMD and EEMD[J].Physica A:Statistical Mechanics and its Applications,2016,442.

[2]Jonathan L.Ticknor.A Bayesian regularized artificialneural network for stock market forecasting[J].Expert SystemsWith Applications,2013,40(14).

[3]A multi-factor analysis model of quantitative invest-ment based on GA and SVM.

[4]Jordan Mann,J.Nathan Kutz.Dynamic mode decompo-sition for financial trading strategies[J].Quantitative Finance,2016,16(11).

[5]史文靜,高岩.EMD结合RBF神经网络新混合模型及股指期货价格预测[J].经济数学,2015,32(1):47-51.

[6]王钧,张鹏,袁帅.基于股票预测的Seq2Seq RNN和LSTM模型比较[J].时代金融,2018(35):381-382+392.

[7]杨青,王晨蔚.基于深度学习LSTM神经网络的全球股票指数预测研究[J].统计研究,2019,36(3):65-77.

[8]Deep Stock Representation Learning:FromCandlestick Charts to Investment Decisions.

[9]J.B.Heaton,N.G.Polson,and Jan Hendrik Witte.Deeplearning for finance:deep portfolios.Applied Stochastic Modelsin Business and Industry,2016.

[10]朱业春,曹崇延.基于熵补偿的Black-Litterman模型的投资组合[J].中国科学技术大学学报,2015,45(12):1030-1035.

[11]Zhengyao Jiang and Dixing Xu.A DeepReinforcement Leaming Framework for the portfolio manage-ment,2017.

[12]He,Guangliang,Litterman,Robert.The Intuition Be-hind Black-Littermau Model Portfolios,2007.

[13]Steven L.Beach,Alexei G.Orlov.An application ofthe Black-Litterman model with EGARCH-M-derived viewsfor international portfolio management,2012.

[14]魏世振,尤晨,韩玉启,陈传明.基于信噪比的投资组合策略研究[J].系统理论与实践2004.

[15]Hinton,G.E.,Srivastava,N.,Krizhevsky,A.,Sutskever,l and Salakhutdinov,R.R.,2012.Improving neuralnetworks by preventing co-adaptation of feature detectors.arXivpreprint arXiv:1207.0580.

作者简介:

张鸿洋,对外经贸大学统计学院在职人员高级课程研修班学员,北京;于冲冲,京东集团反欺作研究员,北京。