人工智能与中国股票市场
——基于机器学习预测的投资组合量化研究

2022-08-03 07:34陈煜之
工业技术经济 2022年8期
关键词:股票收益率收益

方 毅 陈煜之 卫 剑,3

1(吉林大学商学与管理学院,长春 130000) 2(吉林大学数量经济研究中心,长春 130000)3(贵州财经大学,贵阳 550000)

引 言

人工智能是21世纪以来各国重要的发展战略,同时,人工智能成为国际竞争的新焦点,世界各个发达国家都把发展人工智能作为提升国家竞争力、维护国家安全的重大战略。在此背景下,我国加紧出台规划和政策,围绕核心技术、顶尖人才、标准规范等强化部署,力图在新一轮国际科技竞争中掌握主导权。由于人工智能运用的广泛性,它能与各个学科紧密地交叉结合,如互联网、大数据、传感网、脑科学、金融和图像处理等。许多学者也在各个学科的研究中加入了机器学习、人工智能,这些深度学习算法也逐步推动着这些学科发展。

在经济金融领域,股票市场是企业连接生产和投入的关键连接点,同时股市还是一国经济的晴雨表,它能反映一国的经济情况,因此它的波动受到社会的广泛关注。股票价格不仅受到国家宏观部门所关心,它也受投资人所关注。早期,一些投资人透过股价的规律和数学模型的结合在股票市场中获得了超额收益,这便是早期的人工智能与金融相结合的实战产物,如美国文艺复兴科技公司的大奖章基金。随着计算机科学和人工智能算法的不断迭代,美国的华尔街量化投资基金如雨后春笋般崛起,如桥水、AQR等。大数据、人工智能和计算机科学的发展使这些基金能挖掘更多的套利机会。

在学术界,学者们很早就致力于通过传统的计量模型来对股票价格、趋势和收益率进行预测并进行交易。一些计量经济学家认为通过历史的信息可以高概率地判断股价未来的走势,他们认为历史会重演。一些研究技术交易的人员发现,股票的溢价回报与其过去的回报密切相关,在不同的时间段内,股票的超额收益与其滞后收益是负相关的[1-6]。

诚然,不仅仅是价格的历史信息,股票的价格还受市场各种力量所驱使,这些影响股票价格的因素就是定价因子。随着计算机科技的快速发展及机器学习算法的开发,深度神经网络被广泛运用于金融领域,特别是在量化投资中,这主要表现为影响股价的特征因子不断地被挖掘使得股票价格预测更加精准[7-11]。

机器学习以其非线性的数据拟合优势,在模型的预测精准度中比传统的线性模型预测误差更低[12],因此,机器学习能更好地捕捉各个特征对金融收益率预测的影响。中国作为世界第二大经济体,其股市预测问题也被全球学者所关注。中国市场以个人投资者为主①,这些交易者的交易行为对中国股市波动影响巨大。而不同于机构投资者,个人投资者的交易逻辑是以技术指标和动量等因素驱使为主。鉴于个人交易者是一股不可忽视的力量,本文更多的关注个人交易者的交易策略对市场价格带来的影响。以往的研究多从反应不足、过度反应、博彩偏好、羊群效应等角度研究个人投资者情绪和心理对股票价格的影响[13,14],这些交易心理会造成市场出现较强的动量、反转、博彩和趋势跟随等投机现象。基于前人研究,本文主要运用人工智能方法,结合中国市场的特点深入剖析影响中国市场的股票收益率预测因素。

1 文献综述

近年来,许多学者通过机器学习模型结合股票市场特征、公司特征、交易特征等对股票收益率进行预测,大量的实证也表明机器学习在股票收益率预测中起到显著的作用。如Phua等 (2003)[18]进行了一项研究,通过构建神经网络模型,以高于60%的预测精度预测了五大股指的走势。Zhang等 (2020)[19]提出了两阶段机器学习的方法SVRENANFIS预测股票价格,将深圳交易所的4只股票预测比较后,发现他们提出的两阶段机器学习的方法比单一的ENANFIS预测精度要有所提高。Tsai和 Wang (2009)[20]试图通过使用由决策树和人工神经网络组成的集成学习来预测股票价格,他们提出的DT+ANN模型在台湾市场预测的F-score的表现为77%,比单算法的F-score分数表现高出 11%。 Huang 等 (2008)[21]将 Wrapper与SVM、KNN、BP神经网络、决策树、Logistic回归等模型应用到韩国和台湾股市预测并进行了比较,虽然他们发现Wrapper方法在这两个市场中是最好的,但其他算法在预测中也发挥了重要作用,平均准确率为67.83%。

除了神经网络模型外,二分类的机器学习模型在金融市场中的预测能力也被大量学者证明,这些分类模型在对股价未来的上涨和下跌中的预测效果同样出色。与其他模型类似,这些模型也参考了股票的历史信息,以及上市公司的基本面情况,通过影响股价的变量和收益率进行模型的训练并预测股票未来的上涨和下跌,发现二分类模型对股价未来涨跌预测能力较强。如Oztekin等(2016)[22]证明支持向量机(SVM)即使在样本外性能上也具有显著的预测能力,通过SVM模型、MLP-based神经网络模型和自适应神经模糊推理系统(简称ANFIS)这3个模型预测能力的比较,发现三者平均准确率分别为0.72、0.6和0.52,其中SVM表现最好。Kim (2003)[23]用韩国股票市场的每日时间序列训练SVM模型,该模型的命中率约为 56%。 Huang等 (2005)[24]尝试使用支持向量机(SVM)来预测日本日经225指数的周走势。结果表明支持向量机和支持向量机的组合模型能分别达到73%和75%的命中率。

机器学习除了被用在股票的预测中,近年来也被运用到投资组合策略的研究中,如Leippold等 (2021)[25]利用各种机器学习算法建立和分析了一套综合的收益预测因子,从而为中国股票市场资产定价经验的文献增添了新的内容。他们发现散户投资者的主导地位对短期可预测性有积极影响,尤其是对小型股票。

这些研究表明,机器学习对股票收益率时间序列的预测有显著的效果。不同于前人以预测精度为主的研究,本文对中国股票市场所有的股票进行了预测,并形成有效的投资组合以探索机器学习算法在中国股票市场投资组合的有效性,同时,本文还重点挖掘噪声交易是否对中国市场的股价影响较大。

2 模型介绍

本文基于前人的研究结合市面上较为广泛的使用方法,引入了8个机器学习模型,这些模型包括了正则化线性模型、树分类模型和深度学习模型,分别是:贝叶斯回归(Bayesian Regression)、岭回归(Ridge Regression)、随机梯度下降回归(SGD)、 决策树(Decision Tree)、梯度提升回归(GBR)、支持向量机(SVR)、随机森林(Random Forests)、 多层感知器(MLP)。

决策树模型通常用来解决复杂的决策问题,对于数据维度较高,无法用普通的逻辑回归模型分类尤为有效。决策树模型通过其复杂的树分类节点,对各个父节点到子节点的数据进行有效的特征分类从而达到最优的决策结果。决策树根据其属性划分的不同和内部节点的划分不同可分为CLS、ID3、C4.5和CART等算法。

Breiman (2001)[26]提出了随机森林算法(Random Forests),采用Bootstrap方法反复采样。从原始训练样本集N中随机选取N个样本,反复重新定位生成一个新的训练样本集,然后根据自助样本集生成N棵分类树,形成一个随机森林。新数据的分类结果由分类树中的投票数决定。本质上是一种决策树算法的改进,它结合了多棵决策树。单个树的分类能力可能较小,但随机生成大量决策树后,测试样本可以通过每棵树的分类结果统计选择最可能的分类。

支持向量回归(SVR)是预测金融时间序列的一种有效方法,因为它使用了由经验误差组成的风险函数和由结构风险最小化原理推导出的正则化项。它对于高维数据具有一定的优势。(1)即使数据是巨大的、高维的,它仍然有效;(2)决策函数中使用的训练样本具有一定的记忆效应;(3)它有许多用于不同目的的内核。然而,在某些情况下,网络也有一些缺点。如不同的核和参数可能导致过拟合。当数据集较大时,会增加耗时。

贝叶斯线性回归由 Lindley和 Smith(1972)[27]提出,它的参数被视为随机变量,通过模型参数(权重系数)的先验计算后验。贝叶斯线性回归可以用数值方法求解,在一定条件下,可以得到其解析形式或相关统计量的后验。

岭回归通过对系数大小施加惩罚来解决普通最小二乘的一些问题。但由于惩罚项的增加,也使回归系数β的估计不再是无偏的。岭回归是一种解决病态矩阵问题的回归方法,其代价是放弃无偏性,降低精度。

多层感知器(Multi-layer Perception, MLP)从初始的随机权值开始,通过反复更新权值来最小化损失函数。在计算损失之后,向后传递将其从输出层传播到前面的层,为每个权值的参数提供一个更新值,以减少损失。通过选择不同的迭代步长和学习率,不断迭代和学习,当下降步数达到预设的最大迭代次数时,算法停止,或者当损失函数的改善低于一个设定的数值时,迭代停止。

梯度提升回归(GBR)实际是一种集成的算法,它的本质是集合一堆表现较差的模型,通过集合的方法把各自的模型最优性能发挥出来。它集合梯度提升和自抽样的方式对原始数据进行回归,通过自抽样的方式能获取样本内不同抽样样本的回归参数,综合比较得到最优的参数估计。

随机梯度下降(SGD)是一种简单但非常有效的方法,用以拟合线性分类器和回归器下的凸损失函数,如 (线性)支持向量机和Logistic回归。当样本数量(和特征数量)非常大时,它的优势就特别突出,它不像别的算法采用逐步下降的方式寻求最小损失函数,而是采用梯度下降的方法,由于梯度下降跨度较大,它有可能会错失局部最优或者全局最优解,但大大减少了模型的训练时间。

3 数据、变量选择和预测误差

3.1 数据

本文的样本涵盖了上交所和深交所的全部A股,样本数据范围为2000年1月至2020年6月(数据来自WIND数据)。为了计算移动平均线指标,本文设定24个月为最长滞后期。因此,本文的实际开始日期是2002年。2002年中国的上市公司总数约为1280家,除去新上市的公司还能保证每个投资组合至少有100只股票,满足了投资组合多样化的要求。考虑到A股市场的涨跌停限制,本文在构建投资组合前排除任何上市时间不足6个月的公司,以避免新上市公司股价出现异常波动。此外,考虑到A股市场可能因并购重组而停牌,本文也排除了1年内交易天数少于120天或1个月交易天数少于15天的公司。这些并购重组对股票的瞬时价格影响很大,不能真实反映股票的内在价值,所以剔除了这些股票。

3.2 变量选择

根据中国股市的特点与前人研究,本文重点研究动量、反转、情绪和趋势跟随等噪声交易指标,透过对这些指标的研究去探索非理性交易者所关注的交易行为是否对中国股市有较深的影响,同时,本文根据过往的研究,总结大部分国内外现有的文献,选取了对价格预测有所影响的指标,并将这些指标运用到各个机器学习的模型中,旨在探索这些交易指标对股票风险溢价预测的重要程度。这些指标分别是:流通市值、盈利市值比、现金流市值比、账面市值比、异质性波动率、20/240日平均换手率、ROE、当日收盘价/1个月收盘价、 20 天累计收益率、 3/9/12/18/24 移动平均线、3/6/12累计收益率、1个月内最大收益率、20天平均换手率/240天平均换手率。

3.3 预测误差

预测精度的衡量方法有很多,其中大部分都是相似的,检验的主要目的是检验预测数据与真实数据之间的差异,本文采用MSE、R2、MAE、Thile U和RMSE这5个方法对各个模型预测精度进行对比:

在方程(1)~(5)中,是预测数据,yt是真实的数据,n代表预测时期数。RMSE的显著特点是对误差项进行了标准化,便于不同尺度变量之间的比较。MSE则是直接反应预测值与真实值之间的差距。式 (1)~(4)作为真实值与估计值之间的偏差度量,预测误差值越小越好。而R2主要衡量预测值占真实值的比率,它的值越大则模型表现越好。

4 实证分析

4.1 指标的统计性描述

从各个指标的描述性统计来看,在每个形成期中,按照上述筛选条件剔除样本,最后共计样本349748个。其中,Rt是所有股票的月度收益,它的均值为0.012,最大值和最小值分别为-0.78和22.053,由于本文包含了小盘股、ST股,这些股票的投机性强,加上并购、重组等利好消息会造成这些股票收益较高,而对于一些即将退市股票,可能存在着挤兑效应使得个别股票的月均收益较低,因此股票收益的范围较宽。与Liu等(2019)[13]的研究一致,文中选用流通市值作为规模因子,其对数取值范围为8.328~19.122,均值为12.993。由于篇幅所限,不在此呈现。

4.2 模型的预测误差

在检验各个模型对收益率的预测中,本文进行了Horse Racing的模型比较方式,采用RMSE、Thile U、MSE、MAE和R2来分别检验各个模型样本外的预测精度。与大部分研究不同,本文注重模型的现实预测,而非仅为了建模预测数据,因此,在模型的解释变量和被解释变量中,滞后了1期解释变量。具体地,将T期的各个股票收益率作为被解释变量,将上述所选取的第T-1期的指标作为解释变量,将解释变量作标准化处理后与被解释变量进行模型训练,并估计模型的超参数。最后,将T的变量输入模型预测T+1期的收益率,这样做的目的是为了保持与现实投资的一致性。本文将采取滚动1期的预测方式,预测每一期的收益率,最后通过上述几个预测误差测量方式来衡量这些模型的优劣。结果如表1所示。

表1 各模型的预测误差

表1展示了各个模型的预测能力,从表中的8个模型的预测误差可以看出,MLP表现最佳,其RMSE、Thile U、MSE、MAE最低,分别是0.711、0.571、0.682、0.394,而其R2最高,达0.684。而表现最差的是Decision Tree,其RMSE、MSE和MAE最高,分别为1.003、1.366和0.532,而其R2最低,为-0.607。其他模型中,传统的机器学习模型表现较好,其中RF、Tree和SVM的RMSE、Thile U、MSE、MAE、R2的平均值为0.815、0.584、0.927、0.440和-0.088。而线性模型GBR、Bayesian、Ridge和SGD回归的RMSE、Thile U、MSE、MAE、R2的平均值为0.728、0.585、0.714、0.407和0.157。从预测误差的综合表现能力来看,线性模型比机器学习表现更优,但略差于深度学习模型。从预测结果来看,机器学习的横截面预测对股票未来收益有一定的预测作用,深度学习的预测能力更优。

4.3 各个预测指标的表现

由于影响股价收益率的因素很多,本文根据前人研究,选取了20个指标对股价未来收益率进行预测,通过滚动训练模型245次后将每次变量指标的重要性记录,最后取平均值作为每个指标的单个重要度量受篇幅所限,不在此处展示。

从结果来看,MA3和MA12对线性模型的贡献度较高,其中,它对Bayesian和Ridge模型的平均贡献度分别为2.132、1.255和1.366、0.371,这说明这个指标在预测中的作用较大。此外EP和MOM12对线性模型训练的贡献度也较高。相反的,Reversal的反向影响程度较高,它在Bayesian和Ridge模型的平均贡献度为-2.19和-1.659。从上述的结果反映来看,价值面指标、动量以及趋势指标对股票收益率的预测起着较大的作用,这些指标比较符合中国市场散户的交易逻辑,因此,这些指标对股价未来的走势影响较大。

4.4 机器学习投资组合收益

4.4.1 多空投资组合

上述结果可以发现,机器学习模型对中国市场的股票收益率有一定的预测能力。为了进一步探究机器学习预测的量化投资能力,本文分别将预测的收益率进行分组投资。具体而言,本文将8个模型的预测收益率和这些预测收益率的平均值(Avg.Predict)按照从小到大排序并平均分成10等分P1,P2,…,P10,最后求出卖出最低1等分、买入最高1等分以及构建零成本的多空组合策略平均收益。同时,为了获取经风险因子调整后的超额收益,本文引入了Fama-French的五因子模型(FF5)和L-S-Y的四因子模型(CH4)对组合收益进行回归,结果如下:

由于篇幅所限,结果不予展示,从模型的表现来看,Bayesian和Ridge的表现最好,其买入10等分的组合收益率分别为1.875(2.883)和1.837(2.830)。同样,经过FF5和CH4调整后的收益也是最高,Bayesian为 0.771(3.350)和 1.135(4.554), Ridge为 0.771(3.525)和 1.098(4.528)。SGD模型表现最劣,其组合平均收益率仅有1.432。从多空投资策略的组合收益来看,Bayesian和Ridge表现效果依旧最佳,其多空组合的平均收益为0.842和0.789。经过FF5和CH4调整后的收益也达到0.859、0.890和0.858、0.774。为了研究机器学习策略的整体表现,本文还加入了AVG.Predict,这个指标是将所有模型的预测收益率平均后再进行投资组合策略构建。从AVG.Predict的结果来看,它的表现能力处于平均水平,纯多头组合仅有1.541的平均收益率,而多空组合的平均收益率也仅有0.430。

从预测结果分组来看,正则化的线性模型对预测分组效果最好,其收益率最高,传统的机器学习,如Decision Tree、Random Forests和SVM的效果均不如线性模型,做多10等分投资组合的平均收益为1.514,而线性模型的平均收益为1.667。同样,构建多空组合的投资平均收益,机器学习也仅为0.379,而线性模型为0.682。为了直观地了解各个模型的表现情况,本文绘制了买入10等分的组合累计收益图,如图1所示。

图1 做多10等分投资组合的累计收益

从各个模型的累计收益图来看,Bayesian、Ridge和MPL表现最佳,其买入10等分的近20年累计收益达400%左右,其余模型表现次之,累计收益均在350%左右。这些模型的预测组合收益与沪深300走势相似,如2002~2005年,市场有一段缓慢的调整周期,模型的收益率也缓慢向下,同样,2008年金融危机和2016年的股市回调也与市场走势一致。但策略组合获取比上证指数更高的超额收益,这说明机器学习预测在中国市场有显著的效果。为了研究机器学习预测组合多空策略能否抵御市场频繁波动所带来的风险,本文构建多空交易策略并求取其累计收益,其累计收益图如图2所示。

图2 多空投资组合的累计收益

从多空组合的累计收益图来看,Bayesian、Ridge和MPL依旧表现最佳,虽然其多空组合的累计收益不如纯多头的累计收益高,但其风险相对的也有所降低。如从图中可以看出各个模型纯多头组合收益在2002~2005年之间的回撤将近80%,而多空组合的回撤在0~20%的区间。同样,在2008~2009年区间,纯多头组合回撤超过100%,而多空组合的回撤均在0~50%之间。因此,多空头组合收益能有效地降低风险,但其收益也随之下降。

表2 多头组合以及多空组合的策略表现

从表中可以看出,只做多(Long)的机器学习策略要略优于多空组合(Long-Short)的策略,由于纯多头策略收益率较高,尽管其风险较大(标准差较大),也能取得比多空组合高的Sharpe、Calmar、Omega和Sortino比率。从做多组合表现来看,Bayesian模型依旧表现最优,其Sharpe、Calmar、Omega和Sortino比率分别为1.909、0.280、1.021和1.200,年化收益也高达18.5%,但其风险也是最高的,标准差高达9.7%。Ridge和MLP模型表现次之,这两个模型的预测收益组合的Sharpe Ratio也高达1.8以上。从多空组合策略来看,由于该策略存在对冲机制,它将预测收益较差的股票组合进行卖出,这能大大降低这些股票所带来的下行风险。因此,在对冲掉风险后,多空组合的收益率的风险较低,其标准差为纯多头组合的一半。同样,从结果来看,Baysian和Ridge回归的表现依旧最佳。这说明这两个模型对股票收益率的预测能力较强,无论是预测强势的股票,还是弱势的股票,其预测收益组合成的股票组合都能取得较高的收益率。从其他比率来看,也是Baysian、Ridge和MLP这3个模型表现较优,这也印证了这几个模型组合策略在取得较高收益率的同时,风险也相对较低。

4.4.2 稳健性:剔除小市值股票的组合收益

Liu等 (2019)[13]研究发现, 中国市场的小市值股票具有 “壳效应”,即这部分股票的股价可以通过兼并重组、市值管理等手段进行操控,因此,这部分的股票很难被基本面因素所捕获。他们将这部分股票剔除。作为稳健性检验,本文根据他们的做法剔除了底部30%市值的股票,重复上述方法来验证机器学习模型的稳健性。这种做法主要有3个原因: (1)在中国股市中,小型股以其高波动性而闻名,这使得模型预测难度提高;(2)底部30%的股票存在 “壳效应”问题,更多的是暗箱操作,它们很难用市场指标进行模型拟合;(3)一般来说,大型股票的流动性水平较高,价格波动性较低,因此,这些股票受中国10%日限价的影响较小。综上,本文去掉了底部30%的股票,并求取多头和多空组合的各项比率。

从结果来看,基于前70%的大型股票的机器学习投资组合的表现在其结果上与全样本相似。然而,由于剔除了波动较大的小型股票,所有模型的投资组合都获得了较低的平均月收益、夏普比率、标准差和年化收益。但是,机器学习算法的预测组合收益比沪深300的收益更高。其中,深度网络组合收益表现最好,其次是正则线性模型和树模型。这些模型的做多收益和多空组合的收益最高,因此,稳健性检验结果也证实了机器学习方法在中国股市具有出色的预测能力。

5 结论和启示

5.1 主要结论

本文引入经典的机器学习模型探索中国股票市场中价值、动量、反转和趋势跟随等因素与股票未来收益率的关系。研究结果发现:(1)股票历史信息对其未来的收益率有一定的预测能力;(2)本文发现动量、反转和趋势跟随等因素对股票未来收益率影响较大,而这些指标往往是散户交易者的 “羊群效应”、反应不足和反应过度所造成的,这说明了中国市场的散户投资者对市场的影响较大;(3)通过对比全样本数据和剔除底部30%的样本数据的投资组合后发现,小市值的股票更具有预测性,加入了小市值股票的全样本收益要比剔除这些样本的预测收益要高。虽然2019年底之后受到新冠肺炎疫情的影响,但研究结果依旧稳健,所构建的机器学习量化策略在2020年取得较高正收益,这说明了所选因子的有效性。

5.2 启示和建议

(1)对于政策制定者和监管者来说,要充分认识到股票确实存在非理性因素,进而针对不同情况采取合适的措施防止这些非理性因素累积而形成的市场泡沫,如逐步放开卖空限制来增加投资者的对冲能力,增加投资者投资教育水平。

(2)完善中国投资者的教育制度,强化投资者的价值投资观念对中国股票市场的稳定发展起重要作用。散户投资者以短期动量、趋势和反转投机为主,频繁地交易使得市场流动性风险加剧,造成市场的剧烈波动。若投资者能以价值投资为导向,减少股票还手,能降低市场波动。

(3)对于散户交易者而言,小盘股投机性更强,收益更高,但风险更大。应逐步完善退市制度,使得小市值公司和个人投资者利益均能得到保护。完善的退市制度能促进中小市值公司逐步、有序地放开融券质押业务,能刺激市场的良性竞争,促进中小上市公司的发展,以及稳定金融市场。

注释:

①据Wind数据库显示,截至2020年10月,中国散户交易者的交易量约占整个市场的80%。同时,根据2019《上海证券交易所统计年鉴》,在中国市场约有2.14亿的投资者,个人投资者约为2.13亿,而机构投资者仅为0.7亿,个人投资者占整个市场的比例高达99.8%。

猜你喜欢
股票收益率收益
螃蟹爬上“网” 收益落进兜
怎么设定你的年化收益目标
2016年10月债券平均久期、凸性及到期收益率
2016年10月底中短期票据与央票收益率点差图
本周创出今年以来新高的股票
本周创出今年以来新高的股票
2016年9月底中短期票据与央票收益率点差图
2016年9月债券平均久期、凸性及到期收益率
本周连续上涨3天以上的股票
近期连续涨、跌3天以上的股票