投资者情绪对股票收益波动率的影响探究
——基于GARCH-MIDAS混频模型

2022-01-23 15:22梁一铭上海大学
环球市场 2021年36期
关键词:上证综指成指股指

梁一铭 上海大学

一、引言

股票市场是各国资本市场中最为重要的领域之一,既是主要的融资场所,也是投资者们最常见的投资渠道,股票波动率的影响因素探究是多数金融学者关心的主题。资本资产定价模型中认为,波动越大的股票会带来越多的收益,同时投资者承担的风险也越大,所以大幅的波动所蕴含的高风险是投资者必须重视的,因此研究股票市场波动非常有必要。

当今大部分主流金融学理论假定投资者是理性的,不会因为投资者的情绪波动而影响到股市。然而从现实角度来看,投资者在行动过程中并非完全理性。信息获取成本高、信息不对称等现实状况都表明,市场大多数时候并不是有效的。投资者在制定策略并执行的过程中,很难保持理性,经常伴随着投机与冲动的心态,表现出非理性的特征,从而影响投资者具体行为,造成金融异象。所以,很多理论在现实的投资决策中不能得到很好的解释,市场波动性之谜等市场异象挑战着传统理论。

我国股市波动大、行情交替频繁,市场表现出非理性特点,这些现象是否由投资者情绪所驱动,是针对我国市场进行研究的意义所在。随着我国经济的不断发展,股票的市场环境在不断演变。早期对投资者情绪与股票波动率相关性的研究结论对新市场环境的参考价值逐渐降低,应当根据新模型和新数据进行更多检验与补充。因此,本文尝试从行为金融学的视角出发,对投资者情绪与我国股票市场收益率之间的相关性进行研究。加强对投资者情绪的研究,有助于股票市场参与者更好地了解市场价格行为,进行高效率的投资、融资活动,也在政府调控的宏观层面都具有一定的指导意义。

迄今为止,国内国外很多学者都研究了投资者情绪与股票市场波动之间的相关性,Lee等(2002)发现情绪是影响股市的一个因子,且两者之间呈正向的相关性[1]。Bohl等(2009)采用GARCH和马尔可夫机制转换模型研究发现短期内机构投资者的投资决策对股票波动率产生影响[2]。张宗新和王海亮(2013)利用主成分分析法构建投资者情绪综合指标,研究发现情绪对股票收益率和波动率均存在显著的正面冲击,投资者情绪高涨会推动股票收益波动率的加大[3]。叶皓珏和金辉(2020)以我国A股市场为样本,选取2010年至2019年的样本区间,运用VAR模型实证分析投资者情绪对股票收益的影响,研究表明,投资者情绪对股票市场收益没有显著性影响[4]。

本文采用的GARCH-MIDAS混频模型起源于Ghysels等(2004)提出的MIDAS模型,能够将高频的自变量与低频的因变量结合建立回归模型[5]。在此之后,Engle等(2013)将MIDAS引入自回归条件异方差模型,提出了GARCH-MIDAS模型,将股票价格波动分解为长期成分和短期成分,用通货膨胀和工业生产增长驱动的长期成分来建立模型探讨股市波动性与宏观经济活动之间的关系[6]。Asgharian等(2013)证明了该模型可以有效预测股票收益的短期和长期成分[7]。除此之外,也有学者将该模型用到非股市的价格波动上,尹力博和李勍(2017)用GARCH-MIDAS模型研究了投资者的关注行为对人民币在岸与离岸汇率价差变化的影响[8]。可以发现,大多数采用GARCHMIDAS模型进行研究的文献都关注了宏观经济与股票波动之间的相关性,仅有少部分学者将该模型用于行为金融类的研究。

本文的研究内容是投资者情绪与我国股票市场波动率的相关性分析,采用沪深300指数、深证成指和上证综指代表我国股票市场,选取三个股指于2006年1月至2021年2月的日收盘价构建对数收益率序列,投资者情绪采用2006年1月至2021年2月的CICSI指数。股票日收盘价数据来自WIND数据库,CICSI指数来自国泰安数据库。

与现有文献相比本文有研究创新之处,主要体现在两个方面:

第一,在模型的选取方面,本课题采用了GARCH-MIDAS混频模型。投资者情绪指标是月度的,股票数据是日度的,属于不同频数据,而混频模型可以将股票波动分解为高频部分与低频部分,避免了样本信息的减少,更好的利用了高频数据的有效性,估计出的结果应该比采用非混频模型做出的结果更精确、解释力度更强。第二,随着时间的推进,我国股市不断发展逐渐趋于成熟,因此本文在进行实证分析时,选用不同股指或不同时间区间的数据得出的结论可能不一致,为了使最终结论更具参考性,本文将股票收益率序列和CICSI指数序列按时间段划分,估计不同股指不同时间区间内的情况,通过比较分析的方法总结归纳最合理的结论。

二、研究方法及模型介绍

投资者情绪指数通常以月度为标准记录数据,用于体现股票波动率的股票价格时间序列往往可以精确到日度甚至每分每秒,这导致了变量数据之间频率的不一致,使用以上同频模型时,往往会损失高频的股票价格时间序列中所蕴含的许多的信息,得出的结果有失精确性。

为了更充分地利用高频数据中的信息,本文将采用GARCH-MIDAS混频模型。高频的股票价格波动可以通过GARCHMIDAS的过程分解为高频部分与低频部分,具体模型如下:

ri,t表示 股票市场在t月 第i天的对数收益率,μ是到t月第i-1天时ri,t的期望值,τt与gi,t的乘积是ri,t的方差,即τt与gi,t的乘积的根号表示波动率,gi,t是波动率的高频组成部分解释了每日波动,是波动率的低频组成部分,且假定在t月里τt是固定的。随机误差项εi,t服从标准正态分布,即表示在t月第i-1天时获得的特定信息集。假设日度波动成分gi,t服从GARCH(1,1),则:

其 中,α与β是GARCH(1,1)过 程中的参数,。

接着将使用MIDAS方法来表示低频成 分τt:,其中,RVt代表在t月已实现的波动率,k为滞后期数,K为低频解释变量的最大滞后阶数。m与θ是常数项,m是截距,θ是斜率,当θ为正时,低频解释变量与τt呈正相关,反之则为负相关。为β权重函数,表示滞后k期的RVt的权重,ω为参数。

本文将股票市场指数的月度长期波动性定义为每日长期成分的月度和,为了解释股票市场收益率的长期波动性,我们使用长期波动性的对数作为因变量来估计回归模型,并加入了因变量的滞后值,以便控制残差的可能自相关。因此,引入外生低频解释变量,那么上式将变形为:

三、实证分析

(一)数据的选取及描述性统计

本文采用沪深300指数、深证成指和上证综指代表我国股票市场,选取三个股指于2006年1月至2021年2月的日收盘价,各3681个观测值作为初始数据,并通过取对数再差分的方法构建其对数收益率序列。投资者情绪指数采用2006年1月至2021年2月的CICSI指数。

表1展示了沪深300、深证成指及上证综指的对数收益率及CICSI指数的波动率的描述性统计结果。结果表明,沪深300、深证成指及上证综指的收益率有一个较长的左拖尾,可能存在较小的极端值,均值会受到影响而偏向左侧。且两端尾部的分布比正态分布厚,收益率出现极端值的概率较大,投资者容易收到大额回报或大额损失,这些都是我国股票市场的概况。

表1 描述性统计

(二)基于全样本的估计结果

在进行了基本的描述性统计后,本文对三组股指与投资者情绪指数进行了GARCH-MIDAS估计。μ、α和β是GARCH过程的参数,θ为外生变量投资者情绪对沪深300、深证成指及上证综指波动率的长期影响。ω为外生变量投资者情绪在混频模型中的权重最优估计系数。

由表2可知,三个股指的GARCH部分的参数μ、α和β都是显著的,α+β均接近于1,说明沪深300、深证成指及上证综指在短期内的波动具有强烈的集聚效应。沪深300对应的θ值在10%的水平下显著为正,说明投资者情绪的高低对沪深300指数的波动有着正向的作用,即投资者情绪的波动越剧烈,沪深300指数的价格波动幅度越大。深证成指对应的θ值不显著,说明投资者情绪的波动变化不会对深证成指价格波动造成影响。上证综指对应的θ值在1%的水平下显著为负,说明投资者情绪的高低对上证综指的波动有着负向的作用,即投资者情绪的波动越剧烈,上证综指的价格波动幅度越小。

表2 基于全样本的估计结果

通过以上分析可以发现,当我们将2006年1月至2021年2月沪深300、深证成指及上证综指的波动率作为被解释变量时,三个股指分别得出了不一致的结论,但三个股指均能代表我国股市的基本情况,如果投资者情绪与我国股票市场波动的相关性是一个恒定的关系,那么理论上三个股指得出的θ应基本一致。所以接下来本文将对基于2006年1月至2021年2月沪深300、深证成指及上证综指的波动率作为被解释变量时,三个股指得出了不一致结论的原因进行探讨。

(三)基于分时段样本的估计结果

经过三个股指的对比分析,可以发现沪深300、深证成指与上证综指所包含的成分股数量与种类均不相同。沪深300指数是沪深证券交易所于2005年4月8日联合发布的反映A股市场整体走势的指数,包含300只在沪市和深市交易的A股;深证成指是深圳证券交易所的主要股指,在2015年5月之前,深证成指仅包含40只在深市交易的A股,而自2015年5月20日 起,为 更好反映深圳市场的结构性特点,深交所对深证成指实施扩容改造,深证成指样本股数量从40只在深市交易的A股扩大到500只在深市交易的A股,以充分反映深圳市场的运行特征;上证综指反映了上海证券交易所上市股票价格的变动情况,其样本股是在上海证券交易所全部上市股票,包括A股和B股,目前大约有1500只左右。基于此,本文提出了猜想1:基于全样本得出的θ的不同可能与股指包含的成分股数量与种类有关。

另外,考虑到表1是采用2006年1月至 2021 年 2 月这16 年的时间区间的数据估计出的结果,时间跨度比较长,我国股票市场在这16年的时间里出现了多次大幅震荡,对应出现了较多的政策调控,因此当使用时间跨度较长的数据进行实证分析时,不同股指的表现可能不同。基于此,本文提出了猜想2:投资者情绪与我国股票市场波动的相关性不是一个恒定的关系,θ的不同可能与时间区间的选取有关。

为了对以上两个猜想得到印证,本文将2006年1月至2021年2月的深证成指、上证综指及CICSI指数以2015年5月为分界线分别划分为两个时间段。选择2015年5月作为分界点的原因包括两点:深证成指成分股的转变发生在2015年5月并且也是我国股灾发生的时间点。选择深证成指与上证综指进行对比分析的原因是深证成指只包含A股且出现了成分股数量的变动,而上证综指既包含A股又包含B股,对比深证成指与上证综指可以更好地分析假设1。

本文对分成了两个时间区间的深证成指和上证综指分别进行共四次的GARCHMIDAS估计,表3第二列和第三列分别记录了当2006年1月至2015年4月深证成指的波动率和2015年6月至2021年2月深证成指的波动率为被解释变量时,各参数的估计结果。在2006年1月至2015年4月时间区间里,深证成指对应的θ值在1%的水平下显著为正,说明在这段时间里投资者情绪的高低对深证成指的波动有着正向的作用,即投资者情绪的波动越剧烈,深证成指的价格波动幅度越大。而在2015年6月至2021年2月时间区间里,深证成指对应的θ值不显著,说明在这段时间里投资者情绪指数波动对深证成指价格波动的低频部分没有显著影响。

表3第四列和第五列分别记录了当2006年1月至2015年4月上证综指的波动率和2015年6月至2021年2月上证综指的波动率为被解释变量时,各参数的估计结果。在2006年1月至2015年4月时间区间里,上证综指对应的θ值在1%的水平下显著为正,说明在这段时间里投资者情绪指数波动对上证综指价格波动的低频部分的影响在1%的水平下显著为正,即投资者情绪的波动越剧烈,上证综指的价格波动幅度越大。而在2015年6月至2021年2月时间区间里,上证综指对应的θ值不显著,说明在这段时间里投资者情绪的波动变化不会对上证综指价格波动造成影响。

表3 分时间段的深证成指及上证综指估计结果

通过上述结果可以发现,在经过时间区间的划分后,在同一时间段内,深证成指与上证综指表现一致,猜想1无法成立,基于全样本得出的θ的不同与股指包含的成分股数量与种类无关;猜想2成立,投资者情绪与我国股票市场波动的相关性不是一个恒定的关系,θ的不同与时间区间的选取有关。根据本文的研究结论和相关的文献可以发现,在2015年之前,我国的股票市场体制发展的不够健全,投资者情绪对股票市场的影响较为明显,而在2015年之后,投资者情绪对股票市场收益没有显著性影响,原因可能在于近年来,随着我国金融业的高速发展,市场投资者的受教育程度及对金融知识的普及度逐步提升,与过去相比,投资者情绪相对变得理性了一些,中国股票市场也在经历了2015年严重的股灾后出台了一系列新政策,逐渐趋于成熟,因此投资者情绪对股票市场的影响渐渐减弱。

四、结语

行为金融放宽了传统金融理论的范围,不再对市场有效和投资者理性做过多的限制,投资者情绪的相关研究一直是行为金融学术界研究的热点。本文通过GARCHMIDAS模型探究了在不同时期我国股票市场波动与投资者情绪的相关性。本文的研究结论有以下三点:

第一,沪深300、深证成指和上证综指的收益率具有尖峰厚尾、集聚性和波动持续性等特点,即股指的收益率容易出现极端值,且当股票收益率受到影响出现了高波动率时,这种波动会持续较久,造成股指的高波动率和低波动率分别集聚在某一时段的情况。第二,2006年1月至2021年2月的样本GARCH-MIDAS结果表明,投资者情绪与我国股票市场波动的相关性不是一个恒定的关系。第三,通过对时间划分后的深证成指与上证综指分别进行GARCH-MIDAS估计后,本文发现,在2006年1月至2015年4月时间区间里,投资者情绪的波动越剧烈,深证成指和上证综指的价格波动幅度越大。而在2015年6月至2021年2月时间区间里,投资者情绪的波动变化不会对深证成指和上证综指的价格波动造成影响。样本股指包含的成分股数量与种类不影响投资者情绪与我国股票市场波动的相关关系;在不同的时间区间里投资者情绪与我国股票市场波动的相关关系会发生变化。

因此,基于本文的研究可以认为,在进行投资组合并关注投资组合的收益波动时,投资者可以无需特别关注投资情绪的变化,还是应该将更多的关注放在外部市场环境及政策的变化上。

猜你喜欢
上证综指成指股指
华夏战略新兴成指ETF剑指“风口”布局未来
平安千亿回购 股指触底回升
股指再度回落 机构逢高减仓
降杠杆引发股指冲高回落
股指震荡走高筑底之日可期
全球主要指数走势点评
全球主要指数走势点评
深证成指
上证综指
上证综指