中国股市投资者情绪指数构建与有效性检验

2016-10-21 15:14蔡志刚赖明明
金融发展研究 2016年7期
关键词:投资者情绪卡尔曼滤波

蔡志刚 赖明明

摘 要:本文使用了三种不同的数据降维方法——主成分、卡尔曼滤波和拉普拉斯特征映射,选取了城镇居民投资意愿、IPO首日收益率、对数开户比和流通市值加权换手率,建立了三3个从1999年至2015年跨度17年的测度中国股票市场投资者情绪的月度复合指数。同时,基于“孪生股票”现象,使用AH股溢价指数对三个情绪指数进行了有效性检验。结果发现,基于卡尔曼滤波方法的情绪指数最为有效,基于主成分方法的情绪指数次之,而基于拉普拉斯特征映射的情绪指数没有达到实证研究的有效性要求。

关键词:投资者情绪;卡尔曼滤波;拉普拉斯特征映射;有效性检验

中图分类号:F830.91 文献标识码:A 文章编号:1674-2265(2016)07-0024-07

一、引言

行为金融学认为,投资者的认知偏差、投资行为的模仿学习和市场套利的有限性都会使投资人受到某些心理情绪因素的影响做出错误的投资行为,资产价格随之长期偏离其价值,投资者情绪成为影响资产价格的系统性因子。贝克和沃格勒(Baker和Wurgler,2007)指出,投资者情绪是一种不能被已有事实所证实的关于金融资产未来现金流和风险的信念,它是投资者的认知偏误在资本市场上的总体表现。通过对投资者情绪的研究,可以揭示有限理性的投资者是如何长期影响市场的。

投资者情绪的实证研究首先需要解决的是如何对其进行测量的问题。已有研究中有选择主观调查数据来度量投资者对市场预期的总体判断的;有选择市场客观指标来度量总体投资者错误定价程度的;还有通过对财经杂志或网络信息分析,测量投资者对市场的情绪态度的。这些都属于单一情绪指标的范畴。布朗和克利夫(Brown和Cliff,2004)提出,可以将暗藏在多个情绪相关变量中的共同因素提取出来,形成一个复合的指标,更加精确地测量投资者情绪。因为,单一指标既含有投资者情绪因素,也含有其他的干扰因素,如果能够有效地剔除干扰因素、保留共同因素,复合指标对情绪的测量会更准确。

本文从复合指标的角度来构建中国股市的投资者情绪指数。构建复合指数本质上是一个数据降维过程,现有的研究绝大部分都采用主成分分析的方法。不同的数据降维方法是否会对测量结果产生不同的影响?已有文献中并没有回答这个问题。本文使用三种不同的数据降维方法——主成分、卡尔曼滤波和拉普拉斯特征映射(LE)来比较情绪因素的提取测量效果。

投资者情绪研究中的另一个现象是在情绪与市场的相互作用实证研究结果上,已有文献存在较大分歧。有的研究认为,情绪对市场有显著影响;另有一些研究持不同的观点。易志高和茅宁(2009)指出上述现象的一种解释是不同的研究采用的情绪指數测量方法不同。特别是,复合指标中采用的原始情绪相关变量中含有的干扰因素太多,就会造成最主要的共同因素已经不是研究所需要的情绪因素,复合指标的可靠性受到质疑。解决这个问题的思路,一是要细致选择原始情绪变量,确保与情绪紧密相关;二是需要一种检验复合投资者情绪指标可靠性的方法,确认对情绪测量的准确性。前者需要在对已有实证研究结果进行比较的基础上,对中国股市特征进行分析来获得。“孪生股票”现象为后者提供了一种检验思路。贝克等(Baker等,2012)指出投资者情绪是造成“孪生股票”现象——价值相同的资产在不同市场定价不同——的一个重要原因,一个准确测量的投资者情绪指数应该能够显著影响资产价差。本文首次对构建的多个中国股市情绪指数进行了严格的有效性检验比较。

二、文献综述与评论

投资者情绪的测量是情绪实证研究中最基础的问题。研究中有单一指数和复合指数两类划分。单一指数是复合指数构建的基础成分,在不同的研究中使用灵活;复合指数有理论上的优势,如果构建的方法得当,可以获得更精确的情绪测量。

(一)单一情绪指数

单一情绪指数包括:直接调查数据、间接的市场变量和文本信息挖掘变量。

1. 直接调查数据:这一类指标主要通过直接询问投资者对未来市场看涨看跌的态度,或者对未来的投资信心来了解总体上投资者对市场预期的看法。国外研究中多使用:美国投资者协会指数、投资者智能指数、华尔街战略家指数、瑞银/盖乐普指数、希勒股票市场信心指数和消费者信心指数;国内研究中多使用:央视机构看市、央视个人看市、好淡指数、华鼎多空民意调查、巨潮投资者信心指数、中国人民银行城镇居民投资意愿调查、消费者信心指数。

直接调查数据可以获得可持续、可比较和具有一定独立性的投资者情绪时间序列,但缺点在于:其一,一般这类数据的调查样本都不大,甚至很多调查没有披露抽样方法和样本量,代表性上存在疑问;其二,卡托纳(Katona,1975)指出被调查者往往有选择使自己满意答案的倾向,他们的回复不一定等同于他们的真实想法或状态;其三,很多调查对投资者情绪只有定性的划分,没有定量的描述。

2. 间接的市场变量:这一类指标主要是寻找能够代表投资者预期或者投资行为的证券市场变量,主要有:市场流动性指标、IPO指标、衍生品市场指标、基金流量指标、资产价格和市场绩效指标。

这是现有研究中最为重要、使用最多的一类变量。但应该注意到,不同国家、不同的市场机制、不同的投资者理性程度,都会使变量的效果产生差异。更严重的问题是,大量文献是研究投资者情绪对市场的影响,而在选择的代理变量时,实际上就已经假设该变量是与情绪相关的,即也是受到了情绪的影响,而不同的研究选择不同的代理变量,在某个研究中的情绪代理变量——自变量,也许就是另一个研究中的因变量。例如,波尔克和萨皮恩扎(Polk和Sapienza,2009)将市场对公司股票的错误定价作为投资者情绪的代理变量,而斯坦博(Stambaugh等,2012)使用BW指数研究情绪对一大类包含股票错误定价的金融异象的影响。这种现象使得联合假设的问题更严重,这也是催生复合指标的一个重要原因。

3. 文本信息挖掘变量:这一类数据主要是通过对杂志、网络搜索和网络讨论等文本信息进行分析,运用人工或者计算机自动识别的方法,将各种信息按照情绪的不同分类进行统计,测量投资者对市场或者个别股票的情绪。达(Da,2011)和泰特洛克(Tetlock,2007)分别使用股票在Google上的搜索量和机器学习方法分析了华尔街杂志上报道信息的态度。汪昌云和武佳薇(2015)分析了IPO公司上市前在中国主流财经报道中正负面词汇数,来测量同期市场的情绪。近期对这一类变量的研究不断增多,说明其具有一定的優势。其一,情绪相关的网络文本信息数量巨大。情绪是基于个体感受产生的,微信、微博和Twitter这类个性化的信息源是获取个体情绪的理想渠道。其二,当前投资者中使用网络工具进行股票交易的占到了相当比例,而且大多数是中小投资者,这些投资者会在互联网上搜索、发表相关信息,这些信息具有代表性。其三,随着互联网的不断发展,情绪信息的数据量越来越巨大并且很多都是实时信息,依靠传统的人工辨识分类的方式已经无法处理如此海量的信息,但自然语言理解和情感计算等相关技术可以大大提高数据采集分析的效率。其四,网络信息的实时性有助于建立高频情绪变量。

(二)复合情绪指数

布朗和克利夫(Brown和Cliff,2004)对流行的一些投资者情绪指数进行了分类,采用主成分和卡尔曼滤波两种方法从多个单一投资者情绪变量中提取出一个共同的成分——纯粹的投资者情绪。这种复合指标的方法从理论上更合理,因为研究者很难从单一指数的测量中分离出情绪成分和干扰误差成分。这种方法在后续情绪研究中广泛采用,最著名的情绪指数就是贝克和沃格勒(Baker和Wurgler,2006)提出的BW指数。他们利用主成分分析法,通过6个市场变量合成了BW情绪指数,证实了情绪能够反向预测那些小市值、新上市、高波动、可预测性差、不分红、高度成长性、破产概率较高的股票的收益。后续对美国市场的情绪研究很多都基于他们的研究成果或将BW指数作为标杆进行对比研究。

复合指数也存在缺点:(1)研究中一定要确保情绪成分在构成复合指标的源指标中一定是占优的,否则提取出来的共同成分可能就会偏离很远;(2)现有研究中复合指标投资者情绪主要代表的是市场的总体情绪,而一些特定群体——机构投资者或个体投资者的情绪复合指数的构造比较困难。

三、研究设计

(一)投资者情绪指数源变量的选取

基于上述分析,本文在构建中国股票市场投资者情绪指数时选取了城镇居民投资意愿、月度 IPO 首日收益率、对数开户比和月度流通市值加权换手率四个指标作为构建复合情绪指标的源指标。样本期从1999年1月至2015年12月,共204期,表1中列出了4个指标说明,表2中给出了4个指标的描述统计量。

由于IPO 发行的中断,204期中有40个月IPO数据缺失,本文采用与伍燕然等(2012)相同的方法,用其余情绪代理变量作为因变量,IPO月平均收益作为自变量来建立线性回归模型,用缺失月份的预测值来替代缺失值。

(二)合成复合情绪指数的方法

本文采用了三种方法来合成复合情绪指数:主成分分析、卡尔曼滤波和拉普拉斯特征映射(Laplacian Eigenmaps,以下简称LE)。这三种方法都保证降维后的数据最大限度地反映原始数据的特征,但每个方法的解释角度不同。

1. 主成分分析。主成分分析是数据降维中使用频率最高的方法。主成分分析的思想是在减少数据维数的同时保持数据中对方差解释能力最大的特征。主成分分析本质上是一个正交化线性变换,把数据变换到一个新的坐标系统中,使得这一数据的任何投影的第一大方差在第一个坐标上,称为第一主成分,第二大方差在第二个坐标上,称为第二主成分,依次类推。

如果在情绪源变量中,投资者情绪所占的方差解释比率最大,那么第一主成分就是对投资者情绪的一个良好的估计量。

2.卡尔曼滤波。卡尔曼滤波能够从一系列的不完全及包含噪声的测量中,估计动态系统中不可直接观测的状态,它在经济分析中的一个重要作用是对状态空间模型的推断。一个典型的时间序列的线性状态空间模型由“量测方程”式(1)和“状态方程”式(2)共同组成:

其中,表示样本长度,是可观测的包含k个经济变量的维向量,是不可观测的维状态变量,服从一阶马尔科夫过程,,,,和都为待估参数,在所有时间区间上扰动项和相互独立,且都与初始状态无关。

在扰动项与以及初始状态向量正态假设下,卡尔曼滤波方法给出状态向量在最小均方误差意义下的一个最优预测。卡尔曼滤波在宏观经济的研究中比较常见,而投资者情绪作为一种不可直接观测的变量也适用该种建模方法。

3. 拉普拉斯特征映射。贝尔金和尼若吉(Belkin和Niyogi,2002)提出了一种基于数据几何性质的降维方法——LE方法。该方法将每一个样本视为高维空间中的一个点,样本点之间通过空间上距离的远近构成相互关系。数据降维的过程就是将高维空间中的点投射到低维空间上来,保证在原有空间中距离接近的点在低维空间中也接近,该方法反映出数据内在的流形结构。

LE首先要构建相邻关系图,定义样本数据之间的相邻矩阵W,W代表了数据流形的局部结构特征。如果两个样本点和很相似,即两点在原空间中距离接近,那么和在降维后目标子空间中应该尽量接近。设样本点的数目为n,目标子空间的维度为m。定义大小的矩阵Y,其中每一个行向量就是样本点在目标m维子空间中的向量表示,LE需要优化的目标函数为:

(二)情绪指数的有效性检验

随着对投资者情绪的研究越来越丰富,一个现实的问题摆在了研究者面前:实证中使用的投资者情绪指数是否是真实有效的?哪一个指数更能反映投资者情绪的变化?本文尝试从定性与定量两个角度来进行投资者情绪指数的有效性验证。

1. 定性的有效性检验。贝克和沃格勒(2007)指出,如果一个投资者情绪指数是有效的,它应该能够直观地反映资本市场的波动变化,即情绪的高低与牛熊市能够同步。在本文研究的样本期中,中国股市出现的三轮大牛市,一是1999—2001年以网络股为代表的一轮暴涨,网络概念股的强劲喷发推动沪指创下2245点的当时历史最高点;二是2005年开始,以股权分置改革启动为起点,以6124点历史高点为标志的阶段;三是2014年初至2015年6月,号称“改革牛”的一轮暴涨。这三轮牛市之间都是一些小幅波动的行情。从图1中不难发现3个情绪指数都能够捕获到这几次资本市场的波动变化,3个波峰都能够与之匹配。由于4个源变量中有3个都是市场变量,合成的情绪指数与市场波动一致并不出乎意料。

2. 定量的有效性检验。贝克等(2012)首次提出了一种定量分析的思路,利用“孪生股票”来检验投资者情绪的有效性。经典金融理论的“一价定律”指出,除去交易成本,同一种金融资产在市场上只能以一种价格交易,只要存在价差,就会马上涌现大量的套利行为,消除差异。而“孪生股票”现象是针对“一价定律”的一个最重要的反例。“孪生股票”是指一家公司股票在不同的市场上市交易,除去交易成本的差异后往往不同市场上的股票价格上还存在一定的差异,而且这种差异有时会很大,超出了随机误差的范围。经典金融理论不能很好地解释这种现象,而行为金融指出,不同市场的交易者会受到市场情绪的影响,即某一市场情绪上涨会推高在该市场交易的股票的价格,从而影响到“孪生股票”的价差。

中國市场上存在一个特有的现象就是大量公司到中国香港市场上市,形成了很多的“孪生股票”,特别是港交所在2006年推出了A-H股溢价指数,即港交所按照流通额作为权重计算了同时发行A股和H股的上市公司股票的加权溢价,基点100表示两地股票同价,高于100表示A股对H股存在溢价。这是检验投资者情绪指数的有效的数据基础。按照贝克等(2012)研究思路,本文提出的具体的检验方程为:

其中,代表t时刻的A-H股溢价指数,和分别是t时刻的A股市场投资者情绪与港股市场投资者情绪,是误差项,方程考虑了溢价指数的自相关性。如果投资者情绪是有效的,在上述方程中,应该显著大于0,显著小于0。

该方法应用上的一个难点是需要同一时刻两个市场的情绪指数,缺少一个市场的指数等同于在上式中缺少了一个自变量,因为两个市场情绪指数之间一定存在相关性,所以缺少一个自变量会造成参数估计量的非一致。与阿奎特等(Arquette等,2008)以及伯德金和杨(Burdekin和Yang,2013)的研究一致,本文选择了恒生指数月度PE值作为中国香港股市投资者情绪的代理变量。(11)式的回归结果见表3。

表3中比较了三组不同方法获得的理性投资者情绪和非理性投资者情绪的回归结果。首先发现,在所有非理性投资者情绪作为自变量的回归方程中,都显著大于0;但在所有理性投资者情绪作为自变量的回归方程中,都是不显著的,即非理性投资者情绪解释了两个市场“孪生股票”的溢价现象,情绪的波动是造成资产溢价的重要原因,这与理论的预期是完全一致的。反之也说明,剔除了宏观因素的三组非理性情绪指数是基本有效的,能够有效地测量市场情绪的变化。

进一步,考察将非理性投资者情绪作为自变量的回归方程系数。三个方程的都是负值,说明中国香港市场的情绪上升会提高港股的市场估值,降低AH股的溢价,这也是符合理论预期的。有意思的是,在以主成分和卡尔曼滤波为方法建立的情绪指数的前两个方程中,是显著的,但在以LE为方法的第三个方程中并不显著。因为,三个方程中使用了同一个香港市场情绪指数,溢价需要通过两个市场情绪的对比来解释,港股情绪指数的不显著性是受到了A股市场情绪指数的影响。特别是,可以观察到在所有以理性投资者情绪作为自变量的回归方程中,都是不显著的。所以,本文认为可以通过显著性的大小来体现A股市场情绪指数有效性的强弱。的不显著一定程度上可以解释为A股市场情绪指数含有了过多的噪声,没有能够对比反衬出港股市场的情绪,即该A股市场情绪指数的有效性较低。

总之,对比三种方法建立的情绪指数的回归结果,本文认为,三个指数都能够基本捕获A股市场情绪的变化,但在有效性上使用主成分和卡尔曼滤波方法建立的和情绪指数是有效的,含有的噪声较少,可以在后续的实证研究中使用,而且首选是;使用LE方法建立的可能含有较多的噪音,有效性较差,还需要进一步改进。

五、结论

本研究使用了三种不同的数据降维方法——主成分、卡尔曼滤波和拉普拉斯特征映射(LE),选取了适合中国国情的4个情绪源指标——城镇居民投资意愿、IPO 首日收益率、对数开户比和流通市值加权换手率,建立了3个测度中国股票市场投资者情绪的月度复合指数。同时,在控制了宏观因素影响的基础上,基于“孪生股票”溢价现象,使用AH股溢价指数对3个情绪指数进行了有效性检验,发现基于卡尔曼滤波方法的情绪指数最为有效,基于主成分方法的情绪指数次之,而基于LE方法的情绪指数没有达到实证研究的有效性要求。本研究的主要贡献在于印证了复合情绪指数方法的可行性,拓宽了复合情绪指数建立的方法,对复合情绪指数进行了较完整的有效性检验。

注:

①开户数为A股账户开户总数,2014年7月后不公布A股账户开户数,只公布A股投资者数,2014年7月后用开立A股账户自然人投资者数替换A股账户开户总数。

②本文也采用贝克和沃格勒(2006)和易志高和茅宁(2009)研究中的方法考虑了指标“提前”与“滞后”的问题,但采用该方法后会损失一期数据,而且新的第一主成分的方差贡献率反而有微量减少,达到65.2,出于模型的简便性仍然采用当期源变量进行主成分分析。

③本研究尝试了n从5到30,t从5到50的参数变化,主要结论没有改变,后续报道的是n=10,t=5的结果。

參考文献:

[1]Baker M.,J.Wurgler. 2007. Investor Sentiment in the Stock Market[J].The Journal of Economic Perspectives,21(2).

[2]Brown G. W.,M. T. Cliff. 2004. Investor Sentiment and the Near-term Stock Market[J].Journal of Empirical Finance,11(1).

[3]Baker M.,J. Wurgler. 2006. Investor Sentiment and the Cross-section of Stock Returns[J].The Journal of Finance,61(4).

[4]Baker M.,J. Wurgler,Y. Yuan. 2012. Global, Local, and Contagious Investor Sentiment[J].Journal of Financial Economics,104(2).

[5]Katona G. 1975. Psychological Economics[M].New York: Elsevier.

[6]Polk C., P. Sapienza. 2009. The Stock Market and Corporate Investment: A Test of Catering Theory [J]. Review of Financial Studies,22(1).

[7]Stambaugh R. F., J. F. Yu, Y. Yuan. 2012. The Short of It: Investor Sentiment and Anomalies[J].Journal of Financial Economics,104(2).

[8]Da Z., J. Engelberg, P. Gao. 2011. In Search of Attention[J].The Journal of Finance,66(5).

[9]Tetlock P. C. 2007. Giving Content to Investor Sentiment: the Role of Media in the Stock Market[J].The Journal of Finance,62(3).

[10]Burdekin R., R. Luke. 2009. Sentiment Effects on Chinese Share Prices and Savings Deposits: The Post-2003 Experience[J].China Economic Review,20(2).

[11]Baker M.,J. C. Stein. 2004. Market Liquidity as a Sentiment Indicator[J].Journal of Financial Markets,7(3).

[12]Belkin M.,P. Niyogi. 2002. LaplacianEigenmaps and Spectral Techniques for Embedding and Clustering[J].Advances in Neural Information Processing Systems,14(6).

[13]Arquette G. C.,W. O. Brown,R. Burdekin. 2008. US ADR and Hong Kong H-share Discounts of Shanghai-listed Firms[J].Journal of Banking & Finance,32(9).

[14]Burdekin R.,Y. Yang. 2013. Cross-market Trading in Chinas Large State-owned Commercial Bank, 2006-2011[J].Contemporary Economic Policy,31(2).

[15]易志高,茅宁.中国股市投资者情绪测量研究: CICSI 的构建[J].金融研究,2009,(11).

[16]汪昌云,武佳薇.媒体语气、投资者情绪与IPO定价[J].金融研究,2015,(9).

[17]韩立岩,伍燕然. 投资者情绪与IPOs之谜——抑价或者溢价[J].管理世界,2007,(3).

[18]伍燕然,潘可,胡松明,江婕. 行业分析师盈利预测偏差的新解释[J].经济研究,2012,(4).

Abstract:This paper uses three composite indexes to measure the investor sentiment of the China stock market during the last seventeen years from 1999 to 2015 through selecting the Chinese households' investment preferences,IPOR,logarithm of rate of stock account amount and weighted turnover rate by applying three different methods, namely,principal component analyses,Kalman filtering and Laplacian Eigenmaps. At the same time,the authors use A-H stock premium index to test the effectiveness of three sentiment indexes based on the premium phenomenon of "twin stocks". The results show that the sentiment index based on Kalman filtering is the most effective,followed by the principal component analysis. However,the sentiment index based on Laplacian Eigenmaps hasn't reached the effective requirement of the empirical study.

Key Words:investor sentiment,Kalman Filtering,Laplacian Eigenmaps,effectiveness test

猜你喜欢
投资者情绪卡尔曼滤波
卡尔曼滤波在雷达目标跟踪中的应用
卡尔曼滤波在雷达目标跟踪中的应用
投资者情绪对项目融资型定向增发公告效应影响
投资者情绪短期对股票市场的影响研究
投资者情绪与成交量:基于网络论坛证据的分析
基于改进连续自适应均值漂移的视频目标跟踪算法
基于MapReduce的城市道路旅行时间短时预测 
自平衡两轮电动车运动控制系统的硬件设计及实现
投资者情绪与股票市场收益的相互影响分析
一种改进的卡尔曼滤波算法在测量移动物体参数中的应用