苍玉权+殷旭东
[摘 要] 随着互联网的发展,上市公司在社会化媒体平台发布信息,投资者评论这些信息并制定投资策略。现阶段,多数投资者是非理性的,他们缺乏获取真实信息的渠道,也不具备专业的投资理论知识,易受网络舆情的影响而产生“羊群效应”。通过利用中文文本分析技术对东方财富网股吧的评论进行分析,并构建投资者情绪指数,分析投资者情绪在短期对股票市场的影响。实证结果表明投资者情绪在短期的确会影响到股票的收益,该结论能帮助投资者有效利用互联网信息,制定投资决策。
[关键词] 文本分析;投资者情绪;股票收益;影响研究
[中图分类号] F640 [文献标识码] A
Influence Research of Investor Sentiment on the Stock Market in the Short Term
CANG Yuquan, YIN Xudong
Abstract: With the development of the Internet, listed companies release information in the social media platform, and investors review these information and formulate investment strategies. The majority of investors now are irrational, lack of real information channel and professional knowledge of investment theory, and susceptible to network public opinion and produce "sheep-flock effect". The study analyzes the comments of Eastmoney Guba by means of Chinese text analysis technology, the construction of investor sentiment index, and the influence of investor sentiment on the stock market in the short term. The empirical results show that investor sentiment really affects stock returns. This conclusion can help investors to effectively use the Internet information and formulate investment decisions.
Key words: text analysis, investor sentiment, stock returns, influence research
引言
“羊群效应”是一种比较特殊的非理性行为,在一个投资群体中,单个投资者总是参照相似投资者进行操作,在他人买进时买进,在他人卖出时卖出。我国的股票市场仅仅发展了二十余年,还处在新兴市场阶段,信息的披露制度不完全,市场投资环境、股票交易制度、股票市场监管存在缺陷,市场呈现非有效性。在社会化媒体中的关于股票的信息鱼龙混杂,真实的信息广泛传播,虚假的信息传播的更快,范围更广,这些信息相互影响,极容易形成“羊群效应”,因此确定网络舆情对股票收益的影响有重要意义。
本文试图通过中文文本分析技术,分析网络舆情与股票市场的关系,具有如下作用:一是有利于提高市场的有效性,验证不同性质的网络舆情对股票收益的影响,对股票市场的变化具有解释和预测作用;二是为投资者提供投资决策依据,互联网成信息传播的高速通道,同时加快了谣言的传播速度,考虑网络舆情对股价造成的影响有利于投资者辨别有效信息,对市场形成有效判断,做出有效的投资决策。
本文结构如下:第二部分是文献回顾;第三部分是理论分析;第四部分是模型选择、指标设计和数据选择;第五部分实证分析结果;第六部分是文章结论。
一、文献回顾
根据有效市场假说,市场中的理性投资者将会对该市场中的每一条信息进行充分评估,不仅历史数据和当前基本面数据不会影响股价,那些突发的虚假信息也不会对股价造成冲击。现有的研究结果表明股市是弱有效市场或是半强有效市场,网络舆情将会对股票市场产生怎样的影响呢?
基于网络舆情的股票市场研究主要以互联网社交平台上与股票市场相关的信息为研究对象,研究分析二者的相互作用,并进一步分析网上的股票相关信息对股票市场的预测能力和解释能力。Wysocki(1998)以3000多支股票为样本,对946000条股评进行分析,研究结果发现股评数量对次日的股票交易量和异常收益率的变化有一定的解释和预测作用。Vivek Sehgal、Charles Song(2007)验证了网络情绪和股票价值具有相关性,表明股市近期价格波动和网民的情绪密切相关。Johan(2011)对美国大型社交网站Twitter进行数据挖掘,用格兰杰检验发现公众的情绪状态的日变化与道琼斯工业平均指数收盘值的每天的变化显著相关。Sabherwal等(2011)采用WallStreetPit-Thelion网络聊天室中每日讨论前十的10只热门股,该网络聊天室设计奖惩制度赋予发帖者不同的信誉等级,尽可能减少交易噪声。他们发现发帖量不能预测股市交易量、收益率或是波动性,但是股票收益率是可预测的,投资者情绪与同期收益正相关,滞后一期和滞后二期的投资者情绪与收益负相关,引起后期股票收益的急剧下降,可能是由于市场的修正作用。此外他们还发现:行情看涨指数的绝对值与同期波动性和随后一期、两期的波动性负相关,说明投资者的情绪越极端,股票波动率越小;行情看涨指数的绝对值越大(投资者情绪越极端),小单交易就越多。李玉梅等(2011)对通讯行业的上市公司的截面数据进行分析,研究表明在线股票评论的数量和投资者的情绪可以在一定程度上解释个股的异常收益率,股评的数量对股票异常收益率,涨跌额和交易量变化有一定的影响。段江娇等(2014)根据帖子内容中的词汇与词库中各个档次的关键词进行匹配,计算各个档次关键词出现的次数,取次数最多的档次作为帖子的情绪。通过构建向量自回归VAR模型,检验了投资者情绪指数、分析师推荐指数和上证指数收益率之间的动态关系,研究发现分析师推荐指数的上涨会导致股指收益率短期上涨,投资者情绪指数的上涨会导致股指收益率的下降。
总结前面关于网络舆情与股票市场相关研究,我们发现国内的研究者大多数研究都是从评论数量对股市的影响进行验证分析,对评论内容的研究较少,对投资者情绪仅构建一个简单的虚拟变量。本文在综合前人研究的基础上,使用文本情感分析的方法,分析评论的具体内容,探究网络舆情对股票市场造成的短期影响。
二、理论分析
市场有效性研究的一个新的分支就是对新型社会化媒体进行研究。在网络技术的发展过程中,新型社会化媒体通过互联网的技术扩散效应极大地加速了包括各类利好的和利空的、公开的和未公开的股票市场信息的传播速度。虽然这种高速的信息传播渠道缓解了信息的不对称,但是也加剧信息的不当使用,甚至对金融市场的有效性造成巨大冲击,导致股票市场的异常收益并影响金融稳定。
网络舆论多是匿名信息,各类信息鱼龙混杂,信息的真实性很难得到验证。加上很多利用技术带有某些目的大肆扩散信息的庄托,普通投资者极易形成“羊群效应”,从而影响股票市场的价格波动。同时是我国股票市场还处于新兴发展阶段,大多数投资者是非理性的,并且不具备非常专业的投资理论知识,同时又也缺乏获取真实信息的渠道,对股票的分析和预测的能力有限。信息不对称会导致舆情的广泛传播,而针对网络舆论的监管也较为困难,信息的真实性不能够保证,股价易受到舆情的冲击剧烈波动。这种现象与市场有效性“信息能被充分反映在价格中”的相矛盾。因此,研究网络舆情对股票收益的影响不仅是对行为金融学的补充,更是对市场有效性理论的完善。
与传统媒体相比,网络舆情表达便捷、信息多样,交互性强。网络舆情具有以下特点:
1.直接性。通过各类不同社交媒体平台,网民可以随时随地发表自己的观点和意见,舆情信息的发布十分便捷,且信息往往可以随意转载,更容易传播;2.突发性。网络舆情的形成以及传播非常迅速,一个热点事件的存在加之情绪化的意见,就可以成为点燃一片舆情的导火索,没有时间和空间的限制;3.偏差性。由于发言者在网上仅仅以ID示人,很难直接锁定到某一个人本身,具有的匿名性、虚拟性等特点,加之网络舆情规则限制少、监督机制匮乏。某些网民就会选择利用网络发泄自己的情绪,从而使网络上的观点更夸张、悲观或偏激。
上市公司网络舆情具有以下几个特点:
第一,上市公司内部信息公开化,通过年报定期向公众公开的资产、财务信息容易成为人们议论的焦点,公司的内部员工也方便地在网络平台上公布企业的某些内幕信息,从而使越来越多被掩盖的事件公诸于众,引发网络舆情的生成;
第二,网络舆情的传播具有放大情绪的特点。原有的倾向由于相互作用而被强化,从而令起初的观点变得极端。例如问题疫苗事件,广大网友通过跟帖、转载、评论等方式,跟踪事件的发展,并对制药企业进行声讨。网络舆情效应对相关企业会造成深远影响;
第三,网络舆情的演化具有“蝴蝶效应”。一条极不起眼的信息被放上往后就能迅速传播,再加之好事者或别有用心者借机炒作,事件被迅速放大,一夜之间可能使全社会都陷入疯狂状态;
第四,网络舆情信息的真实性缺乏验证,不管是真实信息还是谣言都可能在网络传播上畅通无阻,给上市公司网络舆情的发生提供了更大的可能。
股票市场突发性网络舆情的产生由以下几个因素构成:
1.突发性事件,是舆情产生和导致网民大规模讨论的导火索,网民通过参与网络互动,发表自己的见解和评论,进一步影响其他网民的见解;
2.网络平台,作为舆情产生的载体,为公众沟通交流提供了一个便捷的平台;
3.投资者,是舆情产生的主体,他们既是信息的传播者,也是信息的接受者;
4.上市公司,作为网络舆情密切相关的对象,突发性舆情事件的发生与上市公司经营策略和规划有关,舆情的传播和终止都源自上市公司对该舆情事件的态度和处理方法,对股票收益有影响的网络舆情始终与公众对上市公司的认知紧密联系在一起的,股价的变动也可能会引起广大网民的讨论,通过网络平台传播,进一步影响股价。
网络舆情的传播主要分为三个阶段:酝酿阶段、传播与热议阶段、流行与平息阶段。在酝酿阶段,突发事件产生,关注到的网民形成某种情绪、态度或意见,并有在社交网络表达自己观点的冲动;当网民的个人情绪、态度通过网络表达后,其他网友就会积极地互动交流,这个过程表现在发帖、转发、和其他相关信息进行评论等,这一阶段大量舆情信息在网络上形成;随着网民对突发性事件的讨论,相关信息会在网上大规模流行并持续引发热议,直到舆情信息所指的事件得到解决,网络舆情才会逐渐平息。
从网络平台传播的真实信息和虚假信息的角度出发,我们把网络舆情对股票市场信息的作用主要分为正效应和负效应,对此做出如下假设:一是网络舆情对股票收益具有正效应,假设为网络舆情传播的是真实的;投资者能根据有效信息做出有效的投资决策;股票收益上涨或下降只会更接近股票的真实价值;舆情信息借助互联网传播迅速扩散,增加了股票市场信息的透明度,提高了股票市场的有效性;二是网络舆情对股票收益具有负效应。假设为互联网传播的信息是不真实的,造成股价短暂波动;虚假网络舆情的传播不仅严重冲击了股票价格,还动摇了投资者对股票市场信息真实性和透明度的信心。不管是利好还是利差的舆情,掌握信息少的投资者都宁愿信其有,使得投资者盲目跟风,成交量在短时间激增。根据有效市场理论和噪声交易理论,对称的噪声交易不会对股价造成异常影响;三是网络舆情对股票收益形成超效应,由于股市中存在“羊群效应”,投资者往往跟风操作,这样必然会导致股价过度波动,超效应的主要体现的两个方面:一是网络舆情对真实信息的传播可能会引起广大投资者对该股票的特别关注,加上网络推手的助力以及羊群效应的存在,舆情信息的内容被放大,造成股价的实际变动程度高于理论上舆情事件本身对上市公司股价的影响;另一方面,若是虚假的负面舆情的造成股价暴跌,即便澄清公告发布以后,投资者的信心也遭受严重打击,股价不能恢复到事件发生前的水平。
三、模型选择、指标设计和数据选择
(一)模型选择
根据研究目的以及理论分析,本文选择经济学上广泛应用的事件分析法,研究投资者情绪与股票市场的关系。事件分析法主要包含所关注的事件和事件窗口长度。结合本文研究的方向,我们选定上市公司作为研究对象,强烈冲击投资者情绪的网络舆情对上市公司股票收益会有一定的影响,因而我们把这一时间段作为目标事件来考虑。事件日通常定义为目标事件发生的当天,即舆情信息的初现阶段,我们用T0表示,目标事件发生前后的一段时间定义为事件窗口。根据网络舆情传播的规律,发现网络舆情从出现、扩散到消散大概需要一个星期的时间,因此设定事件发生日前后一个星期为事件窗口。在股票市场,一周只有5个交易日,事件窗口包括T0之前的5个交易日,分别用(T=-1,-2,-3,-4,-5)表示,作为事件的估计窗口;事件发生的当天(T=0)以及事件发生之后的5个交易日,用(T=0,1,2,3,4)分别表示,作为事件的事后窗口。
为了研究舆情事件对单只股票的收益水平影响,需要度量超额收益,假设没有舆情事件,此时该只股票的个体期望收益为E[Rit|It],t∈T,事件发生后的实际收益率为Rit,则事件窗口期的超额收益率就是ARit=Rit-E[Rit|It],在此处假设E[Rit|It]=μi,μi是单只股票在事件窗口期的平均收益,同时定义单只股票在事件窗口期的累积收益率为CRi=■Rit,通过检验事件发生后的累积收益率是否显著不为0来确定舆情事件是否真正影响到股票市场。
(二)情绪指标设计
从实践出发,出于技术和时间的限制,本文仅以论坛为例,结合指标构建客观性和可操作性的原则,通过文本情感极性分析的方法,步骤为:处理要分析的文本,每个句子进行分词,删除句子中的重复词;读取词典,获得能够表示看涨、看跌、中性三种倾向的词列表;计算每个句子的情绪得分。加总后就能得到整篇评论的情绪得分。该方法需要借助中文情感字典和中文情感预料库,本文使用了台湾大学研发的中文情感极性词典NTUSD,并结合股票常见词汇对情感词典进行丰富。在具体操作过程中,由于本人能力有限,对于某些句子的处理不能到达预期值,例如“现在只是暂时回调,午后将会上攻”,分词后会得到“回调”和“上攻”两个词,情感打分得到的该句评分为0,但是实际上句子的重点在后半句,应该给出的评分是1;含有双重否定的句子“卖的人等着后悔吧”,评分为-2,但实际评分也应该是1。针对此类结构的评论做出了优化,总体上本研究使用的衡量情绪指标的计算方法仍是可行的。N为总计评论数,Ci.是第i.条评论的得分,最后得到市场情绪指标emotion的计算方法为:emotion=■
(三)数据来源说明
1.舆情数据来源。本文使用东方财富网股吧作为网络舆情的数据来源,本文根据论坛信息的特点,设置的抓取单个帖子的信息为:标题、内容、发帖时间、评论数;多数上市公司会在3月份公布上一年的年报,所以本文设定的事件日为公司年报的发布日。在选取多个股吧在2016年3月1号-4月15号发表的帖子,剔除重复,无主题,不相关,无评论的帖子后,结合股票的事件窗口期,筛选出42支股票共计26167条有效评论。
图1是从42支股票中选取10支,针对每天的有效评论数作出的折线图,横轴为事件发生天数,纵轴为所有股票当天累积有效评论数。从图中可以看出舆情事件发生当天(横轴为1)的市场关注度较高,有效评论数较多,在3-4天后关注度持续减弱,直到出现新的舆情事件,市场关注度再次回升。
2.股票数据来源。股票数据选自国泰安数据服务中心数据库的子目录“股票市场交易数据库”,我们把网络舆情消息在论坛第一次出现定义成事件发生日。为了使统计结果更加合理和具有可比性,如果事件发生的时候,股市已经收市或者该支股票已经经停牌,那么我们把下一个交易日定义为事件日。为探究网络舆情的传播对股市价格的影响,根据理论部分对股市异常收益的界定,本文选取在事件窗口的以下指标:股票日收盘价:股票交易日复权收盘价格,以元/股为单位;股票日换手率:股票交易日股票成交量与流通股数的比值;股票日回报率:股票当日收盘价格与前一个交易日收盘价格之差与前一个交易日收盘价格的比值。
四、实证分析
(一)变量的基本描述统计
CR2是舆情事件发生后的累积收益率,CR1是舆情事件发生前的累积收益率,检验结果如表1,P值为0.014,说明舆情事件发生后市场会受到明显的影响,累积收益率发生明显变动。
表1 累积收益率Z检验 **为5%显著水平下同
表2 变量的描述性统计
表2给出了所有变量的基本统计描述信息,VB和RB表示舆情事件发生前5个交易日的股票换手率和日收益,VA和RA是舆情事件发生后5个交易日的股票换手率和日收益,emotion是舆情事件发生后的市场情绪指标值,comment是有效帖子和评论数,totalasset是上市公司的总资产。对评论数和总资产取对数得logC和logTA。在样本区间内,投资者的情绪指数为负值,可以看出在这一时期,中国股票市场总体走势低迷,投资者对股票市场的未来表现感到悲观。同时投资者情绪指数的标准差要大于舆情事件发生后股票收益的标准差,说明投资者情绪的波动更大。
表3给出了变量间的相关系数。deltaR是股票的收益变动,由RB-RA得到;deltaV是换手率的变动,由VB-VA得到。投资者情绪指数与股票的收益、成交量均呈现正向相关关系,且与股票收益的正相关关系在5%显著性水平下显著。显然,社交媒体的投资者涨跌情绪指数与股票市场指数存在正相关关系,并且投资者情绪指数与收益之间的正相关关系强于其与换手率之间的正相关关系。
表3 变量相关系数
(二)回归分析
通过前文的介绍,我们已经知道投资者情绪的确会在短期影响投资收益,下面研究舆情事件的发生后对股票市场的影响,所以讨论变量RA、deltaV、emotion、logC和logTA之间的关系。
从表4中可以看出当在舆情事件发生后,股票成交量变动不能用投资者情绪指数来解释,正可能是由于现在中国的股票市场悲观情绪弥漫,但市场的下跌空间也有限,多数投资者选择了持股不动操作策略。对于事件发生后的平均收益率的3因素回归模型发现,股票换手率的变动能够显著影响该支股票的收益率,这与早期的研究结论一致。在考虑到投资者情绪指数的4因素回归模型中,情绪指数在95%置信区间上显著,说明投资者情绪在短期的确会影响到股票市场的收益,这间接表明中国股市存在大量的非理性投资者,他们的非理性情绪将会对股票市场带来显著影响。同时上市公司的规模指标和有效评论数量的系数在三个模型中均不显著,这说明在短期,对股票市场影响较大的是投资者情绪。
五、研究结论
本文以东方财富网股吧为样本,采用中文文本情感分析技术从中抽取出大多数投资者对股票市场未来走势的涨跌情绪倾向,计算投资者情绪指数,使用该指数研究股票收益和成交量的相互影响。研究结果表明:舆情事件爆发的当天市场投资者关注度最高,在事件爆发后3-4天投资者对于该支股票的关注度降到低点,随后新的舆情事件又会吸引投资者的眼球;情绪指数与股票的收益存在正相关关系。投资者情绪指数表现乐观(悲观)时,股票收益会在短期内出现上涨(下跌);投资者情绪指数无法解释股票成交量在短期的变动,原因可能是当下市场悲观情绪蔓延,除非出现重大利好或是利空消息,投资者最佳的投资策略是选择持有手中的股票不做任何交易。
投资者情绪指数可以成为预测短期收益的有效指标,网上蕴含着大量类似于投资者情绪指数的信息,合理运用这些信息能辅助投资者进行有效的投资决策。随着中国股票市场的快速发展,互联网在股票市场的影响能力日益增加,本研究的实证结论对帮助投资者正确、有效地理解和使用互联网并辅助投资决策具有重要现实意义,并且可以帮助投资者提高投资决策能力。如何更好、更及时地挖掘互联网有效信息,分析网络信息与股票市场的深层次关系是今后研究的重要内容。
[参 考 文 献]
[1]Fama and French.Common Risk Factors in Returns on Stocks and Bonds,Journal of Financial Economics,Vol.53,1993
[2]Wysocki P D. Cheap Talk on the Web: the Determinants of Postings on Stock Message Boards[J]. Working Paper, Univercity of Michigan. 1998
[3]Mikkelson and Partch,W.Mikkelson,M.Partch.Stock price effects and costs of secondary distributions. Journal of Financial Economics,14 (1985),P165-194
[4]Lakonishok,J.,ShleiferA.,and Vishny R. .The Impact of Trading on Stock Price.Journal of Financial Economics,Vol.32,1992,P23-44
[5]李晓明,朱家稷,闫宏飞.互联网上主题信息的一种收集与处理模型及其应用[J].计算机研究与发展,2003(12)
[8]赵静梅,何欣,吴风云.中国股市谣言研究:传谣、辟谣及其对股价的冲击[J].管理世界,2011(11)
[9]徐琳.网络舆情对股价波动影响的实证研究[学位论文[D].西南财经大学,2013
[10]李玉梅,闫相斌,胡洋.在线股评对股票市场的影响分析[J].中国管理科学,2011(5)
[11]段江娇,刘红忠,曾剑平.投资者情绪指数、分析师推荐指数与股指收益率的影响研究——基于我国东方财富股吧论坛、新浪网分析师个股评级数据[J].上海金融,2014(11)
[责任编辑:潘洪志]