张 科,李心丹,方 晓,李小琳
(1.南京大学工程管理学院,南京 210093;2.美国特拉华大学阿尔弗莱德勒纳商学院,纽瓦克 19716,美国;3.南京大学管理学院,南京 210093)
信息是投资者制定交易策略的关键,随着通信技术的发展,网络已经成为投资者获取信息最主要的渠道[1].与现实生活中人际交流不同,信息在互联网中的传播速度更快,内容也更庞杂,虽然人人都可以发表观点,但并非所有人的声音都能被公众听到.社会网络领域的研究发现,群体中存在少数被称为意见领袖的特殊个体,他们对网络信息传播具有关键枢纽作用并能广泛影响他人态度行为[1].在现实生活中,部分意见领袖对公众的影响力甚至超越了不少财经媒体,成为互联网上重要的信息传播者,如在新浪微博上一些知名财经评论家的个人粉丝数量可以达到500万以上,而作为专业新闻媒体的国内四大证券报粉丝数量之和仅约为489万.通常,投资者关注意见领袖是因其具有丰富经验并能判断市场走势,但却有一些意见领袖利用其知名度,先买入股票再公开推荐该股,误导投资者并非法获利,例如,2018年廖英强因操纵股市而被证监会罚没1.29亿元人民币.那么,由此产生的问题是这些意见领袖能否准确预测市场走向?意见领袖何以能够预测市场?普通投资者能否鉴别出意见领袖的判断能力并做出合理反应?
金融学研究中通常以投资者发布观点所体现的情绪来衡量其态度观点,目前国外关于投资者情绪的研究主要涉及投资者情绪影响股票价格的理论模型[2, 3]、投资者情绪的计算方法[4, 5],以及实证检验了投资者情绪对股票收益率[6, 7]、股价波动性[8, 9]、交易量[10]和上市公司盈利水平[11]的预测作用.我国学者也从帖子情绪和情绪一致性的角度分析了投资者情绪是否包含能够预测市场的信息[12-15],得出了许多有益结论,但是,现有研究大多是将投资者视为同质化的个体,在衡量投资者情绪时对所有投资者的观点都赋予相同的权重,并未考虑到意见领袖和普通公众对他人行为影响力的差异.通过考察少数意见领袖情绪的作用,不仅可以进一步揭示投资者情绪影响资产价格的运作机理,还可以检验普通投资者能否理性对待网络舆论的影响,合理制定投资决策,为投资者教育的研究提供有益补充.
本研究基于社会网络分析技术,检验股票网络论坛中意见领袖的帖子情绪对未来个股收益率的预测性及其原因,并通过普通投资者对意见领袖判断能力反应的研究分析投资者是否理性.研究结果表明:意见领袖情绪对未来1个月至6个月的个股收益率都具有预测能力,而非意见领袖情绪和整体投资者情绪则不能预测市场,并且意见领袖能够预测市场的原因并非其掌握了上市公司的价值信息,可能是由于其观点能够引导投资者行为进而使股价同向变化.在此基础上,进一步分析投资者对意见领袖预测准确程度的反应,发现投资者对意见领袖的认同程度与其判断准确率无关,投资者更为关注发表发表正面观点的意见领袖而忽视其观点准确性,同时排斥能够准确预测市场下跌的意见领袖.
本研究的主要贡献在于:第一,现有研究发现意见领袖在新产品营销[16]、网络众筹[17]等领域具有重要作用,但在投资者情绪这一领域,据笔者有限知识所知,尚没有文献研究互联网社区中意见领袖情绪对证券市场的影响,本研究通过社会网络分析技术识别股票网络论坛中的意见领袖,发现其帖子情绪对市场的预测能力相比普通投资者更为长期持久,拓展了社会网络在金融市场中的研究;第二,目前关于投资者行为的研究主要分析了投资者自身因素和亲友等社会关系的影响,缺乏对网络上社会互动影响个人行为决策的关注,本研究则基于网络发帖回帖数据,检验了普通投资者对意见领袖言论的反应,分析普通投资者能否识别不同意见领袖的预测准确度,研究结论对投资者情绪传染的控制干预,以及监管部门完善投资者教育保护工作具有一定借鉴意义.
行为金融学认为,投资者情绪是影响股票价格的重要因素[18].Barberis 等[2]认为,投资者在决策时存在两种心理偏差:一是由于投资者心理存在保守倾向,不能及时根据新信息调整自身对股价的观点,导致股票价格对新信息反应不足,使得投资者情绪能够正向影响股票未来价格;另一种则是由于投资者存在代表性启发偏差,过分高估偶然事件的发生概率,造成股票价格对新信息过度反应,此时投资者情绪对股票未来价格为负面影响.Baker和Wurgler[19]则认为,不同类型股票对投资者情绪的敏感度存在差异,小市值、成立时间较短、股价波动性较高或亏损的上市公司更易于受到投资者情绪的影响,而大市值且具有稳定盈利水平的上市公司股票则具有类似债券的特征,较少受到投资者情绪的影响.刘晓星等[20]也提出,当存在卖空约束时,投资者情绪变化引起其产生有偏的认知并影响市场流动性,他们还通过实证检验发现,融资融券业务的开展进一步增强了投资者情绪对市场流动性的影响.
近年来,学者们越来越关注互联网上用户发表内容所体现的情绪对市场的影响.Das和Chen[9]则利用多种方法综合判断Yahoo论坛上的帖子情绪,构建了高科技股票的情绪指数,结果发现该指数虽然对未来个股收益率和科技板块指数收益率并不具有显著影响,但是却与股价波动性显著正相关.Bollen等[21]检验了Twitter情绪对道琼斯指数收益率的影响,他们将用户发表内容的情绪分为六类:平静、警惕、确信、热情、和善和愉悦,研究发现只有平静类型的情绪指标能够显著预测未来道琼斯指数收益率.Sabherwal等[22]在排除了基本面消息的情况下检验了帖子情绪对论坛热门股票价格的影响,结果发现帖子情绪与当期股票收益率正相关,但与未来两日的收益率负相关,表明这些热门股票价格存在“拉高—出货”的模式,股价在成为热门股的当天上涨到最高值,随后就开始下跌.Chen等[6]分析了Seeking Alpha网站上用户发布内容的情绪与个股收益率的关系,研究发现用户发布内容所体现的负面情绪与未来3日到60日的累积超额收益率显著相关.Li等[23]比较了多种机器学习算法衡量投资者情绪的差异,发现基于LSTM的投资者情绪指标具有较强的预测能力.Ge等[24]研究了投资者情绪与股价崩盘风险之间的关系,发现“恐惧”情绪与股价崩盘风险之间相关性较强.
国内学者在此方面也做了一些研究,杨晓兰等[25]根据东方财富网股吧中创业板上市公司的相关帖子内容构建投资者情绪指标,研究发现本地投资者关注对上市公司股票收益率的影响依赖于论坛帖子情绪.金德环和李岩[26]也利用东方财富网股吧的发帖数据检验了投资者情绪对股票未来收益率的影响,研究发现投资者情绪能够显著预测股票未来收益,并且还对上市公司意外盈余具有解释力.段江娇等[13]利用SVM算法判断论坛帖子的投资者情绪,研究发现投资者情绪与当日个股收益率正相关,但对未来两日收益率则没有显著影响,同时,他们还发现当日帖子数量与个股未来两日收益率负相关.部慧等[14]同样基于东方财富网股吧的发帖数据构建了投资者情绪指标,检验发现投资者情绪对未来市场收益率、交易量和波动率均无预测能力,但可以影响当期收益率和交易量,他们还发现,个股收益率导致投资者情绪变化的原因.钱宇等[27]研究了网络论坛用户的情绪一致性对收益率和波动性的影响.姚加权等[28]构建了金融情绪词典,并基于上市公司年报和社交媒体文本构建了情绪指标,研究发现这些情绪指标对股票收益率、波动率和股价崩盘风险等都具有显著预测作用.陈荣达等[29]则研究了互联网金融中的投资者情绪问题,发现该指标与互联网理财产品收益率呈负相关.
从上述文献回顾中可以看出,国内外学者对于网络用户发布内容所体现的投资者情绪进行了一定研究,但主要是将投资者不加区分的作为一个整体以衡量其情绪指标,在构建投资者情绪指标时,缺乏对投资者个体影响力的关注.另外,目前投资者情绪对市场影响的研究尚未形成一致观点,有学者发现投资者情绪与未来收益率显著正相关,但其他实证研究结果则表明投资者情绪与未来收益显著负相关,有必要针对中国市场投资者情绪的影响展开进一步研究.
意见领袖概念最早是由拉扎斯菲尔德等于1948年在《人民的选择》一书中提出的,是指在信息传递和人际互动过程中具有影响力的少数人.该概念提出后,引起了不同领域学者的广泛关注,在营销学研究中,不少文献表明意见领袖能够促进新产品的推广[16, 30, 31]、消费者对现有产品的认知[32].在传播学领域,也有学者研究了意见领袖对于促进信息传递的作用,Liu等[33]研究了社会网络中的信息传播现象,结果发现,相比没有意见领袖的情况,当意见领袖存在时社会网络中的信息传播速度大为增加.在金融领域,Apesteguia等[34]发现意见领袖的交易盈利状况会导致刺激其他投资者过度配置风险资产.Ouimet和Tate[35]则发现同事中掌握更多信息的人能够影响他人投资决策.杨晓兰等[36]发现意见领袖能促进信息传播,放大货币政策对股市收益率的正向影响.
在发现意见领袖对于他人具有重要影响的基础上,学者们研究了其为何能够产生如此作用.一部分文献认为信任感是导致意见领袖具有强大影响力的原因,如Liu等[33]发现,意见领袖能够促进产品口碑传播的原因是其言论被消费者所信赖.Zhao等[30]通过模拟实验也表明意见领袖能够加速信息传播,不过前提是其具有较高的可信度.Kim和Viswanathan[17]发现,在网络众筹市场中具有相关专业经验的投资者更能获得他人的信任和跟随.另一部分文献认为,意见领袖影响力的来源是其社会联系众多,他们认为,当个体拥有大量社会联系时,其能够与他人产生更多互动并具有较强影响力[37, 38].另外,还有一些学者认为,意见领袖能够改变他人观点是因为他们之间具有相似性,如学历、籍贯或经历等,并且这种因相似而发生的改变具有持久性[39, 40].
由于意见领袖在信息传递过程中具有重要作用,如何识别意见领袖也成为学者关心的问题.不少学者采用社会网络分析中的中心性(centrality)算法来识别意见领袖[41],该类算法的特点是根据网络节点对外连接的数量来判断其影响力,如度中心性(degree centrality)、接近中心性(closeness centrality)、特征向量中心性(eigencentrality)等都被用于意见领袖的识别研究中[16, 37, 38, 42].第二类识别意见领袖的方法是基于随机游走的算法,其典型代表为Brian和Page[43]提出的PageRank算法,该算法在计算网络节点影响力时不仅考虑了对外连接数量,同时还将其连接节点的影响力纳入计算,Shafiq 等[44]比较了多种算法识别意见领袖的效果,结果表明PageRank算法的表现优于中心性算法.另外,Kitsak等[45]认为,意见领袖并非网络中连接最多的节点,而是那些处于网络核心位置的节点,并提出用K-shell算法识别意见领袖.
总体来说,目前这一领域的研究主要涉及意见领袖在产品营销和舆论传播方面的作用,分析其产生的原因和识别方法,缺乏对意见领袖在金融市场中作用的分析,特别是投资者对意见领袖言论的反应.
2.1.1 研究假设提出
如前文所述,现有文献认为意见领袖能够通过信任感[33]、社会联系[37]和相似性[46]这3种渠道影响投资者行为.当意见领袖发表关于某上市公司的正面观点时,投资者受其影响也会提高对该公司的评价,进而买入并推高股票价格.反之,当意见领袖对该公司表示出负面态度时,投资者则倾向于卖出该公司股票,导致股价下跌.但是,与普通投资者的不同之处在于,意见领袖在投资者群体中具有强大影响力,其观点会被大量投资者获悉并采纳,对未来股价造成冲击.另外,部分投资者可能在不同途径转发意见领袖的言论,使其观点在投资者群体中反复传播,对股价产生持久影响.因此,本研究提出如下假设:
H1相比普通投资者,意见领袖情绪能够对未来股价收益产生显著并且长期的影响.
借鉴现有研究的结论,意见领袖情绪能够预测市场的原因可能是在于其比普通投资者掌握了更多价值信息,在这些市场并未发现的信息融入股价的过程中,意见领袖情绪就体现出预测能力.但是,另一方面,意见领袖也可能并不掌握价值信息,仅仅是凭借其强大的影响力引导投资者整体行为方向与自身观点趋同,从而表现出意见领袖情绪对未来股价的预测能力.因此,本研究提出以下假设.
H2a意见领袖情绪比非意见领袖掌握更多价值信息;
H2b意见领袖情绪并不比非意见领袖掌握更多价值信息.
关于意见领袖影响力的来源,现有文献认为信任感是意见领袖能够获得大众认同的重要原因[30, 33],当意见领袖能够准确预测未来股价时,投资者会报以持续关注和追捧,而一旦意见领袖对市场预测失灵,则其影响力将会下降.另外,Barber和Odean认为,由于卖空约束,个人投资者普遍更为关注正面消息而忽略负面消息[3],相对于负面帖子,正面帖子能够为意见领袖带来更高的关注度和影响力.因此,本研究提出以下假设.
H3对未来股价的判断准确率能提高意见领袖的影响力,并且正面帖子判断准确率对意见领袖影响力的作用要高于负面帖子判断准确率.
2.1.2 识别意见领袖
本研究选取我国访问量最大的股票网络论坛——东方财富网股吧(1)中国最热门的前3个股票网络论坛分别为:东方财富网股吧、和讯、金融界,其中东方财富网股吧的用户数和访问量最大[13].为研究对象,首先根据论坛账户的发帖和回帖数据构建社会网络,将回帖视为回帖者对发帖者的连接,然后利用社会网络分析中PageRank算法来计算账户的影响力,并选择其中最高的少量账户作为意见领袖.
选择PageRank算法是基于以下两点考虑:一方面,PageRank算法被广泛用于社会网络的研究中,文献表明该算法能准确识别意见领袖.另一方面,该算法非常适用于股票网络论坛这一场景,能够排除投资者利用多个账户回复自己对结果的干扰.在网络论坛中,不少投资者会注册多个账户,这些账户中通常只有一个是其主要使用,其余偶尔登录的账户则影响力极低,投资者可能在用一个主要账户发帖后再用其他次要账户回帖,人为提高帖子的关注度.基于连接数量的算法仅能根据与账户联系的邻居数量确定其影响力,而PageRank算法在计算中也会考虑邻居自身的影响力,从而降低了同一投资者次要账户对结果的影响.
本研究将论坛账户作为社会网络的节点,并根据发帖和回帖的记录构建社会网络连接,具体分为以下步骤.
1)统计了每月所有用户在所有A股讨论区中的发帖和数据,依据以下4条规则清理回帖数据:(1)考虑到论坛帖子信息具有时效性,参考Chen等[6]的做法,本研究只保留发帖之后2天内的回帖记录;(2)若账户j对账户i的同一个帖子回复多次,则忽略重复回帖,只保留第一次回帖记录;(3)若账户j多次回复了账户i的多个不同帖子,则保留每个帖子下的第一个回帖记录;(4)删除账户i对自身发布帖子的回帖.
2)确定每个自然月内账户之间的连接及权重.若账户j回复了账号i在当月发布的帖子,则从账户j到账户i建立一个单向链接.当月内账户j回复账户i的次数就是链接的权重.由此,构建每个月的有向带权重图.
(1)
其中t-t′代表以往连接对应时间周期与当期的间隔,间隔越大,则以往连接权重衰减的程度就越大,对当期的影响就越小.γ代表衰减系数,该数值越大,则以往连接权重衰减的速度越快,这里取γ=1.(2)本研究也尝试了0.5和2等其他数值,对检验结果没有显著影响.需要说明的是,本研究只考虑最近6个月的连接权重数据,这是因为6个月前连接的权重值乘以衰减函数后已经趋近于0.同时,排除更久之前的数据可以避免在社会网络中引入大量长期不活跃的账户,增加计算难度.
根据上述3个步骤,本研究利用股票网络论坛的发帖回帖数据,建立了论坛账户的社会网络,构成一个动态有向带权重的社会网络.在此基础上,本研究采用个性化PageRank算法计算网络中各个节点(账户)的影响力.由于在股票网络论坛中,意见领袖能够获得认同的重要原因是公众认为其能够预测市场未来趋势.因此,本研究以每个账户发帖的判断准确程度作为重启概率.具体公式如下
(2)
其中PRi代表账户i的影响力;Mi代表所有连接到账户i的账户集合;Li代表账户i连接到其他账户的权重之和;N是网络中账户总数;α代表重启概率,一般取值为0.85;acci代表账户i发帖判断准确程度,以该账户5个月内总体发帖准确率衡量.
2.1.3 判断意见领袖情绪
在识别出意见领袖的基础上,还需要根据其发布帖子内容判断意见领袖的情绪倾向.由于金融领域用语与日常交流有所不同,直接根据语言学通用词典统计词频或其他通用情感判断模型会产生较大误差[48],本研究采用Stack集成学习的思路,综合利用THULAC中文分词工具(3)该工具是由清华大学自然语言处理与社会人文计算实验室推出的,分词准确率达到94%以上.、Word2vec工具和LSTM算法判断论坛意见领袖和普通用户的帖子情绪,通过分为文本分词、计算词向量和训练模型判断帖子情绪3个步骤,构建Stack-LSTM模型.具体过程如下.
1)利用THULAC中文分词工具将所有帖子的内容切分为各个词组,并删除了不影响语句含义的停用词,以避免无关信息对算法模型的干扰.
2)利用Word2vec工具在随机抽取的500万条论坛帖子文本词组中进行训练,用得到的模型计算所有帖子中每个词组的词向量,从而将每一个帖子的文本内容都用词向量矩阵的形式表达.
3)采用Stack集成学习的思路构建帖子情绪判断模型,由于帖子情绪分为中性、正面和负面3类,为了提高判断准确率,本研究将判断帖子情绪这样一个三分类问题转化为3个二分类问题,利用LSTM算法构建了3个初级模型,分别用于判断正面或其他情绪、负面或其他情绪,以及中性或其他情绪这3个二分类问题,每个LSTM模型均包含2个隐藏层且每层含有100个神经元.在此基础上,根据Stack集成学习的思路,将这3个模型的输出结果输入线性回归模型,得到对帖子情绪的最终判断结果.
关于模型训练方面,本研究随机选取了10 000条帖子并由5名具有股票市场交易经验的投资者判断其蕴含情绪(4)在这10 000个帖子中,包含正面帖子2 234条、负面帖子3 211条以及中性帖子4 555条..若投资者的判断结果存在差异,则以多数人的意见作为最终判断结果.在此基础上,为了评估Stack-LSTM模型的判断性能,本研究采用5倍交叉验证的方式,将10 000个帖子分为5等份,每次取其中4份作为训练数据建立模型,剩余1份作为验证数据检验模型的表现.然后取5次验证结果的均值作为Stack-LSTM模型判断性能的最终结果,并与其它主流算法建立的模型进行对比.发现本研究所采用Stack-LSTM模型的判断准确率达到76%,并且在准确率、精确率和F1得分等方面均优于随机森林、SVM和XGBoost等主流算法.具体结果如表1所示.
表1 各类模型在验证数据中的判断性能
指3个类型帖子F1得分的均值.
在利用Stack-LSTM判断每个帖子情绪的基础上,本研究参考现有文献[6, 8],采用以下公式计算意见领袖和非意见领袖的情绪指标
pos_kol=
pos_other=
本研究选取东方财富网股吧论坛中关于沪深两市A股的帖子,时间自2011年1月1日~2017年12月31日,通过网络爬虫程序收集帖子1.6亿余条,其中7 392万条是发帖,其余是回帖,发帖与回帖用户数超过850万.考虑到媒体新闻对论坛帖子内容的影响,本研究还收集了《上海证券报》、《中国证券报》、《证券日报》、《证券时报》和《人民日报》在2011年到2017年期间的所有新闻报道共419 907条,剔除不含上市公司股票代码和名称的新闻后获得204 120条新闻报道.上市公司股价、财务和分析师报告等数据均来自CSMAR数据库.
表2展示了个股收益率、意见领袖情绪和非意见领袖情绪的描述性统计结果.其中,意见领袖情绪(pos_kol)和非意见领袖情绪(pos_other)的均值分别为0.044 6和0.018 9,说明投资者整体态度略微偏正面.另外,为降低极端值的影响,本研究对个股收益率(ret)在1%和99%分位上做了缩尾处理.
表2 主要变量的描述性统
本研究将个股收益率作为因变量,检验意见领袖情绪对其影响.
借鉴现有文献[5, 13]的做法,本研究根据以下模型检验意见领袖情绪对股票收益率的影响.
reti,t+n=α+β1pos_koli,t+β2pos_otheri,t+
(3)
其中reti,t+n代表股票i未来收益率,包括未来1个月、未来1个月~3个月和未来4个月~6个月累积收益率等3个指标;pos_koli,t和pos_otheri,t分别代表意见领袖和非意见领袖在t月关于股票i的帖子情绪,本研究以上月论坛社会网络中影响力最高的前1%账户作为当月意见领袖,其余当月发帖账户则作为非意见领袖,从而避免选择偏差问题;Xi,j,t是一系列控制变量,包括:媒体情绪(media_senti)、个股收益率的滞后项、市场收益率的滞后项、分析师正面评价数量(upgrade)、分析师负面评价数量(downgrade)、账面市值比(bm)、换手率(turnover).另外,还控制了月份(month)和行业(industry)的影响,并在公司层面做了聚类(Clusteratfirm)以控制个体效应.
本研究分别以未来1个月、未来1个月~3个月和未来4个月~6个月的累积收益率为因变量,利用模型(3)检验意见领袖情绪的作用,具体如表3所示.
表3 意见领袖情绪对股票收益率的影响
根据上表结果,在控制影响个股累积收益率的相关变量后,列(1)、列(2)和列(3)中意见领袖情绪(pos_kol)的系数分别为0.479 0、1.194 0和0.713 4,并且均在1%水平上显著,表明意见领袖情绪不仅能够在预测短期股价收益率,并且对长期股价收益率也具有预测能力.非意见领袖情绪(pos_other)的系数为-0.575 5、-1.154 3和-1.097 3,并且也都在1%水平上显著,表明非意见领袖情绪与股票未来收益率负相关.根据列(2)和列(3)结果,股票网络论坛中意见领袖正面负面帖子之差所占比例每提高10%,相应个股未来1个月~3个月和未来4个月~6个月的累积收益率将平均提高0.119%和0.071%,说明意见领袖情绪能够预测个股未来收益,支持了假设H1的推断.
在列(4)、列(5)和列(6)展示了股票网络论坛整体投资者情绪(pos_all)对未来股票收益率的影响.结果表明,整体投资者情绪(pos_all)与股价未来1个月、未来1个月~3个月和未来4个月~6个月收益率都是负相关,说明投资者整体表现出过度反应的现象,当情绪高涨时,买入者增加导致股价高估,并随后发生反转.该结论与金德环和李岩[26]的发现并不一致,这可能是由于本研究的因变量为累积收益率,而他们以累积超额收益率作为因变量,同时,本研究判断意见领袖情绪的模型算法也与其有所不同.
意见领袖情绪能够预测股价可能是因为其观点中包含了尚未被市场发现的信息,也可能仅仅是其能够引导投资者行为,从而表现出自我实现预期(self-fulfilling prophecies)的特点.本研究以上市公司发布季度业绩公告为研究事件,检验公告发布前的意见领袖情绪能否预测意外盈余,由此判断意见领袖情绪中是否包含价值信息.
参考Chen等[6]、金德环和李岩[26]的思路,本研究采用以下模型研究意见领袖情绪对意外盈余的影响.
SUEi,t=α+β1pos_koli,t-3,t-90+
β2pos_otheri,t-3,t-90+
(4)
其中SUEi,t代表上市公司i在t日业绩公告的意外盈余,是上市公司季度业绩公告中的每股盈余减去分析师预测均值,再除以该季度末股价;pos_koli,t-3,t-90代表业绩公告发布日前3日~前90日内意见领袖的帖子情绪;pos_otheri,t-3,t-90代表业绩公告发布日前3日~前90日内非意见领袖帖子情绪;Xi,j,t是控制变量,包括:媒体情绪(media_senti)、上一年末的账面市值比(bm)、上一季度市值(size)、业绩公告发布前3日~前90日期间的股票累积收益率(crett-3,t-90)、上一季度意外盈余(SUEi,t-1),还有分析师意见分歧(ana_disper),是指业绩公告发布日前3日~前90日期间,经股价调整后的分析师预测每股盈余的标准差.另外,还控制了年份(year)和月份(month)的影响,并在公司层面做了聚类(Clusteratfirm)以控制个体效应.
模型(4)的检验结果如表4所示.其中,列(1)结果表明,意见领袖情绪(pos_kol)和非意见领袖情绪(pos_other)对意外盈余的影响均不显著.列(3)和列(4)中,为了排除无关帖子的影响,在剔除了不包含“业绩”这一关键词的帖子后重新计算了意见领袖情绪(pos_kol)和非意见领袖情绪(pos_other),此时,意见领袖情绪(pos_kol)和非意见领袖情绪(pos_other)都与意外盈余显著负相关.列(5)和列(6)排除了ST、创业板和金融行业上市公司样本,结果表明意见领袖情绪(pos_kol)仍然与意外盈余显著负相关.同时,在列(4)和列(6)中,整体投资者情绪(pos_all)也均与意外盈余显著负相关.上述结果说明,意见领袖并不比其他投资者掌握更多关于上市公司的价值信息,假设H2b得到了印证.
表4 意见领袖情绪对意外盈余的预测能力
根据意见领袖影响力的计算方式,若投资者不再认同该意见领袖,则其影响力应当下降,反之,其影响力将会提高,因此,投资者对意见领袖的整体反应可以通过其未来影响力的变化来衡量.本研究利用模型(5)检验意见领袖判断准确率对其未来影响力的作用.同时,由于卖空的成本较高或门槛较高,个人投资者普遍更为关注正面消息而忽略负面消息[3],本研究利用模型(6)检验正确或错误的正面帖子和负面帖子数量对意见领袖影响力的作用.
本研究利用以下模型检验预测准确率能否提高意见领袖影响力
(5)
PRj,t+1=α+β1pos_rj,t+β1pos_wj,t+β3neg_rj,t+
(6)
模型(5)和模型(6)的检验结果如表5所示
表5 投资者对意见领袖预测能力的反应
根据上表结果,列(1)和列(2)表明,不论是总体发帖准确率(acc_all)、正面帖子准确率(acc_pos)或是负面帖子准确率(acc_neg)都对其下个月影响力(PRt+1)没有显著影响.列(3)中结果表明,不论是判断正确的正面帖子(pos_r)还是判断错误的正面帖子(pos_w)都能显著提高其下个月的影响力,并且这两个变量的系数大致相当,另一方面,判断正确的负面帖子(neg_r)和判断错误的负面帖子(neg_w)也都能显著提高意见领袖下个月的影响力,但是其影响系数远低于两类正面帖子.列(4)、列(5)和列(6)则检验了论坛所有用户的预测准确率与其下个月影响力的关系,结果与列(1)至列(3)基本一致.这说明,股票网络论坛中的意见领袖受到广泛关注并非因为其能够准确预测市场,而是因为其在论坛中的活跃表现,特别是发布关于股价看涨的帖子能够极大提升其影响力.这一结论反应出投资者并不能理性判断他人观点正确与否,而是片面认同发布正面消息的意见领袖,对能够准确判断市场下跌趋势的观点则较为忽视,假设H3部分得到了支持.
另外,相关性分析表明,意见领袖当月发帖准确率与其下个月影响力相关性较为微弱,而当月正面帖子准确率和负面帖子准确率与其下个月影响力则显著为正和负(6)限于篇幅,本研究没有展示相关性分析的结果,欢迎联系作者索取.,这与表5结果一致.
3.5.1 改变论坛账户影响力的计算方法
考虑到前文采用的个性化PageRank算法对结果的影响,本研究根据无个性化的PageRank算法计算论坛账户的影响力,并仍选取上月影响力居前的1%账户作为当月意见领袖,表6展示了其情绪与股票收益率关系的检验结果.结果表明,意见领袖情绪与个股未来收益率正相关,而非意见领袖情绪和整体投资者情绪则与个股未来收益率负相关.
表6 按其他方法选出意见领袖的情绪对股票收益率的影
3.5.2 改变意见领袖的选取标准
考虑到意见领袖的选取标准可能对结果产生影响,本研究改变了意见领袖的选取标准,重新运行模型1,结果如表7所示.在列(1)、列(2)和列(3)中,本研究将意见领袖的选取标准扩大为上月影响力最高的前5%账户,结果表明,前5%意见领袖情绪(pos_kol5)同样与个股未来1个月和3个月累积收益率显著正相关,但影响系数小于表3中的前1%意见领袖(pos_kol),说明意见领袖对未来股票收益率的影响随着其影响力的提高而增强,这可能是由于影响力较高的意见领袖能够引导更多投资者行动.在列(4)~列(6)中,本研究将上月影响力最高的前10%账户作为意见领袖(pos_kol10),结果与前文一致.
表7 前5%或前10%意见领袖情绪对股票收益率的影
3.5.3 用百度Senta工具(7)Senta是百度公司于2018年推出的自然语言处理工具,通过深度学习算法在大规模语料库上训练得到,在百度自建数据集上的效果 分类准确率为90%.来源:https://github.com/baidu/Senta..衡量意见领袖情绪
前文中的意见领袖情绪是采用本研究自建的Stack-LSTM模型判断分类,训练数据的选择和算法优化建模过程可能影响研究结果,表8中采用了百度Senta工具分别判断意见领袖和非意见领袖的帖子情绪类型,从而重新计算出意见领袖情绪指标(pos_kol)和非意见领袖情绪指标(pos_other),并根据模型(3)再次检验了意见领袖情绪与股票收益率的关系.列(1)和列(3)中,意见领袖情绪(pos_kol)的系数分别为0.438 1和0.743 7,并且均在1%水平上显著,说明意见领袖情绪与未来短期和长期股价收益率显著相关.在列(2)和列(3)中,非意见领袖情绪(pos_other)与股价未来收益率显著负相关.另外,在列(4)至列(6)中,整体投资者情绪(pos_all)与股价未来收益率呈现无关或负相关关系.这些结论与前文一致,表明相比非意见领袖,意见领袖情绪能够显著且持久的预测股价未来收益率.
表8 基于百度Senta的意见领袖情绪对股票收益率的影响
3.5.4 用以往30天帖子检验意见领袖情绪与季
报意外盈余的关系
考虑到以往90天的信息过于陈旧,投资者和分析师尚不能准确评估上市公司意外盈余,表9使用了业绩公告发布前3日~前30日期间的数据计算意见领袖情绪,并以分析师盈余预测的平均值和去年同一季度实际盈余(随机游走模型)两种方法来构造意外盈余.列(1)和列(3)中,意见领袖情绪(pos_kol)与因变量均为负相关,结论与前文一致.
表9 最近30天意见领袖情绪对意外盈余的预测能力
3.5.5 投资者对前5%或前10%意见领袖预测
能力的反应
表10以上月影响力最高的前5%或前10%账户作为意见领袖,检验其发帖准确率与未来收益率的关系.其中,列(1)~列(3)是以影响力最高的前5%账户作为意见领袖,总体发帖准确率(acc_all)对其下个月影响力没有显著影响,而正面帖子准确率(acc_pos)则与其下个月影响正相关,同时负面帖子准确率(acc_neg)与其下个月影响负相关.另外,判断正确的正面帖子(pos_r)和判断错误的正面帖子(pos_w)都能显著提高其下个月影响力,并且其系数都大于判断正确的负面帖子(neg_r)和判断错误的负面帖子(neg_w).列(4)~列(6)将意见领袖标准调整为前10%账户,结果与列(1)~列(3)一致.上述结果表明,普通投资者对正面和负面消息的关注程度存在明显的不对称性,甚至抵制能够准确预测市场下跌的意见领袖,反而会认同发表错误积极言论的意见领袖.
本研究揭示了投资者情绪对个股未来收益率具有一定预测能力,这一结果与Das和Chen[9]、部慧等[14]不同,主要原因在于本研究根据社会影响力对投资者进行了区分,只有少数具有影响力的意见领袖能够预测市场未来变化,若考察投资者总体情绪的影响,则结果与现有研究一致.进一步研究发现,这些意见领袖并没有掌握价值信息,他们能够预测市场可能是由于其强大的影响力引导投资者整体行为方向与自身观点趋同,从而使未来股价与其预期相符.同时,本研究还发现,无论判断正确或错误,意见领袖发布的正面帖子都能够增强其影响力,甚至相比判断正确的负面帖子,错误的正面帖子能够产生更大影响.上述研究结果说明,由于卖空约束,网络上的投资者群体明显更为偏好乐观的言论,而意见领袖可以通过发布夸张的看涨信息来吸引公众关注,即便这些信息事后被发现错误,也无损其影响力.从这些行为和行为产生的结果看,本研究认为我国股吧论坛中的投资者群体存在非理性倾向,即他们宁可接收错误的乐观信息,也不愿看到正确的悲观信息.
本研究基于社会网络分析技术,以2011年1月1日到2017年12月31日东方财富网股吧论坛的发帖数据和对应的上市公司特征数据为样本,研究意见领袖情绪对未来个股收益率的预测性和原因,以及其他投资者对意见领袖判断能力的反应.研究结果发现:1)意见领袖情绪对未来1个月~6个月个股收益率均有显著影响,而非意见领袖情绪和整体投资者情绪则不能预测市场,说明相比普通投资者,意见领袖对未来股价收益率的判断更为准确.2)为了研究意见领袖能够预测市场的原因,本研究以上市公司季度业绩公告为事件,考察意见领袖和非意见领袖情绪与意外盈余的关系,研究发现,意见领袖情绪与意外盈余无关,意见领袖并未比普通投资者掌握更多关于上市公司的价值信息,他们对股价的影响力可能是由于其观点能够引导投资者行为进而使股价同向变化.3)本研究进一步探究了投资者对意见领袖预测准确程度的反应,研究发现,意见领袖影响力程度与其总体判断准确率无关,投资者群体更为关注发表正面观点的意见领袖而忽视其观点准确性,同时排斥能够准确预测市场下跌的意见领袖.
本研究具有重要的理论与现实意义.首先,在理论上,研究了意见领袖对资本市场的影响及其影响力成因,从社会网络的角度拓展了投资者情绪的研究.其次,监管部门应该制定相关法律法规,加强网络舆论监管,规范意见领袖在网络上的言论,并在必要时采取措施引导舆论方向,互联网平台也应当配合监管部门进行舆情管理,及时干预意见领袖的夸张言论,以避免非理性情绪在网络上的蔓延.最后,监管部门有必要加强投资者教育工作,使投资者特别是中小投资者对其所投资的金融产品风险有更充分了解,避免盲目听信他人,提高投资者的自我保护能力.