徐小阳 路明慧 李玭
摘 要:随着互联网技术的不断渗透,共享单车、共享汽车等共享经济形态机遇与挑战并存。网络社交媒体作为目前投资者交流与传递投资信息的重要渠道,能够成为量化投资者情绪的数据来源。以2017年1月1日至2017年6月30日东方财富网共享单车概念股的股吧信息为研究对象,通过网络文本挖掘技术构造投资者情绪、投资者关注度、投资者互动程度三个指标,并与股票收益进行相关性分析和混合回归分析。结果发现,共享单车市场中投资者情绪高涨、关注度增强能够提升概念股的股票收益水平,而投资者互动度与股票收益负相关。此外,积极情绪、消极情绪对股票收益的影响存在差异。
关键词:共享单车市场;投资者情绪;股票收益;网络文本挖掘
中图分类号:F832.5 文献标识码:B 文章编号:1674-2265(2018)02-0080-05
DOI:10.19647/j.cnki.37-1462/f.2018.02.013
一、引言
随着“互联网+”概念的不断渗透,“共享”思维逐步深入到居民的日常生活。从出行方式来看,“共享单车”作为其中最典型的共享经济形态,旨在为人们提供自行车共享服务。共享单车一方面能够改善城市快速发展带来的自行车市场萎靡状况,充分利用城市公共道路资源;另一方面,能够提高居民的身体素质,符合全民健身的宗旨,起到节能减排的功效。目前,摩拜、ofo、永安行等共享单车品牌均借助网络信息平台,极大地降低了交易成本,而网络支付又为其实现资产共享创造便利,显著增强共享单车市场大规模发展的可能性。据艾媒发布的《2017Q1中国共享单车市场研究报告》显示,2016年中国共享单车市场规模达到12.3亿元,用户规模达到0.28亿人。然而,共享单车乱停放、“扎堆”停放、恶意损坏车辆等问题层出不穷,严重影响共享单车市场的健康运行。显然,随着市场竞争日益激烈,市场急剧饱和后蕴藏着更多不可预计的风险。
投资者情绪是投资者对未来股票市场的主观性预期(Brown和Cliff,2004)。早期,学者们主要利用直接替代指标、间接替代指标和复合指标对其进行测度。直接指标是指通过问卷调查直接获取投资者对市场行情的预期,具有强烈的主观色彩(Fisher和Statman,2000;Lemmon和Portniaguina,2006;Fong和Toh,2014;熊伟和陈浪南,2015);间接指标则是指借助交易市场的客观交易数据进行统计研究,寻找单一的情绪替代指标如换手率、交易量、认沽认购比率 、封闭式基金折价率等;单一指标具有片面性,复合指标则涵盖直接指标和间接指标的信息,多选用主成分分析法或偏最小二乘法构造投资者情绪指数(Baker和Wurgler,2006;文凤华等,2014;Aissia,2016;黄宏斌等,2016)。近年来,网络社交媒体平台已经成为投资者获取信息的重要场所。大量不同身份、不同背景、不同学历的投资者汇聚在各类网络平台上进行交流互动。行为金融学理论一直强调从人的心理、行为角度去解释市场的异象。单纯依靠问卷调查、交易数据无法全面认识投资者行为,进一步了解网络社交媒体视阈下的投资者情绪非常必要。
在信息化技术加速的背景下,投资者能够通过股吧、微博、博客等新型社交媒体更加快捷地关注市场的发展动向,交流、传递股票信息,由此形成了海量的金融文本信息。网络文本挖掘技术可以对这些金融文本信息进行数据处理,从中提取出未被发现的、可信服的有效信息,实现文本的情感倾向分析,用于量化投资者情绪并进行投资决策。目前研究领域中,关于我国共享单车市场的投资者情绪测评留有空白,而且国内基于网络文本挖掘技术的投资者情绪研究处于探索阶段。因此,本文基于网络文本挖掘技术,对我国共享单车市场的投资者情绪进行测评,并对股票收益进行相关性和回归分析,为政府监测管理共享单车市场风险和倡导投资者理性决策提供全新的方向。
二、研究假设
围绕投资者情绪,国内外学者进行了一系列的研究,理论上认为投资者的非理性情绪是影响资产定价的系统性因子,能够对股票市场收益起到“放大器”的作用。Lee等(2002)发现超额收益与同期的情绪变化正相关。王春(2014)以开放式股票型基金资金净流入作为投资者情绪的度量指标,运用GARCH-M模型研究发现,投资者情绪与股票市场收益之间存在正向反馈作用。文凤华等(2014)将投资者情绪分为正面情绪和负面情绪, 并分别研究了两种情绪对股票价格的影响。研究结果表明,正面情绪有助于提高股票收益,而负面情绪对股票价格无显著影响。据此,提出假设H1a和H1b:
H1a:投资者情绪越高涨,股票收益越高;反之,情绪低落带来股票收益的下跌。
H1b:积极情绪与消极情绪对股票收益的影响有所不同。
投资者的有限注意与海量股市信息之间存在时间和空间上的矛盾。在社会化媒体的视阈下,投资者逐步通过快捷、方便、廉价的互联网平台参与投资者决策,这就使得人们获取金融讯息所需要的时间大大缩短。信号传递理论认为投资者充分获取股票市场交易的相关信息,可以极大地减少信息不对称的程度,达到提升股票市场有效性的目的,进而影响股市交易行为。Barber和Odean(2008)通过实证研究发现,投资者尤其是个人投资者的某只股票关注度提升,增加了股票被购买的可能性,从而股票价格上涨带来正向收益。据此,提出本文的假设H2:
H2:投资者关注度越高,股票收益越高;反之,关注度减少导致股票收益下降。
社交媒体视角下,投资者针对某只股票的交流越多,互動的频率越频繁。然而,海量的互联网信息中掺杂着许多难以识别、难以分辨的虚假信息,随着互动程度的加深会不断地扩散。通过转发、分享等途径,非理性的投资者将网络上获知的交易信息传递给市场中其他的投资者,容易在股票市场中产生“羊群效应”(Boyd等,2015;Gavriilidis等,2016)。金德环和李岩(2017)以月发帖数的对数形式作为投资者互动的代理变量,实证发现投资者互动越少的股票未来收益越高。据此,提出本文的假设H3:
H3:投资者互动程度越高,股票收益越低;互动度减弱则导致股票收益增多。
三、实证设计
(一)数据来源
概念股依靠特定的题材,经常被当作选股方式,可被引申为一个市场的共识。由此,本文选取中路股份、深中华A、信隆健康、红旗连锁、华讯方舟、上海凤凰、华西股份、兆新股份这8只共享单车相关概念股作为研究对象。而永安行作为共享单车上市第一股,发展历程较短,采集数据缺失值较多,因而未被引入研究框架。本文主要涉及两类数据:一类是股票收益的市场数据,一类是基于东方财富网股吧平台的共享单车概念股文本挖掘数据。其中,股票收益的市场数据选用日收益率,来自锐思金融数据库。为了更加合理地反映投资者情绪,研究采用的金融文本信息必须具有代表性、可操作性。东方财富网的Alexa排名、百度权重、Google PR(Page Rank)值和搜狗PR值在中国财经论坛网站中排名靠前,它对板块、行业、个股进行了全方位的精细分析,可以为信息采集提供便利。由此,文本挖掘数据从东方财富网采集。本文利用八爪鱼采集器爬取到2017年1月1日至2017年6月30日期间8只共享单车概念股相关信息的标题、作者、发表日期、阅读数、评论数等信息,采集时间为2017年10月8日。实证分析采用Stata 14软件来实现。
(二)数据初步处理
采集到的数据存在信息抓取遗漏、评论标题重复、网络用语或者表情符号较多的现象,还存在许多广告、推送等无用信息,所以情感分析前需要对原始数据进行清洗。本文主要利用Excel的“查找”、“删除重复值”、“筛选”等功能将数据初步人工清洗。接着,使用ROST Wordpraser软件过滤掉无意义的词汇,对数据进一步去噪处理。将剩余的数据按照发表日期进行排序,将余下的标题信息提取出来,生成“txt”的文本文档格式。
(三)基于网络文本挖掘的投资者情绪指标体系构建
ROST情感分析软件是由武汉大学ROST虚拟学习团队自主研发的情感分析工具,可以不通过Python、R语言等编程来便捷地实现情感倾向分析。该工具主要考察情感词和程度词在句子中的分布来确定情感倾向,适合基于语义的中文文本情感分析。此外,它还带有权值词典,囊括了情感词表、否定词、程度副词、停用词表,准确率较高。因此,本文应用ROST CM 6.0软件对文本进行情感分析,可得到“情感分析详细结果”、“正面情感结果”、“中性情感结果”、“负面情感结果”、“情感分析统计结果”、“情感分布视图”。每个标题的情感值可从“情感分析详细结果”中获取,是句子中正面、中性、负面情感值的加总平均值。共享单车概念股股吧主题的情感值见表1,可以反映出投资者的积极、中性或者消极情绪。同时,对积极和消极情绪进行了层次的划分,包括一般、中度和高度,基本契合微观主体的心理。从表1可以看出,采集的39249条文本信息中表现出的中性情绪居多,占总体情绪的43.55%,其中红旗连锁最突出。积极情绪次之,消极情绪最少,仅占19.9%。从乐观情绪、消极情绪的程度来看,投资者多表现出一般的情绪。这表明,多数投资者对我国共享单车市场持观望态度。
然而,从股吧挖掘到的信息还不止文本标题,还包括阅读数、评论数等数值型指标。阅读数可以用来反映投资者对该标题内容的关注程度,而评论数则是投资者之间的互动交流、信息传递的直观数据。由此,本文将阅读数、评论数定义为投资者关注度指标与投资者互动程度指标。本文通过日频数据进行后续研究,投资者情绪則是当日所有股吧主题帖情感值的算数平均值,而投资者关注度和互动程度是当日总阅读数、评论数的对数值。
(四)实证模型
结合投资者情绪、投资者关注度、投资者互动程度3个指标,对8只共享单车概念股2017年上半年内119个交易日的股票收益进行面板数据分析,基于投资者情绪的实证模型见公式(1):
其中,股票收益用Return表示,代表第i只共享单车概念股t交易日的日收益率水平。投资者情绪用Sentiment表示,[β2]则是用来反映投资者情绪对股票收益的影响程度。投资者关注度和投资者互动程度分别用Attention、Interaction表示,而[β3]、[β4]反映相应的指标对股票收益的解释能力。
四、实证分析
(一)描述性统计分析
从表2可看出,投资者情绪均值为1.361,标准差为1.957,说明基于共享单车概念股论坛挖掘的投资者情绪高涨并且较不稳定。而投资者关注度和投资者互动程度的标准差值较大,反映了投资者的关注程度和互动程度在样本期内变化幅度明显。股票收益率均值为负,标准差约为0.025,股票收益波动相对稳定。
(二)相关性分析
表3显示了投资者情绪指标体系与股票收益的Pearson和Spearman相关性分析结果。在1%的显著性水平下,投资者情绪与股票收益的正向相关性均显著。这意味着,投资者情绪能够正向影响股票收益,论证了假设H1a。而投资者关注度、互动程度和股票收益的相关关系不显著。投资者情绪指标体系究竟对股票收益产生怎样的影响还需要通过回归分析来进一步检验。
(三)混合回归分析
经过LM检验和Hausman检验,本文确定选用混合回归模型对投资者情绪指标体系与股票收益进行实证研究。由于面板数据的特点,虽然通常假设不同个体之间的扰动项相互独立,但是同一个个体在不同时期的扰动项往往存在自相关。因此,本文在混合回归模型的基础上,对标准误的估计采用聚类稳健标准误。表4中,列(1)是投资者总体情绪下股票收益的回归结果,列(2)和(3)则分别体现积极和消极情绪下股票收益受到的影响。
投资者总体情绪对股票收益的影响系数为0.125,符号为正且在1%水平下显著,说明给定投资者关注程度和互动程度时,投资者总体情绪每变动1个单位,股票收益将提升0.00125。这表明投资者情绪与股票收益正相关,与相关分析的结果保持一致,也满足本文的假设H1a。就投资者关注度而言,在5%的显著性水平下与股票收益呈现出显著的正向关系,暗示了投资者关注度的增加能够带来股票收益的上涨。而投资者的互动程度对股票收益的解释方向发生了改变,其回归系数明显小于0,且在5%的统计水平上显著,表明投资者互动越频繁,股票收益越少,符合假设H3的推断。
对比积极情绪和消极情绪下股票收益的回归结果,不难发现消极的投资者情绪、关注度和互动程度对股票收益的作用均不明显,其中投资者关注度的影响方向还发生了改变。积极情绪的影响系数为0.141,略大于总体情绪的影响值,说明积极情绪对股票收益的提升能力更强。而消极情绪的影响系数较小且不显著,则消极情绪对股票收益无显著影响。这验证了文凤华等(2014)的结论和本文的假设H1b。在既定的积极情绪水平下,投资者关注度和互动程度对股票收益的影响方向未发生改变,但影响较大。
五、结论与建议
本文以我国共享单车概念股为切入点来着重分析投资者情绪对股票收益的影响。通过爬取中国最大的股吧论坛——东方财富网2017年1月1日至2017年6月30日关于8只共享单车概念股的股吧信息,利用ROST情感分析软件生成基于网络文本挖掘的投资者情绪指标,并结合挖取到的阅读数、转发数等数值型指标来进一步研究投资者情绪、投资者关注度和互动程度与股票收益的相互关系,还考察了积极情绪和消极情绪下股票收益的表现,得出以下主要结论:中国共享单车市场的投资者情绪与股票收益呈正相关关系,即随着投资者情绪不断高涨,股票收益将有所提升;投资者关注度的增加会带来更多的股票收益;投资者对共享单车概念股的互动频繁,将拉低该股的股票收益水平。此外,积极情绪对股票收益的正向提升作用显著,而消极情绪对股票收益无显著影响。
共享单车市场属于新兴市场,再加上我国股票市场规范程度较弱,投资者市场情绪能够引起股票收益的剧烈波动。随着各类互联网媒体的蓬勃发展,难辨真伪的信息不断传播,这使得投资者情绪产生波动,而情绪变化会导致股票投资行为发生偏差和非理性,加剧了证券市场的非稳定性。为了防范因投资者情绪过度波动可能带来的系统性金融风险并稳定资本市场秩序,提出如下几点建议:个人投资者应加强情绪管控,谨防非理性投资;机构投资者应加强窗口指导,积极应对“羊群效应”等跟风行为所导致的市场非理性;政府部门应大力宣传理性投资观念,强化理性投资教育。同时,应该创新管理社会化媒体的途径,加强对社会化媒体的舆情监控,防止虚假信息的传播。证券市场的监管应逐步走向多维度、全方位,全面纠正市场非理性投资行为。
参考文献:
[1]Brown G W,Cliff M T. 2004. Investor Sentiment and the Near-Term Stock Market[J].Journal of Empirical Finance,11(1).
[2]Fisher K L,Statman M. 2000. Investor Sentiment and Stock Returns[J].Financial Analysts Journal,56(2).
[3]Lemmon M, Portniaguina E. 2006. Consumer Confidence and Asset Prices: Some Empirical Evidence[J].Review of Financial Studies,19(4).
[4]Fong W M, Toh B. 2014. Investor Sentiment and the MAX Effect[J].Journal of Banking & Finance,46(3).
[5]Baker M, Wurgler J. 2006. Investor Sentiment and the Cross-Section of Stock Returns[J].The Journal of Finance,61(4).
[6]Aissia D B. 2016. Home and Foreign Investor Sentiment and the Stock Returns[J].Quarterly Review of Economics and Finance,59.
[7]Lee W Y,Jiang C X, Indro D C. 2002. Stock Market Volatility,Excess Returns,and the Role Of Investor Sentiment[J].Journal of Banking&Finance;,26(12).
[8]Barber B M, Odean T. 2008. All That Glitters: The Effect of Attention and News on the Buying Behavior of Individual and Institutional Investors[J].Review of Financial Studies,21(2).
[9]Boyd N E, Büyük?ahin B, Haigh M S, et al. 2016. The Prevalence, Sources, and Effects of Herding[J]. Journal of Futures Markets,36(7).
[10]Gavriilidis K, Kallinterakis V, and Tsalavoutas I. 2016. Investor Mood, Herding and the Ramadan Effect[J]. Journal of Economic Behavior & Organization,132.
[11]熊偉,陈浪南.股票特质波动率、股票收益与投资者情绪[J].管理科学,2015,28(5).
[12]文凤华等.投资者情绪特征对股票价格行为的影响研究[J].管理科学学报,2014,17(3).
[13]黄宏斌,翟淑萍,陈静楠. 企业生命周期、融资方式与融资约束——基于投资者情绪调节效应的研究[J].金融研究,2016,(7).
[14]王春.投资者情绪对股票市场收益和波动的影响——基于开放式股票型基金资金净流入的实证研究[J].中国管理科学,2014,22(9).
[15]金德环,李岩.投资者互动与股票收益——来自社交媒体的经验证据[J].金融论坛,2017,22(5).