管理层的“弦外之音”，投资者能听得懂吗？
——基于管理层语意的LSTM深度学习研究

2019-06-14 10:07:42杨七中马蓓丽

财经论丛 2019年6期

杨七中，马蓓丽

(1.南京财经大学会计学院，江苏南京 210023；2.江苏理工学院商学院，江苏常州 213001)

一、引言

东方文明深受“儒家文化”的熏陶和影响，人们在交流信息时，习惯于间接隐晦、绕弯子的表达方式，甚至有些信息只可意会不可言传，即东方社会是一个高语境传播的社会(Hall，1976)[1]。那么当企业管理层向资本市场传递公司私有信息，特别是一些非财务信息时，投资者能否听懂这些话里话、弦外音呢？能否吸收这些非量化、描述性信息呢？对这一问题进行研究，有助于理解资本市场异象，提高资本配置效率，缓解股价崩盘风险。

前期文献研究了信息传递时的资本市场反应，其中多数聚焦于可量化的财务信息披露，如盈余、收入和分析师荐股等对市场反应的影响，但对于那些难以量化的非财务信息披露，由于缺乏客观量化非财务信息的方法，长期以来针对投资者能否有效地吸收这些非财务信息的研究还不多见。近年来随着计算机自然语言处理技术的发展，已经有文献使用文本分析技术来量化非财务信息的内容和情绪(Tetlock et al.，2008；Loughran et al.，2011；谢德仁等，2015；林乐等，2016，2017)[2][3][4][5][6]，其中使用最多的是“词袋法”，然而“词袋法”存在一定的局限性：不同学科的词典并不兼容；词与词之间缺乏因果关系，容易导致语义误判，造成虚假回归(Jegadeesh et al.，2013)[7]，尽管后期有学者采用构建或扩充专业词典的研究方式(林乐等，2016)[5]，但解决上述问题仍需要寻求新的文本量化技术。

本文选用LSTM深度学习技术，对我国上市公司年度业绩说明会上的管理层回复进行文本分析，试图研究投资者能否听懂管理层所表达的真正语意。用Python程序爬取2010～2014年全景网站(http：//www.p5w.net/)所有上市公司年度业绩说明会上管理层和投资者之间问答文本，经过数据清洗，构建人工标注和玻森中文语义平台(BosonNLP)相互印证的语料库，利用python的Jieba分词库、tensorflow库等基于LSTM神经网络技术进行深度学习，以分析管理层回复的“弦外之音”。进一步利用事件研究法分析相关上市公司业绩说明会的市场反应和管理层语意之间的相关性，以检验投资者能否听懂管理层的“弦外之音”。研究表明，投资者能够理解管理层的真实语意，资本市场对正面语意做出显著的正向反应，对负面语意做出显著的负向反应，但是对正面语意的反应存在一定滞后期，未发现证据支持投资者会把管理层语意作为交易策略因子。

本文主要有以下几方面贡献：一是采用的LSTM深度学习技术，顾及词语之间的因果关系，可以降低语意误判率，避免陷入虚假回归陷阱，是对传统“词袋法”文本分析技术的改进；二是发现管理层语意的确具有信息含量，在前期Fama-French五因子模型基础上，未来可否考虑将一些非财务信息作为影响资产定价的因子纳入模型，这为行为金融量化研究提供有益的启示；三是研究表明上市公司和投资者之间以业绩说明会这样的互动敞开方式沟通，起到了有效的信息披露作用，为监管部门思考如何进一步提高管理层讨论与分析质量和完善投资者保护环境提供经验证据。

二、制度背景与研究假设

(一)管理层信息披露制度概况

作为上市公司年报的重要组成部分，管理层讨论与分析(MD&A)是针对一些非常重要，但却无法通过定量财务指标进行揭示的机遇、挑战和风险向投资者做出说明，以便投资者做出合理的决策判断。上市公司业绩说明会本身又作为MD&A的一种补充，类似于美国的自愿性分析师盈余电话会议，最初源于2004年深交所针对中小企业发布的《深圳证券交易所中小企业板块上市公司诚信建设指引》，规定“上市公司应在每年年度报告披露后举行年度报告说明会，向投资者真实、准确地介绍公司的发展战略、生产经营、新产品和新技术开发、财务状况和经营业绩、投资项目等各方面情况，并将说明会的文字资料放置于公司网站供投资者查阅”。深交所在2005年、2010年、2015年多次修订的《深圳证券交易所中小企业板创业板上市公司规范运作指引》做了更为明确的规定“上市公司举行业绩说明会、分析师会议、路演等投资者关系活动，为使所有投资者均有机会参与，可以采取网上直播的方式”“公司应当在年度报告披露后十个交易日内举行年度报告说明会，公司董事长(或者总经理)、财务负责人、独立董事(至少一名)、董事会秘书、保荐代表人(至少一名)应当出席说明会”。2009年10月，创业板正式上市，深交所发布《深圳证券交易所创业板上市公司规范运作指引》规定“鼓励上市公司通过召开新闻发布会、投资者恳谈会、网上说明会等方式扩大信息的传播范围，以使更多投资者及时知悉了解公司重大信息”。除中小企业创业板之外，证监会并不强制要求主板上市公司举行业绩说明会，但随着互联网自媒体热潮席卷，许多主板上市公司为了自身的发展，自愿举行业绩说明会向资本市场传递当下和未来的经营发展信息。随着时间推移，每年越来越多的大公司借助互联网，自愿举行网上业绩说明会，逐渐变成公司管理层和投资者之间交流的主要平台。

与MD&A和分析师盈余电话会议等信息披露方式相比，通过分析我国上市公司网上业绩说明会的形式与内容，发现其具有一些鲜明的披露特征：第一，时间点较集中。业绩说明会一般集中在年报披露之后的14个交易日之后举行(林乐，2016)[5]，就事件研究而言，可以避免盈余公告效应以及其他跨期外生事件对股票超额累计收益率的干扰；第二，高管参与度高。八成以上公司由董事长、总经理和独立董事亲自参与业绩说明，保证了信息披露的权威性、正规性及可信性；第三，开放互动包容。相对于美国盈余电话会议主要是公司高管和分析师参加而言，我国上市公司业绩说明会更加开放，现有和潜在投资者、分析师及各类感兴趣的人均可在线参与提问。由于采用网络在线问答，实时随机互动，问题兼容并包；第四，交流内容多元。从行业状况、公司战略、生产经营、募集资金使用、新产品新市场开发，到公司营销、技术、财务及发展前景等方面存在的困难和损失，甚至还包含个人兴趣爱好，涵盖投资者关心的大多方面，信息琳琅满目，内容丰富多元；第五，语言含蓄内敛。由于受到中国文化情境影响和基于商业机密的考虑，管理层在回答投资者等提问时，常常表现出语言含蓄、避而不答或者程式化答案，这给传统的文本分析方法带来了研究挑战。

(二)研究假设

国外学者通过计算机自然语言处理技术，提取出非财务文本所包含的语意或情感变量，来研究文本语意与公司价值和投资者行为等的关系，发现其与未来盈利水平、投资者行为、股票预期收益率甚至是管理层欺诈行为具有关联性(Price et al.，2012；Mayew et al.，2018)[8][9]。有的学者从文本的可读性方面进行研究，发现迷雾指数越高的公司(即年报越难读懂)，其盈利水平越差(Feng Li，2008)[10]，报告越易读懂，则小股东越愿意持股(Lawrence，2013)[11]。还有的学者从文本的语调方面进行研究，发现MD&A和盈余电话会议语调越正向，则股票收益率越高、波动性越低(Price，2012)[8]，盈余电话会议中管理者特定语调与未来业绩正相关，即语调越正向，未来四个季度的资产报酬率越高(Davis，2015)[12]。在检验10-K披露的市场反应时，发现正向语调和负向语调与市场反应显著相关(Jegadeesh and Wu，2013)[7]，甚至可以预测管理层欺诈(Purda and Skillicorn，2015)[13]。近年，国外对非财务信息的文本分析已经从语调走向语音研究，如利用测谎软件分析盈余电话会议上管理层音频声调和情感真实度，发现正向语调会引起当期超额收益率(Mayew，2018)[9]。

国内会计与财务领域的非财务信息文本分析研究处于刚刚兴起阶段。有的学者从文本的可读性特征进行研究，如彭红枫(2016)[14]发现借款陈述的迷雾指数和文本长度都与借款成功率呈“倒U型”关系，并与实际借款利率存在线性正相关关系。有的从文本的语调角度进行研究，如谢德仁等(2015)[4]基于业绩说明会发现管理层正面语调与公司下一年业绩正相关。林乐等(2016)[5]发现投资者对管理层正面语调做出显著的正向反应。朱朝晖等(2018)[15]基于A股上市公司MD&A样本，检验管理层语调离差策略对分析师预测的影响，发现业绩较差的公司会策略性地安排管理层语调词的分布，且这样安排对分析师预测有显著影响。有的从文本主题类型方面进行研究，如孔翔宇等(2016)[16]挖掘了财经新闻主题内容与股市的相关性，发现国际贸易以及城市化新闻主题与股市变动密切，能准确预测当日股市涨跌。还有学者研究社交媒体的投资者情绪影响股票未来收益(徐巍等，2016；金德环等，2017)[17][18]。

相较于其他披露方式，管理层业绩说明会受到各地证监局的大力支持，上市公司自身的积极响应和深交所的严格管制，无论是披露时点、内容还是形式都比较规范。另外，参会的管理层是实名的，投资者是匿名的，双方可就主要问题开诚布公交流，相关问题的回答比较彻底，信息挖掘比较深入，有的问题甚至会经过多轮重复博弈，特别是采取网络在线、实时动态的交流方式，使得一些无法事先预设、即问即答的话题能够原汁原味地呈现出来，有助于降低管理层和投资者之间的潜在信息选择性偏差和道德风险，预期可以给资本市场带来新的信息增量：(1)降低信息选择性偏差。由于信息披露具有经济后果，管理层有可能为了特殊利益而选择性地披露信息，如时间、内容和方式的选择来影响投资者的预期，对管理层业绩说明会这一开放互动披露方式而言，投资者可以就自己关心的问题反复追问管理层，从而降低了信息不对称风险，大大减少了公司只披露对自己有利信息而规避对自己不利信息的逆向选择行为；(2)减少道德风险。公司通常的季报、年报和公告等其他披露方式是以集体名义披露，存在搭便车问题。而管理层业绩说明会采取实名制，管理层个体要为自己说的话负责，最终交由资本市场去检验，即所有的信息都能承包到户、责任到人，另外管理层对他们的声誉资本是非常敏感的(李增泉等，2000)[19]，这就意味着资本市场的声誉约束机制可以抑制管理层的“语言膨胀”，减少道德风险。

不确定性是影响宏观经济运行的潜在因子(Bloom et al.，2018)[20]。Ball and Sadka(2015)认为用会计盈余对经济增长的预测虽然合理，但实际情况更为复杂，真正起到资产定价作用的是盈余风险(Beaver et al.，1970；Fama and French，1995)，盈余风险映射了微观经济不确定性，可诱导宏观经济更大幅波动。行为经济学的前景理论认为人们往往对损失比对获得更敏感，即投资者在决策时对损失风险更敏感，考虑到我国尚处弱式有效市场、信息披露质量并不高，投资者对于正负语意信息的反应可能有所不同。对于正面语意信息，投资者为了决策更稳健，需要花费更多的时间和渠道去验证正面语意信息，而对于负面语意信息，投资者往往抱着“宁可信其有，不可信其无”的心态，反而会及时做出风险规避决策。实验研究也表明投资者在使用会计信息进行风险评估时，更看重负向预期而不是正向预期。在投资者情绪的作用下，会计准则变革引发的企业财务行为的变化通过一种加速传导机制作用于资本市场和宏观经济，学者们发现投资者情绪能够引发资本市场波动和跨市场效应，即损失风险映射了微观经济不确定性，可诱导资本市场乃至宏观经济更大幅波动。因此，我们预期当面临不确定性时，投资者对负向非预期盈余的反应大于对正向非预期盈余的反应，即投资者对负向语调的反应更及时并且也更显著。

基于以上分析，本文选择管理层业绩说明会作为文本分析样本，利用LSTM神经网络深度学习技术，提取管理层的语意，再把语意区分为正面语意和负面语意，并提出以下待检验假设H1和H2。

H1：在其他条件相同的情况下，资本市场会对管理层正面语意做出正向反应，但存在滞后期。

H2：在其他条件相同的情况下，资本市场会对管理层负面语意会做出更及时、更显著地负向反应。

三、研究设计

(一)管理层语意的衡量

目前比较主流的文本分析方法是词袋法(Bag of words)，原理是忽略文本的词序和语法，假定文本中每个词不依赖于其他的词，都是独立的，仅将其看作是若干词语所组成的集合。具体执行步骤首先是通过分词库对文本进行分词(中文如Jieba分词库，英文如NLTK库)，然后通过词频-逆文档算法(TF-IDF)筛选出每个文本中一些关键词，再载入语意/情感词典进行比照，最终计算得到文本语意/情感概率值。

其中最关键的就是情感词典的选用。国外相关研究主要基于四种英文情感词典：(1)Henry词典；(2)Harvard GI词典；(3)Diction词典；(4)Loughran and McDonald词典。国内比较常见的中文情感词典有台湾大学情感词典(NYU)、Hownet情感词典、英文字典汉化(谢德仁等，2015；林乐等，2017)[4][6]。情感词典最大的局限性就是缺乏普适性，特别是缺乏在财务会计领域的普适性。Loughran and McDonald(2011)[3]曾批评过Harvard词典和Diction词典的高误判率，用Harvard和Diction词典发现年报中MD&A的管理层语意和未来业绩不存在正向关联。Harvard词典中75%的负向词语，在金融文本中并不一定表示负向情绪，比如“税收”“成本”“债务”和“折旧”等在词典中被归入负向词语，但在年报文本中随处可见，只不过是会计专业名词，未必表示负向情绪。与前三种词典相比较而言，尽管Loughran and McDonald词典的主要特点是考虑了情绪词典在财务会计领域的适用性，但在判断准确率方面仍然差强人意，本文分别使用LSTM和词袋法在对测试集样本验证后发现，LSTM的总预测准确率约86.25%，高于词袋法的总预测准确率75.65%。

人的思维具有连贯性，通常在阅读时，人类不会孤立地理解所阅读到的词语，而会基于对前面词语的理解来推断后面词语的意思。关于这一点，传统的神经网络却无法做到。比如你打算对一部电影里的某个镜头进行分析，想了解它正在上演什么。传统的神经网络只能孤立地看待每一个镜头，而无法把上一个镜头串联到下一个镜头发生的事情(Christopher Olah’s blog, 2015)[注]http://colah. github. jo/posts/2015-09-NN-Types-FP/。现在RNN(循环神经网络)解决了这个问题，就是能够让信息在网络中再次循环。LSTM(Long Short-Term Memory，译为长短期记忆网络)是一种特殊的RNN，能够重复学习并记忆以前的信息，并连接到当前的任务中来。基于此，本文雇佣10名会计和金融专业研究生，首先对2005～2007年业绩说明会文本进行人工标注(正面语意标注为1，负面语意标注为0)，并相互比对，保留标注一致性的文本作为语料库(其中管理层正向语意20001条，负向语意20435条)，然后利用LSTM读取语料库并深度学习出管理层语意特征，最后去识别2010～2014年度的业绩说明会的管理层语意。LSTM法避免了词袋法没有考虑上下文因果逻辑和普适性不足的缺陷，较好地切合所研究样本的语境特点，实现了文本分析法的改进。

本文借鉴Loughran and McDonald(2011)、Price(2012)、林乐(2016，2017)[3][4][5][8]等的方法，构建上市公司业绩说明会管理层语意(MEANING)衡量指标如下：

MEANING_pos=POSNUM/(POSNUM+NEGNUM)当POSNUM>NEGNUM

MEANING_neg=-NEGNUM/(POSNUM+NEGNUM)当POSNUM

其中，MEANING_pos是t年第i家上市公司业绩说明会管理层正向语意，等于管理层正向回答问题数目(POSNUM)占全部问题数目的比例，0.5NEGNUM时，本文界定t年第i家上市公司业绩说明会管理层呈现正向语意。当POSNUM

(二)样本与数据

本文研究样本来自全景网投资者关系互动平台(http：//rs.p5w.net)，利用Python程序爬取2010～2014年全景网所有上市公司年度业绩说明会上管理层和投资者之间问答文本，删除ST公司和针对IPO前召开的业绩说明会，经过数据清洗，最终得到12万余条文本，合计3276个公司年观测值，其中1710个公司年观测值呈现正向语意，1566个公司年观测值呈现负向语意，168个公司年观测值呈现中性语意。本研究所需的其他数据来源于CSMAR和WIND数据库。在回归前，对所有连续变量上下1%进行winsorize，以避免异常值影响。数据清洗和统计分析使用Pandas库和STATA统计软件。

(三)研究模型与变量

本文采用事件研究法，借鉴林乐等(2016；2017)[5][6]、Loughran and McDonald(2011)[3]等研究，构建了如下市场反应与管理层语意的多元回归模型：

CAR=β0+β1MEANING+β2SUE+β3SIZE+β4LEV+β5ROA+β6GROWTH+

β7AGE+∑IND+∑YEAR+ε

(1)

在模型(1)中，被解释变量是股票超额累计收益率(CAR)，包括短窗口期CAR[0，3]、中窗口期CAR[0，10]和长窗口期CAR[0，20]。解释变量是管理层语意(MEANING)，分为正面语意(MEANING_pos)和负面语意(MEANING_neg)。根据假说H1和H2，预期MEANING_pos的系数显著为正，MEANING_neg的系数显著为负。控制变量有：T年末未预期盈余(SUE)、T年末上市公司资产规模对数(SIZE)、T年末财务杠杆(LEV)、T年末资产收益率(ROA)、T年成长率(GROWTH)、截至T年末上市年限(AGE)。同时还控制了行业(IND)和年度(YEAR)。

四、实证结果及分析

(一)描述性统计

表1给出了全样本和子样本下CAR单变量均值检验结果，在全样本情况下CAR[0，3]的均值是0.0153(t值是3.38)，在1%水平上显著；CAR[0，10]的均值是0.0353(t值是6.98)，在1%水平上显著，可见业绩说明会无论在短窗口期还是在中长窗口期，市场反应均显著不等于0，这表明业绩说明会具有信息含量；在划分为正面语意和负面语意两组子样本情况下，正面语意样本CAR[0，3]均值不显著异于0，而CAR[0，10]在1%水平上显著大于0，说明正面语意的市场反应可能存在一定滞后期；负面语意样本无论是短窗口期CAR[0，3]还是在中长窗口期CAR[0，10]，市场反应均显著不等于0；此外，负面语意样本比正面语意样本短窗口期CAR[0，3]均值大0.0113(t值是2.66)，中长窗口期CAR[0，10]均值大0.0281(t值是2.98)，均在1%水平上显著，说明负面语意样本市场反应比正面语意样本更强烈。

表1 全样本及子样本CAR单变量均值检验

注*、** 和*** 分别表示10%、5%和1%的显著性水平，CAR值取绝对值。

表2是主要变量的描述性统计结果。其中，管理层正面语意比负面语意的观测数稍多一些(1710：1566)，这比较符合业绩说明会的答疑实质，即大多数投资者在业绩说明会上就自己关心的问题提出各种质疑，更多的时候是表现出负面情绪，而管理层是尽可能地用正面语意来回答投资者的各种质疑，LSTM深度学习的结果准确地捕捉了这一双方势均力敌的博弈情况。正面语意的均值(中值)是0.6413(0.6250)，标准差是0.0946，最大值是1，最小值是0.5048，负面语意的均值(中值)是-0.6311(-0.6111)，标准差是0.0922，最大值是-0.4717，最小值是-1。未预期盈余(SUE)的均值和中值为负，资产规模的对数(SIZE)均值是21.4571，ROA的均值(中位数)是0.0458(0.1312)均为正，说明公司整体盈利能力良好，其余变量与前期文献基本一致。

本文对主要变量进行了Pearson和Spearman相关性检验，在正面语意样本组，MEANING_pos与CAR[0，3]、CAR[0，10]正向但不显著相关，与CAR[0，20]在10%水平上显著正相关。在负面语意样本组，MEANING_neg与CAR[0，3]、CAR[0，10]和CAR[0，20]均在1%水平上显著负相关。其他控制变量的VIF均小于5，故模型不存在多重共线性问题。

表2 多变量描述性统计

本文对正面语意和负面语意两个样本组，分别按照正面语意和负面语意(MEANING_pos/MEANING_neg)从小到大五等分，并对CAR[0，3]、CAR[0，10]和CAR[0，20]三个短、中、长窗口进行均值差异检验。首先对MEANING_pos分五组，最大组和最小组短窗口期CAR[0，3]的均值差异为0.0375(t值是1.27)，中窗口期CAR[0，10]的均值差异为0.0407(t值是1.36)，在10%水平上不显著，长窗口期CAR[0，20]的均值差异为0.0669(t值是2.21)，在5%水平上显著，可见，管理层正面语意越大，CAR值越大，但两者在短中窗口期CAR[0，3]、CAR[0，10]并不显著正相关，但在长窗口期CAR[0，20]呈现显著正相关性。然后对MEANING_neg分五组，最大组和最小组CAR[0，3]的均值差异为-0.0289(t值是-1.87)，在10%水平上显著，CAR[0，10]的均值差异为-0.0409(t值是-2.59)，在1%水平上显著，CAR[0，20]的均值差异为-0.0645(t值是-2.75)，在1%水平上显著，这说明管理层负面语意越大，CAR值越大，两者在短、中窗口期和长窗口期均显著负相关。

(二)多元回归分析

表3报告了多元回归模型的回归结果：(1)在正面语意样本组中，管理层正面语意(MEANING_pos)对CAR[0，3]的回归系数为0.0206(t值为1.31)，在10%水平上不显著，CAR[0，10]的回归系数为0.0407(t值为1.37)，在10%水平上不显著，而CAR[0，20]的回归系数为0.1255(t值为3.02)，在1%水平上显著，说明资本市场上的投资者并未及时对管理层正面语意做出反应，存在一定的滞后期，基本支持研究假说H1。(2)在负面语意样本组中，管理层负面语意(MEANING_neg)对CAR[0，3]的回归系数为-0.2688(t值为-3.58)，在1%水平上显著，CAR[0，10]的回归系数为-0.3425(t值为-3.94)，在1%水平上显著，CAR[0，20]的回归系数为-0.4413(t值为-4.69)，在1%水平上显著。再进一步对CAR[0，3]和CAR[0，10]的回归系数作组间差异性检验，结果为-0.074(Chi2值为0.05)，在10%水平上不显著。CAR[0，3]和CAR[0，20]组间回归系数差异的结果为-0.173(Chi2值为0.28)，在10%水平上不显著，表明投资者在短窗口已经开始对管理层负面语意做出及时并且显著的负向反应，从而支持研究假说H2。本文的研究发现与行为经济学的前景理论和相关前期文献的结论是一致的。

本文的研究一方面为行为经济学的前景理论提供了经验证据，另一方面提供了政策启示：第一，上市公司业绩说明会这样的非财务信息披露形式，是财务信息披露的有益补充，有利于提高资本市场配置效率。监管部门未来可在非财务信息披露的形式多样性、内容互动性、现场即时性等方面做进一步拓展，积极引导上市公司实时、主动、全方位地披露财务和非财务信息，切实有效地保护公司外部投资者的利益。第二，加大规范非财务信息披露的内容和质量。从目前业绩说明会上管理层回答的内容来看，并不是每家公司都会做全面细致的披露，存在避重就轻、欲说还休的情形。监管部门应当在现有的“规范指引”基础上，进一步规范公司非财务信息内容的广度和深度，加强约束、拉高准绳。第三，完善技术手段，建立非财务信息预警体系。如果说公司非财务信息具有信息增量，能够修正投资者情绪，那么对于建立非财务信息预警体系，缓解未来股价崩盘风险具有重大实践意义。

表3 多元回归结果

注：括号内为t值，*、** 和*** 分别表示10%、5%和1%的显著性水平。

(三)基于三因子模型的进一步分析

本文进一步研究管理层语意可否作为投资者股票交易策略的因子之一？基于Fama and French(1993)三因子模型，通过计算管理层语意在低分位组和高分位组之间，三因子模型的Alpha值是否存在显著差异，用以验证该问题。具体步骤如下：(1)先根据上一年度的管理层语意，对所有样本公司进行五分位排序；(2)再对下一年度第一分位和第五分位的公司进行三因子模型回归；(3)最后比较五分位前后Alpha值是否存在显著差异。如果存在显著差异，则说明投资者在进行股票交易时，会把管理层语意作为股票交易策略因子之一。

表4 基于三因子模型的管理层语意分位回归结果

注：括号内为t值，*、** 和*** 分别表示10%、5%和1%的显著性水平。

表4是2010～2014五个年度分别根据上一年度管理层正面语意，分位前后的三因子模型回归结果。可以发现2010、2011和2013三个年度的Alpha值在分位前后均不显著异于0，2012和2014年Alpha值虽然显著大于0，但分位前后的差异并不显著(t值分别是1.32和1.05)，说明基于正面语意分位，并未给投资者带来超额Alpha收益，因此本文没有证据支持投资者在进行股票交易时，会把管理层语意作为交易策略因子之一。同样基于管理层负面语意的分位研究，得到类似的结果(限于篇幅，图表省略)。

(四)稳健性检验

为了确保结论的稳健性，本文进行了多种稳健性检验：(1)采用幼稚模型(Naive Model)重新计算CAR[0，3]和CAR[0，10]，用窗口(-200，-20)作为估计期，回归结果保持不变。(2)选用不同长度的窗口计算CAR值。具体包括短窗口(-3，1)、(-3，3)以及长窗口(3，30)、(3，60)和(3，90)，回归结果保持一致。(3)分别基于用四因子和五因子模型，对管理层语意进行分位回归，回归结果基本一致。仍然支持假说H1和H2。

五、结论

本文基于2010～2014年间我国上市公司年度业绩说明会上管理层披露的文本内容，选用LSTM深度学习技术，对管理层的回答文本进行分析，研究投资者能否听懂管理层所表达的真正语意并做出相应的反应(用业绩说明会前后的市场异常回报来衡量)。研究发现投资者对正面语意在短窗口期内并未做出显著的正向反应，但却在长窗口期内做出显著的正向反应，而投资者对负面语意无论是在短窗口还是长窗口期内都做出显著的正向反应。这些结果说明，我国资本市场上的投资者能够听懂管理层所传递的“话里话、弦外音”，不过投资者对好消息的反应存在一定滞后期，对坏消息的反应更为及时，验证了行为经济学领域的前景理论。此外也说明作为一种新兴的非财务信息披露渠道，管理层业绩说明会确实具有信息含量，是一种行之有效的实践操作方式。

不同于前期文献普遍采用的词袋文本分析法，本文率先选用LSTM深度学习技术，某种程度上可以避免词袋法存在的不同学科词典不兼容、无法捕捉文本因果关系以及词义误判等缺陷，正如Leuz and Wysocki(2016)[21]所指出，文本应当是试图反映所属行业领域的经济现实，倘若将文本与行业背景相分离，那将是影响所有会计质量指标的基本问题。而LSTM深度学习是基于前期管理层业绩说明会自身文本信息，最少损失地提取文本特征并用于分析后期业绩说明会文本信息，既可以消除了词典的兼容问题，又可以捕捉文本因果关系，最终降低词义误判，提高回归准确率。该方法具有良好的普适性，可以推广到其他非财务信息披露研究领域，但是必须指出的是，对语料库的准确标注是决定LSTM深度学习成功的关键因素。

未来在研究方法和研究领域方面可做进一步拓展：(1)在文本分析法基础上，结合声音软件(比如测谎软件)、图像识别技术等测量管理层语气和相貌等特征，捕捉全方位、多维度的非财务信息；(2)可借助刚刚兴起的“从微观数据到宏观经济”理论框架，以管理层语意为切入点，研究其在宏观经济预测中的应用价值及作用机制，服务于经济政策制定和微观企业实践。

财经论丛2019年6期

财经论丛的其它文章: 环境规制与城镇居民收入不平等
——基于异质型规制工具的视角; 人们会在网上做更多慈善吗？
——“互联网+慈善”模式对个体慈善行为影响机制研究; 绿色文化、环境绩效与企业环境绩效信息披露; “短贷长投”是企业的被迫行为吗？①
——基于管理者过度自信的视角; 分析师关注的治理功能悖论：中国的逻辑
——基于A股上市公司的经验证据; PPP项目是否创造价值？
——来自上市公司2012～2016年参与PPP项目的经验证据

管理层的“弦外之音”，投资者能听得懂吗？——基于管理层语意的LSTM深度学习研究

一、引 言