地区信息、注意力约束与股票收益

2023-05-18 00:46刘昌阳薛英杰

云南财经大学学报 2023年6期

刘昌阳,薛英杰,汪勇

(1.重庆交通大学经济与管理学院,重庆 400074; 2.对外经济贸易大学金融学院,北京 100029;3.西南财经大学金融学院,成都 611130)

一、引言

股价变动是对信息的反应,具有共同特征的公司,其股票价格往往会一起变动,典型的例子为同一行业内股票的联动。根据经典资产定价理论,具有共同特征的公司股价在面临共同信息时会因为受到影响的大小而产生相应变化,但无论变化程度如何,变化速率应该一致(Fama,1970)[1]。然而,行为金融的注意力约束理论指出,投资者处理信息或执行多任务的能力有限,金融市场信息繁多、复杂,信息的收集、处理和分析需要大量成本,因而导致其不能及时关注和解读所有关于公司价值的信息(Kahneman,1973;Hirshleifer and Teoh,2003)[2-3]。大量实证研究表明,具有共同特征的股票对共同信息的反应不总是同步的,一些股票的反应存在延迟,表现出股票收益可预测性(Cohen and Lou,2012;Parsons et al.,2020;胡聪慧等,2015;向诚和陆静,2018)[4～7]。A股市场由于发展历程较短,交易主体以散户为主,可能存在比较严重的投资者注意力约束问题,因此相关研究结论对理解A股市场信息的反应特征和定价效率具有重要意义。

与行业联动相似,同一地区的公司由于共享本地生产要素,因此其股票价格会对本地区相关信息做出明显的共同反应(Pirinsky and Wang,2006;郦金梁等,2009)[8～9]。例如:2017年4月1日,中国宣布设立雄安新区,地处河北省的上市公司股票随后两周内平均涨幅为30.01%,而同期A股整体涨幅为0.58%(1)根据WIND数据库河北板块指数(CN6009.CNI)和中证A股指数(930903)在2017年4月1日至2017年4月14日的区间涨幅统计。。类似的还有上海自贸区等区域政策,都造成了相关股票的明显联动。此类“炒地图”现象一直受到资本市场的广泛关注,但相关学术研究却比较少。本研究试图结合投资者注意力约束理论,探讨同一地区内的公司对地区信息的反应速率差异问题,并在股票收益可预测性框架下进行实证研究。

本地公司的经营活动并不限于本地的事实给本研究区分投资者解读地区信息时面临的注意力约束程度,进而研究上述问题提供了渠道。现代公司的地域边界是模糊的,位于同一地区的公司在这一特征上也存在明显差异,例如:同属于电力行业的上市公司建投能源(000600)与科林电气(603050),总部均位于河北省,2017年前者的全部收入均来自于河北省,但后者的业务活动遍布全国,2017年河北省本地收入只占其全年总收入的29.35%。如果将公司的生产经营活动集中于本地区的程度定义为“本地化程度”,那么,建投能源是一家完全本地化的公司,而科林电气的本地化程度较低。

在投资者注意力约束普遍存在的股票市场中,高、低本地化公司在这一维度上的差异可能对股票价格纳入信息的效率造成重要影响。一方面,当新的地区信息来临时,注意力约束会促使投资者主要关注与该地区关联度最高、地区“标签”最鲜明、最容易分析的高本地化公司,这将导致信息对低本地化公司价值的影响被忽视,进而股价反应延迟。另一方面,注意力约束会降低投资者处理复杂结构信息的效率。高本地化公司业务较为集中,当新的地区信息来临时,投资者经过相对简单的信息处理过程就能够将信息融入股价中。低本地化公司由于地域覆盖面较广,导致更为复杂的业务结构,投资者需要在同一时间内综合多地信息来评估新地区信息对其价值的确切影响,从而需要更长的时间才能将信息融入股价中。总之,本文提出的核心研究假设为:面对地区信息,同一地区内低本地化公司的股价要比高本地化公司的股价反应更慢,采用高本地化公司股价变动作为反映地区信息的信号可以正向预测低本地化公司未来的股票收益。

采用2001—2018年沪深A股数据,提出一种基于年报文本中地区名称的提及频率度量公司本地化程度的方法,在将上市公司划分为“高”“低”本地化公司之后,利用投资组合分析及Fama和Mac-Beth(1973)[10]的回归分析方法,研究发现基于同一省(自治区、直辖市,下文称省份)内高本地化公司当月股票收益构建的预测指标可以正向预测低本地化公司未来1月的股票收益,对冲组合每月可获得超过1%的风险调整后收益。这一结论在控制一系列度量偏差以及子样本分析中均保持稳健。进一步分析表明,该股票收益可预测性在投资者关注度越低和信息处理复杂度越高的低本地化公司中均更明显,说明注意力约束理论指出的投资者忽视和信息处理复杂度是低本地化公司表现出股票收益可预测性的主要内在机制。

本研究的新意表现在以下三个方面:其一,发现了一个新的与上市公司地理特征相关的股票收益可预测性方法,有助于提高资产定价领域对于区域特征的研究兴趣;其二,目前A股上市公司未按照规则统一且详细地披露公司经营的地区分布情况,本研究提供了一种基于年报文本度量上市公司经营活动的本地化程度或者地域分散程度的方法,丰富了近年来关于年报文本信息挖掘的文献,也为研究相关金融经济学问题提供了技术选择;其三,现有关于注意力约束影响资产价格的研究主要集中于投资者忽视这一机制,本研究则强调了注意力约束框架下投资者忽视和信息处理复杂程度这两种既联系紧密又相互区别的机制。此外,本研究一定程度上表明了监管部门有必要对上市公司披露经营活动的地区分布情况时在规范性和详细性上提出更高要求,这有助于提高股票的定价效率。

后文的安排如下:第二部分为文献回顾并提出研究假设;第三部分为介绍关键变量度量和数据样本;第四部分为验证股票收益可预测性;第五部分为讨论内在机制;第六部分为结论。

二、文献回顾与研究假设

(一)投资者注意力约束与股票收益可预测性

根据Kahneman(1973)[2],Hirshleifer和Teoh(2003)[3],Peng和Xiong(2006)[11]的描述,投资者注意力约束,就是放松传统金融学理论中投资者完全理性并拥有无限信息处理能力的假定,认为注意力是一种有限资源。投资者对某些与公司价值相关的信息并不能及时关注,即使关注到了信息,投资者有限的信息处理能力仍然会导致资产价格对信息的反应速率受到信息处理复杂度的影响。

一些研究表明,投资者对某些与公司价值相关的信息存在短期忽视,股价的滞后修正引发股票收益可预测性。Hou(2007)[12]认为投资者注意力约束导致行业信息的缓慢传播是以往研究发现的大、小市值公司之间股价领先滞后效应背后的原因。Cohen和Frazzini(2008)[13]则提供直接证据,表明投资者未及时关注和解读具有经济联系(客户-供应商)的公司之间信息的相互影响,进而导致供应商-客户公司之间的股价变化存在领先滞后效应。根据相似的逻辑,Cao等(2016)[14]发现投资者忽视了战略伙伴公司信息变化对公司自身价值的影响,因此伙伴公司之间存在股票收益的领先滞后效应。Lee等(2019)[15]根据专利引用情况识别公司之间的科技关联度,结果发现公司的股票收益率与科技关联度相近公司股票收益率之间存在滞后领先关系。

国内研究方面。饶育蕾等(2013)[16]采用A股上市公司的交叉持股数据,发现被持股公司股票的当期收益能够正向预测持股公司未来股票收益,并证明该可预测性源自投资者注意力约束。此外,向诚和陆静(2018)[7]认为投资者注意力的有限性将导致行业信息在行业内和行业间逐步扩散,进而表现为同行业内低关注度公司的股票收益可预测性以及行业收益率与市场未来收益率之间的相关性。

另一些研究则提供了以信息处理复杂度为机制导致股票收益可预测性的证据。Cohen和Lou(2012)[4]发现单行业公司比集团公司反映行业信息更及时,集团公司的股票存在收益可预测性。他们将原因归结于集团公司(涉及多行业)比单行业公司业务结构更复杂、信息复杂度更高。胡聪慧等(2015)[6]基于A股市场也发现集团公司的股价相比于单行业公司对行业信息的反应更慢,不过他们认为投资者忽视机制在其中也起到一定作用。与Cohen和Lou(2012)[4]只强调信息处理复杂度驱动收益可预测性不同,Huang(2015)[17]认为投资者由于受到注意力约束,不能及时关注和处理影响跨国公司价值的国外信息,实证发现基于业务所在国的信息可以预测跨国公司未来股票收益。Finke和Weigert(2017)[18]则将Huang(2015)[17]的研究扩展到了22个国家的跨国公司样本,并证明这种股票收益可预测性普遍存在。

概括而言,近年来资产定价领域的一个重要发展特征就是引入投资者注意力约束,Hirshleifer和Teoh(2003)[3]以及Peng和Xiong(2006)[11]等构建的注意力约束模型对解释信息的市场反应差异、股价联动、盈余漂移以及资产之间的交叉可预测性都取得了成功。在该理论指导下,众多股票收益可预测性被发现,进一步加深了人们对资产价格运行规律的认识。与上述研究关注公司之间的经济联系或者行业属性不同,本研究着眼于上市公司的地区特征,旨在结合投资者注意力约束,分析股票价格在纳入地区信息时的反应速率问题,并提出相应的股票收益可预测性研究假设。

(二)地区信息、公司本地化程度与股票收益可预测性

许多研究已经关注到了股票价格变动背后的地区因素。Pirinsky和Wang(2006)[8]发现总部在同一地理区域公司的股票回报存在很强的联动性(股价同涨齐跌)。这一股票价格的地区联动现象在A股市场亦有明显体现(郦金梁等,2009;朱宏泉等,2011)[9][19]。同一地区的公司由于共享本地生产要素,导致其股票价格变动与当地经济条件变化紧密相关,所以地域联动现象背后反映了股价的变动受到地区信息的影响。Korniotis和Kumar(2013)[20]以及Tuzel和Zhang(2017)[21]找到了地区信息与本地股票收益率的直接关系,前者发现当地失业率较高、住房抵押比率较低时,本地股票会获得更高的未来回报,后者发现当地工资与房地产价格的顺周期程度会影响当地公司的风险,进而影响其股票收益。Parsons等(2020)[5]基于美国市场发现,总部位于同一地区的上市公司之间股票收益存在领先滞后效应,他们的解释是因为证券分析师是按行业组成团队而不是按地区,因此导致地区信息未被及时反应,当同一地区的公司具有共同的分析师时,预测性明显削弱。

然而,这些研究在探讨地区信息影响股价变动时是将同一地区内的公司都看作同样的“本地公司”,而忽略了一个显而易见的事实:公司经营活动并不限于本地。将公司的生产经营活动集中于本地区的程度定义为“本地化程度”,同一地区内本地公司的本地化程度存在很大差异。曹春方等(2015)[22]认为,中国省份地区之间市场分割的客观存在是一个共识,企业进行异地扩张能够较好地跨越市场分割限制,提升资源配置效率,并发现中国地方制造业上市公司有42.15%的子公司为外省份的异地子公司,民企的这一比例更是高达47.83%。而王斌和张伟华(2014)[23]的研究数据显示,2006—2010年,沪市上市公司一半以上的经营所得来自外地子公司。

假设本地区有新的信息来临,根据经典资产定价理论,该地区本地公司会因为本地化程度不同,进而公司价值受到的影响大小也不同,股价产生相应变化,但不论变化程度大还是小,变化速率应该一致(Fama,1970)[1]。但在投资者注意力约束普遍存在的股票市场中,高、低本地化公司的股价对于这一共同信息的反应速率也可能存在显著差异,从而表现出股票收益可预测性。

本研究认为,本地化程度可能会通过影响受注意力约束的投资者及时关注信息或者影响其解读信息的复杂程度,从而影响股价的反应速率。下面结合一个简单例子作具体分析。假设A、B两家公司都位于甲省份,A公司的经营活动全部限于甲省份,而B公司的经营活动只有50%在甲省份,即A公司为高本地化公司,B公司为低本地化公司。一方面,如果投资者要利用地区信息进行投资,那么就需要为股票划分地区类别然后形成待决策的“自选股”,在注意力约束情况下,其很可能只会关注少数几家与该地区关联度最高、地区“标签”最鲜明、最容易分析的公司——高本地化公司。换言之,如果投资者预期未来国家会出台针对甲省份的区域政策,那么A公司更可能成为“自选股”。当一则新的本地信息来临时,其对A公司的影响将会被投资者及时关注到,当期股价将迅速反应,而被暂时忽略的B公司的股价反应将相对滞后。另一方面,即使投资者都关注到了这则信息对A、B公司的影响,但两者之间的业务结构差异也可能造成信息复杂度存在差异,进而影响投资者解读信息的速率。对于高本地化公司A,业务集中于本地区,从而容易分析,当新的本地信息来临时,投资者能够通过相对简单的信息处理过程就可以将信息融入到股价中。而对于低本地化公司B,地域覆盖面广导致的更复杂的业务结构,会给投资者造成更高的信息处理复杂度。具体而言,B公司经济利益不全在本地,直接增加了投资者评估新地区信息对其价值确切影响的难度。因为投资者很难知道公司业务的确切地理分布,即使知道确切分布,投资者也需要在同一时间综合多地信息来完成评估过程,从而需要更长的时间才能将信息融入股价中,即低本地化公司B的股价对新地区信息的反应相对于高本地化公司A更慢。

图1展示了以上分析的基本逻辑。同一地区内高、低本地化公司的股价对地区信息反应时间上的这种“及时、延迟”特征启示人们可以捕捉股票收益的可预测性。如果t期某地区高本地化公司股票的平均收益为正,则表明该地区存在积极的地区信息,而该地区内低本地化公司在t期本应反应的这一积极信息则会延迟到t+1期才会最终完全融入股价。换言之,人们并不需要直接去度量地区信息本身,而是可以利用高本地化公司当期股价的变化构建反映新地区信息的“信号”,预测同一地区内低本地化公司未来股价的变化。因此,在A股这个以散户为交易主体,投资者受注意力约束理应更强的市场中,本研究试图实证检验如下假设:

图1 基于公司本地化程度的股票收益可预测性

H1:同一地区内的高本地化公司当期股票收益可以作为低本地化公司未来一期股票收益的正向预测信号。

根据对投资者注意力约束理论和股票收益可预测性相关研究的梳理,认为相关可预测性主要源自投资者忽视和信息处理复杂度这两种紧密联系的机制独立或共同的作用(Cohen and Frazzini,2008;Cohen and Lou,2012;Huang,2015;Cao et al.,2016;胡聪慧等,2015;向诚和陆静,2018)[13][4][17][14][6～7]。本研究对本地化程度导致股票收益可预测性的分析也是基于上述两种内在机制的逻辑演绎。基于上述内在机制进行进一步阐述,并提出相应的研究假设。

前文指出,因为注意力约束,高本地化公司可能更受交易地区信息的影响和投资者的关注,实际上这也可能在媒体和卖方分析师身上体现。当地区出现较大信息时,媒体也可能更多地关注和报道与该地区联系度最高的公司——高本地化公司。卖方分析师是以行业划分研究团队的,但为了迎合市场需要解读地区信息时,对地区内公司并不完全熟悉的他们也可能倾向于关注高本地化公司。所以,由于市场的这种“缺乏关注”,新地区信息对低本地化公司价值的影响被暂时忽视,导致股价反应延迟。按照现有研究逻辑,如果本研究确实发现低本地化公司存在股票收益可预测性,并且确实部分源于投资者忽视这一机制,那么将观察到股票收益可预测性在关注度越低的低本地化公司中体现会越明显。因此,提出如下内在机制假设:

H2:高本地化公司对低本地化公司股票收益的预测性,在投资者关注度越低的低本地化公司中越明显。

本研究还提出,由于经营活动的地域覆盖面广度不同,本地化程度不同的公司其业务结构复杂度亦不同,对注意力约束的投资者造成的信息处理复杂度亦不相同,是导致两类公司股价对地区信息反应速率不同的另一机制。一些研究间接表明,公司经营的地理分散程度确实会影响市场参与者的认知,以及分析相关信息对公司价值影响的难度。Garcia和Norli(2012)[24]通过年报文本识别美国上市公司经营活动的地理分散度,发现地域集中公司的股票预期收益高于地域分散公司,他们认为这是因为投资者对地域集中公司的认知度较高所致。Smajlbegovic(2019)[25]则发现,公司总部以外的经营活动所涉及地区的宏观经济信息能够预测公司未来业绩,进而影响股票收益。Bernile等(2015)[26]认为,机构投资者能够利用企业经营活动地理分散产生的信息不对称,并利用信息优势获得超额收益。Platikanova和Mattei(2016)[27]则发现,分析师对业务覆盖地域越分散的公司发布的盈利预测越不准确,反映了公司业务地理上越分散,估值复杂度越高。换言之,对于业务结构越复杂的公司,信息对公司价值的影响越复杂,投资者信息处理能力约束体现越明显。因此,如果本研究确实发现低本地化公司存在股票收益可预测性,而信息处理复杂是内在机制之一的话,那么信息处理复杂度越高的低本地化公司,投资者分析信息越困难,股票收益可预测性越强。因此,提出如下内在机制假设:

H3:高本地化公司对低本地化公司股票收益的预测性,在信息处理复杂度越高的低本地化公司中越明显。

三、变量设计与数据样本

(一)公司本地化程度

识别上市公司的本地化程度是本文实证的基础,其定义是公司生产经营活动集中于本地区的程度。目前A股上市公司对主营收入的地区分布情况未采取统一的规则披露且十分粗略,无法用于本地化程度的度量(2)根据中国证监会《公开发行证券的公司信息披露内容与格式准则第2号——年度报告的内容与格式(2012年修改稿)》第四节董事会报告第二十一条,“公司应当……对于占公司营业收入总额或营业利润总额10%以上的业务经营活动及其所属行业、主要产品或地区,应当分项列示其营业收入……”。但实际中,一些上市公司对营业收入的地区分布只简单统计为国内、国外,或者省份内、省份外,仅有少部分上市公司披露到了省份一级。根据本研究对2010年上市公司披露的营业收入地区占比的数据统计,超过2000家上市公司中仅有246家的披露具体到了省份一级。。参考近年来关于年报文本信息挖掘的研究(Garcia and Norli,2012;Bernile et al.,2015;刘昌阳等,2020)[24][26][28],提出一种基于年报文本中地区名称提及频率识别上市公司的经济所属地以及本地化程度的方法。基本思想是:年报文本中对某地区提及的频率,可以看作是上市公司与该地区经济联系的紧密程度,如果把提及率最高的地区视为该上市公司的所属地(本地),那么相应的提及率大小可以反映其本地化程度。

从上海证券交易所、深圳证券交易所网站和巨潮资讯网收集了2001—2016年所有A股上市公司共30366份年报文本。用于度量公司本地化程度的样本经过了如下筛选:其一,剔除因格式问题无法提取文本信息的样本;其二,许多上市公司的收入中很大比例来自海外,而“本地化”的含义限定于国内范畴,为减轻这种偏差,保证公司之间的可比性,剔除了有海外收入的公司样本;其三,剔除金融类公司。最终样本共涉及1947家上市公司的15437份年报,筛选过程详见表1中的Panel A。

表1 样本筛选过程

基于年报文本度量公司本地化程度的具体步骤为:

第一步,采取类似“关键词查询”的方式统计年报中地区名称的出现数量,例如:使用珠海、上海和重庆为关键词,对照格力电器(000651)2015年的年报全文,结果分别出现408次、9次和38次。同时,从国家民政部网站获取全国县级以上行政区划的名称和代码,共计3216个县、市、省级地区名词,建立一个地名词库(3)本研究获取的是2017年中华人民共和国行政区划代码,剔除中国台湾、中国香港和中国澳门,网址为:http://www.mca.gov.cn/article/sj/tjbz/a/2018/201803131439.html。。考虑到年报中提及地区名词一般是以简称的形式,因此对原始地区名称的全称进行了简化处理,作为最终匹配的关键词词库。例如:广西壮族自治区,用于匹配的关键词为“广西”(4)有些地区名称简化后是常用词,例如:甘肃省合作市,如果用“合作”作为关键词,会极大增加识别偏差。为此,在第一步县级地名统计频数后,将地名简称字面上容易混淆且在20%以上年报中都有提及的共256个地名进行了剔除。被剔除的256个地区详细名单备索。。基于此,可以从每份年报中获取一个包含地区以及相应出现频数的数据序列。

(1)

第三步,将提及率最高的省份确定为公司i的所属地(本地),相应的提及率就是公司i第t年的本地化程度(Localnessi,t)。例如:公司i在第t年年报中只提及了广东、四川、河南三个省份,各自的提及率与相应大小为a%>b%>c%,则公司i的所属地为广东省,本地化程度(Localnessi,t)为a%(7)本研究未直接将上市公司总部所在地设定为所属地,是因为总部所在地并不一定就是与公司经济联系最密切的地区。例如:一家上市公司经过了兼并重组,其总部在A省份,但其生产经营的主体可能在B省份,公司与B省份的经济联系可能相比A省份更强,那么在年报中B省份的提及率可能最多,从而被本研究的算法确定为公司的所属地。当然,最终识别的结果是92%以上公司提及最多的地区是其总部所在地,本研究在稳健性检验中也考察了这一因素对结论的影响。。

表2对本研究识别公司本地化程度过程中的相关变量进行了描述性统计。在年报样本中,1份年报出现的地名总数平均为563.24次,最少和最多分别为19次和3819次,平均会提到8.86个省份,最少为1个省份,最多则提及了31个省份。而对于单个省份的提及,最少为5次,最多达到2289次。这些特征表明,年报中确实会频繁提及地区名称,公司之间也具有明显差异。

表2 上市公司本地化程度识别:统计特征

如表2所示,本研究对1份年报中出现频率最高的前5个省份的提及率进行了统计。一家公司对与自己联系最紧密的地区(Top1)的提及率(Mtop1),也即是本研究定义的本地化程度(Localness)平均高达68.67%,25%的分位数为55.31%,最高为100%。而提及率第二高的地区(Mtop2)就降低至平均12.81%,提及率第4高的地区(Mtop4)平均不足5%。这说明A股上市公司的经济活动可能涉及很广的地区,但基本都有一个与自己联系明显紧密的地区,也即本研究认定的公司所属地。同时,本地化程度(Localness)平均较高,直觉上要高于单纯的公司营业收入分布于本地区的比例,这符合预期,因为本研究的本地化程度概念更多是指经济利益,而不限于单纯的收入关系。此外,这一基于年报识别的公司所属地与其总部所在地的重合率(=HQ)达到92.1%,与其注册所在地的重合率(=REG)为89.7%,三地一致的情况(=HQ=REG)则为87.6%,也符合直觉。

(二)股票收益预测变量

为了验证股票收益可预测性假设,从国泰安数据库(CSMAR)中获取A股上市公司的年度财务数据和月度股票交易数据,并与上述年报样本进行合并。由于A股上市公司发布t-1财政年报的最晚时间为t年的4月30日,为保证当月交易时年报数据为已知,因此合并的原则为t交易年5月至t+1交易年4月的月度股票数据对应t-1财政年的年报数据。另外,对合并的数据进行以下处理:其一,剔除上市交易不足6个月的样本;其二,为减轻股票停牌对研究结论的影响,要求进入样本的股票交易月,其前1个月的收益率不存在缺失;其三,剔除所有者权益为负或缺失以及净资产收益率数据缺失的样本。最终获得涉及1939只股票的176005个股票-月度观察样本,样本期间为2002年5月至2018年4月,处理过程见表1中的Panel B。

根据假设H1,通过以下思路构建股票收益预测变量,划分高、低本地化公司。本研究采取绝对值法设定划分标准,即本地化程度达到某一给定值的公司即为高本地化公司。由于70%的本地化程度介于所有样本公司本地化程度的均值与中位数之间(见表2),因此以70%为标准,本地化程度超过该值即为高本地化公司。而为了体现高、低本地化公司之间足够的差异,将本地化程度小于60%的公司认定为低本地化公司。因此,每一个地区都划分出了高、低本地化两组公司(8)在稳健性检验部分测试了其他划分标准(例如:65%、75%)对研究结果的影响。本研究并未采取相对值划分法,例如:按照各地区中位数划分高、低本地化公司,因为各地区之间公司的本地化程度中位数数值差异较大,可能会出现在一些地区80%本地化程度仍被划分为低本地化公司,一些地区50%即被划分为高本地化公司的情况。。对公司本地化程度的识别是每年进行,相应的高、低本地化公司也每年更新。图2和图3显示,两组公司数量在各省份和各年的基本分布特征均为高本地化公司数量多于低本地化公司数量。

图2 高、低本地化公司数量各省份分布(9)由于样本中无上市公司年报提及最多的省份是青海省,因此图2中无青海省。

图3 高、低本地化公司数量各年分布

在高、低本地化公司划分基础上,依据高本地化公司股票收益反映地区信息原则构建针对低本地化公司未来股票收益的预测指标——本地信息代理(LocInfo):

(2)

采用式(2)作为预测指标,实际假设本地信息完全未融入低本地化公司当期股票收益中。这一假设过于严格,更可能是LocInfoi,t已经部分反应在了当期股价中,可能出现的股票收益可预测性主要源于那些未反应到当期股价中的部分。因此,参考饶育蕾等(2013)[16]的做法,进一步构建未反应的本地信息代理(URLocInfoi,t),即低本地化公司i在t期的股票收益(RETi,t)对原始本地信息代理(LocInfoi,t)回归的常数项(α)与残差项(εi,t)之和:

LocInfoi,t=α+β×RETi,t+εi,t

(3)

URLocInfoi,t=α+εi,t

(4)

模型(3)中的β×RETi,t可以看作是t期本地信息已经纳入低本地化公司当期股票收益的部分。对模型系数的估计基于t期已知信息,因此在预测未来股票收益时不存在前视偏差问题。

(三)投资者关注度

选择以下指标作为投资者关注度的代理变量:

分析师覆盖(Analyst)。分析师覆盖较多的上市公司往往也是投资者关注度较高的公司,因此是文献度量投资者关注度的常用指标(Huang,2015;Cao et al.,2016;胡聪慧等,2015)[17][14][6]。

基金持股比例(FundRate)。基金等机构投资者被认为是具有信息优势的专业投资者,机构重仓的股票往往也受到个人投资者的重点关注(饶育蕾等,2013)[16]。

媒体报道(Media)。上市公司被媒体报道越多,越容易引发投资者的持续关注,被媒体报道的情况也被现有文献用于衡量投资者关注度(Hillert et al.,2014)[29]。

百度搜索指数(Baidu)。当投资者通过搜索引擎搜索某种股票时,即对这只股票产生了关注,搜索量的相对大小,直接体现了投资者关注度的高低(Da et al.,2011;俞庆进和张兵,2012)[30～31]。

(四)信息处理复杂度

现有研究一般从公司业务结构的复杂程度来度量投资者在面对这类公司时的信息处理复杂度。参考Cohen和Lou(2012)[4]以及胡聪慧等(2015)[6]的做法,采用公司经营涉及的行业数量(IndNum)度量公司的信息处理复杂度,公司涉及行业越多,业务结构越复杂,信息复杂度也就相应越高。与这种观点类似,本研究认为公司经营涉及的地域越多,投资者在解读与地区相关的信息时面临的复杂度相应越高,这一度量复杂度视角也更贴近本研究的内容。利用上市公司经营的地域分散程度从三个方面衡量信息处理复杂度:其一,年报文本提及的地区数量(ProvNum);其二,提及地区相对于公司总部所在地的加权平均距离(Distance),具体是先得到公司年报提及的每个省份与其总部所在省份的地理距离,然后使用提及率作为权重得到加权平均距离;其三,地区提及率的赫芬达尔指数(GHHI),为地区提及率的平方和,例如:公司甲最近1期年报提及了A、B、C三个省份,提及率分别为70%、20%、10%,则GHHI=0.72+0.22+0.12=0.54。根据涉及地区越多、范围越广,进而业务结构越复杂的思想,提及地区数量越多、平均距离越大和GHHI值越小的公司,信息复杂度越高。

A股上市公司被知名财经媒体报道的数据以及百度搜索数据来自中国研究数据服务平台(CNRDS),其余如分析师覆盖和基金持股数据来自CSMAR。上述变量的具体计算方法见表3。对于一些变量的数据期间不能覆盖本研究股票收益样本的情况,给出了相应的数据起始时间。变量的描述性统计特征见表4。用于回归分析的变量,除收益率变量外均进行了前后0.5%的缩尾处理。

表3 变量定义表

表3(续)

表4 主要变量描述性统计

四、股票收益可预测性检验

采用实证资产定价规范的投资组合分析和Fama-Macbeth横截面回归对假设H1进行检验。

(一)投资组合分析

一是根据本地信息代理(LocInfo)或未反应的本地信息代理(URLocInfo)逐月构建股票组合。以本地信息代理(LocInfo)为例,股票收益样本期间为2002年5月至2018年4月,在样本期内的每个t月底,都将该时点存在的所有低本地化公司按照其对应的t月本地信息代理(LocInfoi,t)的数值从小到大进行排序,并依据10%、35%、65%和90%分位数分成5组形成5个股票组合(P1、P2、P3、P4和P5)。P1和P5分别代表买入本地信息代理指标最低10%的公司股票和最高10%的公司股票形成的投资组合,P5-P1可以看作是买入本地信息代理最高组(P5),卖空最低组(P1)构建的多空对冲组合。

二是计算t+1月各股票组合中个股收益率的算术平均值,以及以个股在t月底的总市值为权重的加权平均值,分别作为该组合在t+1月的等权重收益率和加权收益率。

三是利用因子模型计算资产组合的超额收益。参照资产定价惯例,利用因子模型对资产组合收益率进行调整,以检验可能存在的超额收益是否可以被现有风险因子模型所解释。选择的因子模型包括纳入了市场因子(MKT)、规模因子(SMB)和价值因子(HML)的Fama-French三因子模型(Fama and French,1993)[32],增加盈利因子(RMW)和投资因子(CMA)的Fama-French五因子模型(Fama and French,2015)[33],以及在五因子模型基础上加入动量因子(UMD)的六因子模型。以Fama-French三因子模型为例进行说明:

RETp,t-Rf,t=α+βMKTMKTt+βSMBSMBt+βHMLHMLt+ε

(5)

其中,RETp,t为股票组合p在t月的原始收益率,Rf,t为t月的无风险收益,MKTt、SMBt和HMLt分别对应t月的市场因子、规模因子和价值因子。回归得到的截距项α就是股票组合p在样本期内针对三因子模型的月度超额收益。本研究从国泰安数据库(CSMAR)获取了1年期定期存款月度化利率代理无风险收益,以及基于A股市场计算的上述六个因子的月度数据。

表5中Panel A报告了基于原始本地信息代理(LocInfo)构建的5个低本地化公司股票组合以及相应的多空对冲组合在样本期内的平均月度原始收益率。从原始收益率看,无论是等权方式还是加权方式,5个组合的收益表现从P1的每月1.111%(0.279%)单调递增至P5的2.022%(1.343%)。也就是说,低本地化公司对应的t月本地信息代理(LocInfo)指标的值越大,其未来1月的股票收益越高,符合假设H1。以等权(加权)方式买入多空对冲组合(P5-P1),平均每月可以获得0.911%(1.064%)的收益,相当于年化约10.9%(12.77%),t值为3.16(2.52),表明这一股票可预测性兼具经济意义和统计意义。

表5 投资组合分析

表5(续)

图4展示了对冲组合(P5-P1)在每年度的回报情况,具体为计算该对冲策略从每年初执行到当年末获得的累计收益。可以看出,对冲组合在大多数年份都取得了正收益,在两次明显的牛熊市转换期内(2007—2008年和2014—2015年)也都表现良好,表明低本地化公司表现出的股票收益可预测性具有较高的稳健性。

图4 基于本地信息代理的股票对冲组合分年度收益

表5中Panel A也报告了使用因子模型对组合收益进行调整的结果,结论并未改变。以多空对冲组合(P5-P1)进行说明,在等权重组合下,三因子模型α为0.828%(t值为3.27),即多空组合在考虑了市场风险(MKT)、与市值相关的风险(SMB)以及与账面市值比相关的风险(HML)之后,仍取得了每月0.828%的超额收益。五因子模型α和六因子模型α的变化不大,分别为0.820%(t值为2.95)和0.844%(t值为2.94)。市值加权组合的考察结果相似,在六因子模型调整下,α为1.058%(t值为2.71),与1.064%的原始收益相似。

表5中Panel B则报告了基于未反应的本地信息代理(URLocInfo)构建的投资组合的分析结果。同样地,股票组合的原始收益率从P1至P5呈现单调递增模式,以等权(加权)方式买入多空对冲组合(P5-P1),平均每月可以获得1.992%(1.465%)的收益,且都具有较高的统计显著性。无论是等权重组合还是市值加权组合,各种因子模型均不能解释多空组合(P5-P1)的超额收益,市值加权情况下的六因子模型α为1.406%(t值为3.14),只是略小于1.465%的原始收益。

以上结论印证了本研究的假设H1,对于共同的地区信息,低本地化公司的股价反应要延迟于高本地化公司,基于t期高本地化公司股票收益构建的预测指标仍然与低本地化公司t+1月股票收益存在显著的正向关系,从而表现出股票收益可预测性。值得注意的是,基于未反应的本地信息代理(URLocInfo)构建的组合获得的超额收益在经济意义和统计意义上都高于原始本地信息代理(LocInfo),说明前者更能够捕捉低本地化公司的股票收益可预测性,与假设H1的内涵一致。

(二)Fama-Macbeth横截面回归检验

Fama-Macbeth横截面回归可以进一步控制其他影响股票收益的因素,而投资组合分析法无法满足这一要求。Fama-Macbeth横截面回归模型的基本形式设定如下:

RETi,t+1=λ0,t+λ1,t×Xi,t+λ2,t×Ci,t+εi,t

(6)

其中,RETi,t+1为低本地化公司i在t+1月的股票收益率,核心解释变量(Xi,t)为公司i对应的t月本地信息代理(LocInfoi,t)或未反应的本地信息代理(URLocInfoi,t)。对于控制变量Ci,t的选择,一方面,考虑了股票的系统性风险,即市场贝塔(βMKT);另一方面,参照Cohen和Lou(2012)[4]以及胡聪慧等(2015)[6]的研究,选择t期的公司规模(SIZE)、账面市值比(BM)、动量(MOM)、短期反转(REV)、换手率(TURNOVER)以及特质波动率(IVOL)。参照Fama和French(2015)[33]的研究,还考虑了表征盈利能力的净资产收益率(ROE)和表征投资水平的总资产增长率(IA)。此外,尽管本研究强调基于年报识别的地区提及率并不等于真实的营收占比,但是在回归时仍然对非本地信息进行了控制,具体采取与度量本地信息代理一致的思想,将年报提及的所属地以外其他省份的地区股票指数求加权平均得到非本地信息代理(NoLocInfot),权重为相应提及率。上述变量的具体含义见表3,描述性统计特征见表4。

表6报告了Fama-Macbeth横截面回归的结果,(1)-(3)列的核心解释变量为原始本地信息代理(LocInfot),(4)-(6)列则为未反应的本地信息代理(URLocInfot)。(1)列的回归设定参照了Fama-French三因子模型,将个股的市场贝塔(βMKT)、公司规模(SIZEt)和账面市值比(BMt)纳入控制变量。结果表明,LocInfot的系数为正(0.098),且在1%置信水平下显著(t值为3.28),与前文投资组合分析的结论一致。本研究构建的本地信息代理指标与低本地化公司未来股票收益显著正相关。规模(SIZEt)和账面市值比(BMt)的系数符合预期,但不同于CAPM模型的预测,市场贝塔(βMKT)的系数并不显著,这与近年来众多研究的发现一致,市场贝塔(βMKT)无助于解释股票横截面收益,较早的证据可以追溯到Fama和French(1992)[34]的研究。

表6 Fama-Macbeth横截面回归

表6(续)

表6中(2)列控制了更多影响股票收益的因素,但LocInfot系数的符号和显著性无明显变化。与李志冰等(2017)[35]的研究结论一致,本文的研究结果也表明,A股不存在明显的资产增长效应和动量效应。而短期反转(REVt)的系数显著为负,说明A股市场存在显著的反转效应,与田利辉等(2014)[36]的发现一致。(3)列的回归加入了所有控制变量,结论仍然未发生改变,LocInfot的系数为正(0.102),且在1%置信水平下显著(t=3.55),与张峥和刘力(2006)[37]以及尹玉刚等(2018)[38]的研究一致。A股市场存在显著的换手率异象和特质波动异象,换手率(TURNOVERt)与特质波动率(IVOLt)的系数都显著为负。非本地信息代理NoLocInfot的系数显著为正,一定程度上说明非所属地省份的相关信息也影响低本地化公司股价。

从(4)-(6)列看,将核心解释变量换为未反应的本地信息代理(URLocInfot),也并未改变前文的结论。在所有回归结果中,URLocInfot的系数和显著性都相对高于前三列结果中LocInfot的系数和显著性,这与投资组合分析的结果一致,未反应本地信息代理(URLocInfot)与低本地化公司t+1月股票收益的正向关系相比于原始本地信息代理更强,但是(6)列中反转(REVt)的系数不再显著,可能的原因是未反应本地信息代理(URLocInfot)在构建时剔除了部分自身当期收益,间接削弱了反转(REVt)与未来收益的关系。

总之,Fama-Macbeth横截面回归分析和投资组合分析的结果均印证了假设H1,基于高本地化公司当期股票收益构建的预测指标——本地信息代理,能够正向预测同一地区内低本地化公司的未来股票收益,这一股票收益可预测性在考虑现有影响股票收益的其他主要因素之后依然显著。

(三)稳健性检验

1.本地化程度识别相关稳健性检验

(1)高、低本地化公司的不同划分标准

一方面,将高本地化公司的标准更改为本地化程度大于65%、75%和80%;另一方面,将低本地化公司的标准更改为本地化程度小于50%。表7根据不同高、低本地化公司划分标准重复了Fama-Macbeth横截面回归稳健性检验。以表7中(1)列为例,[65,60]的标识是指将本地化程度大于65%(小于60%)划定为高(低)本地化公司,相应地,未反应的本地信息代理(URLocInfot)也是基于本地化程度大于65%的高本地化公司构建(10)鉴于未反应的本地信息代理这一指标构建时依赖的假设更符合现实,为简化分析,本研究后续的实证分析均基于未反应的本地信息代理(URLocInfot)进行。。7组回归结果均表明,未反应的本地信息代理(URLocInfot)的系数都显著为正,说明改变高、低本地化公司的划分标准对研究结论并无明显影响。

表7 高、低本地化公司的不同划分标准

(2)控制特殊地区识别偏差

A股有两个股票交易所——上海证券交易所和深圳证券交易所,分别位于省级地区上海市和广东省,由于交易所监管的缘故,在各自交易所上市的公司必然需要在年报中提及、甚至多次提及上海或深圳两个地区名,这给本地化识别带来了偏差。对此,从样本中剔除总部所在地不在上海或广东,但最后依据年报识别出所属地是上海或广东的公司重新进行检验,表8中(1)列报告了回归结果,结论并未改变。考虑到北京作为中国的政治经济中心,各经济领域的监管部门也都位于此,因此剔除了总部所在地不在北京,但识别出所属地是北京的情况,检验结果仍然保持稳健,见表8中(2)列。

表8 其他稳健性检验

表8(续)

(3)基于过去三年年报识别本地化程度

本研究是利用每年年报对上市公司地区属性进行识别,这可以保证识别的及时性,但公司的经营在短期内一般比较稳定,动态识别可能会破坏这一稳定性。为此,重新基于上市公司过去3年年报地区名称提及率划分所属地和本地化程度,可以简单理解为在t年识别上市公司i的所属地时将其过去3年年报看作一份年报进行地区提及率计算,然后重复了Fama-Macbeth横截面回归,结论也未发生改变,见表8中(3)列。

(4)控制上市公司数量过少的地区

在图2的统计中,发现某些省份的上市公司数量较少,例如:在2016年的样本中,海南、西藏和宁夏都不足5家。本研究是假设高本地化公司的股票收益能够及时纳入本地区的新信息,但如果高本地化公司的数量较少,则可能导致本地信息代理指标包含过多公司特质信息而不能较好地反映地区信息,从而影响研究结论。为此,在每一期均剔除高本地化公司数量少于5家的地区之后重新进行Fama-Macbeth横截面回归。表8中(4)列的回归结果表明,这一剔除并不改变研究结论。

(5)所属地、总部地以及注册地不一致

表2表明,只有约10%的样本中年报文本识别的所属地与公司总部地或注册所在地不一致,对研究结论应该不会造成显著影响。但是为了结论的稳健,进行如下检验:其一,仅在经济所属地与公司总部地一致的样本中进行检验;其二,仅在经济所属地与公司注册地一致的样本中进行检验;其三,仅在经济所属地与公司总部地以及注册地三者一致的样本中进行检验。表8中(5)-(7)列分别给出了三种情况下的检验结果,结论仍然稳健。

(6)行业集聚与行业信息

现实中存在产业地区聚集现象,即某一地区的上市公司大部分属于一个行业,此时行业信息和地区信息会交织在一起影响研究结论。如果本地区公司集中于某个行业,那么基于高本地化公司构建的本地信息代理,实际上主要反映了行业信息,其对低本地化公司股票收益的预测性,可以由低本地化公司对行业信息的反应不足来解释(Cohen and Lou,2012;胡聪慧等,2015)[4][6]。尽管现实中大部分省份不存在仅有一个行业主导的情况,但是仍进行如下检验:在构建本地信息代理(URLocInfot)时,只使用与低本地化公司不属于一个行业的同一地区高本地化公司,从而只包含“地区信息”,而不包含“行业信息”。利用Fama-Macbeth横截面回归重新检验这一指标对低本地化公司未来股票收益的预测性。表8中(8)列的结果表明,URLocInfot的系数仍然显著为正,说明与地区行业集聚相关的行业信息反应不足并不能够解释本研究的发现。

2. 子样本检验

一是样本期间涉及到2007年前后的新会计准则改革和股权分置改革,两者对年报文本规范和市场定价效率的影响可能使得本研究的结论在样本前后期存在显著差异。对此,将总样本按时间划分为2002年6月至2010年4月与2010年5月至2018年4月两个子样本,然后分别重复Fama-Macbeth横截面回归,并将回归结果作为稳健性检验。表9中(1)-(2)列的结果显示,未反应的本地信息代理(URLocInfot)的系数均显著为正且相差不大,说明本研究结论在样本前期和后期都成立。

二是A股市场的一个重要特征是波动较为剧烈,牛熊市转换快。在市场上涨时期,受赚钱效应的驱使,投资者可能对市场上影响股价的信息较为敏感,使得市场的信息效率提高。但是市场的亢奋也可能使得投资者主要追逐上涨的股票,关注视野变窄,对那些不明显的信息产生忽视。同样,在市场下跌时期,也可能出现相应的信息效率问题。因此,检验本研究的结论在不同市场状态下是否存在差异。根据当月市场收益是否大于0,将样本划分为牛市状态与熊市状态两个子样本,然后分别进行检验。表9中(3)-(4)列的结果表明,本研究结论在不同市场状态下都显著存在。

三是国有企业和非国有企业在制度背景方面存在很大差异,受到的经理人市场管制、薪酬管制、承担政治责任的程度也各不相同。特别是地方国有企业强调本地投资,负有带动本地区经济发展的重任,因此不同产权性质的公司对本地信息的反应可能有所不同。通过在国有企业与非国有企业两个子样本中重复本检验,以进行考察。表9中(5)-(6)列的回归结果表明,低本地化公司的股票收益可预测性不受企业产权性质的影响,在非国有企业样本中更为显著。

五、内在机制检验

在股票收益可预测性的验证基础上,对验证其内在机制的假设H2和假设H3进行检验,即检验低本地化公司的收益可预测性是否源于投资者忽视或者信息处理复杂度。

(一)投资者忽视机制

假设H2预期,如果投资者忽视是低本地化公司对本地信息延迟反应的内在机制之一,那么投资者关注度越低的低本地化公司对地区信息的反应会越延迟,股票收益可预测性越强。本研究采用实证资产定价经典的二维投资组合分析检验该假设。

以分析师覆盖(Analyst)为例说明检验步骤。在每个t月底,先按照分析师覆盖的中位数将所有低本地化公司股票样本分为低关注度组和高关注度组;然后在每个关注度组内,再根据其对应的t月本地信息代理(URLocInfo)从小到大进行排序,以最高20%的低本地化公司股票形成投资组合(High),以最低20%的低本地化公司股票形成投资组合(Low),以及买入前者卖出后者的对冲组合(H-L)。如果假设H2成立,则将观察到低关注度股票组中的对冲组合(H-L)的平均收益比高关注度组中更大。

表10报告了不同的投资者关注度代理指标与未反应的本地信息代理(URLocInfo)进行二维投资组合检验的结果,分别给出了投资组合的原始收益率和经六因子模型调整后的超额收益(α)。

表10 投资者忽视机制验证

在Panel A中,采用分析师覆盖(Analyst)高(低)作为投资者关注度高(低)的代理变量。在组合收益以等权重计算方式下,低关注度股票组内对冲组合(H-L)的原始收益率和六因子模型α分别为1.860%和1.973%,并都在1%的置信水平下显著(t值分别为6.60和7.87)。而在高关注度股票组中,对冲组合的原始收益率和六因子模型α分别为1.453%和1.428%。这一结果符合假设H2,即在投资者关注度越低的低本地化公司中,本地信息代理对股票收益的预测性更强。在市值加权情况下,低关注度股票组内对冲组合的原始收益率与六因子模型α也大于高关注度组中对冲组合的表现,与等权重组合的结论一致。

在Panel B中,采用基金持股(FundRate)高(低)代理投资者关注度高(低)。预期在基金持股比例较低的股票中,对冲组合(H-L)的收益更大,结果符合这一预期,在低基金持股比例中,对冲组合(H-L)获得了1.928%的原始收益率和2.067%的六因子模型α,大于高基金持股比例中的1.630%和1.432%。

在Panel C中,采用媒体报道(Media)多(少)代理投资者关注度高(低)。结果表明,在媒体报道较多的股票中,多空组合(H-L)的收益率低于媒体报道较少的股票,也与假设H2一致。例如:在市值加权情况下,低媒体关注度股票组中对冲组合(H-L)的原始收益率和超额收益分别为1.559%和1.678%,而在高媒体关注度股票组中则为1.192%和1.335%。

采用百度指数(Baidu)高(低)作为投资者关注度高(低)的代理变量,结果由Panel D报告。与之前的结果不同,未发现在搜索较少的股票样本中对冲组合(H-L)的收益表现更好的证据。在等权重计算情况下,低关注度股票组中对冲组合(H-L)的原始收益率为1.585%,小于高关注度股票组中的1.769%;但六因子模型α的检验结果则相反。

总之,检验结果总体上支持投资者忽视机制,即发现低本地化公司对地区信息的反应延迟部分来源于投资者短期内未及时关注到新地区信息对公司价值的影响,表现为在投资者关注度越低的低本地化公司中,本地信息代理的预测作用更明显。

(二)信息处理复杂度机制

假设H3预期,如果信息处理复杂度是低本地化公司对本地信息延迟反应的内在机制之一,那么信息处理复杂度越高的低本地化公司对地区信息的反应会越延迟,股票收益可预测性越强。同样地,采用不同的信息复杂度代理指标与未反应的本地信息代理(URLocInfo)进行二维投资组合,分析检验该假设,表11报告了检验结果。

表11 信息处理复杂机制验证

表11(续)

在Panel A中,采用地域分散赫芬达尔指数(GHHI)高(低)作为信息复杂度低(高)的代理变量。结果表明,低信息复杂度股票组中多空组合(H-L)的等权重原始收益率为1.366%,六因子模型α为1.511%;而在高信息复杂度股票组中,两者分别为1.614%和1.770%。即高信息复杂度的低本地化公司中股票收益可预测性更明显,与假设H3一致。

在Panel B和Panel C中,使用另外两个表示公司经营活动地域分散程度的指标——加权距离(Distance)和提及省份数(ProvNum)数值的高(低)作为信息复杂度高(低)的代理变量。结果显示,多空组合(H-L)的原始收益率与六因子模型α在高信息复杂度股票组中均比在低信息复杂度股票组中更高。例如:在Panel C中,在等权重组合情况下,高信息复杂度股票组中,对冲组合(H-L)分别获得了1.742%的原始收益率和1.919的六因子模型α,而在低信息复杂度股票组中,两者分别为1.130%和1.267%。

在Panel D中,采用涉及行业数(IndNum)的多(少)代理信息复杂度高(低)。结果发现,本地信息代理对股票收益的预测性在涉及行业越多的公司中同样更明显。在市值加权情况下,高信息复杂度股票组中对冲组合(H-L)的原始收益率与六因子模型α分别为1.426%和1.453%,均大于低信息复杂度股票组中的0.873%和1.084%。

总之,以上结论也支持假设H3,即信息处理复杂度越高的低本地化公司,基于本地信息代理的股票收益可预测性更明显。

(三)其他机制的讨论(11)本研究还检验了本地信息代理与低本地化公司股票收益未来多期的关系,结果发现,t期的本地信息代理与低本地化公司t+2期、t+3期的股票收益均无显著关系,说明这种研究发现的可预测性在3个月时间内没有反转,从而并非源自投资者炒作。在此感谢审稿人的建议,限于篇幅,结果备索。

1.套利限制

Shleifer和Vishny(1997)[39]指出,现实中广泛存在的套利限制,如不能卖空,则流动性较差导致的套利非对称问题(尹玉刚等,2018)[38]以及其他交易摩擦,可能会导致专业投资者在即使知道存在误定价的情况下也无法将其消除。换言之,低本地化公司的股票收益可预测性可能部分源自于这类公司相比于高本地化公司更高的套利限制程度,投资者未能及时将新的地区信息纳入股价。虽然低本地化程度与套利限制高之间并不存在直觉上的联系,但本研究仍然通过选择不同的套利限制代理变量考察套利限制程度如何影响低本地化公司的股票收益可预测性。

参照现有研究(Cao et al.,2016;Smajlbegovic,2019)[14][25],选择以下套利限制代理变量:特质波动率(IVOL),套利对象的特质波动率较大,会增加套利过程中的持有风险,增加套利限制;非流动性(ILLIQ),该指标越高,套利对象流动性越差,会极大增加交易成本,限制套利行为。

表12报告了不同套利限制程度代理指标与未反应的本地信息代理(URLocInfo)进行二维投资组合分析的结果。两组代理变量的检验结果一致,对冲组合(H-L)在套利限制更大的低本地化公司股票组中表现更好,符合套利限制理论预期。但是在套利限制低的股票组中,股票可预测性仍然显著存在,这表明套利限制在一定程度上增强了低本地化公司对地区信息的延迟反应,但本研究发现的股票收益可预测性并不局限于套利限制高的股票中。

表12 套利限制的影响

2.本地动量

低本地化公司的股票收益可预测性一个可能的原因是本地股票的动量效应。具体而言,实际上同一地区的高、低本地化公司的股价在t期都在对新的地区信息作出反应,但投资者整体上对该地区的信息反应不足,高、低本地化公司的股价反应实际都延续到了t+1期。本研究发现的t期高本地化公司的股价变化与t+1期低本地化公司的股价变化存在正相关关系,这是因为两者的同方向运动,即本地动量效应。如果低本地化公司的股票收益可预测性只是本地动量,那么同时也应该观察到:其一,t期高本地化公司的股票收益也能正向预测t+1期高本地化公司的股票收益;其二,t期低本地化公司的股票收益与t+1期高本地化公司的股票收益之间存在显著正相关关系;其三,t期低本地化公司的股票收益与t+1期低本地化公司的股票收益显著正相关。

在表13中,采用Fama-Macbeth横截面回归对上述三个推论进行检验。在(1)组回归中,样本为所有高本地化公司,即被解释变量变为高本地化公司i在t+1月的收益率,解释变量为t月本地区所有高本地化公司股票的市值加权平均收益(RET70t),结果表明,RET70t的系数为正,但在统计上并不显著,说明上述第一点推测不成立。在(2)组回归中,样本不变,但解释变量为t月本地区所有低本地化公司股票的市值加权平均收益(RET60t),结果显示,RET60t的系数为负,但不具有统计上的显著性,也不支持第二点推测。在(3)组回归中,样本更换为低本地化公司,即被解释变量为低本地化公司i在t+1月的收益率,解释变量仍为RET60t,结果显示,RET60t的系数不具有统计显著性,第三点推测也未得到证实。简言之,本研究发现的低本地化公司的股票收益可预测性并非只是源自本地股票的动量效应。

表13 本地动量机制检验

六、结论

从公司经营活动并不限于本地区视角,结合投资者注意力约束理论探讨本地化程度不同对本地公司股价纳入地区信息速率的影响,并在股票收益可预测性框架下进行实证研究。采用2001—2018年的沪深A股数据,依据年报文本中地区名称提及频率识别上市公司所属地并量化其本地化程度,在将同一所属地内的公司划分为“高”本地化公司和“低”本地化公司之后,采用投资组合分析和Fama-Macbeth回归分析,研究发现:

第一,相比于高本地化公司,低本地化公司股价对地区信息的反应存在延迟,其股票收益具有可预测性。基于同一地区高本地化公司当月股票收益构建反映地区信息的指标(本地信息代理),可以正向预测低本地化公司未来1月的股票收益。这一结论在控制了一系列度量偏差和子样本的分析中均保持稳健。

第二,注意力约束理论指出的投资者忽视和信息处理复杂度是低本地化公司表现出股票收益可预测性的主要内在机制。一方面,采用分析师覆盖、基金持股、媒体报道以及百度搜索表征投资者关注度,结果发现在投资者关注度越低的低本地化公司中,股票收益可预测性越强;另一方面,在以经营活动地域分散度越高、地域范围越广以及涉及的行业越多表征的信息处理复杂度越高的低本地化公司中,股票收益的可预测性也越强。此外,套利限制一定程度上增强了低本地化公司股票收益的可预测性,但并非只存在于高套利限制的股票中,这一可预测性也并非本地股票的简单动量效应。

第三,在依据年报文本度量公司经营活动地域特征的基础上,发现公司本地化程度这一属性阻碍了投资者解读信息的证据,这一定程度上表明,监管部门有必要对上市公司披露经营活动的地区分布情况在规范性和详细性方面提出更高要求,进而提高股票定价效率。