公司高质量发展水平能否预测其股票市场表现
——基于机器学习方法

2023-12-14 08:20张金清李梓豪
金融经济学研究 2023年6期
关键词:收益率指标体系高质量

张金清 李梓豪

一、引言

2017年中共十九大提出“高质量发展”概念,表明中国经济要由高速增长阶段转向高质量发展阶段,“创新、协调、绿色、开放、共享”的五大新发展理念也成为中国未来科学谋划和战略部署的基石。高质量发展概念涵盖宏观、中观、微观三个层次,宏观层面的经济发展、中观层面的行业与地区发展以及微观层面的企业发展都是高质量发展关注的对象。因此,五大新发展理念不仅是宏观、中观调控方向的根本要求,也是推动微观企业高质量发展的重要指导。然而,目前国内针对高质量发展的研究基本聚焦于宏观与中观层面,少有学者将高质量发展概念落实到企业层面。

中国A股市场的规模近年发展迅速,但已有文献针对中国A股市场定价有关的研究仍处于较初级阶段,以复现美股市场的经典研究为主。中国的宏观环境、制度体系与公司状况等与美国市场有较大的差别,成熟市场的规律未必适合迅速发展的中国股市,投资者也缺乏契合中国市场的投资策略。因此,研究A股市场的回报与定价、探寻具有A股市场特色的投资策略是必要且有意义的。

为探究上述问题,本文从“创新、协调、绿色、开放、共享”五大新发展理念出发建立上市公司高质量发展评价指标体系,运用机器学习中的OLS、Lasso、Ridge(岭回归)、Enet(弹性网络回归)、PCR(主成分回归)、PLS(最小二乘回归)、GBRT(迭代决策树回归)、RF(随机森林)、ANN(人工神经网络)等算法,对指标体系与股票收益率数据进行训练,此后基于单、双变量分组等方法探究公司高质量发展水平对能否预测股票市场表现并进行稳健性检验,随后探讨指标体系中各指标的重要性、指标体系各成分的预测能力以及预测能力的来源。

相较于已有文献,本文可能的创新与贡献有五点。第一,已有研究对公司高质量发展水平的评价方法往往比较单一,本文从五大新发展理念出发建立高质量发展指标体系,能较为全面地评价上市公司的高质量发展水平。第二,本文使用机器学习的方法探究高质量发展指标体系对股票市场表现的预测能力,充分应用指标体系各维度信息,具有丰富的理论意义和现实意义。第三,高质量发展水平对股票市场的预测能力在A股市场非动荡时期都有较好的表现且有效性增强,构建投资策略收益来源于多头力量,在做空限制较多的A股市场依旧有较强的可实施性。第四,创新类与绿色类指标对股票收益的预测能力逐步增强,协调类指标的预测能力有所下降,这种变化可为公司的发展与投资者的投资提供理论指导。第五,本文发现高质量发展预测能力来源于投资者对信息的反应不足,可以为资本市场定价机制的完善提供理论指导。

二、文献综述

中共十九大首次提出了“高质量发展”理念,象征着中国经济发展要从数量增长转为质量增长。从内涵来看,学者们从宏观、中观、微观不同层面对高质量发展理念进行了积极的研究。金碚(2018)认为,高质量发展是相对高速发展的理念,要求经济体系统性地创造出发展优势,既要符合实际也具有中国特色。师博和张冰瑶(2018)认为,高质量发展需要与“创新、协调、绿色、开放、共享”五大新发展理念相契合。刘志彪(2018)和张军扩等(2019)认为,高质量发展是关注效率、公平和绿色的可持续发展。黄速建等(2018)围绕国有企业高质量发展进行研究,指出发展需要追求高水平、高效率、高层次的价值创造,要有持续成长能力和高素质价值创造能力。综上可见,从不同的视角和层次解读高质量发展的内涵基本上遵循五大发展理念的宗旨。

从高质量发展评价与测度来看,不少学者对宏观、中观高质量发展的评价进行探索。周永道等(2018)围绕经济、政治、文化、社会、生态文明建设建立指标体系衡量区域社会经济发展状况。李金昌等(2019)从经济活力、创新、绿色、人民生活、社会和谐五大角度,建立了由27项指标构成的高质量发展评价指标体系。付智等(2021)基于高质量发展和新发展理念,构建了中国高质量发展水平评价指标体。杨宗翰等(2020)从产品创新、研发支出、公司治理与社会责任四个变量刻画上市公司高质量发展水平。高运胜和杨阳(2020)从创新、经济、社会、环境四方面建立了制造业高质量发展指标。但总体来看,目前缺乏系统且契合最新发展理念的高质量发展指标评价体系。

20世纪后半叶,针对美股市场异象、因子与定价模型等的研究层出不穷,据Hou et al.(2020)的研究,截至2020年,美股市场中已存在447个异象。而目前针对A股市场定价研究的文献数量较少,且已有文献以探究美股市场的因子是否能在中国复现为主,并没有充分结合中国股市自身的特色进行研究。如潘莉等(2011)研究了贝塔系数、股票市值、市盈率、市净率、回报率等经典因子在A股市场的表现。尹力博和廖辉毅(2019)从价值投资的核心理念出发,利用在美股市场具有良好表现的多个指标构建品质因子,探究中国市场价值投资的可行性。Liu et al.(2019)依据A股市场数据构建传统三因子模型。Liu et al.(2018)发现了中国市场的趋势因子,并提出四因子模型。

从研究方法来看,目前国内学术界针对指标体系构建投资策略的研究采用主观赋权法和客观赋权法两类方法确定权重。前者主要包括层次分析法、德尔菲法等,后者主要包括主成分分析法、排名法、分组法等。如高运胜和杨阳(2020)将指标体系利用主成分分析提出主成分,之后使用方差贡献比进行加权得到综合得分。尹力博和廖辉毅(2019)利用公司在每一个指标上的排名对公司进行赋分,最后将得分加总作为综合评分。杨宗翰等(2020)运用多个指标将样本进行分类,最终用分类虚拟变量识别上市公司高质量发展情况。

近年来,部分学者将机器学习的相关方法引入资产定价领域。Gu et al.(2020)提出利用机器学习等非线性方法对指标体系进行学习之后构建的因子表现更好。Bali et al.(2021)将机器学习的方法运用到对股权、债权、期权市场回报的研究上,发现机器学习方法的确能显著提升指标体系对相关市场收益率的预测能力。李斌等(2019)在A股市场中探究机器学习在基本面量化中的应用,使用A股市场96个异象因子进行学习,发现有显著的预测能力,并能据此得到超额收益。方毅等(2022)将人工智能运用在中国金融市场,发现多种机器学习算法都对股票收益率有显著的预测能力。

三、指标构建和数据说明

(一)高质量发展指标体系构建

本文从“创新、协调、绿色、开放、共享”五大新发展理念出发,建立由五方面26项指标构成的企业高质量发展评价指标体系。

1.创新类。本文从研发投入、企业资质、创新产出与生产效率四个角度的六项指标刻画企业创新水平。采用研发投入占总资产比(RDI)与研发人员占比(Reaserch_staff)两个指标刻画研发投入,研发相关数据来自WIND数据库,企业总资产来自国泰安CSMAR数据库。企业资质数据来源于CSMAR资质认定信息,当年及后三年赋值为1的企业被认定为高新技术企业。本文采用两个指标刻画创新产出。第一个指标是发明专利、实用新型和外观设计专利的总申请量(Patent),数据来源于中国研究数据服务平台(CNRDS)。第二个指标为企业的专利质量(Patent_quality),张杰和郑文平(2018)用企业专利知识宽度进行衡量,计算方法为:

α表示专利分类号中各大组分类所占比重。可以看出,Patent_quality越大,各个大组层面的专利分类号之间的差异越大,即表明企业创造专利所运用的知识宽度越大,专利质量可能就表现为越高。本文使用企业专利文件中IPC分类号①IPC专利分类号采取“部—大类—小类—大组—小组”的格式,本文采用专利分类号中各大组分类所占比重。的数量信息,计算基于专利层面知识宽度信息指标之后,根据“企业—年份”这两个维度将申请和授权专利层面的知识宽度信息加总到企业层面,加总的时候采用中位数的方法。相关数据来源于国家专利局。

全要素生产率(TFP)能很好地反应企业的创新,计算方法如下所述。本文采用CD生产函数:其中Yit为产出,Lit代表劳动投入,Kit代表资本投入。对其两边取对数得到:

估计出了α与β,就可以从上式中求出全要素生产率Ait(TFP)。本文采用OP方法计算TFP,借鉴宋敏等(2021)、鲁晓东等(2012)的思路,用如下模型进行估计:

Yit取上市公司营业收入,Lit代表企业员工人数,Kit取固定资产净额,Iit是投资,取购建固定资产无形资产和其他长期资产支付的现金来代替,Provincej、Yeart、Industryn分别代表省份、年份与行业固定效应。除此之外,OP方法还需要控制企业退出相关变量,如果企业出现了ST或PT,则本文视为企业退出市场。由此计算TFP,相关数据来自国泰安CSMAR数据库与WIND数据库。

2.绿色类。本文从环保综合评分与公司的绿色信息公开得分两个角度的三项指标对公司的绿色性进行评估。环保综合评分有两个指标,第一个是和讯网通过环境治理、环保意识、环境管理体系认证、环保投入、排污种类、节约能源种类形成的综合评分(Envir_resp),第二个是彭博ESG评级中的环境得分。ESG是衡量企业非财务绩效的关键指标,但会受到很多因素的影响。因此,本文对ESG的有关评分运用固定效应模型进行调整,方法如下:

其中,In(size)it是公司规模取对数后的结果,Industryn是行业固定效应,Yeart是时间固定效应,回归后的残差εit作为调整后的ESG_E的评分。评分数据来源于彭博评级,其余数据来源于国泰安CSMAR数据库。

绿色信息披露(Environ_score)得分来源于CSMAR中国上市公司环境研究数据库,本文根据如下角度进行评分,上市公司年报中是否披露了相关绿色信息、上市公司社会责任报告是否披露了环境相关信息、上市公司是否单独披露环境报告、是否披露相关的环保管理理念、是否披露了环境教育培训、是否披露了环保制度体系,每满足一项得一分。

3.共享类。本文用公司对社会的贡献、公司自身的价值的增长与承担的社会责任三角度的七项指标刻画公司高质量发展的共享性。首先,公司对社会的贡献用其公益捐赠金额(Donation)与所得税占利润总额(Tax)的占比可以反应公司对社会较为直接的贡献。其次,本文从公司的成长能力出发,采用Roe的增长速率(Roe_growth)和公司总资产的增长速率(Assets_growth)来衡量公司自身价值的增长为社会带来的福利。相关数据来源于国泰安CSMAR数据库与WIND数据库。最后,本文采取了三个指标衡量承担责任:第一个指标是是彭博ESG评级中的社会得分(ESG_S),该评分也进行上文所述的调整;第二个指标是股东得到的收益,反应公司对股东承担的责任,借鉴尹力博等(2019)使用过的累计分红率指标,如公式(5)所示,相关数据来自国泰安CSMAR数据库;第三个指标是公司对员工承担的责任(Employee),采用和讯网对职工收入、员工培训、安全保障等方面给出的综合评分。

4.开放类。本文从对外出口金额、对外投资金额与专利在全球范围内被引用的次数衡量企业高质量发展的开放程度。对外出口金额(Export)数据来源于网易数据,可以很好的反应企业在全球中的竞争力与商品的国际化水平。上市公司对外投资金额(Invest_foreign)数据来源于CSMAR数据库的海外关联公司表,既可以反应企业与别国的合作情况,也可以反应企业在全球的布局与转型。专利在全球范围内被引用的次数(Pantent_refere)数据来源于CnOpenData中国上市公司专利及引用被引用数据,可以很好地衡量上市公司的知识输出的开放程度。

5.协调类。本文从股权制衡、监督能力、激励机制、决策能力和公司治理能力五个角度的七项指标对公司协调性进行刻画。

从股权制衡来看,本文选取了两个指标,即第二至第十大股东持股比例(Holding)与第二到第五大股东持股比例/控股股东持股比例(Share_balance)。相关的数据来源于国泰安CSMAR数据库。

除此之外,本文使用董事会的规模(Board)和独立董事的占比(Qutratio)代表公司内部的监督机制。使用管理层持股比例(Mana_share)衡量公司内部激励情况。使用董事长与总经理是否二职合一(Dual)衡量公司决策能力。相关的数据来源于国泰安CSMAR数据库。

最后一个指标是彭博ESG评级的公司治理得分(ESG_G)。

(二)股票价量数据

本文选取中国沪深全体A股股票作为研究样本,剔除了ST、PT以及金融类股票的数据。收益率使用考虑现金红利后的再投资收益率,无风险利率为定期整存整取一年期利率,市值采用月个股流通市值,用个股的流通股数与月收盘价的乘积得到。使用国泰安CSMAR数据库关于会计报告公布日期的有关数据来确定数据可得时点。本文研究区间为2011年5月至2021年12月。股票价量数据来源于国泰安CSMAR数据库。

(三)数据处理

对上述指标数据进行如下处理:首先,所有的连续指标进行左右1%的缩尾;其次,通过财报信息对部分缺失数据进行相应的补充;再次,将所有的指标标准化,每一个截面上通过下述关系将数据映射到[-1,1]之间的均匀分布中。

其中,xit是样本i对应的指标在时间为t时的值,xtmax是时间为t的截面之中指标x的最大值,xtmin是时间为t的截面之中指标x的最小值,x*it是样本i对应的指标在时间为t时转化到[-1,1]的均匀分布之间的值,该方法可以很好地统一预测因子的分布对训练的影响。最后,将缺失值设为0,不会影响到机器学习方法的训练。

四、公司高质量发展水平对股票收益率的预测能力与稳健性检验

本文利用机器学习方法对高质量发展指标体系与股票收益率进行训练,形成预测收益率序列,以此为信号进行单变量、双变量分组构建组合,探究公司高质量发展水平对股票收益率的预测能力,并进一步利用Fama-Macbeth截面回归等方法探讨预测能力的稳健性。

(一)单变量分组

本文利用2011年5月至2021年12月的数据作为研究样本,采用机器学习模型进行滚动学习,窗口长度为1年期,每次向前滚动一个月,采用月度调仓。具体而言,本文采用的机器学习方法①限于篇幅限制,本文不再详述参数设置,本文的参数设置有两种思路:第一是使用交叉验证的方法找最优参数,第二是借鉴Gu et al.(2020)的参数设置。有普通最小二乘法(OLS)、Lasso、Ridge、Enet、主成分回归(PCR)、偏最小二乘回归(PLS)、随机森林RF、迭代决策树回归GBRT和一层人工神经网络(ANN1)。

预期收益率信号从高到低按照3:4:3进行分组构建多空组合,每个组合内的股票按照市值加权进行配置②按等权重配置的结果与此接近,后文不再展示。。然后对高组、低组和高低组差额的收益率使用Fama-French三因子(市场因子MKT,市值因子SMB、价值因子HML)、五因子(三因子、盈利因子RMW,投资因子CMA)进行调整,调整收益率FF3_alpha与FF5_alpha展示在表2中。

机器学习的方法需要计算样本外预测R2),本文借鉴Han et al.(2021)与Bali et al.(2021)的横截面样本外R2计算方法,如公式(7)所示。

表2的第8行展示了高低两组平均月度收益率的差额与其显著性水平,所有方法下的高低两组收益率差都为正数且显著较强,进行调整后的结果依旧不变。其中,GBRT方法表现最好,经过三因子、五因子调整后的收益率分别为1.5%与1.46%,高于未调整时的1.35%。由此可以看出,最大的机器学习方法能对股票收益率有更好的预测能力,基于此方法构建的策略表现也最好,说明GBRT方法下的预测能力最强。

(二)双变量分组分析①为节省篇幅,相关表格备索。

本节进一步控制公司规模、账面市值比、净资产收益率、机构持股比例、特质波动率与系统性风险等影响股票横截面收益的因素,进行双变量分组构造投资组合,除市值采用1∶1的分组之外,其余变量全部采取3∶4∶3的分组,构建投资组合后运用三因子、五因子调整。

其中公司规模、账面市值比、净资产收益率、机构持股比率来源于国泰安CSMAR数据库,特质波动率的测算方法借鉴邓雪春等(2011),如公式所示,先将个股的日度收益率利用FF3进行调整,用调整后残差项的标准差乘以股票当月交易日的平方根作为股票i在t月的特质波动率IVOLi,t,见公式。

系统性风险借鉴朱红兵等(2020)的方法,用CAPM模型进行估算,本文使用股票月度数据回归CAPM模型,将β作为系统性风险的衡量。

结果可得,双变量分组下构造的投资组合的平均月度收益率依旧非常显著,且均能通过三因子(FF3)、五因子(FF5)的检验。与单变量分组一样,GBRT与RF方法是公司高质量发展水平对其股票收益率预测能力最强的两种方法。以GBRT方法为例,单变量分组下的投资组合经五因子调整月度收益率为1.46%,而本小节中,在六种双变量分组下投资组合的五因子调整收益率分别为0.91%、1.44%、1.20%、1.47%、1.55%与1.40%。

(三)基于Fama—Macbeth和Pooled OLS回归分析

Fama-Macbeth回归可以很好的排除残差截面相关性对标准误的影响,因此,本部分基于Fama-Macbeth控制相关因素后进行稳健性检验,如公式(10)。

其中Ri,t+1代表股票收益率,Ret_mli,t代表机器学习方法下预测的股票收益率序列,Sizei,t、BMi,t、Roei,t、Insti,t、Ivoli,t、Riski,t分别代表公司市值(取对数)、公司账面市值比(取对数)、盈利能力(净资产收益率)、机构持股比率、特质波动率与系统性风险。

Fama-Macbeth回归中的标准误的估计并不满足异方差稳健,因此本部分还采取Pooled OLS的做法,将所有期数据聚合,使用多固定效应(考虑公司固定效应与时间固定效应)Pooled OLS回归,回归时考虑聚类稳健标准误(在公司与时间维度上进行聚类)。

表3展示了两种稳健性检验的结果,Fama—Macbeth方法下公司高质量发展水平的确对截面收益具有显著的预测作用,λ比较显著,Pooled OLS的方法也得到了相似的结果,说明公司高质量发展水平的确能预测公司股票收益率。

五、拓展讨论

接下来,本文探究高质量发展指标体系中不同变量的预测能力,将高质量发展指标体系拆解为创新、绿色、开放、协调、共享五部分分别进行预测,并探究高质量发展水平预测能力的来源。

(一)变量重要性分析

本文构建的高质量发展指标体系由26个指标构成,本部分拟探究不同变量在预测股票收益率时相对重要性的大小,借鉴Gu et al.(2020)的方法:维持机器学习训练得到的模型不变,依次将指标体系中的变量令为0,计算下降的幅度,下降幅度较大时,对应的变量比较重要。随后,本文将同一模型下各变量对应的下降的幅度进行标准化(让其和为1),将每种方法下重要性前10的变量①OLS的结果类似,限于篇幅,本图中没有展示。结果见图1。之后,本文综合所有模型的排名,得到变量重要性综合排名前20名,结果如图2所示。

如图2所示,不同方法下变量重要性的分布略有不同,Lasso、Rdige、RF的方法对单变量的依赖性比较强,PCR、PLS两方法相对依赖更为广阔的变量信息。变量重要性排名如图2所示,重要性排名前三名的变量分是全要素生产率(TFP)、绿色信息披露得分(Environ_score)与董事会的规模(Board),这三者是预测股票未来收益率时蕴含信息最多的变量。

创新类变量在高质量发展水平预测股票收益率中起到最重要的作用,全要素生产率(TFP)、企业资质认定(High_tech)、专利数量(Patent)与专利质量(Pantent_quality)的重要性都排在比较靠前的位置,与国家提出的“高质量发展需要以创新作为第一动力”不谋而合。此外,协调类变量也在高质量发展水平预测股票收益率时有较为不错的表现。

(二)预测能力的时序变化①本部分仅展示GBRT方法下针对高质量发展指标体系与其各分类指标构建的投资组合对应的结果。其余机器学习方法下结果类似,本文不再展示。

本文进一步探讨中国A股市场上高质量发展指标体系与其各成分对股票收益率的预测能力在不同区间的表现情况。选取2015—2016年的金融危机与2020—2021年的疫情作为时间区间的分割点,将样本区间分为2012—2014、2015—2016、2017—2019②此区间中,各成分预测能力的均值与显著性有所下降,因为2018年整体量化多头回撤比较高,本策略也存在这个问题,因篇幅限制,不再单独展示2018年的策略情况。、2020—2021四个子区间,将机器学习方法分别用于指标体系与其各成分指标中得到预测收益率序列,以此构建多空组合并进行三因子(FF3)、五因子(FF5)调整,结果如表4所示。

表4说明,除了2015—2016年股市动荡区间之外,公司高质量发展水平在其他时期对股票收益率都具有显著的预测能力,且略有增强趋势,策略可行性较强(但与大多数策略相同,2018年前后也出现了明显的回撤情况)。

观察创新、绿色、共享、开放、协调五类指标构建的投资策略收益得到如下结论:第一,创新类和绿色类指标对股票收益率的预测能力越来越强,调整后收益率大小与显著性水平明显提升,说明创新和绿色对公司价值带来的影响有增强趋势且未被充分定价;第二,协调类指标的预测能力有所下降,反映出该类指标逐渐成为市场共识而被定价;第三,在2015—2016年的股市动荡区间中,除开放性类指标与协调类指标之外,其余指标的预测能力在该区间失灵;第四,共享类指标与开放类指标的预测能力相对稳定。

(三)高质量发展水平对股票收益率预测能力的来源①本部分展示R2OOS最大、策略的收益率最高的机器学习方法GBRT对应的结果。其余机器学习方法下的结果类似,这里不再展示。

本部分拟探究高质量发展水平对股票收益率预测能力的来源。从定义来看,公司高质量发展水平指标体系是符合公司发展逻辑与社会政策导向的多维评价体系,理应可以作为领先指标预测公司未来基本面的情况。该评价体系选取出的未来基本面向好的公司自然也会在二级市场上有着更好的表现。但对于投资者来说,企业高质量发展涉及的信息较为复杂且多维,投资者无法充分接触并理解每一层面的信息,导致对指标体系中的信息反应不足,市场难以对企业高质量发展水平产生准确的评估,导致真正的高质量发展企业被低估,且前文说到,该策略收益由多头力量决定,而多头力量带来的异常收益也往往来源于错误定价中的反应不足。

据此,本文猜测,高质量发展指标可以预测公司未来的基本面信息,但是市场投资者难以充分接触并理解这些信息,往往对信息反应不足,导致真正的高质量发展企业被低估,这种错误定价是预测能力的来源。

针对上述讨论,本文从如下几个角度进行验证。假说一主要证明高质量发展水平对公司未来基本面情况的预测能力,假说二至五参考已有研究,从不同机制去印证预测能力与信息反应不足的关系,从而证明预测能力来源于错误定价。

1.高质量发展指标的基本面溢出效应。本文提出第一个假说:高质量发展可以预测公司未来的基本面情况,具有基本面的溢出效应。

对公司基本面的预测主要通过对公司盈利能力的预测和未预期盈余的预测来判断:一方面探究高质量发展指标体系对短(Roet+3)、中(Roet+6)、长期(Roet+12)净资产收益率的预估能力,一方面探究高质量发展水平对公司短(SUEt+3)、中(SUEt+6)、长期(SUEt+12)的标准化未预期盈余的预估能力,未预期盈余是公司盈余的未预期变化,反应公司未来基本面变化决定的盈余变化的情况(Tetlock et al.,2008;段丙蕾等,2022),构造方法如下。

Et+i指的是t+i季度时公司的净利润,UEt+i可以反映未来i季度之后相比于现在净利润的变化,代表预期外的收益,SUEt+i是对数据进行标准化后的结果。

本部分分别用Fama-Macbeth的方法与Pooled OLS的方法探究高质量发展指标体系对公司基本面的预估,其中,Pooled OLS考虑公司固定效应与时间固定效应,并考虑了聚类稳健标准误,在公司与时间上进行聚类,相关的结果展示在表5的子表1之中。

表1 公司高质量发展指标评价体系

2.正向反馈交易反应不足。正向反馈交易行为(即追涨杀跌行为)往往可以用来检验资产定价的反应不足(尹力博等,2021)。追涨杀跌行为在新兴股票交易市场较为常见,而正反馈投资者只关注股票过去的表现,对基本面的识别不足。即在过去表现好(差)但是基本面较差(好)的股票中,投资者对高质量发展有关信息反应不足,这些公司的股票容易被高估(低估)。但考虑到中国存在做空限制,正反馈交易者可以充分的做多过去表现好的股票,但是并不能充分做空过去表现差的股票,因此在过去表现好的股票之中,基于高质量发展指标体系构建投资策略收益会更加显著。据此得到第二个假说:高质量发展水平对股票价格的预测能力在过去表现好的股票中更加显著,即预测能力与正反馈交易体现出的反应不足相关。

本文在月底时将每只股票向前回溯6个月的收益率均值作为股票过去表现的衡量,随后进行双变量分组构建投资组合(按3∶4∶3进行分组),每个组合内的股票按照市值加权进行配置。相关的结果展示在表格5的子表2之中。

表2 单变量分组构建投资组合的平均月度收益率与调整收益率

3.套利限制与反应不足。流动性与股票市场的错误定价密切相关。在流动性较差的股票中,纠正错误定价的成本会更高,错误定价往往会更加严重。据此,本文提出假说三:高质量发展水平对股票价格的预测能力在流动性差的股票中更加显著,即预测能力与套利限制导致的反应不足相关。

本文使用Amihud(2002)中的方法衡量非流动性,同时考虑了流动性速度、宽度以及深度。rt是考虑现金红利再投资的日个股回报率,Qt为交易金额,N为年交易日数。Amihud值越大,非流动性越强。

进行类似前文的操作,相关的结果展示在表5的子表3之中。

表3 基于Fama—Macbeth和Pooled OLS的回归分析

4.投资者关注与反应不足。投资者对市场上的股票价格的关注程度并不相同,如果投资者对一个股票关注越低(高),则对相关信息的反应不足的程度越高(低)。据此,本文提出假说四:高质量发展水平对股票价格的预测能力在投资者关注较低的股票中更加显著,即预测能力与投资者关注导致的反应不足相关。

本文使用月平均超额换手率代表投资者的关注,月平均超额换手率采用该股票本月之前六个月的平均换手率减去对应去年同期的平均换手率。超额换手率越高,说明投资者对该股票比较关注,反之投资者不太关注。进行类似前文的操作,相关的结果展示在表格5的子表4之中。

表4 投资组合在不同时期的收益率表现

5.博彩偏好与反应不足。Egginton and Hur(2018)认为投资者具有博彩性偏好,会偏好历史最大收益最高的股票,而忽视了股票本身包含的信息,因此,本文提出假说五:高质量发展水平对股票价格的预测能力在历史最大收益较大的股票中更加显著,即预测能力与博彩偏好导致的反应不足相关。

本文采用个股在过去一个月中的最大日度收益率刻画博彩效应,进行类似前文的操作,相关的结果展示在表5的子表5之中。

表5 高质量发展水平预测能力来源的实证检验

如表5的子表1所示,在Fama—Macbeth与Pooled OLS的方法下,高质量发展水平对公司未来短、中、长期的盈利能力(Roe)与未预期盈余(SUE)都有显著的预测能力,说明高质量发展水平的确可以预估公司的未来基本面的情况。因此,假说一成立。

如表5的子表2所示,高质量发展水平对股票价格的预测能力在过去表现最好组合中的收益大于过去表现较差组合中的收益,前者的平均值为0.0177、T值为3.34,后者平均值为0.0147、T值为2.98,两组之间策略的差距为0.0028,通过5%的显著性水平。因此,假说二成立。

表5的子表3、4、5分别展示了高质量发展与非流动性、投资者关注、日度最大回报三指标的双变量分组构建投资策略的结果,运用前文的分析方法,发现高质量发展水平对股票价格的预测能力在流动性较差、投资者关注度低、历史日度最大收益较高的股票中表现比较好,策略收益差分别达到了0.0070、0.0084、0.0157,分别通过了5%、5%、1%的显著性水平,即公司高质量发展水平对股票市场的预测能力来源于反应不足,假说三、四、五成立。

六、结论与建议

本文基于创新、协调、绿色、开放、共享五个维度建立高质量发展指标体系,使用机器学习方法探究高质量发展水平对股票收益率的预测能力,并进行稳健性检验和拓展讨论。

本文研究结果发现,公司高质量发展水平对其股票收益率有显著的预测能力;创新类变量是高质量发展指标体系预测股票收益率时最重要的变量类别,全要素生产率(TFP)、绿色信息披露得分(Environ_score)是预测时最重要的两个变量。除了2015—2016年的股市动荡区间之外,高质量发展水平的预测能力在各个时期都有显著存在且逐渐增强,此外,创新类与绿色类变量的预测能力变得越来越强,协调类变量的预测能力有所下降。本文发现高质量发展指标可以很好地预测公司的基本面信息,但投资者对高质量发展信息反应不足,导致高质量发展公司被错误定价是高质量发展水平预测能力的来源。

基于上述研究,本文认为投资者、企业与政府都应该关注高质量发展概念。对投资者来说,基于高质量发展水平的预测能力构建的投资组合可以在中国A股市场得到超额收益,且可操作性较强;对于企业来说,推进高质量发展既符合国家的战略要求,也可以改善企业自身的基本面情况,有利于企业的长期发展;对于有关部门来说,应该深入普及高质量发展概念,提高投资者的综合素养,帮助投资者竖立价值投资的理念,让资本市场定价机制变得完善,从而使得高质量发展企业得到充分的定价,与此同时,有关部门也要帮助企业认识到高质量发展的重要性与意义,从而推动国家经济转型与企业自身的发展。

猜你喜欢
收益率指标体系高质量
坚持以高质量发展统揽全局
高质量项目 高质量发展
牢牢把握高质量发展这个根本要求
“三部曲”促数学复习课高质量互动
层次分析法在生态系统健康评价指标体系中的应用
供给侧改革指标体系初探
测土配方施肥指标体系建立中‘3414
土地评价指标体系研究