牛丽文 张艳艳 冯绪
【摘 要】 根据历史收益来检验投资策略的有效性,造成了基于历史收益的股票选择偏差,并由此导致历史收益较低的股票必须有更高的风险溢价才会被投资者选择。文章以1996—2017年沪深两市全部正常的A股信息为研究对象,创新性地提出股票历史最高收益因子,将其作为新的风险定价因子加入到资本资产定价模型中,并通过Fama-MacBeth横截面方法进行了单因子检验和多因子的有效性检验。研究发现:历史最高收益风险因子的系数均显著异于零,可以作为解释股票收益的必要因子,能够反映我国沪深股票市场的股票价格波动;新的风险因子的发现有益于投资者正确全面地判断影响股票收益的因素,从而使投资者获得更大的利益,同时能够通过资源的优化配置促进我国股票市场健康稳定的发展。
【关键词】 股票市场; 历史最高收益; 风险因子; 横截面检验
【中图分类号】 F832.5 【文献标识码】 A 【文章编号】 1004-5937(2019)21-0118-06
一、引言
Fama[1]提出的有效市场假说认为,在市场有效的前提下,无法根据历史数据预测其未来变化趋势,通过历史收益分析对股票收益预测是无效的。但在有摩擦的真实市场中,尤其是金融界,量化投资的机构和个人总是根据历史收益来检验策略的有效性,由此造成了基于历史收益的股票选择偏差。例如,某些股票有较高的历史收益,基于这些股票所构建的投资策略在历史回测中表现较好,投资者会更多地使用该策略,从而将财富分配在这些股票中;与之相反,当股票的历史最高收益较低时,投资策略回测中表现较差,投资者会天然地回避选中这些股票的投资策略,以及回避这些股票,从而决定这些历史收益较低的股票必须有更高的溢价才会被投资者选择。因此,尽管最高收益是股票的历史表现,但是由于投资者采用历史收益作为策略选择的标准,该指标最终还是有可能像公司规模、账面市值比等公司特征一样,在资产定价过程中发挥作用。
本文创新性地提出用股票历史最高月收益率作为股票的风险定价因子,发现随着历史最高月收益率的增加,股票的平均收益率呈递减趋势,初步判断历史最高月收益率和股票收益有关;但是,需要通过有效性检验来确定两者的关系是否显著。通过Fama-MacBeth横截面方法对构造的历史最高收益风险因子进行了单因子检验和多因子有效性检验,研究发现历史最高收益风险因子的检验结果均显著,可以作为新的因子来解释股票截面收益。该因子与上市公司特征因子(公司规模、账面市值比、投资风格、利润等)或市场风险因子不同,它是基于投资者行为习惯所形成的,代表了由于投资者行为偏差所导致的对股票的认知风险。
二、文献综述
早期的资本资产定价模型(CAPM)认为市场风险的存在导致了股票超额收益,市场风险因子是影响超额收益的唯一因子。Ross[2]提出的套利定价理论(APT)认为,风险资产的收益不仅仅与市场风险因子有关,其与多个因素之间均存在线性关系。随后在对历史数据的分析下,许多对于股票收益有显著解释能力的其他因素被发现。Basu[3]运用1963—1980年纽约股市数据,研究了市盈率倒数(E/P)与股票回报之间的关系,发现E/P有助于解释股票平均报酬。Fama et al.[4]发现市值、账面市值比和市盈率可以解释β值不能解释的股票回报率差异。这些风险因子的发现离不开对股票历史数据的分析,同时也引起后来学者对前人研究结果的不断挑战和完善,对许多新的定价因子的出现起到了促进作用。
随着国外影响资产收益的风险因子的不断发现,越来越多的学者关注风险因子对资产收益的解释作用,实证方法也被广泛运用到资产定价研究中。Michael[5]表明仅仅是CAPM模型的β因素不足以描述预期回报的横截面;与多因素模型相比,CAPM模型的绝对价格误差相当大,即公司规模和账面价值有助于解释股票平均回报的变化。Basiewicz et al.[6]通过测试Fama-French三因素模型的可行性来解释规模和价值效应,结果显示,三因素模型能够解释价值效应,并且能正确地解释市值效应。
国内学者关于CAPM和Fama-
French三因子模型的实证研究,得出的普遍结果是,在国内股票市场CAPM的不适用和三因子模型中规模与账面市值比因子对收益的解释更强。陈小悦等[7]通过实证研究均发现,CAPM在中国股票市场上不适用。刘媛媛[8]研究表明,Fama-French三因子模型与传统CAPM相比,前者在中国股票市场上表现更好。
虽然三因子模型能很好地解释股票市场超额收益,但寻找新的因子也逐渐被国内学者所重视。何治国[9]发现除β外,市盈率倒数(E/P)也对资产组合收益率具有很强解释能力。黄诒蓉等[10]通过构造非流动性风险因子,发现一个基于系统非流动性风险调整的资产定价模型,能更好地解释股票收益率截面差异。黄彦菁等[11-12]均采用主成分分析方法構建投资者情绪指标,发现基于投资者情绪的四因子模型对于股市收益具有较高的解释能力。欧阳志刚等[13-14]发现,在三因子的基础上加上其他因子相比于三因子对超额收益率的波动有更好的解释力,更加适用于中国市场。可见,为了更全面准确地解释我国股市收益,寻找新的风险因子非常重要。
三、研究设计
(一)数据的选取与处理
中国股票市场规模和投资者群体自1990年深圳和上海证券交易所相继成立以来不断壮大。截至2017年末,上市公司数已达3 400多家,上市股票数也达到3 500多只。1990—1995年期间中国股市从初步建立到逐渐完善,相关政策也在不断出台,该期间股票数较少,一些数据的波动性较大,不适合作为研究样本。因此,本文的样本区间为1996年1月1日到2017年12月31日,研究对象为沪深两市全部正常的A股信息;个股交易数据和股票年收益率来自于国泰安数据库(CSMAR),市场溢酬因子、市值因子、账面市值比因子和无风险收益率数据源于锐思数据库(RESSET),使用MATLAB进行统计分析。
由于选取股票数据的时间跨度较大,种类较多,不可避免地会存在数据缺失现象,因此非常有必要对数据进行预先处理。首先,剔除ST股票来排除其影响;其次,将每只股票各年份不足12个月的年份数据剔除,以保证样本数据具有代表性;最后,剔除某些取值异常的数据。经过数据的预处理得到共2 973只股票数据。
(二)风险因子的确定
对于风险因子的选择一般没有固定的模式,但要遵守有效性、直观性和明确性;有效性是风险因子在资产定价模型中作为解释变量是显著的,能有效地解释股票收益率的波动;直观性是表示具有直观的含义,便于理解;明确性是风险因子的经济意义明晰确定,风险来源比较容易识别。
为了确定风险因子,预先判断历史数据是否对当前数据有影响,需要根据回报率高低对样本股票进行分组。采取与Fama et al.[15]相似的股票分组方法。首先,将样本股票的日个股回报率数据按月进行求和,选出每只股票在1996—2017年每年的最高月收益率,再选出每只股票在1997年到2017年每年的历史最高月收益率;然后,从1997年到2017年每年都根据该年的历史最高月收益率从低到高对股票分组(分为5组),最后根据分组求出每组股票该年的平均收益率,共得到105组的数据;最后,对每组的所有年份的平均收益率求平均值。
如图1所示,整体上,由第一组到第五组平均值在逐渐变小,即随着历史最高月收益率的增加,股票的平均收益率呈递减趋势,但其变化并不均匀。将其变化分为四个阶段。第一阶段为第一组到第二组,曲线斜率较小,股票平均收益率递减趋势较缓;即历史最高月收益率虽有所增加,但其投资策略回测中表现仍较差,其预期亏损的概率也稍大,对投资者回避选中这些股票的表现改善不大;这些股票仍然被要求有更高的溢价才会被投资者选择,所以第一阶段的平均收益率变化不大。第二阶段是第二组到第三组,随着历史最高月收益率的增加,股票平均收益率减小的幅度增大;说明此阶段的股票历史回测表现达到了更多的投资者的接受范围,其预期亏损的概率更小,投资者对期望回报率要求更低,股票的平均收益率减小的幅度明显比第一阶段大。第三个阶段是变化最大的阶段,此阶段股票平均收益率下降幅度最大;如果说第二阶段的变化只是让更多投资者接受股票历史回测表现,那这一阶段股票的历史回测表现对大部分投资者来说更有吸引力,以至于愿意接受更低的溢价而将财富分配在这些股票中。第四阶段相比于第一阶段变化更加平缓,基本趋平;说明经过第三阶段的变化股票的期望回报率已经非常低,以至于股票的历史表现再好,风险再小,投资者所要求的期望回报率也不会有太大的波动。
总的来说,历史收益率越高的股票,其预期亏损的概率越小,对其进行投资的风险越小,投资者对其要求的预期收益越低;相反,历史收益率越低的股票,对其进行投资的风险越大,投资者对其要求的预期收益越高。风险越大的股票其期望的回报率也越大,非常符合资产的风险越高收益率越高这一金融界的普遍共识。
经过前面根据历史最高月收益率每年分五组得到的股票数据,分别计算第一组和第五组所有股票每年每个月的平均收益率;同样仿照Fama et al.[15]中因子的构造方法将第一组低的历史最高月收益率的平均收益率和第五组高的历史最高月收益率的平均收益率按照日期对应相减,得到一个由差值形成的21年每年12个月共252期的时间序列。该时间序列是通过分析构造的历史最高收益风险因子,本文表示为Q。
(三)研究方法
在实证研究方面,存在变量中的误差问题和残差方差与真正的β相关的问题,Fama-MacBeth横截面检验方法的出现,解决了这些问题,也在不断地被运用到CAPM的实证检验中。Fama-MacBeth横截面检验方法简称FM回归法,是一种用于显著性检验的计量经济学模型研究方法,对横截面收益现象分析应用较广泛。
Fama-MacBeth横截面检验的主要思想是:通过对股票分组形成的组合来估计敏感因子对每个组合的风险系数β,使得估计的β能够降低个股的估计误差,以求更加准确地表示真实的β。通过回归来检验风险因子是否真的显著存在,以此来判断风险因子对股票的收益是否有影响。
检验步骤如下:
第一阶段:用预期收益率作为被解释变量,敏感因子为解释变量,进行回归得到由回归系数组成的一个序列。计算回归系数序列的均值、标准偏差和t统计量,判断敏感因子与股票收益率的线性关系。
yi,t=αi+βixt+εi,t (1)
其中:yi,t是横截面点i上t期的股票收益率,xt是敏感因子,βi是敏感因子的回归系数,αi为回归截距,εi,t为误差项(代表被解释变量yi,t中无法被解释变量xt所解释的部分)。t检验值是判断解释变量的参数βi是否为零,从而确定解释变量xt是否对被解释变量yi,t有显著的影响。
第二阶段:将股票收益率yi,t取平均值與βi进行进一步的线性回归,计算回归系数b的t值,与临界值做比较,判断b是否显著异于零,由此得出βi是否能在一定程度上解释截面收益。
yi=a+bβi+εi (2)
其中:yi为第i组的股票平均收益率时间序列数据的平均值,a为回归截距,b为βi的回归系数,式中其他符号的意义同上。
四、实证研究
(一)样本构造
由于单只股票的收益波动较大,无法准确分析股票之间的差异,为了解决这个问题从而达到最大的平均收益差异,需要根据Fama et al.[4]的二维分组方法对样本股票进行分组,即按照市值-账面市值比维度构造5×5的投资组合。分组步骤如下:
1.将样本股票根据市值从小到大进行排序,然后将排序后的股票均分为5组,分别表示为S1、S2、S3、S4、S5。将样本股票根据账面市值比从小到大均分为5组,分别表示为M1、M2、M3、M4、M5。其中由于是用历史数据分组,因此需要滞后一年,则开始年份为1997年。
2.两种分组互不影响,将两种分组交叉产生5×5组,即25个组合。按照分组分别求每组相应年份每月的平均收益率,这样就得到25组时间序列数据,每组252个月的组合平均收益率。
(二)单因子检验
将构造的风险因子Q时间序列作为解释变量,经过分组得到的25组时间序列数据每一组作为一个被解释变量,进行线性回归,得到由回归系数βi(i=1,2,…,I)组成的一列数据。被解释变量共有25组,则I取25。回归模型为:
yi,t=αi+βiQt+εi,t (3)
其中:yi,t为第i组的股票第t个月的平均收益率数据;Qt为构造的历史最高收益风险因子,式中其他符号的意义同上。
首先,通过对每组月度收益率数据进行时间序列回归得到回归系数βi和其t值t(βi),结果如表1所示。从纵向看,除了S4M4组合外,βi系数表现出随着账面市值比增大而减小的趋势;橫向看,除了个别几个组合外,βi系数大部分是随着市值的增大而逐渐减小的;整体上看,由市值和账面市值比最小的组合S1M1到最大的组合S5M5,βi系数的绝对值是明显逐渐增大的,βi系数的绝对值越大,风险因子Qt的变化对组合股票平均收益率影响越大,股票的风险越大。在高市值和高账面市值比情况下,股票的风险相对较大。
表1t(βi)结果中加粗的为t(βi)绝对值大于临界值1.65的数据;由此可见,t(βi)绝对值数据中大于临界值的组合比小于临界值的组合数目多,也即是存在一部分组合在90%的概率下构造的风险因子可以解释股票的平均收益。
其次,计算回归系数βi序列的均值、标准偏差和t统计量,结果得:βi均值为-0.4359、标准偏差为0.3415、t统计量为-6.382,其绝对值明显大于在0.05显著性水平t统计量的临界值2.06,说明在95%的置信水平,βi系数显著异于零,即构造的风险因子Q与组合月度收益率时间序列数据成反比关系。
最后,用每组时间序列的平均值为被解释变量利用式2对前面获得的回归系数βi进行进一步的回归,结果得出系数b的t值为2.620,明显大于0.05显著性水平的临界值2.07;通过进一步回归得出的系数b显著异于零,说明βi与股票平均收益率时间序列数据的平均值显著存在线性关系,组合的截面收益能被βi值所捕捉;同时也说明构造的风险因子Qt存在,并可以解释股票的平均收益。
(三)多因子有效性检验
Fama-French三因子模型表明三因子(市场溢酬因子、市值因子和账面市值比因子)能够很好地解释股票的平均收益。为了发现历史最高收益因子与三因子的区别,并判断其是否能够作为解释中国沪深股票市场股票超额收益率的影响因素。在单因子检验的基础上,引入三因子建立如下多因子回归方程:
yi,t=αi+βqQ+βm(Rm t-Rft)+βsmbSMB+βh m lHML+εi,t (4)
其中:Rm t为市场组合在第t个月的收益率,Rft为第t个月的无风险利率;Rm t-Rf t即股票投资组合第t个月的市场溢酬;SMB(Small Minus Big)体现公司规模因素,是小公司与大公司投资组合的月收益率的差值;HML(High Minus Low)是高账面市值比的股票组成的投资组合比低账面市值比的股票组成的投资组合高出的收益,该指标体现公司的价值因素;αi为常数项,βq、βm、βs m b、βh m l分别是各组合收益率对各个因子的敏感系数,式中其他符号的意义同上。
第一步,对25组月平均收益率数据分别进行时间序列回归分析,得到组合各因子的敏感系数βq、βm、βs m b、βh m l及其对应的t值,如表2所示。
从表2的回归结果可以看出,构造的风险因子Q回归系数βq的绝对值由于三因子的加入有所减小,但整体上依然表现出随着账面市值比的增大而减小,随着市值的增大而减小;从显著性方面来看,其t值大部分明显大于在0.1显著水平下t值临界值1.65,说明构造的风险因子能在一定程度上解释市场组合的收益率。
从市场溢酬因子的回归系数βm中可以发现,βm值基本接近0.05,并且t值均通过了检验,普遍大于其他因子的t值,可见其稳定性非常高;说明Rm-Rf与其他三个因子相比对市场组合收益的解释能力最强,是解释组合收益的时间序列变化不可或缺的变量。市值因子的回归系数βs m b随着市值的增大而减小,且βs m b的t值的变化趋势和其回归系数的变化趋势相似,且均显著异于零;说明SMB对股票收益的影响随着市值的增大而减弱,市值因子可以作为一个重要因素影响组合收益。账面市值比因子的回归系数βh m l和其t值均呈现出随着账面市值比增大而增大的趋势,当账面市值较大或较小时,t值较显著,说明HML对组合时序收益变化具有很强的捕捉能力,当账面市值比落于中间组合时,该因子对组合时序收益变化的捕捉能力明显减弱。
从整体上来看,市场溢酬因子对市场组合收益的解释能力最强,市值因子次之,构造的风险因子与其他三个因子相比解释能力最弱;但是也能在一定程度上解释市场组合的收益率,其对我国沪深股票市场收益也是有一定影响的。
第二步,为了更好地估计每个因子的风险溢价,采用Fama et al.[16]中剔除HML的方法,对第一步得到的回归系数βq、βm、βs m b、βh m l进行回归:
Βh m l=c+bβq+mβm+sβs m b+γi(5)
得到回归方程的残差■i=βh m l-■h m l(■hm l为βhm l的拟合值),用残差■i代替回归系数■hm l进行回归:
yi=a+bβq+mβm+sβsmb+r■i+εi (6)
其中:yi为第i组的股票平均收益率时间序列数据的平均值,式中其他符号的意义同上。
对回归系数βq的进一步回归检验,主要目的是检验在其他因子不变时,构造的风险因子Q是否对市场组合收益率有显著的影响。由表3可知,回归系数b的t值为10.223非常显著,即βq显著异于零,说明在三因子检验下构造的风险因子Q可以作为解释组合收益的必要因子,对我国沪深股票市场股票价格波动存在一定程度上的影响;在对我国股票市场进行资产定价风险分析时,可以把历史最高收益因子作为参考因子。
五、预测
通过对构造的历史最高收益风险因子Q进行单因子检验和加入三因子检验,得出历史最高收益风险因子Q对沪深股票市场的波动存在影响,可以作为解释组合收益的必要因子。但通过对该风险因子的分析能否对投资者预测我国股票市场的价格变化趋势有一定的参考价值,还需要我们对上述检验结果做出预测。
对每期的历史最高月收益率是否能预测下一期的股票年收益率进行FM回归分析。用下一年的股票年收益率作为被解释变量,当年的样本股票历史最高月收益率由低到高排列的数据为解释变量,进行一元线性回归得到由回归系数βt(t=1,2,…,T)组成的一个时间序列。样本开始年份为1996年,由于年收益率数据均滞后一年,即由1997—2017年共21年,因此T=21。
yt+1=αt+βtzt+εt (7)
其中:yt+1是t+1期的股票年收益率,zt是第1期到第t期股票最高月收益率由低到高排列的數据。
计算回归系数βt时间序列的t统计量,与临界值作比较。计算结果得:βt的均值为-0.1143、标准偏差为0.1992、t统计量为-2.6286,t统计量的绝对值明显大于0.05显著水平的临界值,表明在误差不超过5%的情况下,可以认为股票历史最高月收益率与下一期的股票年收益率成反比;说明可以根据股票历史最高月收益率来预测股票年收益率的变化趋势,对投资者预测我国股票市场的价格变化趋势有一定的参考价值。
六、结论与启示
本文在关注股票收益率及其风险基础上,利用1996—2017年沪深两市数据,从静态方面研究历史最高收益风险因子能否作为预测股票年收益率变化趋势和做出相关投资策略的参考因子。结果显示:在单因子检验和多因子有效性检验下,由历史最高收益数据构造的风险因子Q对股票的平均收益率均有解释作用;且在高市值和高账面市值比情况下,风险因子Q对股票的风险影响相对较大,说明历史最高收益因子有助于更全面准确地预测我国股市收益;投资者可以将股票历史最高月收益率作为参考因子,预测股票年收益率变化趋势和做出相关投资策略。
本文的结论对投资者全面准确地预测我国股市收益有一定的参考价值,对我国股票市场的发展也有重要的启示作用。
1.在多因子的有效性检验中,市场溢酬因子相比其他因子非常显著;说明市场风险因素仍然是影响股票收益的最主要因素,这与我国股票市场二十多年来的政府调控不可分离。但是,在政府调控的大环境下,寻找新的风险因子有益于投资者正确全面地判断影响股票收益的因素,使投资者获得更大的利益,资源得到更好的配置,这对我国股票市场健康稳定的发展具有深远意义。
2.结合二十多年的收益数据构造风险因子,不仅有利于对我国股票市场进行更加全面的描述,而且有助于寻找新的适合我国股票市场特征的定价因子。但是,随着我国股票市场的相关制度不断完善,不同阶段不同政策下历史最高收益风险因子的定价机制是否不同,这一点还需要继续研究。●
【参考文献】
[1] FAMA E F. Efficient capital markets,a review of theory and empirical work[J]. Journal of Finance,1970,25(2):383-417.
[2] ROSS S A. The arbitrage theory of capital asset pricing[J]. Journal of Economic Theory,1976,13(3):341-360.
[3] BASU S. The relationship between earning yield,market value and return for nyse common stocks:further evidence[J]. Journal of Financial Economics,1983,12(1):129-156.
[4] FAMA E F,FRENCH K R. The cross-section of expected stock returns[J]. Journal of Finance,1992,47(2):427-465.
[5] MICHAEL D. Beta,firm size,book-to-market equity and stock returns[J]. Journal of the Asia Pacific Economy,2003,8(3):354-379.
[6] BASIEWICZ P G,AURET C J. Feasibility of the fama and french three factor model in explaining returns on the JSE[J]. Investment Analysts Journal,2010,39(71):13-25.
[7] 陈小悦,孙爱军. CAPM在中国股市的有效性检验[J].北京大学学报(哲学社会科学版),2000(4):28-37.
[8] 刘媛媛. 中国股票市场的有效性实证研究[D].成都:西南财经大学硕士学位论文,2012.
[9] 何治国. 中国股市风险因素实证研究[J].经济评论,2001(3):81-85.
[10] 黄诒蓉,李跃云. 非流动性风险因子在资产定价中的作用——基于中国股市的经验研究[J].当代财经,2009(9):56-60.
[11] 黄彦菁,徐旭. 基于投资者情绪的四因子模型实证研究[J].会计之友,2018(1):57-61.
[12] 尹莉娅. 投资者情绪对股票收益影响的实证研究——基于Fama-French三因子模型[J].会计之友,2018(6):51-56.
[13] 欧阳志刚,李飞. 四因子资产定价模型在中国股市的适用性研究[J].金融经济学研究,2016(31):84-96.
[14] 阳佳余,赵泽宇,张少东. 股票市场仍然存在超额收益吗?——基于条件资本资产定价模型的研究[J].南开经济研究,2018(1):86-103.
[15] FAMA E F,FRENCH K R. Common risk factors in the returns on stocks and bonds[J]. Journal of Financial Economics,1993,33(1):3-56.
[16] FAMA E F,FRENCH K R.A five-factor asset pricing model[J].Journal of Financial Economics,2015,116(1):1-22.