基于PET衍生因子的量化选股实证研究

2017-12-29 00:00:00周全
今日财富 2017年16期

α收益是基金追求的超过市场平均收益的部分,量化选股多因子模型一直是市场量化分析选股的热点,如何找到一个有效的选股因子一直是每个投资者关注的问题。常见的阿尔法策略有动量Alpha策略以及基本面Alpha策略。本文综合考虑基本面以及市场交易层面的因素,在过往的研究基础上进行创新。首先根据基本面筛选出特定的股票池,并根据市盈率及换手率构建出衍生的∆PET因子,并探讨∆PET选股的有效性。本文采用2007-2017年上证综指及深证成指成分股数据的基本面和行情数据进行分析,并对因子选股的有效性进行分析论证,通过回测历史样本数据以及对样本外数据检验,证明了选股因子的有效性。

本文首先利用上证综指及深证成指的2007到2017年十年期数据进行模拟实证得出模型中参数的最优化设置。选取该时段的数据目的在于这段时间内A股市场经历了一个完整的周期,市场环境不仅仅有上升或者下降的趋势,这样可以看到因子在不同环境下的表现。为防止牛市效应使得选股因子失效,以每年为周期,用每年的数据进行进一步验证不同年份、不同行情中得分较高的组合的平均收益会超过得分较高组合的平均收益。

一、有效因子构造

(一)实证思路

一般来说,投资者会购买估值被低估的公司股票,若A公司股票被低估,其市盈率会远低于同行业平均市盈率(以下简称“PE”),且低于收益增长率。市场中绝大多数股票交易者会对公司进行盈利性估值,通过买入低估值的股票来获取风险利润。相对估值法中多数估值类因子受到行业及市值规模因子影响较大,即便估值成长较好,财务数据也会有较为的严重滞后性,从估值企业效益提升传导到资本市场中股票价格上涨,也存在着一定的时间差。因此应该对估值及市场交易因素综合考虑。估值类因子选取中,市净率(以下简称“PB”)对应于重资产的公司估值,市销率决定于企业扩张成长率,投资者要求的回报率以及销售的收入,而PE以及EP应用则相对广泛, 但不同行业不同市值的股票估值差异较大,因此在构建因子时要剔除行业市值影响。

(二)基础数据处理

由于不同行业市值规模的股票估值不具有可比性,因此首先得对股票的市盈率进行市值行业中性化处理。取出个股的历史时间序列截面PE,去极值之后在截面的基础上做出标准化处理,减去均值后除以标准差,得到一个新的近似于标准正态分布的序列,将缺省值填充为均值(即0,表示持中性看法)。再将标准正态分布的序列作为因变量对于市值规模因子,行业因子哑变量进行多元线性回归,测试出相应的残差进行替代,得出剔除行业及市值规模因子的PE序列。回归调整模型如下:

是股票i在T时刻截面期的PE值,是股票所属申万一级行业的哑变量,为股票i在T时刻的流通市值,为残差,即调整后的PE。处理以后采取的,作为选股构建模型的PE基础,所计算IC值也在此基础上进行。

估值方面的因子选取完毕之后,在市场交易因素的选取中,需要考虑诸多问题。交易量及交易额是绝对值数据,往往因为数值较大对模型产生较大影响从而干扰了其他因素对模型带来的影响。换手率作为一个相对指标,同时考虑市值规模因素和成交量,能够从量纲上与PE结合起来。所以选取换手率作为考察的市场交易因素。

PE是每只股票在调仓期开始时的截面PE,对它进行一些调整有利于对不同行业、不同规模的企业进行估值对比。而换手率因子具有特殊性,一个区间内可能会存在极值问题。且换手率的距离调仓日的远近对于下一个交易日的股票价格影响大小是不一样的,较远日期的换手率信息可能没有什么影响,而较近日期的换手率有着较强的影响,所以选取的换手率是调仓区间的日换手率,根据加权移动平均法,赋予近期换手率较大权重,赋予较远期的换手率以较小的权重来得出每个调仓日最后所使用的换手率。

其中:wi是按日加权的换手率的权重,Ti是股票距离上一个调仓日i天的换手率。对于调仓期内有停牌的股票,换手率缺失值用该日市场平均值代替[1]。

(三)因子体系组合

调整完参数指标后,就可以对二者结合来看,用以反映个股的基本面及市场交易因素的综合。若两个方面都较好,则该个股就是投资组合的选取目标。

由于每只股票的情况各不相同,单个时点的市盈率的高低无法反映这个股票的具体情况,市盈率越低,代表投资者能够以较低价格购入股票以取得回报。所以使用市盈率的纵向变化量。用换手率结合PE,从侧面可以反映出交易者对股票估值关注的程度,当估值较前一交易周期下降较大且换手率也下降较大的情况下,若交易者对该个股估值的预期较好,且此时个股的关注度较低,此时提前进入,交易的成功率较高。而相反若一个个股∆PET较高,则说明在相同估值的情况下,该股关注度可能已经偏高,股价已经充分反映,此时交易的成功率较低。举例来说∆PET较低组合去年交易胜率均值为0.52196,而∆PET较高组合去年交易胜率均值为0.44608。

综上,∆PET作为相应的选股基准,具有明显的特点:(1)在研究投资者预期及交易模式中,具有短中期选股的特征;(2)不会选出具有很强动量效应的强势个股;(3)注重选取前期强势后下跌,但在短中期存在右侧行情的个股。基于这些特点,选股调仓周期不能太长。在所有组合中,得分综合排名靠近前2,3左右的组合是选取的目标,因为此时可能出现的结果是PE以及换手率降到底部后,出现趋势性反弹,但还有可能会继续下跌,但此时换手率已经下降较多,即使出现下跌的情况,后续的空间的预期也不会太大。若∆PET因子有效,则实证的预期结果应该为总体靠前的组合应当小于靠后的组合,因子收益率IC值应该显著為负。

∆PET=∆Turnover ratio+∆PE

∆Turnover ratio=(Turnover ratioT -Turnover ratioT-1)/Turnover ratioT-1

∆PE=(PET-PET-1)/PET-1

Turnover ratioT是移动加权调整过后的换手率,Turnover ratioT-1是上一期换手率调整值, ∆PE为调整PE本期与上一周期的一阶差分。如果当前PET发生显著变化,那就能清楚的从∆PET中反映出来。

对于∆PET因子,使用它而不是直接用PET因子的优点在于,对于不同行业不同风格的股票样本来说,PE和换手率均有巨大差异,所以PET因子会有绝对值上的差异,而使用相对值可以进一步剔除一部分行业以及风格因子的影响,同时又考虑股票基本面及市场交易面的变化。

选择全部上证A股加上深证成指成分股作为整个股票池。这是因为深证成指成分股中剔除了一部分财务状况较差有重大违规的股票,∆PET因子的构建中涉及基本面,对基本面要求较高。由于∆PET反映了股票的一个短中期趋势,所以调仓频率不应太低,将调仓频率设为每隔45个交易日[2],从而保证了被低估的股票有足够的时间来回归正常值。所有参数设置都通过反复数据实验检测选取最优的。

二、实证结果

(一)基本假设条件

基本假设:

1.假设市盈率及换手率两个因子对∆PET的影响相同,因此赋予两个因子等权重[3]。

2.假设利润及净利润同比增长率都为负的个股市场对其预期较差,未来表现不会太好。

3.假设中短期内个股市盈率仅有行业及市值规模为外部影响因素,其他影响因素为内部因素。内部影响因素可能有每股股利增长率,股息发放率等。

4.假设落单量不会影响最后成交平均价,调仓日按开盘价的2%滑点全部成交,即买入按101%的开盘价成交,卖出价按开盘价99%成交。盘中数据用真实数据测试,考虑涨跌停限制。

本节中,讨论组合的具体构建以及选股能力。使用历史分层回测的方法来计算∆PET的选股能力,不仅区分不同组合的选股效果,更能考察选股因子的单调性,操作可行,是一种广泛使用的手段。

回测时间段:2007年1月1日至2017年3月8日

初始资金:10,000.00万元[4]

样本空间:选取所有上证指数及深证成指成分股,剔出了PE以及净利润同比增长率为负以及调仓日停牌的股票,剔除ST、ST*、退市股票以及上市不满一年的次新股。

调仓标准:期初调仓,每隔四十五个交易日调仓一次。以每次调仓日的开盘价滑点2%进行调仓。在每个调仓周期的的最后一个交易日核算调仓因子,满足因子指标要求的保留,不满足的卖出。新加满足指标的股票,等权重构建投资组合。

交易费率设置:2013年一月一日以后为买入万分之三,卖出万分之十三。2011年1月1日到2013年1月1日之间为买入千分之一,卖出千分之二。2009年1月1日到2011年1月1日为买入千分之二,卖出千分之三。2009年1月1日之前为买入千分之三,卖出千分之四。所有日期最小交易费每笔5元。

数据处理方法:按照之前已经阐述的方法构建因子,其余的不做处理,缺失值为空值的采取该日市场均值填补[5]。

分层回测,针对多空组合分别构建8个资产组合,考察多空组合中大体表现差异以及每个组合的单调性。其中,多方组合为可行股票池中,得分靠前的前八十只股票(∆PET因子值最小),每十只股票构成的股票组合,空头组合为得分靠后的八十只股票构成的资产组合(∆PET因子值最大),按照预期多头组合的总体表现应该优于空头组合,且在多空组合中,按照得分从高到低收益应该呈现一定的单调性[6]。

分层组合回测净值图。按前面说明的回测方法计算组合 1~组合 8、基准组合的净值,与同期上证综指净值对比作图。

评价方法:年化收益率、夏普比率、 信息比率、 最大回撤、 日胜率等,波动率等。

(二)分层回测

1.多头组合绩效统计

多头组合为市场中∆PET因子值最小的组合,统计了其各项绩效指标,结果如下:

从收益结果来看,未做风险规避的多头组合排名靠前的两组的收益十分接近,分别在952.71%以及962.01%,组合年化收益26.89以及27.00%,最大回撤为75.387%左右,日胜率为0.542,反映了交易日中日收益超过大盘的概率为54.2%,市场较差环境下组合的收益都出现了大幅的回撤,总体来说组合的选股效应较为良好。单调性方面组合从1到8年化收益率及对数收益率和夏普比率都呈现一定下降趋势,波动率和最大回撤无明显单调变化,说明组合的收益随着因子的暴露度有一定的负相关关系[7]。

根据图表3所示,多头各组组合在不同年份的收益及排名,排名靠前的组合在横盘震荡及市场弱势的年份中的表现比较偏中性,而在牛市中都能取得远大于靠后组合的收益,年度排名具有较为明显的单调性。如图表4结合风控的组合会有不错的收益,每五日判断组合净值是否低于上一周的0.95倍(基于样本数据回测最优化得出),若小于则平仓,多头第一组组合累计收益6138.693%,组合年化收益52.94%,最大回撤22.92%。

2.空头组合绩效统计

空头组合为市场中∆PET因子值最大的组合,统计了其各项绩效指标,结果如下:

从空头组合收益结果来看,单调性分化更加明显。空头组合定义为得分排名为股票池中最靠后的80只个股,未做风险规避的空头组合收益得分第一和第三的组合表现较好,年化收益率467.28%,568.13%,年化26.89%以及24.32%。胜率都在0.51左右,而全股票可选池内得分最低的一组收益仅为19.14%,年化1.7%,空头组合内部分化明显。夏普比率索提诺比率等绩效指标以及空头的八个组合的整体平均收益也明显小于多头组合,说明PET因子区分选股的能力较为明显。

(三)相关性分析

因子IC值是指因子在T期的暴露度與T+1期的收益率的斯皮尔曼秩相关系数,反映的是因子的收益相关性,若因子收益率关于因子暴露度是一个严格单调递增或者单调递减的关系,则系数的绝对值为1,当值越接近1时反映收益率与因子的正相关关系越强,越接近-1则表示负相关关系越强,该函数优点在于既能反映线性又能反映非线性关系。公式如下:

其中ICT是因子x在T时刻的秩相关系数,RT+1是股票在T+1时刻的收益率向量,XT是股票在T时刻的因子暴露度值截面向量,这样一来求出一个的因子IC值的时间序列。本文中,采用的因子值是经过剔除市值以及行业因子后的PE值以及加权后的换手率因子,衡量一个因子的IC值序列具有以下几个标准:

1.IC值的均值,反映了整体因子的显著性,越接近正负一为佳,或绝对值很大;

2.IC值的标准差,反映了因子的稳定性,越小越好;

3.IR信息比率,反映了因子的有效性,越大越好(用均值除以标准差的绝对值);

4.IC值的方向性,用小于0的占比来反映,反映了作用的方向性;

构建IC计算模型回溯区间2013年到2016年四年48个月,测算出∆PET因子秩相关系数,图11给出了每个月因子值与次月收益的秩相关系数,其中5%的概率显著的有27个,显著为正的5个,显著为负的有22个。IC值小于0的占比为81.48%,说明因子作用方向为负方向,验证了之前按照较小∆PET因子值选股的方法结论,IC值均值为-0.12154,标准差0.149167,IR信息比率为0.68,大体上来看,∆PET的选股因子的稳定性,显著性,方向性,有效性各方面较为良好。

三、研究结论与不足之处

本文通过综合运用估值及市场交易层面信息选取相关因子,并利用2007-2017上证综指、深证成指成分股财务数据以及行情数据,建立了∆PET衍生因子选股的思路。实践表明所选组合的收益在较大概率下高于指数基准。投资组合的主要特点有:短中期收益较高;右侧交易意图明显;熊市环境下的损失小于指数;震荡市及牛市能获得不错的收益,因子的效果会受到市场环境的影响。

同时,本文还存在一些不足:

(一)本文假设两类因子对∆PET的影响相同,但很多文献在对不同多因子选股权重问题的讨论中,会采用层次分析法对因子赋权,实证表现要稍微优于等权重赋权。通过动态或静态赋权的方法能使得因子得到进一步优化,在后续的研究中会进一步拓展。

(二)在因子的选取中,市场及交易层面中可能会有更好的待选因子组合优于本文中选取的因子组合。同时,本文无买入、卖出点设置,具体买入、卖出点有待量化择时理论进一步完善,因此本文实证只是构建了选股因子,并检验有效性,不可单独作为选股策略使用。(作者单位为华东政法大学商学院)

注释:

[1]具体到本文中,本文中由于没有卖出点的设置,为被动持仓的指数化投资,持仓周期为固定的四十五天(根据样本内数据实证最优化分析所得),所以w_i为距離上一个到期日的天数。

[2]参数根据样本内数据实证结果最优化所得。

[3]多因子选股中赋予权重的方法常见的有等权重法及层次分析法,这里借鉴等权重法[7]。

[4]过高的资金有较高的手续费,过低的资金无法配置资产。

[5]表示市场中性看法。

[6]由于每个截面值的不同,每次回测均能覆盖到股票池中不同的个股,∆PET相差较大的个股收益差别比较明显,而因子值相差较小组合回测没有意义,故这里做抽样。

[7]基于实验数据的不同,每组的收益可能不是严格单调,但大概率下排名靠前的组合的整体平均收益大于靠后的组合整体平均收益,则说明因子有一定的选股区分性。