干伟明
(南京大学 商学院,江苏 南京 210093)
配对交易是统计套利的重要方式之一,早在20世纪20年代西方资本市场中著名投资者Jesse Livermore建立了一组相关股票的对冲交易模式,从而开创了统计套利之配对交易的先河。他在证券投资过程中经常觉察到相似行业的股票,由于业务相似其市场价格也往往存在相关性,而当其市场价格远离相互均衡关系时就产生了低风险套利可能。这时卖空价格走势为强势的股票同时买进价格走势为弱势的股票,只要在双方的市场价格重新达到相互均衡时立刻进行相反操作即可盈利。由于配对交易操作能够规避主要的市场风险,所以通常也被视为一种市场中性的投资方式。
之后,物理学出身的摩根斯坦利员工Nunzio Tartaglia在20世纪80年代中叶建立了一个理工科背景的多学科量化分析团队,借助当时快速发展的信息技术,在很大程度上促进了基于统计学的量化套利在实际投资业务和程序化交易中的应用。此后的二三十年间,经过众多学者的推导证明和大量投资机构的实践操作,统计套利之配对交易方法逐渐被业界采纳并广泛使用。尤其是最近一二十年来伴随着信息技术和程序化交易的快速发展,配对交易模型的研究日益深入,其市场规模也日趋增长。
在当今A股市场有效性逐步提高的背景下,配对交易策略可以为广大投资者提供一种崭新的交易方式,促进市场价格发现机制的进一步完善,从而进一步提高我国资本市场资源配置效率。
Krauss(2017)对统计套利中配对交易的各种方法和策略进行了总结和梳理[1]。自20世纪80年代中期,摩根斯坦利Nunzio Tartaglia的投资团队在交易中采用配对交易后,Bondarenko(2003)最早从金融经济学视角对这种投资方法做出完整说明[2],之后Gatev等(2006)对统计套利的基本交易原则从理论上进行了阐述,提出了经典的最小距离方法:即以过去一年作为回溯期,然后计算两两股票的标准化价格的欧几里得距离(SSD),选择其中较小的作为配对组合,当配对组合价格大于回溯期的2个标准差时入场,回到均值时则平仓[3]。
在这些研究的基础上,学者们对配对交易方法展开了更为透彻的分析。Whistler(2004)按照相关性来挑选配对组合,并综合考虑基本面与技术面的因素来共同明确进入与退出交易的条件[4];Vidyamurthy(2004)指出配对组合间若存在协整关系,则套利操作的期望收益率也有可能更高[5];Bertram(2010)对配对组合的价格取对数后发现其差符合零均值O-U分布,在此基础上分析了配对组合开展交易的规则[6]。Jacobs等(2015)认为配对交易收益来源于信息传递的速度差异,特别是当金融市场上出现大量非预期信息时,投资者的关注点从个股转向市场,造成了个股信息传播速度的差异,从而会表现为不同股票价格的分离[7]。总体而言,统计套利的可操作性已在海外市场得到较充分的证实,在配对组合挑选、套利模型确立以及开仓、平仓信号触发等三个重要步骤上基本成型。
考虑到A股市场直到近年才允许做空操作,基于统计套利的投资操作在国内资本市场中多年来一直未被有效关注和使用,国内学者对该领域的研究还不是非常丰富。崔方达等(2011)对基于GGR最小距离法的配对交易进行了研究[8];王菊等(2017)提出了采用滚动回归生成的配对比率进行配对交易的方法[9]。戴进(2012)对协整模型在股指期货和ETF的套利操作进行了分析[10];王春峰等(2013)研究结论是在A股市场按照价差开展配对投资操作能够消除主要的市场风险且持续盈利[11];赵胜民等(2015)指出统计套利在A股市场的可行性,但存在非持续和不稳定的风险[12]。总体而言,国内学者针对A股市场进行了统计套利操作的研究,并在模型确立和操作策略设计上相较西方同行进行了改进,但尚未在西方传统的套利模型和理论方面有所创新。
配对交易模型主要面临着发散的风险。根据Do等(2010)的研究,GGR的最小距离方法得到的配对组合中,32%并不收敛[13]。原因主要是目前在建立配对组合的均衡相互关系时,只考虑了配对组合价格时序序列之间的数学关系这一单一因素,而忽视了决定配对组合市场价格变动的基本定价因素,即没有依靠资产定价理论,从而会发现对特定样本合适的模型在样本外推时失效,即面临着模型发散的风险。所以一个有效的配对投资策略应当依照资产定价理论,在配对组合均衡相互关系构建时,不仅应考虑配对组合价格的时序序列,还应综合考虑配对组合的其他各种基本定价因素。因此,本文将从Fama-French多因子资产定价模型出发,利用现代金融学理论的定价模型和定价因子对传统协整配对模型进行改进并开展实证分析。
Vidyamurthy(2004)提出的协整模型[5]是统计套利中应用最广泛的技术方法。设配对组合中两个证券价格序列各自是Xt和Yt,且满足:
若配对组合中两个证券的价格Xt和Yt之间的关系是协整的,则表明:股票价格Yt可由股票价格Xt的线性组合α+kXt所描述,且这种描述关系是持续稳定的;同时定义残差序列εt为股票价格Yt无法被股票价格Xt所描述的部分,则这个序列εt也必须满足平稳要求。所以判断配对组合中两个证券的价格Xt和Yt之间的关系是不是协整就等同于对(1)式中的残差序列εt的平稳性进行判断。一般在应用中普遍采用ADF检验来对配对组合价格之间的均衡关系开展协整判断,股票价格Xt和Yt之间关系若是协整的则必然要求两者同阶。具体步骤为:首先借助单位根检验方法挑选出价格序列符合单阶平稳特性的股票,然后在其中两两进行回归,即对股票价格Xt和Yt建立(1)式的回归方程,若残差序列εt满足单阶平稳要求,则可组成满足协整要求的配对股票Xt和Yt组合。
在配对交易中,配对股票的选择是整个交易环节中最为关键的步骤,无论是GGR提出的最小欧式距离方法还是Vidyamurthy提出的协整分析方法,均是只依赖配对组合价格时序序列之间的数学关系这一单一因素来建立配对组合的均衡相互关系,由于缺乏资产定价理论作为支撑,忽略了决定配对组合市场价格变动的基本定价因素,因此稳定性较差。
在资产定价理论的一系列研究中,Fama和French认为资产定价模型中的定价因子可以从CAPM模型未能解释的市场异象中寻找[14-15]。两位学者基于美国资本市场1963—1990年的数据,综合分析了市场风险、股票市值、账面市值比、债务结构和市盈率五个因素之后,认为市场风险、股票市值、账面市值比可以包含上述因素,从而提出经典的同时也是综合CAPM和APT两种模型的三因子定价模型;在此基础上,两位学者进一步将盈利(也基于股利折现模型)和投资因子加入,从而产生了五因子定价模型[16]:
此外干伟明等(2018)应用FF多因子资产定价模型对国内A股市场进行了实证研究,结果表明FF多因子资产定价模型可以较好地解释A股市场股票收益率[17]。基于此,本文将多因子资产定价模型纳入配对分析中,采用如下两步开展配对交易。
第一步,在多因子模型的基础上构建配对股票收益率之间的均衡关系模型:
其中,RY和RX分别为配对股票的收益率序列,回归系数kr则是在综合考虑了其他风险因子影响之后的配对股票收益率之间的相互关系。
第二步,利用多因子定价模型对传统的协整分析加以改进。根据多因子定价模型,不难得到配对股票Xt和Yt的价格满足:
从而不难构建配对股票价格序列Xt和Yt的均衡关系模型为:
其中,回归系数k则是在综合考虑了其他风险因子影响之后对配对股票组合间相互关系的描述,借助(3)式和(6)式中其他多个风险定价因子对配对组合收益率和价格进行挑选后的配对组合的相关性也会更高。因此通过在协整分析中纳入资产定价理论,配对组合价格之间的关系描述将变得更加稳定和全面,从而可以有效降低传统配对模型面临的发散风险。
虽然我国资本市场已经开通了融券业务,但考虑到现实情况中各券商能提供的融券种类和数量非常少,而基于沪深300指数的股指期货的流动性更加充足,因此关于配对交易的实证分析主要针对沪深300指数与个股的日线数据开展。为了检验不同配对模型在实际情况中的收益情况,本文采用滚动时间窗的方式,即在每一个交易日根据过去最新200~250个交易日中数据进行配对搜索和计算,时间跨度为2017年6月1日至2018年3月30日,期间国内资本市场经历了较为明显的上升、下降及振荡走势。在计算收益率时,沪深300指数的乘数为300,保证金比例为0.15,其他交易费用暂时忽略不计。
在开始具体的实证分析前,不妨先以沪深300指数与浦发银行(600000)为例来说明基于多因子资产定价模型,即根据(3)式和(6)式进行配对交易分析较传统的协整分析可以有效避免配对模型发散的风险。基于沪深300指数与浦发银行(600000)从2017年3月30日至2018年3月30日的日线价格进行传统的协整分析,这时仅仅依靠配对股票的价格数据,相关性分析表明沪深300指数与浦发银行的相关系数为-0.5732。根据(1)式回归为:
从协整分析的结果来看,沪深300指数与浦发银行为负相关,配对系数为-147.43。而根据(3)式多因子资产定价模型对两者的收益率进行回归:
同时根据(6)式回归的配对系数为298.30。从资产定价模型出发的配对交易分析来看,沪深300指数与浦发银行为正相关,其收益率配对系数为298.30,显然基于多因子资产定价模型的配对交易更加准确。
在得到了配对模型和配对系数的基础上,进一步分析模型的残差可知(见图1):协整回归的残差基本符合正态分布,而基于多因子资产定价模型的回归残差则与正态分布相差较大,这进一步验证了上文的结论。
图1 沪深300指数与浦发银行(600000)回归残差
上述例子说明了样本期间内分别采用传统协整配对模型和基于多因子资产定价模型的配对交易策略:传统协整模型策略是利用(1)式对两两股票的价格序列进行回归,并选取残差平稳、符合正态分布且偏离达到一定标准差的配对股票作为协整策略的搜索结果。而多因子资产定价模型的配对策略分两步进行:第一步,利用(3)式对配对股票的收益率序列进行回归,选取拟和优度高且收益率配对系数显著的配对股票,在此范围内进一步采用(6)式在控制了其他多个风险因素之后对两两股票的价格序列进行回归;第二步,在(3)式和(6)式中配对系数符号相同的配对股票中进一步选取残差平稳、符合正态分布且偏离达到一定标准差的配对股票作为多因子资产定价模型策略的搜索结果。具体搜索结果如表1和表2所示。
表1 协整模型部分配对交易结果(开仓点为1.5倍Sigma)
表2 基于多因子模型的部分配对交易结果(开仓点为1.5倍Sigma)
由于券商股往往与大盘走势高度相关,下面选取沪深300指数与中信证券(600030)的两种配对交易策略在样本期间内搜索的结果,进一步说明两种配对策略的不同。
在2018年1月30日两种配对策略都搜索出了沪深300指数与中信证券(600030)的配对组合(见表1、表2),其中传统协整模型的配对系数5.27×104,残差标准差为-2.21,而多因子资产定价模型的配对系数是6.45×104,残差标准差为-4.13。从回归的残差分析来看(见图2),多因子资产定价模型的残差偏离更大,在零轴附近的正态分布特性更加明显。此外虽然两模型的平仓日期虽然相同,但多因子模型的收益率高达9.54%,而传统协整模型的收益率只有3.6%,这也说明了多因子配对交易策略在控制了其他多个风险因素之后可以更好地描述配对组合之间的关系,从而有较高的收益率。
图2 沪深300指数与中信证券(600030)回归残差
表3 传统协整和多因子模型的配对交易(1.5倍Sigma)结果比较
表4 配对交易在不同开仓点比较
关于两种配对策略的分析汇总如表3和表4所示,从中可以发现:第一,基于传统协整分析的(1)式较基于多因子资产定价模型的(3)式和(6)式的配对交易,可以搜索出更多的配对组合。但正如Do等(2010)所指出的,传统的协整配对交易存在着配对模型发散的风险[13]。本文实证结果验证了这一论断,传统的协整配对模型存在不少失败的组合,而基于多因子资产定价模型的配对交易则具有更高的盈利稳定性。在样本期2017年6月至2018年3月内,开仓点为1.5倍标准差的情况下,传统的协整配对模型共搜索出76组配对组合,其中盈利组合为54组(占比为71.05%),总体实现盈利,平均收益率为1.40%;而多因子模型的配对交易共搜索出17组配对组合,各组均实现盈利,平均收益率为13.50%;从持仓期间的最大回撤来看,基于多因子模型的配对交易平均回撤为-1.51%(持仓期大于1天的情况),也明显优于传统的协整模型的-12.42%;从配对组合的持有时间来看,传统的协整模型持有配对组合的时间也较长。总体而言实证结果表明基于多因子资产定价模型的配对交易策略明显优于传统协整模型的交易策略。也就是借助资产定价模型中其他风险定价因子,基于多因子资产定价模型挑选出来的配对组合的均衡相互关系描述变得更加稳定和全面,有效地降低了模型发散的风险,从而能够显著减少套利风险,提高配对交易的盈利。
近年来,一方面金融资产定价理论得到了快速发展,特别是得到学术界广为认可的Fama-French多因子资产定价模型获得了越来越多的应用;另一方面随着国内资本市场的发展,特别是股指期货、融资融券的开展,我国资本市场具备了做空机制,这就为配对交易在A股市场的应用提供了条件。本文从Fama-French多因子资产定价模型出发,将现代金融学理论的定价模型和定价因子纳入传统协整配对模型中,分析了传统协整配对模型和基于多因子资产定价模型的配对交易策略。实证结果表明:相比传统的协整配对模型仅仅依靠股票价格序列信息,本文提出的基于多因子资产定价模型进行的配对交易策略由于有资产定价理论的支撑,配对组合的均衡关系描述更加稳定和全面,模型发散的风险得到了规避,从而能够显著减少套利风险,提高配对交易的盈利。从投资实践的角度来看,该模型能够丰富国内投资者的操作手段和盈利模式。统计套利特别是配对交易操作方式已经过国外业界实践证明,在此基础上本文提出的基于多因子定价模型的配对交易策略所需交易头寸并不高,可获取较低风险下的高收益率,尤其是可以有效规避熊市中的市场整体波动风险。从市场建设的角度来看,有助于提高A股市场的资源配置效率。基于多因子定价模型的配对交易策略通过综合考虑多个风险定价因子有利于A股市场形成更加合理的价格发现机制,借助基于多因子的套利促使股票价格的无效偏离快速回归,从而有利于进一步完善我国资本市场的定价效率。