罗辰宇 单磊
摘 要:本文以焦炭与螺纹钢商品期货主力连续合约为研究对象,分析其收盘价之间的协整关系,设计有效的套利模型,基于模型对残差序列特性的描述,利用残差均值回归对配对交易的实现进行说明。从而利用模型进行配对交易完成期货市场上的跨品种套利,获得稳定的收益。
关键词:商品期货 配对交易 统计套利 协整模型
一、引言
(一)配对交易策略的定义
基于计算机技术的进步,量化投资得到了快速发展,配对交易就是其中一种。由于该策略结合数理统计理论与计算机技术对资产的历史数据进行分析,利用计算机发出交易指令,在一定程度上克服了人性的弱点,在发达的金融市场中一直备受机构投资者的青睐。
这种投资方法从属性上来看,是市场中性的。其主要目的是市场中两个相关系数较高的投资标的价格之差随着时间发生波动,当波动幅度突破了其长期均衡价差时,可以捕捉该突破实现套利,获得稳定套利收益。
(二)配对交易策略的特征
配对交易具有两大特征——短期的和中性的。
如定义所述,配对交易通过识别投资标的资产之间的价格相对偏离来实现套利,当两个标的的价格发生偏离时预期这种偏离是暂时的,从长期来看两者的价差会实现均值回归,从而获得收益。具体原因在于大部分投资者倾向于追涨杀跌,投资者的这种倾向在一定程度上导致了标的价格的动量效应,即价格会在一段时间内持续性地向一个方向变动。这种惯性又导致了标的价格在短期内的过度上涨或者下跌。但是这种过度的上涨或者下跌缺乏基本面和消息面的支撑,大部分是由非理性的因素所引起,因此从长期来看,市场最终会在理性因素的驱使下回归正常,从而使标的价格回归至合理水平。综上所述,配对交易策略适用于短期内标的价格发生相对偏离的情况。
纵观配对交易的完整实现过程,无论是做空还是做多,两个标的的单独操作都会受到自身价格变动的影响。即单边来看,头寸会有资产的个别风险暴露,以及相应的系统性风险敞口,但是作为整体,由于同时建立了多头与空头,系统性风险将会被对冲掉很大一部分,整个交易系统中只剩下资产自身的个别风险敞口,根据一价定律可得,两个资产价差的波动会朝着均衡时的均值靠拢,这个过程就将个别风险转化成了个别收益。
目前,我国股票市场主要以单边做多为主,且为“T+1”的交易机制,虽然具有融资融券的业务,但两融业务的标的数量有限且有着较高的准入门槛,这就使配对交易策略在股票市场中的应用受到了一定的限制,为了便于分析和探讨配对交易策略在我国期货市场中的应用性,本文选取商品期货焦炭主力连续合约和螺纹钢主力连续合约作为配对交易策略的研究对象。
(三)文献综述
1国外文献综述
Gatev等人在研究配对交易策略时,首次提出来以最小距离法寻找配对资产,并且制定了适当的交易规则,将交易阈值设定为资产价差的二倍标准差,当配对资产价差突破交易阈值时,触发交易,当价差回归历史均值时平仓,该文章使用股市数据进行实证,结果显示该策略能够实现超额收益,说明了该策略在美国股市的实用性。
Vidyamurthy在研究传统配对交易的基础上,将协整理论引入配对交易策略,在对协整模型中的时间序列研究时,加入了对权重的考量,关于衡量配对的优劣,文章提出了相关系数衡量法、时间序列平稳性研究等方法,由于配对交易的核心交易逻辑在于捕捉价差序列异常偏差回归均值的过程,所以结论是平稳性指标更重要。
Elliott等人在对资产价差的均值回归过程进行建模时,首次使用高斯-马尔科夫链来描述,并提出了随机基差模型,其核心逻辑是在利用模型计算出理论价差的基础上,对比实际资产价差,当模型计算出的价差与实际价差出现较大偏离时,意味着存在交易机会。
随着技术与理论的发展,许多复杂的模型被用于配对交易,但是关于实操性而言,最小距离法的配对交易,以及基于协整理论的配对交易可操作性较强。
2国内文献综述
崔方达和吴亮利用最小距离法完成了对配对交易的分析与构建,同时对比了其他实现方法,相比于传统的配对交易,其研究引入了适当的加权权重,从而计算该种配对的收益大小。结论显示,国内市场的配对交易是可行的。
张连华在构建配对交易策略时,应用了协整理论,并以股指期货与现货为交易对象,构建了一套完整的高频期限套利系统柜,文章中还囊括了套利系统设计的完整思路,进而得出了协整理论下的配对交易策略优于传统配对交易策略。
张河生和闻岳春主要研究关于配对交易时交易阈值的设置,协整理论没有考虑到价差序列的波动聚集性效应,即异方差性,故他们对残差序列进行GARCH模型建模,使原来固定的交易阈值变成了一个随时间变化的交易阈值时间序列。
二、配对交易的理论模型
目前,主流的配对交易方法有三种,即最小化偏差平方和、协整理论和随机价差模型。
(一)最小化偏差平方和方法
最小化偏差平方和方法原理是在价格进行标准化后的向量空间中,找出向量距离最小的资产标的,对其进行相应的配对。在设计合理的交易规则后,对整体进行检验,从而发现配对交易的获利性。最小距离法属于非参数化方法大类,其核心在于计算以资产价格时间序列为元素的向量之间的欧氏距离,用欧氏距离刻画资产价格之间可能存在的錯误定价,在此基础之上选择策略合适的形成期,选择能够使向量间的距离平方最小化的资产进行配对。最后,构建完成的交易配对在进入交易期时,当两者价格时间序列偏离达到交易规则设置的阈值时,生成交易信号,触发交易。
(二)协整理论
协整理论根本性地解决了配对交易的参数化问题,为其提供了可靠的数理模型,开辟了配对交易的新局面。通过相关文献可以了解到,大多数情况下,人们会假定资产价格的对数时间序列满足随机游走的特性,也就是说该序列本质是一种非平稳的序列,并不能直接用来做分析,但却奠定了协整关系建立的基础。协整理论表明,在两个时间序列满足平稳的前提下,就能够使用该理论对其建模,然后分析二者的对数价格时间序列对其均衡水平的偏离程度,从而产生符合逻辑的建仓信号,最终获得套利利润。
在此对两个资产A,B的价格时间序列做一假定,分别为{pAt}和{pBt},则对数价格间的长期均衡关系可以表示为:
表达式中,εt表示平稳的时间序列,其均值为0,通常代表着错误的定价,其中反映出在协整模型中,价格时间序列组合偏离模型均衡时的均值的情况。常数项用a来表示。
基于有效市场的假设,对金融市场进行长期观察可以得知,市场中被错误价格关系定价的资产,其价格最终将会被修正,从而不能为套利型投资者带来套利空间。但实际情况是,当下的市场出现价格偏差时,在短期内难以得到迅速地修正,也就是说该种偏差存在于短期金融市场中,并且呈现出一定程度上的翻转或持续的特点。由于协整模型中εt这个错误定价的时间序列是满足平稳性的,即围绕其均值做均值回归运动,所以我们可以利用该性质。当其突破已经设定的阈值时,在一定程度上我们认为其发生了异常情况,接下来大概率将会均值回归,据此可以依据模型比例关系,建立合适的头寸,待偏离进行回归时,可以平仓获利。
(三)随机价差模型
Elliott曾提出,金融资产实现配对后,对其价差过程{yt},可以建立如下的线性状态空间模型:
其中{yt}是资产A,B的价格时间序列{pAt}和{pBt}的价差{pAt-pBt},wt,εt是独立同分布的随机变量,a=κθΔt,Δt是时间间隔,v,σ,b>0是正常数,xt是不可观测的状态价格。
从实证的角度看,随机价差模型具有如下三个方面的优势。第一,两个金融资产的价格之差。一般而言,其长期均值并不都为常数,其均值主要受到两个资产价格本身的影响,通常呈现出价差均值会随着两个标的资产价格的上升而变大的特点,同理,其均值也会随着两个标的资产价格的下降而变小,但使用资产价格的对数在一定程度上就能解决这个问题。第二,该模型相对容易处理,参数可以通过卡尔曼滤波算法进行估计。第三,随机价差模型本质上属于连续时间模型,这就为预测未来提供了很大的便利。
此方法的缺点在于应用该模型的限制较为苛刻,主要限制资产价格的长期均衡关系,即该使用模型的前提是从长期来看,配对的金融资产的均值回报必须是相同的。因此,现实情况中该模型的适用性受到了限制。
三、基于协整模型的实证分析
(一)标的选择
由于我国股票市场做空机制并不十分完善,且做空门槛较高,故本文将研究对象选在期货市场。我国是煤炭生产与消费大国,从产业链的角度来看,焦炭与钢材的关系较为密切,焦炭是冶炼过程中的原料,冶炼大多数是为了炼钢,因此在产业链的逻辑上,两者的价格走势具有一定的正向相关性,考虑到模型的验证以及交易的活跃性,本文选取2020年1—12月,两种商品近一年的主力连续合约收盘价作为研究对象进行研究(数据来源于Wind)。
(二)数据采集与统计分析
首先,对于已经得到时间序列数据作出一个较为直观的时序图,从而以可视化的方式对两种商品的收盘价进行时间序列的分析,运用Stata计量软件进行相关操作可以分别得到焦炭主力连续合约收盘价与螺纹钢主力连续合约收盘价的时间序列图,如图1所示。
从图1中可以观察出,焦炭与螺纹钢的期货收盘价格并未围绕其均值进行上下波动,而是在2020年4月以后总体上有一个逐渐上升的趋势,即两者收盘价的时间价格序列很明显是非平稳的序列,故不能直接用于计量操作,否则会出现伪回归的情况。
在对两种商品收盘价时间序列进行协整分析之前,应该对焦炭与螺纹钢的主力连续合约收盘价进行相关关系分析,结果如表1所示。
计算得出,两者收盘价之间具有较强的相关性,相关系数达到7561%,满足了配对交易策略的基本条件。
(三)对收盘价进行平稳性检验
协整关系有效的前提是资产价格的时间序列在经过一阶差分后是平稳的时间序列,即两个时间序列需要满足同阶单整,因此在建立模型之前先要对资产價格一阶差分以后的时间序列进行平稳性检验。其结果如图2和图3所示。
对焦炭与螺纹钢主力连续合约的收盘价格进行一阶差分后,并对一阶差分的时间序列进行单位根检验,其检验结果显示,两个一阶差分后时间序列P值均为0,即二者一阶差分后的时间序列为平稳的时间序列,可以进行后续的分析与模型建立的工作(见表2、表3)。
(四)建立模型
先将两个商品价格一阶差分时间序列进行OLS回归,回归结果如表4所示。
由表4可得二者一阶差分时间序列回归结果为:ΔPrb=20774+00986ΔPjt+εt,且该方程在90%置信水平上可以较为良好地描述二者的关系,即基本上可以认可该回归模型。
回归结果说明,焦炭主力连续合约价格每变动1%,螺纹钢主力连续合约价格会同向变动00986%。
(五)残差平稳性检验
根据前几步的相关计算以及OLS回归模型的建立后,可以得到一个关于残差的时间序列,接着使用Stata计量软件绘制残差的时间序列图,如图4所示。
从图4中可以清晰直观地看出,残差序列围绕0轴进行上下波动,虽然从图中可以大致推断该残差序列近似平稳,但是出于严谨性考虑,我们先对残差序列进行描述性统计分析,观察残差的均值与方差等数量统计特征,紧接着对其进行单位根检验,主要是为了科学严谨地检测该残差序列是否为平稳序列,结果如表5所示。
经过计算,结果显示残差的均值约为0,其标准差σ约为5313。单位根检验的结果显示,P值为0,意味着该残差序列平稳,说明两者的收盘价格的一阶差分时间序列是具有协整关系的。
(六)残差的分布及正态性检验
接下来我们需要对残差的分布做一个统计性的描述与判断,主要是为了找到能够拟合残差分布的已知统计分布模型,进而通过统计分布模型对残差的分布特性进行分析。运用Stata对残差绘制分布直方图,同时加入正态分布曲线与之对比,目的是直观地反映出残差分布与正态分布之间的相似程度,最后对残差进行正态性检验,更为严谨地判断残差的分布能否使用正态分布来刻画,其结果如图5所示。
在残差序列进行正态性检验过程中,由表6的结果数据可知,本次检验一共有222个观测值,其中W统计量为087649,标准差为20183,P值为0,所以在一定程度上可以认定该残差序列满足正态性分布,由此可以依照正态性分布的3σ原则进行合理的开平仓信号设定,从而避免过度频繁生成开平仓信号,同时也避免开平仓信号生成频率过低。依据正态性分布从而能够较为简单地找到设置开平仓信号的合理阈值。本文选取当残差序列偏离其正负两个标准差的阈值为例,当残差序列偏离正负两个标准差时,其大概率会回归均值,综上所述,我们可以据此建立配对交易的策略。
(七)配对交易阈值的确定
交易阈值的确定指的是按照残差偏离其均值几倍标准差的原则进行建仓,由于经过之前一系列检验后,发现残差满足均值回归的效应,当残差偏离残差均值一旦达到Kσ的水平时,立刻按照协整关系的比例买入低估的资产,同时卖出相对高估的资产。
具体交易阈值的确定也在一定程度上受投资者个人偏好的影响,当投资者选择较大的交易阈值时,其配对交易策略进行的交易次数就相对较少,因为需要残差偏离其均值达到很大幅度时才能满足条件,进而触发交易。虽然较大阈值的策略相对来说反应较为迟钝,可能在一定程度上会错过一些投资机会,但是操作起来相对安全,且成功率较高。相反,投资者选择较小的交易阈值来构建配对交易策略时,所进行的交易次数就较多,因为残差偏离其均值很小的幅度就满足了交易的条件,频繁交易造成的手续费也相对较多,虽然在一定程度上能够有更大概率抓住每次投资机会,但也容易会因为方向判断错误导致被套牢或者亏损。
根据统计学的理论,当残差时间序列符合正态分布且当残差偏离超过其均值的2倍方差时,仅有228%的概率使得残差接下来继续偏离其均值,而有9772%的概率使残差会围绕其均值进行回归。当残差偏离超过其均值的15倍方差时,仅有668%的概率使残差会继续偏离其均值,而有9332%的概率使残差进行均值回归。综上所述,选择交易阈值K为15~2较为合适。
(八)历史数据回测
将开仓阈值系数K定为2时,通过对2020年近一年的数据回测发现,该策略一共触发了16次交易。其结果如图6所示,落在两倍标准差以外的残差分布一共有16次。
例如,2020年1月10日,残差向上突破2倍σ,达到了11489之高,由此可见焦炭处于相对低估状态,而螺纹钢处于相对高估状态,由此可以按照模型系数比例对焦炭进行多头开仓,对螺纹钢进行空头开仓,即每卖出一单位螺纹钢的同时,需要买入00986单位的焦炭,等待残差回归其均值附近时,对之前建立的仓位进行平仓;又如2020年2月3日,残差向下突破两倍σ,处于-28707,由此可以推断出此时的焦炭处于相对高估的状态,而螺纹钢处于相对低估的状态,可以根据模型比例系数,对焦炭进行做空,对螺纹钢进行做多,待残差回归其均值附近时选择平仓,从而完成配对交易的整个过程,获取相应的利润。
四、模型的应用价值及展望
(一)模型的应用价值
通过研究焦炭和螺纹钢主力连续合约收盘价格之间的协整关系,设计了较为可行和有效的模型,可以利用该模型进行配对交易并从中获取利润。虽然本次使用商品期货进行研究,但是该模型研究的本质是具有高度相关的两个金融产品的价格时间序列之间长期的协整均衡的关系。所以该模型的使用范围并不仅限于国内的期货市场,而是具有一定的延展性,随着我国股票市场的不断发展与成熟,做空机制不断完善以后,该模型同样适用于我国的股票市场。
(二)展望
该模型可以通过量化平台进行建模并与历史数据回测,通过对交易阈值进行参数寻优,测算出使收益率最高的交易阈值以满足各类投资者的需求。
也可以对该模型的残差序列进行进一步研究与建模,通过GARCH模型拟合残差序列,从而得到一个动态的交易阈值时间序列。
参考文献
[1]崔方达,吴亮配对交易的投资策略[J]统计与决策,2011(23):156-159
[2]张连华基于高频数据的股指期貨期现统计套利程序交易[J]计算机应用与软件,2011,28(9):93-95,156
[3]张河生,闻岳春基于参数调整的协整配对交易策略:理论模型及应用[J]西部金融,2013(1):11-16
[4]徐杰,周志中中美股市跨市场配对交易实证分析[J]上海金融,2019(8):26-30
[5]毕秀春,刘博,袁吕宁,张曙光带止损条件的配对交易最优阈值[J]系统科学与数学,2019,39(7):1117-1141
[6]宋洪波,刘盛坤基于协整的统计套利在玻璃期货中的应用研究[J]中国证券期货,2013(9):29,31
[7]GATEV E,GOETZMANN W N,ROUWENHORST K GPairs trading: Performance of a relative-value arbitrage rule[J]The Review of Financial Studies,2006,19(3): 797-827
[8] VIDYAMURTHY GPairs Trading: quantitative methods and analysis[M]USA:Wiley Finance,2004
[9] ELLIOTT R J,VAN DER HOEK J,MALCOLM W PPairs trading[J]Quantitative Finance,2005,5(3).