邢恩泉 尹涛
摘要 对基于协整理论的配对交易策略进行了改进.改进后的模型利用计算机能够快速循环运算的特点,循环查找最优配对组合与建仓阈值,使模型能够快速运用到各类资产及多种数据频率的配对交易中,具有根据数据变化进行自我动态修正的功能.
关键词 协整模型;配对交易;遍利性
中图分类号 F832.51 文献标识码 A
AbstractThis paper is aimed at improving pairs trading strategy based on the cointegration theory. The improved model loops and searches for the optimized pairs and transaction threshold by taking advantage of the rapid loop calculation of computer, which accelerates its application in pairs trading of assets and data frequency of various kinds. The model has the function of dynamic selfcorrection in accordance with the data changes.
Key wordscointegration model; pairs trading; ergodic research
1引言
从本质上讲,统计套利就是一种投资组合策略.其基本过程可以大致归纳为:首先,运用统计分析工具对投资组合中资产价格的历史数据进行分析与研究;然后,建立能够刻画出资产价格之间关系的数量模型;最后,在资产价格之间的关系偏离模型预测的均衡值时,利用“均值回归”理论,进行相应的套利操作,从而实现稳定的投资收益.
统计套利自从20世纪80年代,由Nunzio Tartaglia带领的摩根士丹利的一支数量分析团队提出以来,其套利策略被广泛应用,目前在欧美、日本等成熟市场已成为主流,被对冲基金、共同基金、投资公司及资深的独立投资者使用.统计套利的有效使用和广泛传播,一直被看作是资本市场成熟的重要标志之一.其不仅丰富了投资者的投资策略,而且有利于最大限度地发挥资本市场的“自我纠错”机制,从而优化与提高了资本市场的资源配置效率.
统计套利的常见方法包括:配对交易、β中性策略与多因素模型等.其中,配对交易策略(Pairs Trading)在国内资本市场有着较为广泛的应用,在统计套利中的具有尤为突出的地位.基于统计套利的配对交易策略是一种市场中性策略,具体的说,是指从市场上找出历史股价走势相近的股票进行配对,当配对的股票价格差(Spreads)偏离历史均值时,则做空股价较高的股票同时买进股价较低的股票,等待他们回归到长期均衡关系,由此赚取两股票价格收敛的报酬.
配对交易一般采用“最小化偏差平方和”、“随机价差模型”与“协整模型”等方法来进行资产组合的选择与交易.其中,协整模型的应用频率相对较高.
在通常情况下,采用协整模型实现配对交易时:首先,通过构建协整模型确定资产价格之间存在的长期均衡关系;然后,根据价差波动的特性,确定交易频率、交易触发条件与平仓规则等交易规则;最后,对价差走势进行动态追踪,从而完成套利交易.在关于统计套利的研究中,存在着两个“经验性”选择:依靠经验选择构建配对交易的基本品种;依靠经验选择偏离均值的标准差倍数.本文将利用计算机技术,对上述两个“经验性”选择进行遍历性研究,从而实现对配对交易协整模型的改进与优化.
2文献回顾
国外学者主要对配对交易的模型与方法进行了大量的研究.其中,除了可以运用普通最小二乘法对传统的协整模型进行估计之外,Giovanni等利用弹性最小二乘法对配对交易中的回归模型进行了估计,并以标准普尔500期货指数为对象验证了该方法是有效的1].Robert等在研究了配对交易策略的分析框架之后,为价差建立均值回归马尔科夫链模型,并用模型给出的价差预测值与价差的观测值进行比较,从而决定合适的交易时机2.C.L. Dunis等以WTI原油期货和BRENT原油期货为配对交易对象,分别使用协整模型、移动平均法、神经网络分析法、自回归移动平均法建立套利模型,并比较了模型之间的套利绩效,发现利用移动平均法和自回归移动平均法进行模拟交易的年收益较高,而传统协整模型,神经网络分析法并未获得理想效果.国外学者对套利品种的研究也较为多样3.Paul以原油及原油提炼品期货为研究对象,发现其价格之间存在的长期均衡关系.因而根据协整理论,对裂解价差的套利机会进行了研究,并设计出相应的套利策略.历史数据表明原油及原油提炼品期货价格之间存在可盈利的风险套利机会,且在统计学上是显著的4.Christos研究多国股票市场指数的长期协整关系,研究表明市场指数的表现会影响这种长期关系,当一个市场趋势显著改变时,投资者应该重新构建套利组合5.
国内也有学者对配对交易的方法进行了研究.吴栩等运用价差服从OU过程的随机价差模型与基于Elliott的随机价差模型对沪深300股指期货和上证180ETF的配对交易机会进行了研究与预测,研究结果表明价差服从OU过程的随机价差模型的预测效果更好6.也有很多学者对基于协整模型的配对交易进行了实证研究.雷井生和林莎基于股票价格的日数据和5种日内高频数据,采用协整策略对上证超级大盘指数的20只成分股进行统计套利,通过对套利结果的比较与分析,得出在各频率数据下,统计套利策略均能有效地应用于我国股票市场7.期货品种之间的统计套利研究也是国内学界关注的焦点,如丁秀玲和华仁海以协整理论为基础,对大豆与豆粕期货之间的历史价格关系进行了深入研究,发现其价格会相互影响且存在长期的均衡关系,并在此基础上对样本数据进行模拟套利交易,发现套利的平均利润并不显著8.扈文秀等选取商品指数期货与上证大宗商品股票ETF作为套利对象,运用协整统计模型设计套利方案,其中交易信号设置为价差偏离序列标准差的0.75倍.研究表明该统计套利方案能够获得稳定收益,证明统计套利在商品指数期货双跨套利是可行的9.贾尚辉、江令对股指期货与其相对应的股票指数关联性进行了讨论,并以沪深300股指期货与沪深300指数为对象进行了协整关系的实证研究10.
协整模型作为目前国内配对交易研究中主要使用的研究方法,已经有不少国内学者对其提出了改进.比如何树红等在协整理论的基础上,引入GARCH模型,建立了股指期货跨期套利模型.在建立套利交易策略时,利用标准正态分布的置信水平确定建仓阈值.实证研究表明该模型能够有效的发现股指期货市场存在的日内跨期套利机会,并且通过建立合理的套利交易机制可以获得较为可观的收益11.贺正楚等立足于期货市场的基本功能,发现期锌市场及其现货市场对来自各自身的冲击反应迅速,且具有强持续性.期货市场对现货市场冲击是积极、有效的,但现货市场对期货的冲击是消极、微弱的,研究结果为套期保值时点的选择提供了重要的理论参考依据12.在配对交易策略的改进方面,丁涛提出了基于协整模型的延后开仓配对交易策略并证明了该策略在我国的可行性13.
上述文献对本文的研究具有重要的启发与借鉴意义.但同时也存在一些不足:首先,虽然统计套利研究中的配对交易品种较为多样化,但是配对交易品种的选择主要依靠实际经验或者依据配对交易对象之间存在的某些经济学联系.其次,建仓阈值的选择具有主观性,特别是在使用协整方法进行套利的研究中,多数以kσ(σ为价差序列的标准差)作为建仓阈值,而k值的确定依赖于经验判断,如果选取的k值过大,交易机会就会减少,不会尽可能多的获得交易利润,而如果选取的k值太小,又会导致交易太频繁,产生巨大的交易成本,导致利润减少.本文以协整模型为基础,利用计算机能够快速循环运算的特点对传统模型进行改进,给出配对交易中具有一般性的统计套利模型,循环查找最优配对组合与建仓阈值,利用计算机技术进行循环计算与数据挖掘,从而得到遍历解.
3模型构建
3.1传统套利模型
3.1.1套利对象的选择
传统套利模型在选取配对交易的对象时通常以两个具有高度相关性的资产作为配对组合,并且假设它们之间相关性是长期可持续的.一般来讲,这种相关性主要来源于不同种类的资产之间存在某种经济学联系,例如,上下游产业链的商品期货价格往往相互影响,从而使期货之间的价格走势存在某种稳定的关系.以此为基础,在套利模型建立之初,投资者就会凭借经验选择一组套利对象,然后检验其是否具有协整关系,若不具备协整关系,则投资者就会按照上述原则继续寻找其他配对组合,若所选对象具有协整关系,则根据协整回归模型来确定资产间的配置比例,最后通过价差的统计性质来确定套利机制.这样的选择方法存在的问题就是效率低,且所选取的配对组合未必能够实现预期利润.3.1.2协整关系检验
检验资产之间的协整关系主要采用EngleGranger两步法.其具体步骤是:首先,假设{Xt}与{Yt}代表资产X与资产Y的价格序列,对时间序列{Xt}与{Yt}进行ADF检验确定两者的平稳性,确定其均为非平稳序列且是一阶单整.其次,构造回归模型:
3.2套利模型的改进
第一,在选取配对交易对象时,先将所有考虑范围内的资产价格时间序列作为输入变量,其次,输入已经设计好的计算机程序,然后通过计算机的循环运算,筛选出两两之间具有协整关系的配对交易品种.假设共有N种资产,首先利用ADF检验筛选出M个均是一阶单整的资产价格时间序列;再次,将这M个资产价格时间序列进行两两组合,则共有M*(M-1)/2个组合结果,记为集合G;最后,对所有组合结果做协整检验,筛选出具有协整关系的资产组合作为配对交易对象.
4实证分析
本文选取在大连商品交易所交易的8个商品期货品种,即大豆、豆油、豆粕、PVC、玉米、塑料、棕榈油和焦炭.数据来源于Wind资讯金融终端.由于每个期货合约都有到期时间,因此期货价格具有不连续的特点,而且,在同一交易日,同一期货品种有若干个不同交割月的合约在交易,为了研究方便,我们选用行情报价系统提供的连续合约价格,即豆一连续、豆油连续、豆粕连续、PVC连续、焦炭连续、塑料连续、玉米连续、棕榈油连续.时间段选取2012年1月4日到2014年4月18日,在数据频率上,选取日内收盘数据,每个序列有样本552个,并将其中每个序列的最后100个数据作为样本外数据.
其次,将8个品种的期货价格时间序列作为输入变量,导入用matlab编写好的程序中(参见附录),其中,将K值的取值范围设置为[0,3],以0.01为步长.运行后得到如表1结果.
实际运行结果说明,8个期货品种的配对组合中有14个组合存在协整关系,其中,有7对配对交易组合在样本外测试阶段不存在任何交易机会.另外,由于没有考虑交易费用以及止损水平,因此所有的收益率都表现为正值.
在剔除这7对交易组合后,系统根据总收益率最大原则输出最终选择结果,即最优配对交易组合为豆油和棕榈油,其配对交易的样本内收益率为76.99%,样本收益率为17.93%,总收益率为94.93%.配对系数为0.932,即交易组合的比例为250∶233,即卖出250手豆油合约的同时需要买入233手棕榈油合约,或者买出250手豆油合约的同时卖出233手棕榈油合约.此外,豆油与棕榈油配对交易的最优k值为0.06,代表当开仓信号设置为价差均值基础上±0.06σ时,其总收益率达到最大.
5总结与展望
本次研究以协整模型为基础,利用计算机能够快速循环运算的特点对传统模型进行改进,给出配对交易中具有一般性的统计套利模型.该模型具有很强的普适性:
第一,在任何数据频率下,能够对任意种类的资产进行模型检验,并迅速地找到能够进行配对交易的品种.
第二,克服依靠经验选择建仓阈值的缺点,利用计算机循环运算的功能,快速找出使样本内收益最大的交易阈值.
第三,以样本内与样本外总数据区间内的收益率最大为标准,选取最优配对交易组合,并且自动剔除掉样本内收益率或样本外收益率小于等于零的配对交易组合,以此增强模型的稳健性.
为简单介绍模型功能,本文以在大连商品交易所上市的8个期货品种为例,将8个期货品种的价格时间序列作为输入变量,经过计算机运算,首先发现14个组合长期上存在协整关系,然后比较出其中最优配对交易组合为豆油和棕榈油,其最优K值为0.06;最后,通过计算机指令将所有结果进行输出.在研究中,由于样本外数据区间较短,且样本外数据的波动性与样本内数据不同,最终结果中有7个配对交易组合在样本外测试期间不存在任何交易机会.因此,在实际使用模型进行配对交易时,还需要对模型进行进一步的调整,如优化数据区间的选择,计算交易费用对收益的影响,建立完善的风险控制机制,设置合理的止损水平等.
参考文献
[1]G MONTANA, K TRIANTAFYLLOPOULOS,T TSAGARIS. Flexible least squares for temporal data mining and statistical arbitrage[J]. Expert Systems with Applications. 2009, 36:2819-2830.
[2]R J ELLIOTT, JOHN, V D HOEK,et al. Pairs trading[J].Quantitative Finance. 2005,3: 271-276.
[3]C L DUNIS, J LAWS, B EVANS. Trading futures spreads: An application of correlation and threshold filters[J].Applied Financial Economics. 2006. 16: 903-914.
[4]P B GIRMA, A S PAULSON. Risk arbitrage opportunities in petroleum futures spreads[J].The Journal of Futures Markets,1999,8:931-955.
[5]CHRISTOS, ALEXAKIS. Longrun relations among equity indices under different market conditions:Implications on the implementation of statistical arbitrage strategies[J].Journal of International Financial Markets, Institutions & Money.2010,20: 389-403.
[6]吴栩,宋光辉,董艳.沪深股市夏普比率的多重分形相关性分析[J].经济数学,2014,31(2):13-18.
[7]雷井生,林莎.基于高频数据的统计套利策略及实证研究[J].科研管理,2013,34(6):138-145.
[8]丁秀玲,华仁海.大连商品交易所大豆与与豆粕期货价格之间的套利研究[J].统计研究.2007,24(2):55-59.
[9]扈文秀,牛静,李芳,等.基于统计套利模型的商品指数期货双跨套利方案研究[J].管理评论,2013,25(9):100-107.
[10]贾尚晖,江令.股指期货和股票指数的关联性分析[J].数学的实践与认识.2013,43(2):90-94.
[11]何树红,张月秋,张文.基于GARCH模型的股指期货协整跨期套利实证研究[J].数学的实践与认识,2013,43(20):274-279.
[12]贺正楚,周贤军,文先明.基于SVAR模型的期锌市场及其现货市场的价格发现功能实证研究[J].湖南大学学报:自然科学版,2011,38(7): 92-97.
[13]丁涛.配对交易策略在A股市场的应用与改进[J].中国商贸.2013,(2):24-27.