孔凡胜
摘 要:众所周知,股市是宏观经济的晴雨表。整个市场经济的变化会对股市造成大幅度的影响,在一些股票的大波动下,行业轮动效应、板块轮动效应、羊群效应等一系列的效应都会相应出现。但是这种带动效应在股票市场中并不是迅速传递的,一些股票的变动快些,另一些股票变动的相对较慢。准确的找到这些时间差距可以对股市的投资及决策起到更好的指导作用。通过对进行了时间滞后的股票数据之间进行统计套利分析,以期寻找到正常统计套利情况下无法找到的套利机会并与之比较。
关键词:协整检验;单位根检验;滞后协整模型;统计套利
中图分类号:TB 文献标识码:Adoi:10.19311/j.cnki.1672.3198.2018.32.113
统计套利与传统投资不同,是一种基于模型的投资过程。统计套利是在不依赖其具体的经济含义情况下,仅仅是通過运用数量手段进行构造投资组合,这种投资是根据成对的证券或股票期货的价格与其数量模型所预测理论价值进行对比分析,寻找价值偏离并构建有关组合的多头和空头,进而规避市场的固有风险并获取一个相对稳定的套利收益。构造统计套利组合是统计套利的第一步,通过寻找相关性强的股票对并对分析股票对之间是否存在长期的均衡关系即协整关系,对于存在这种协整关系的股票对可以结合成一种投资组合,由于股票对长期均衡因此当这两种股票之间在某一个短期内价差偏离较大并超过一定值时,即可实施对冲交易,即进行相应的建仓和平仓操作,经过一段时间当价差回复到正常的水平时,对交易的股票对开始反向平仓和建仓的操作,通过这种平仓与建仓赚取相对低风险的收益。统计套利这种方法也是存在一定风险的,这是由于此方法是利用股票的历史价格数据进行建模套利的,因此这种基于历史规律的投资方法的前提是在未来的一段时间内规律继续存在。此外在进行统计套利时,股票对价格偏离一定程度时要设定套利开始时的值,即开始交易点,还要设定强制止损点即强制反向操作的值,以避免由于各种影响导致长期协整关系不存在时进一步的亏损。
国内外大多学者都是基于股票价格或其他证券价格直接通过计量手段研究投资组合,寻找套利机会,即用统计套利的方法来进行投资组合的选取及对投资的指导。而基于滞后时间的投资组合却很少见。对于交易信号的建立目前最常用的是选择静态的价差标准差作为交易触发点,即设定价差标准差的几倍作为触发条件和止损条件。方昊(2005)的交易信号是根据以下标准建立:假如当期价格比值长期触发均值偏差大于 1 个标准差时,选择交易。并且设定了10%的止损额来控制交易中出现的风险,即假如价格超出了长期均值的 110%时,进行平仓操作。常宗琪(2008)采用的交易标准是:当价差低于或者超过股票价差的均值偏差大于 1 时,则开始建仓进行交易。将±2 设定为平仓的上下限,将0.9个标准差设定为止损点以控制风险,即价差的波动大于0.1个标准差时,则进行强制平仓,认赔出局。
1 模型介绍
1.1 协整模型
在进行统计套利分析时其前提是相应的股票对之间存在协整关系。具有协整关系的序列一般来说相关性也比较强。因此分析时先找出相关性比较强的股票对,然后再对股票对进行检验看其是否存在长期的协整关系。对于存在协整关系的股票对来说,差价偏离到一定预设程度时开始投资建仓:此时买进相对来说被低估的股票,同时卖出相对高估的股票,等到价差回归均衡时进行相反操作卖出即可。
首先是检验相关性比较高的股票对即变量Yt,Xt 之间是否存在协整关系,Engle和Granger于1987年提出两步检验法,也称为EG检验。具体步骤如下:
1.2 含滞后期的协整模型
类似于上述协整模型,本文是检验滞后i(i=1,2,3…)阶后的序列Yt1-i与序列Xt2之间是否是协整。同样类似于E-G两步法具体步骤如下:
第二步:检验残差序列μ︿t是否存在单位根,如果序列μ︿t是不存在单位根,则序列μ︿t是平稳序列,并认为序列Yt-i,Xt存在协整关系。
对于滞后阶数i的选取,对于每个股票组合会对应不同的最优滞后阶数i。因此选取最优i时应结合具体的股票组合具体取值。
当这两个序列存在协整关系时,我们就可以得出后一个序列与前一个滞后i期后的序列存在长期的稳定关系。应用在股票市场时,我们就可以先找到存在这种滞后协整关系的股票组合,然后通过对应于上述Yt的股票来预测上述Xt的股票在未来的大致走势,并根据预测走势进行股票建仓平仓操作,赚取低风险下的高额收益。
2 数据准备与实证分析
2.1 数据来源
本文的数据来自Wind数据库,采用的是2014年6月5日到2018年5月31日共1000个交易日的每日的收盘价价格。选取了申万一级行业中的4个行业,每个行业选取少量股票。
2.2 实证分析
出于实际经济考虑,对数据的滞后期最大选取为100个交易日。在进行数据间的相关系数计算时,首先计算一只股票滞后1个交易日与另一只股票之间的相关系数,然后是计算滞后2个交易日与另一只股票之间的相关系数,然后是滞后3个交易日、4个交易日、100个交易日。通过这种计算可以得到一只股票与另一只股票的100个相关系数的向量。
2.2.1 计算相关系数及滞后期
通过计算多组股票之间的这种相关系数我们就可以得到一个由多个100个相关系数向量组成的矩阵。本文共选取了的多支股票的配对结果及配对后的相关系数。利用R软件编程我们可以得到一个含有滞后项的相关系数矩阵,我们可以得到部分较优的组合及其各滞后期的相关系数如图1。
通过图像我们可以看出部分滞后期最优在20左右,还有在50左右。具体股票组合及滞后时间如表1。
2.2.2 滞后模型的单位根检验
以滞后14个交易日的河北钢铁(e1)与中国远洋(e2)股价为例,首先对原股价进行对数化处理以后进行股价的单位根检验。单位根检验的结果显示p值0.5663表明在5%的显著性水平下,p值都大于0.05,不能拒绝原假设,因此两对数化后的股票序列都是不平稳。经过一阶差分后的结果p=0.01显示一阶差分后的结果都拒绝不存在单位根的原假设。此时两对数化后的股票序列都是平稳的。这表明河北钢铁与中国远洋的对数股票价格序列都是一阶单整的。
2.2.3 滞后模型的协整检验
上一节中我们确定了河北钢铁与中国远洋对数化后的股票价格序列都是一阶单整的。接下来我们看看它们是不是协整的。第一步,我们建立回归模型:
对模型进行回归后得到:
回归系数p值远小于0.05,高度显著。这说明河北钢铁与中国远洋对数化后的股票价格序列有线性关系。
第二步,对线性回归的残差序列进行单位根检验,程序结果显示p值等于0.01,单位根检验的结果表明在5%的显著性水平下,p值小于0.05,拒绝原假设,残差序列是平稳序列。即滞后14个交易日的河北钢铁与中国远洋的对数化后的股价序列之间存在协整关系。
2.2.4 传统统计套利建模
同上述建模相类似,传统的统计建模首先选取相关性较好并且相对稳定的股票对。河北钢铁与中国远洋股价在没有对河北钢铁股价滞后时相关系数为0.9616418,相关程度比较高,可以用没有滞后期的河北钢铁与中国远洋股价进行建模,看其是否存在协整关系。类似上述建模,首先进行的是两股价对數化处理后的单位根检验,结果如下:
Dickey-Fuller = -1.4937,Lag order = 7,p-value = 0.7919
Dickey-Fuller = -2.0272,Lag order = 7,p-value = 0.5663
我们可以看出在这两个原股价对数化处理后的序列都是不平稳的,经过一阶差分后的序列进行单位根检验结果如下:
Dickey-Fuller = -7.8459,Lag order = 7,p-value = 0.01
Dickey-Fuller = -6.6784,Lag order = 7,p-value = 0.01
经过一阶差分后的两股价序列都拒绝无单位跟的原假设,此时没有滞后期的河北钢铁与中国远洋对数化后的股价序列都是一阶单整的时间序列。
我们对这两个时间序列进行回归建模,结果如下:
Coefficients:
Estimate Std.Error t value Pr(>|t|)
(Intercept) -0.257645 0.011592 -22.23 <2e-16***
e2 0.785106 0.007322 107.22 <2e-16***
通过程序结果我们可以看到对数化后的股价之间存在回归关系。最后我们对线性回归残差后的序列进行单位根检验,结果如下:
Dickey-Fuller = -3.5977,Lag order = 7,p-value = 0.03311
P值小于临界值0.05,拒绝无单位根的原假设。这说明没有滞后期的河北钢铁与中国远洋对数化后的股价序列之间是存在协整关系的。通过这种传统的协整关系,我们可以设定统计套利建仓平仓时机。
3 制定买卖时机
3.1 传统套利模型的交易时机
传统统计套利中,一般是将上节中的没有进行时间滞后的残差序列进行正态标准化,标准化后的序列记为Z。结果如上图所示。当标准化后的序列偏离均值一定距离时,表明两股价其中一个被高估,一个被低估。此时也是传统统计套利开始套利的机会。对于不同的投资者,入场套利的时机选择不同。就本文来说,当 |Z|>|二倍标准差|>0时河北钢铁的股票价格相对高估,中国远洋的股票价格相对低估,此时可以卖空河北钢铁的股票,同时买入相应的中国远洋的股票。当Z回复到均值附近时,说明河北钢铁股价与中国远洋股价价差回复均衡水平,此时平仓获利了结。当股价偏离均衡状态时并不保证一定能够回复到均衡状态,因为影响股价的因素很多,市场热点的轮换&企业重组等因素都可以引起股价非暂时性地偏离均衡位置。因此,必须设定止损点,即当|Z|大于某一个设定值时,止损平仓,以防止价差进一步扩大引起保证金不足导致的强制平仓。一般来说,|Z|偏离均值越大,均值回复的可能性越大,此时套利空间也就越大,但是能够进行套利的机会也就越少。相反|Z|偏离均值越小,能够进行套利的机会也就越多。|Z|与均值偏离的程度因投资者而定。本文若以二倍的标准差定为入市套利的时机,三倍标准差为止损点。则共有三次套利机会,一次触发止损点。
3.2 本文的结论
本文提出了河北钢铁滞后14个交易日后与中国远洋股价是有着协整关系,也就是说当河北钢铁滞后14个交易日与中国远洋股价之间的价差是平稳序列,因此当价差变动幅度相对稳定并且幅度较小时,一段时间内的河北钢铁股票价格与14天后这段时间内中国远洋股价之间变化幅度大致相同。从图中我们能够看出在河北钢铁股价上涨后没多久,中国海洋股价也随之上涨,随后的河北钢铁的下跌也引起了中国远洋股票的下跌,并且涨跌幅与河北钢铁差距不大。此时,我们就可以通过河北股价的上涨预测到未来中国远洋股价也会随之上涨。通过这种涨跌,我们可以通过持有相应的股票与期权冒着较小的风险获得超额收益。
4 结论及展望
由于宏观经济政策的波动对整个经济市场的影响不是同时发生的,这就导致每个企业间对宏观经济政策的反应有一定的时间差距,这种差距是由多方面原因造成的。这种差距存在于同行业间,也存在于同一产业链的上下游企业中。宏观经济政策的波动的影响比较大,持续时间也比较长。例如2007年的股市大涨一直持续到2008年,2013年的“一带一路”政策在2014年开始被广泛炒作,炒作的结果就是众多大盘股纷纷涨停,后期很多相关的股票也都开始涨停,通过有滞后期的协整模型就可以找出更优的投资组合,这对投资者有很好的指导借鉴作用。同时,由于得到了某一股票关于未来的大致走势,不但可以直接做股票投资,同时还可以进行期权的交易,这对期权交易也是有很高的借鉴意义。
本文也存在一些不足与缺陷:对于滞后期i的选择偏主观性,如果i的选择有偏差则可能会使协整的结果完全相反,这就会让投资者失去投资机会。本文的数据选择仅仅是选择了Wind数据库中几个行业中的少量股票,并没有从公司结构或产业链的上下游之中去挑选要建模的股票,因此本文中滞后的效果不是太明显。而且本文中趋势的变化也是由于整个宏观市场发展势头强劲,大量股票都在上扬导致的,对于部分公司和产业自身的政策调整无法在本文中的模型中很好体现出来。但如果能从产业链的上下游着手选取股票的话,再加上本文提出的滞后协整检验方法,公司的政策调整就能够很好的体现在模型中。在企业政策中,高频股票数据会更有效。通过模型进行投资才是最优的投资选择。
参考文献
[1]丁军广.我国 A 股市场行业轮动规律研究[D].成都:西南财经大学,2011.
[2]丁鹏.量化投资:策略与技术[M].北京:电子工业出版社,2012.
[3]方昊.统计套利的理论模式及应用分析——基于中国封闭式基金市场的检验[J].统计与决策,2005,(06X):14.16.
[4]常宗琪.白糖统计套利理论模式研究及实例分析[J].经济师,2008,(11):30.31.
[5]王云平.基于协整的统计套利策略实证研究[J].辽宁师专学报:自然科学版,2011,13(4):1.5.
[6]安云博.关于协整的统计套利[J].时代金融,2013,24:164.
[7]赵自强,程畅.上下游企业关联度与企业营运资金,股利分配和财务风险的关系——基于中国制造业上市公司数据的实证分析[J].技术经济,2014,33(9):112.118.
[8]叶恒洁.基于协整的统计套利实证研究[J].中国商贸,2009,(08X):238.238.