田祎佳等
摘要: 文章引入了点过程中的Hawkes过程来进行股票买卖强度的拟合与预测,并提供了基于该有效预测的交易策略。文中首先对所使用的Hawkes过程进行了介绍,并从理论上说明其在高频金融数据拟合中的优势;之后叙述了极大似然方法在Hawkes模型参数估计中的具体应用;最后,结合由wind数据库中选取的内地股票市场中的股票实例,使用Hawkes过程进行强度预测、策略构建与盈利情况分析,证实了该模型在实际拟合中的优势与策略的有效性。
Abstract: In this paper, Hawkes process in point process is used for the fitting and forecast of the stock buying and selling strength and the trading strategies based on the effective forecast is provided. First, an introduction is given to Hawkes process, and its advantage in high-frequency financial data fitting is theoretically explained. Then the specific application of maximum likelihood in Hawkes model parameter estimation is described. Finally, combined with the practical case in inland stock market selected from wind database, Hawkes process is used for strength forecast, strategy construction and profitability analysis, which proves the effectiveness of the advantage and strategy of this model in actual fitting.
关键词: 买卖强度;点过程;交易策略
Key words: buying and selling strength;point process;trading strategies
中图分类号:F830.91 文献标识码:A 文章编号:1006-4311(2014)28-0001-05
1 研究现状
随着交易机制的不断完善、市场的快速繁荣与交易信息透明化程度的不断提升,高频交易获得了交易人员与研究学者的高度关注。研究人员希望通过构建适当的模型拟合市场中的日内交易信息,并对市场的变动作出即时、正确的反应。
作为高频交易信息的有效拟合工具,点过程被研究人员广泛利用,并对其数学原理进行了完整的介绍[1],成为后续使用的理论依据。这其中,泊松过程以其便于理解、参数估计难度较低、结果稳定的特点成为了基本的研究对象之一。中外学者都对其进行了广泛而深入的研究,并在实际交易策略的制定与应用方面对其进行了一定的发展。但是,由于泊松过程存在无记忆性的特点,导致其不能很好地描述市场中交易行为的集聚现象,也不可用来研究交易行为之间的影响。这会影响我们对市场微观结构的深入了解与也会影响算法交易策略的有效性。
因此,西方学者第一次提出了Hawkes过程[2],这是一种能够实现基于历史信息来完成对未来预测的可靠手段,在参数估计方面也比较容易驾驭。收集了对历史过程的观测之后,使用Hawkes过程,就可以准确地对未来事件的发生强度进行有效的预测。在此理论的支撑之下,Hawkes过程在高频金融数据建模中开始被使用,多维Hawkes过程也被引入[3][4],并证明了该过程在金融领域中使用的合理性,也为利用该过程提出交易策略提供理论支持与实践依据。
在数学理论中的点过程,往往假设时间是连续的,即同一事件在同一时间发生次数至多为一次。然而在真实的金融高频交易的研究中,由于交易机制和所获得数据辨识度的限制,导致这一假设不能成立,因此引入离散时间模型也就十分必要。在这一理论下,学者为交易和报价的研究提供了模型[7],本文的研究中也将沿着这个方向扩展我们的模型。
在高频交易研究更加成熟的西方,Hawkes过程不断被应用于定单的建模。有学者使用了Hawkes过程对挂单的情况与微观结构下的价格变动进行了建模[8],也有研究人员使用二维的Hawkes过程对纽约股票交易所的数据进行建模,并证明了该模型对交易与报价分析的适用性[9]。之后,高维Hawkes过程被引入,定单也根据其类型与攻击性分类,市价定单挂单行为之间的显著影响得到证明[10]。因此,我们有足够的理由相信,Hawkes过程在高频金融数据的拟合与预测方面有着理论和实践上的显著优势。本文也就是基于这样的设想,同时利用大陆股票市场中的数据对Hawkes模型在定单建模中的应用进行介绍并进行一定的实证检验。
不仅如此,西方的学者也将Hawkes模型的使用范围进一步推广,将二维Hawkes过程应用于债券、期货两个与股票市场高度相似的市场[11],这样的推广也为笔者进行后续研究奠定了基础。
2 研究目的与意义
目前,我国内地的证券交易市场所采用的均为指令驱动系统,即由买方定单与卖方定单共同驱动,交易系统以买卖双方价格为基准,遵照“价格优先,时间优先”的原则进行撮合。对定单进行建模、研究交易日内的买卖强度,能够对买卖双方力量对比的情况进行较为准确的预测。在对市场微观结构有更加深入的了解的基础之上,可以制定出合理的交易策略,选择最优的交易时机,使投资者在日内交易中获得可观的收益。虽然,目前我国内地股票市场所采用的T+1交易制度不能支持基于买卖强度制定的日内高频交易策略,但是,上海证券交易所已表示,T+0交易制度正在研究中。因此,可以预见,在不久的将来,收益可观的高频交易策略必定会受到交易者的推崇。同时,期货市场中采用的T+0交易制度为此高频交易策略提供了应用场所,也为笔者在日后的研究中推广策略的应用范围提供了方向。endprint
此外,虽然指令驱动市场中的流动性不由做市商提供,但是,相关的研究表明,市场中一些定单的出现扮演着做市商的角色,同时,另一些定单则作为流动性的使用者出现。因此,对定单进行分类,并对其强度进行研究,可以有效地以其对市场流动性的影响作为标准将定单分类,进而对指令驱动市场中的流动性问题有更直观的认识。
3 基本模型
约束条件(21)(22)保证了模型参数估计的稳定性。
4.2 数据选取与处理方法 本文使用Hawkes指数模型对计数过程Nt进行建模。Nt作为一个随机计数过程,在订单强度模拟问题的研究中代表了0到t时刻市场中所表现出的挂单量的合计数,即0到t时刻的观测时间段内挂单行为的累计表现。N(t)则表示第t个时间段内的挂单量。
参数估计与实证检验中使用了wind数据库中提取的中国联通、浦发银行股票的日内交易数据。
内地市场的交易机制规定,每个交易日内9:30-11:30、13:00-15:00为连续竞价时间。为了获得较为连续的数据,所使用数据均出自以上时间段。同时,wind数据库所提供的数据内容为每5秒的挂单及交易情况,包括买一到买五的买盘挂单情况、卖一到卖五的卖盘挂单情况。因此将模型中的时间间隔确定为5秒,即每五秒是一个观测时间段。为了获得N■的观测值,我们假设买一到买五买盘挂单的挂单量之和可以描述该时段的挂单量,也就是假设买五之后的买盘挂单对未来时间定单强度的影响可以忽略。同时假设所有挂单行为均是以买卖为目的的交易行为,即不考虑交易者虚拟下单等复杂交易心理,可以认为买盘挂单合计与卖盘挂单合计为该时段内买单、卖单挂单的合计数,可将其作为一日内该股票每隔5秒的买单、卖单的挂单量的变化情况,也就是模型中的n(t)。
4.3 参数估计 由极大似然的基本思想可知,该参数估计过程可以转化为带约束条件的非线性规划求解问题。因此可以使用matlab中的模拟退火的计算方法对(16)式中的函数在约束条件(17)(18)下进行优化,所输出的列向量中的元素即为满足约束条件,且使似然函数L取得最大值的参数值。将该参数值作为参数的估计值符合概率与统计中,大概率事件更容易发生这个直观的思想。
5 交易策略的构建与分析
5.1 基于买卖强度的交易策略 在指令驱动的市场中,买卖行为形成了价格。具体表现为,在某一时刻,买单量大于卖单量时,价格呈现上升趋势,反之则呈现下降趋势。如果能在价格变动之前,预测到这一变动趋势,并在价格上涨之前买入,价格下降之前卖出,就有可能获得买卖价差带来的收益。
简单地来说,买单、卖单的力量对比可以表现为本文中描述的强度的对比,即单位时间内买单、卖单的挂单量λ(t)。基于所观测的历史信息,对下一时刻的买单、卖单强度λ1、λ2分别进行估计。当买单强度大于卖单强度时买入,卖单强度大于买单强度时卖出即为基于买卖强度交易策略的基本思想。
5.2 模型的实证检验 使用本文4.2中数据选取与处理的方法采集浦发银行连续竞价时间内的1000个时段中买单挂单情况数据,对应模型中的n(t)。将其带入(15)式中,并利用4.1中的极大似然思想,使用4.3中的估计方法对其中的参数μ、α、β进行估计,得到:
μ=26.4419,α=0.0064,β=4.2756
将参数估计值带入(8)式中,对t=1001,1002,…,2000时的λ(t)进行预测。预测结果如图1所示。
将该时间段内观测到的买单挂单情况n(t)与买单强度预测值进行对比,见图2。
由图2可以看出,模型对浦发银行买单强度的走势进行了较为有效的预测。
使用同样的方法对浦发银行股票卖单挂单情况、中国联通股票买单、卖单挂单情况进行数据处理与预测,将买单强度记作λ1(t)、λ2(t)卖单强度记作,结果分别绘制对比图像,如图3-图5所示。
由图3-图5可以看出,使用Hawkes模型对定单强度都能实现有效预测。因此可以使用5.1中的思想构建基于买卖定单强度的交易策略。
该交易策略的基本思想为,当买单强度大于卖单强度时买入,卖单强度大于买单强度时卖出。具体操作中,可根据不同股票定单强度的具体情况设定参考值ρi,将所预测的买卖强度的比值与该参考值比较,当买单强度比卖单强度的比值大于ρ1时买入,当卖单强度比买单强度的比值大于ρ2时卖出。
为了检验该交易策略的有效性,我们使用浦发银行股票定单强度的预测数据构建策略,并检验该策略在强度预测的时间段内的盈利情况。
根据对浦发银行股票定单强度预测结果的观察,我们选取参考值ρ1=12,ρ=0.6,并假定每笔交易量为一股,不考虑成交量限制以及交易成本,允许卖空,市价成交,并假定每笔交易在成交后的第五十个时间段内平仓。则预测时间段内(t=1001至t=2000对应下图中t=1到1000)的盈利情况为:
预测时间段内,根据既定策略,对浦发银行股票实施交易及盈利情况如表1。
由图7浦发银行策略实施时间段可以看出,在预测时间段t<50的时间段内,实施的交易为基于买单强度的买入交易,且相应的卖出对冲交易均在50 由累计盈利情况可以看出实施基于买卖强度的交易策略能够在一定的时间段内获得可观的收益。 根据对中国联通股票定单强度预测结果的观察,选取参考值ρ1=1.4,ρ2=1.15,实施相同交易策略。预测时间段内(t=1001至t=2000对应下图中t=1到1000)的盈利情况为:
预测时间段内,根据既定策略,对中国联通股票实施交易及盈利情况如表2。
由图9可以看出,在预测时间段t<300的时间段内,没有交易,则累计盈利为0。300 由累计盈利情况可以看出实施基于买卖强度的交易策略能够使投资者在一定的时间段内获得可观的收益。 6 结论与未来研究方向展望 通过将Hawkes模型用于定单强度的拟合与预测,并将其与实际挂单情况进行对比,可以认为该指数Hawkes模型能够有效地拟合定单强度,进而描述股票未来时刻的挂单情况。 根据该强度的有效预测,可以制定出基于买卖强度的交易策略。通过实证检验可以认为该策略能够在不考虑交易成本及交易限制的情况下获得日内收益,即基于买卖强度的交易策略有效。 本文中所介绍与使用的是形式较为简单的Hawkes过程。 其中,传播算子hij的形式为固定的指数形式。这样的假设在简化参数估计过程的同时,也给了模型形式更加固定的假设,即假设历史事件对未来事件发生的影响程度随两事件相距时间的延长呈指数形式递减。然而实际中的影响并不一定遵循该假设。因此,在后续研究中,可以将该传播算子一般化,使该模型能够更加有效地对实际数据进行拟合,以便获得对未来强度更加准确的预测。 在进行订单建模的过程中,本文将定单简单地分为买单卖单两类,使用一维模型进行拟合。然而,实际中的定单分为很多类,例如,市价单、限价单、停损单、限价停损单。不同类型定单的挂单情况对未来各类订单挂单情况的影响也各有不同,因此,在未来可将定单进行更加详细的分类,以便对各类定单进行深入研究。 参考文献: [1]Daley DJ, Vere-Jones D. An introduction to the theory of point processes[C]. New York: Springer, 1988. [2]Hawkes AG. Spectra of some self-exciting and mutually exciting point processes[J]. Biometrika 1971, 58:83. [3]Bowsher CG. Modelling Security Market Events in Continuous Time: Intensity Based, Multivariate Point Process Models[J]. Journal of Econometrics 2007, 141:876-912. [4]Almgren RF. Optimal Execution with Nonlinear Impact Functions and Trading-Enhanced Risk[J]. Applied Mathematical Finance 2003, 10:1-18. [5]Engle RF, Russell JR. Forecasting the Frequency of Changes in Quoted Foreign Exchange Prices with the Autoregressive Conditional Duration Model. Department of Economics, UC San Diego, University of California at San Diego, Economics Working Paper Series, 1995. [6]Engle RF, Lunde A. Trades and Quotes: A Bivariate Point Process[J]. Journal of Financial Econometrics 2003, 1:159-88. [7]Hasbrouck J. Trading Fast and Slow: Security Market Events in Real Time[C]. 17 ed: United States, NEW YORK UNIVERSITY SALOMON CENTER, 1999. p. ALL. [8]Hawkes AG, Oakes D. A Cluster Process Representation of a Self-Exciting Process[J]. Journal of Applied Probability 1974:493. [9]Bowsher CG. Modelling Security Market Events in Continuous Time: Intensity Based, Multivariate Point Process Models[J]. Journal of Econometrics 2007, 141:876-912. [10]Large J. Measuring the Resiliency of an Electronic Limit Order Book. Journal of Financial Markets. 2007,10(1):1-25. [11]Bacry E, Delattre S, Hoffmann M, Muzy JF. Modelling microstructure noise with mutually exciting point processes[J]. Quantitative Finance 2013, 13:65-77. [12] Bauwens L, Hautsch N. Dynamic latent factor models for intensity processes. Universite catholique de Louvain, Center for Operations Research and Econometrics (CORE), CORE Discussion Papers: 2003103, 2003. [13]Obizhaeva A, Wang J. Optimal Trading Strategy and Supply/Demand Dynamics. National Bureau of Economic Research, Inc, NBER Working Papers: 11444, 2005. [14]Biais B, Hillion P, Spatt C. An Empirical Analysis of the Limit Order Book and the Order Flow in the Paris Bourse[J]. Journal of Finance 1995, 50:1655-89. [15]Bauwens L, Hautsch N. Modelling financial high frequency data using point processes. Universite catholique de Louvain, Center for Operations Research and Econometrics (CORE), CORE Discussion Papers: 2006080, 2006. [16]Cont R, Stoikov S, Talreja R. A Stochastic Model for Order Book Dynamics[J]. Operations Research 2010, 58:549-563.
预测时间段内,根据既定策略,对中国联通股票实施交易及盈利情况如表2。
由图9可以看出,在预测时间段t<300的时间段内,没有交易,则累计盈利为0。300 由累计盈利情况可以看出实施基于买卖强度的交易策略能够使投资者在一定的时间段内获得可观的收益。 6 结论与未来研究方向展望 通过将Hawkes模型用于定单强度的拟合与预测,并将其与实际挂单情况进行对比,可以认为该指数Hawkes模型能够有效地拟合定单强度,进而描述股票未来时刻的挂单情况。 根据该强度的有效预测,可以制定出基于买卖强度的交易策略。通过实证检验可以认为该策略能够在不考虑交易成本及交易限制的情况下获得日内收益,即基于买卖强度的交易策略有效。 本文中所介绍与使用的是形式较为简单的Hawkes过程。 其中,传播算子hij的形式为固定的指数形式。这样的假设在简化参数估计过程的同时,也给了模型形式更加固定的假设,即假设历史事件对未来事件发生的影响程度随两事件相距时间的延长呈指数形式递减。然而实际中的影响并不一定遵循该假设。因此,在后续研究中,可以将该传播算子一般化,使该模型能够更加有效地对实际数据进行拟合,以便获得对未来强度更加准确的预测。 在进行订单建模的过程中,本文将定单简单地分为买单卖单两类,使用一维模型进行拟合。然而,实际中的定单分为很多类,例如,市价单、限价单、停损单、限价停损单。不同类型定单的挂单情况对未来各类订单挂单情况的影响也各有不同,因此,在未来可将定单进行更加详细的分类,以便对各类定单进行深入研究。 参考文献: [1]Daley DJ, Vere-Jones D. An introduction to the theory of point processes[C]. New York: Springer, 1988. [2]Hawkes AG. Spectra of some self-exciting and mutually exciting point processes[J]. Biometrika 1971, 58:83. [3]Bowsher CG. Modelling Security Market Events in Continuous Time: Intensity Based, Multivariate Point Process Models[J]. Journal of Econometrics 2007, 141:876-912. [4]Almgren RF. Optimal Execution with Nonlinear Impact Functions and Trading-Enhanced Risk[J]. Applied Mathematical Finance 2003, 10:1-18. [5]Engle RF, Russell JR. Forecasting the Frequency of Changes in Quoted Foreign Exchange Prices with the Autoregressive Conditional Duration Model. Department of Economics, UC San Diego, University of California at San Diego, Economics Working Paper Series, 1995. [6]Engle RF, Lunde A. Trades and Quotes: A Bivariate Point Process[J]. Journal of Financial Econometrics 2003, 1:159-88. [7]Hasbrouck J. Trading Fast and Slow: Security Market Events in Real Time[C]. 17 ed: United States, NEW YORK UNIVERSITY SALOMON CENTER, 1999. p. ALL. [8]Hawkes AG, Oakes D. A Cluster Process Representation of a Self-Exciting Process[J]. Journal of Applied Probability 1974:493. [9]Bowsher CG. Modelling Security Market Events in Continuous Time: Intensity Based, Multivariate Point Process Models[J]. Journal of Econometrics 2007, 141:876-912. [10]Large J. Measuring the Resiliency of an Electronic Limit Order Book. Journal of Financial Markets. 2007,10(1):1-25. [11]Bacry E, Delattre S, Hoffmann M, Muzy JF. Modelling microstructure noise with mutually exciting point processes[J]. Quantitative Finance 2013, 13:65-77. [12] Bauwens L, Hautsch N. Dynamic latent factor models for intensity processes. Universite catholique de Louvain, Center for Operations Research and Econometrics (CORE), CORE Discussion Papers: 2003103, 2003. [13]Obizhaeva A, Wang J. Optimal Trading Strategy and Supply/Demand Dynamics. National Bureau of Economic Research, Inc, NBER Working Papers: 11444, 2005. [14]Biais B, Hillion P, Spatt C. An Empirical Analysis of the Limit Order Book and the Order Flow in the Paris Bourse[J]. Journal of Finance 1995, 50:1655-89. [15]Bauwens L, Hautsch N. Modelling financial high frequency data using point processes. Universite catholique de Louvain, Center for Operations Research and Econometrics (CORE), CORE Discussion Papers: 2006080, 2006. [16]Cont R, Stoikov S, Talreja R. A Stochastic Model for Order Book Dynamics[J]. Operations Research 2010, 58:549-563.
预测时间段内,根据既定策略,对中国联通股票实施交易及盈利情况如表2。
由图9可以看出,在预测时间段t<300的时间段内,没有交易,则累计盈利为0。300 由累计盈利情况可以看出实施基于买卖强度的交易策略能够使投资者在一定的时间段内获得可观的收益。 6 结论与未来研究方向展望 通过将Hawkes模型用于定单强度的拟合与预测,并将其与实际挂单情况进行对比,可以认为该指数Hawkes模型能够有效地拟合定单强度,进而描述股票未来时刻的挂单情况。 根据该强度的有效预测,可以制定出基于买卖强度的交易策略。通过实证检验可以认为该策略能够在不考虑交易成本及交易限制的情况下获得日内收益,即基于买卖强度的交易策略有效。 本文中所介绍与使用的是形式较为简单的Hawkes过程。 其中,传播算子hij的形式为固定的指数形式。这样的假设在简化参数估计过程的同时,也给了模型形式更加固定的假设,即假设历史事件对未来事件发生的影响程度随两事件相距时间的延长呈指数形式递减。然而实际中的影响并不一定遵循该假设。因此,在后续研究中,可以将该传播算子一般化,使该模型能够更加有效地对实际数据进行拟合,以便获得对未来强度更加准确的预测。 在进行订单建模的过程中,本文将定单简单地分为买单卖单两类,使用一维模型进行拟合。然而,实际中的定单分为很多类,例如,市价单、限价单、停损单、限价停损单。不同类型定单的挂单情况对未来各类订单挂单情况的影响也各有不同,因此,在未来可将定单进行更加详细的分类,以便对各类定单进行深入研究。 参考文献: [1]Daley DJ, Vere-Jones D. An introduction to the theory of point processes[C]. New York: Springer, 1988. [2]Hawkes AG. Spectra of some self-exciting and mutually exciting point processes[J]. Biometrika 1971, 58:83. [3]Bowsher CG. Modelling Security Market Events in Continuous Time: Intensity Based, Multivariate Point Process Models[J]. Journal of Econometrics 2007, 141:876-912. [4]Almgren RF. Optimal Execution with Nonlinear Impact Functions and Trading-Enhanced Risk[J]. Applied Mathematical Finance 2003, 10:1-18. [5]Engle RF, Russell JR. Forecasting the Frequency of Changes in Quoted Foreign Exchange Prices with the Autoregressive Conditional Duration Model. Department of Economics, UC San Diego, University of California at San Diego, Economics Working Paper Series, 1995. [6]Engle RF, Lunde A. Trades and Quotes: A Bivariate Point Process[J]. Journal of Financial Econometrics 2003, 1:159-88. [7]Hasbrouck J. Trading Fast and Slow: Security Market Events in Real Time[C]. 17 ed: United States, NEW YORK UNIVERSITY SALOMON CENTER, 1999. p. ALL. [8]Hawkes AG, Oakes D. A Cluster Process Representation of a Self-Exciting Process[J]. Journal of Applied Probability 1974:493. [9]Bowsher CG. Modelling Security Market Events in Continuous Time: Intensity Based, Multivariate Point Process Models[J]. Journal of Econometrics 2007, 141:876-912. [10]Large J. Measuring the Resiliency of an Electronic Limit Order Book. Journal of Financial Markets. 2007,10(1):1-25. [11]Bacry E, Delattre S, Hoffmann M, Muzy JF. Modelling microstructure noise with mutually exciting point processes[J]. Quantitative Finance 2013, 13:65-77. [12] Bauwens L, Hautsch N. Dynamic latent factor models for intensity processes. Universite catholique de Louvain, Center for Operations Research and Econometrics (CORE), CORE Discussion Papers: 2003103, 2003. [13]Obizhaeva A, Wang J. Optimal Trading Strategy and Supply/Demand Dynamics. National Bureau of Economic Research, Inc, NBER Working Papers: 11444, 2005. [14]Biais B, Hillion P, Spatt C. An Empirical Analysis of the Limit Order Book and the Order Flow in the Paris Bourse[J]. Journal of Finance 1995, 50:1655-89. [15]Bauwens L, Hautsch N. Modelling financial high frequency data using point processes. Universite catholique de Louvain, Center for Operations Research and Econometrics (CORE), CORE Discussion Papers: 2006080, 2006. [16]Cont R, Stoikov S, Talreja R. A Stochastic Model for Order Book Dynamics[J]. Operations Research 2010, 58:549-563.