基于EMD的VaR估计方法及实证研究

2015-04-25 07:15李合龙
统计与决策 2015年1期
关键词:记忆性置信区间分形

李合龙,杨 志

(华南理工大学 经济与贸易学院,广州510006)

0 引言

经验模式分解(Empirical Mode Decomposition,EMD)[1]是由NASA的Norden.E.Huang等于1998年提出的一种具有高时频分辨能力的信号分析方法。与小波分析相比,它具有更高的分解效率和更好的时频特性,特别适用于各种非平稳非线性时间序列的处理和分析。近年来,关于EMD的理论和应用研究不断出现,已遍及医学,信号处理,机械诊断,气象和地震预测等领域,展现出良好的应用前景。金融时间序列作为一种典型的非平稳非线性序列,如何通过运用EMD方法进一步挖掘各种交易行为产生的对市场定量波动特征刻画有益的统计信息,进而为更加准确的预测市场走势和评估风险提供依据,仍然是该领域颇具实际意义的研究方向之一。本文提出了一种基于EMD的VaR估计方法,并进一步运用Kupiec检验[2]将该方法与多种传统方法进行了实证对比,结果显示其具有较高的计量精度。因此本文的研究为EMD在风险评估领域中的运用提供了另外一种思路。

1 问题描述

传统计算VaR的方法是在假设收益率为正态分布的前提下,给定置信区间,并通过模拟、参数预测、方差-协方差等方法计算分位点以得到风险价值。采用上述方法进行计算的关键在于准确认识收益率的波动行为。当市场运行平稳时,传统的假设和计算是合理的,即收益率的波动遵从或近似遵从随机游走过程。但是当市场出现大的转折,构建在经验参数上的模型就会瞬间崩塌。而实际市场波动正是由确定性趋势、随机趋势和各种噪声交相缠绕而成,其行为并不总遵循理想化的假设。同时由于传统计算方法主要是基于统计收益率频率并拟合其分布,难以反映内在波动的趋势特征。这使得实证中经常出现尖峰厚尾等“异象”。因此如何区分序列各种内在波动的性质并分别对其构建合适的时间序列模型便成为准确计量VaR的关键。

为了方便说明内在波动的运行对市场风险刻画的重要性,本文设计一个简单的模拟序列并假设市场仅有两种波动形态组成:噪声部分--代表了市场中无序的噪声交易。其行为完全不可预测,只能推测其大概分布,体现为短期的日常的风险;主体的趋势部分--代表了不同频率的中长期交易者。由于其交易相对固定,难以立即从市场中退出,即使市场出现结构性调整也可以在一定程度上可以进行短期预测。由此构建市场交易r(t)=0.5·sin(0.01·x)+ε(t):其中,正弦函数模拟长期变动趋势;ε(t)模拟市场中不确定的风险(如图1-1)。

图1 趋势加噪声交易以及EMD分解后的各部分时间序列图和直方图

r(t)及其频率分布直方图如图1-1,图1-2所示,折线代表正态分布曲线。从统计可以看出,由于引进了趋势,而使交易的频率分布不再严格遵循正态分布(表1),导致基于拟合分布的传统方法失效。为了去除趋势在经济研究中的影响传统计算方法需要对时间序列进行对数差分、滑动平均以达到平稳状态。然而,引入对数差分会破坏系统本身的混沌特性[3];而滑动平均等方法又难以刻画序列的非线性特征。因此传统方法在建模过程中实际已经牺牲了一部分系统所蕴含的信息。

表1 模拟交易及其各组成分的统计描述

为了说明传统方法在非线性非平稳特征序列中的应用缺陷,本文依据经典的Delta-正态方法以及历史模拟方法对后300个数据分别计算了95%、97%、99%置信区间的下的VaR。并给出了失败次数的统计。表2是各种方法下的检验结果。

表2 Delta-正态方法和历史模拟法计算的各置信水平下的VaR的失败率

由表2,基于统计分布的传统计算方法都没有捕捉到趋势所带来的风险偏差(图1-7,1-8)。主要有两个原因:1)趋势成分中的相位信息在统计频率过程中被丢失了,而市场内在波动特征的精确刻画是预测未来走势、评估风险的关键。2)分布的来源是基于历史数据,没有包含正弦函数未来的趋势调整。实际市场正是一个由各种趋势及噪声构成的复杂系统,其未来风险的准确刻画不能只通过拟合某种分布获得而需要结合分析其内在不同的波动特征来实现。基于上述认识,本文试图通过对价格序列直接进行EMD分解并结合下文提出的IMF重划分算法,将市场中的主体趋势成分和噪声成分进行分离,同时根据它们不同的特性分别建模以计算一定置信区间下市场总的风险价值(VaR)。

2 基于EMD的VaR估计算法设计

2.1 经验模式分解(EMD)介绍[1]

经验模式分解(EMD)是一种自适应分解,广泛应用于各种非平稳非线性信号。在医学,信号处理,机械诊断,气象和地震预测等多个方面有着极高的应用价值。典型的EMD分解的基本流程为:

(1)确定s(t)的所有极大值和极小值。

(2)根据极大值和极小值进行三次样条插值构建s(t)的上下包络线。

(3)根据上下包络线,计算出s(t)的局部均值m11(t)以及s(t)和m11(t)的差值h11=s-m(t);

(4)以h11代替原始信号s(t),重复以上三步,直到h1(k-1)与h1k之间的方差小于某一设定值,即h1k认为是一个IMF分量,记c1=h1k,r1(t)=s(t)-c1,s(t)=r1(t);

(5)重复以上四步,直到rn小于某一设定值,或者rn变成了一个单调函数时,原始信号的EMD分解结束,得到的分解形式如下:

其中r是残余项(RES)。

每一个IMF分量都反映了原信号在不同尺度下的特征。由于分解出的每一个IMF分量是代表一组特征频率的数据序列,因此EMD过程实际上是把原始数据序列分解为各种不同特征波动的叠加。初始的几层IMF的频率相对较高,可以认为短期的噪声交易,而越接近残余项,则频率越低,越具有长期交易的特性。

2.2 多尺度下的VaR估计算法

2.2.1 IMF的重划分

市场是一个多种交易交织混叠的组合体,每一种交易的特性均不同。投资级别的交易一般交易周期较长,其交易引起的价格变动更偏向于一种长期记忆性序列形态。而投机级别的交易以及散户交易引起的价格变动则更倾向于一种随机趋势和随机游走形态[4]。因此不仅需要考察不同尺度下的IMF周期,还有必要区分分解后的子序列的形态以判断是否具有记忆性。

依照R/S分形分析理论[5],可以利用重标极差分析法(Rescaled Range Analysis)[6]来建立Hurst指数(H)作为判断时间序列数据遵从随机游走还是有偏随机游走过程的指标。可以用来作为检验市场有效性的一个重要指标。当H=0.5时,分形时间序列表明价格变动的相关性越小,信息的反应时滞越短,市场有效性越强[7]。本文利用这一性质对分解出的IMF进行重新分类,以便将原价格序列中具有相互独立性质的噪声部分和具有长期记忆性部分进行剥离。具体操作如下:

①设原始序列为y(t),长度为T。分解出的层数为n,每一层IMF(包括残余项RES)记为ci,i=1,2,3,···,n 。

由R/S分形分析的结论可知,此时s(t)的个体接近相互独立,不具备长期记忆性。为了不至于使模型过于复杂,将s(t)作为 y的噪声部分。 p1(t)…pk(t)由于其H指数较接近1,具有一定的长期记忆性而作为趋势部分。

上述步骤将时间序列y(t)分解成了一个噪声部分s(t),t∈[0,T]和几个趋势部分 p1(t)…pk(t),t∈[0,T]。 由于长期记忆性意味着基于更多的历史信息可以显著提高预测的效果。而神经网络能从数据样本中自动地学习,逼近那些最佳的刻画了样本规律的函数从而实现对长期记忆序列的未来走势做出准确预测。并且所要表现的函数形式越复杂,非线性程度越高,神经网络这种特性的作用就越明显。本文采用径向基函数神经网络(RBF神经网络)对pi(t)…pk(t)进行拟合,再以得到的拟合函数预测未来时刻的函数值:μT+t0=p1(T+t0)+p2(T+t0)+…+pk(T+t0)。

2.2.2 资产的VaR估计

VaR是指在给定的置信度和时间间隔下,由市场变化引起的高于目标水平的最大损失。其精确定义为:若资产组合未来的随机损益为,则对应于置信水平为(通常在99%或者95%)的VaR满足如下等式:

通过(1)的算法已经将市场中的长期记忆性的主体部分和不具备长期记忆性的噪声部分进行了剥离。由于具有长期记忆性且可以得到相对准确的预测,因此从风险不确定的角度,在不考虑趋势部分的结构性变动的条件下,s(t)成了整个价格序列未来风险的主要来源。s(t)的分形结性构也说明了其具备较好的相互独立,接近随机游走的序列形态。而这一性质正是传统计量方法所具备假设之一,可依据不同的精度要求而构建相应的估计模型。结合VaR的原始定义,在价格形态下,基于EMD的VaR为:

zα为α置信区间下的下分位点,σ为s(T+t0)时刻的条件方差。

2.3 Kupiec LR后验分析

即在分位数水平P上,如果所计算的LR检验值大于该水平上自由度为1的χ2分布的临界值的话,则可以拒绝原假设,反之即可认为所采用的波动率模型足够精确。

3 基于三峡债的实证研究和后验分析

3.1 实证研究

为了检验上述计算模型所具有的实际意义,以实际市场数据进行实证研究。由于中国股市采用涨停板制度,对于每日的涨跌有着严格的限制,即使不用计算VaR也可以大概确定其最大损失,为了方便说明这种方法的优势,随机选取了波动性比较大的企业债进行实证。

本文以2005年12月19日至2012年10月9日间三峡债日收盘数据(N=1403)作为实证样本,数据来源于大智慧软件。依照上文描述的计算模型进行VaR估计。为了方便对计算结果进行检验,本文采用移动窗口法进行计算,以2009~2010年的1141个数据用于构建初始模型,窗口长度T=1141,移动步长为1。2011-2012年度数据用于对比验证计算出的VaR。本文分别计算了95%置信度,97%置信度和99%置信度下的VaR,并与传统的Garch类方法、Delta-正态方法和历史模拟法得出的VaR进行了对比分析。首先对初始序列进行EMD分解,然后分别计算每个IMF的Hurst指数和新建序列的Hurst指数,并以此为判据对主体趋势和噪声进行分离,表3给出了分析结果。

表3 初始数据下各IMF的方差贡献和Hurst指数

新序列a(i)的Hurst指数计算表明前四层IMF的组合的Hurst指数最接近0.5,依据R/S分形理论可以认为其各个时间点的值近似相互独立。但是从图2可以看出,即使Hurst指数已经接近0.5,但是依然存在一点尖峰现象,这可能是由于实证序列内含频率过多,相互混叠所致。但由于其方差贡献只占总体的14%,而趋势部分占了85%,故而在总风险下这一小部分混频所引起的误差可能很小。而IMF6到RES项的Hurst指数都很接近1,具有很强的长期记忆性,只有IMF5的Hurst指数略小,接近0.65,表示这一层模态具有一定的趋势,但是也还仍存在一定的噪声,由于这部分的方差贡献较小,约占12%,为了不至于使模型变得过于复杂,这里也仍认为这部分可以预测,从而继续采用神经网络进行逼近和预测。当然,随着对风险管控要求的提高,这一部分的影响就不能忽略了。图2给出了分离出的不同成分的序列形态和直方图:

图2 EMD分解后得出的噪声部分和主体趋势部分及其直方图

上述步骤将资产价格运行过程中的主体趋势部分和噪声部分进行了分离,下一步将通过预测主体趋势部分的未来走势,并计算噪声部分在给定置信区间、时间长度的分位点对总体进行风险评估。

图3中的虚线部分为2011年1月1日至2012年10月9日(t∈[1142,1403])间95%置信区间下预测的日VaR。可以明显看出,这种方法很好的勾勒出了市场的未来风险和主要趋势。在这262个预测点中,出现异常的点为11个,即在262次中只有11次超过了预警风险。以此计算出模型的精度为4.58%,接近预先给定的5%(13次)的失败率。并且超出的11次预测偏离实际值程度很小,可以认为完全锁定了可能的风险。基于EMD的VaR计算方法在该置信区间下得到了较优异的估计精度。

图3 02三峡债走势图及预测分析图

3.2 后验分析结果

为了对比各个方法的优缺点,本文采用历史模拟法、Delta-正态方法,Garch-正态分布分别计算了实证数据在各置信区间下的VaR,并对比各种方法的后验分析结果。由于程序采用的是不断移动窗口进行预测,难以将每一次计算的各项参数给出,这里不再给出具体的

据描述和实现步骤。其中传统方法计算均转换为对数收益率。表4中给出了一些传统方法计算出的VaR。

表4 VaR失败率的Kupiec LR检验

从各组检验的结果可以看出:历史模拟法虽然实现简单,但是在各个置信度下都比较难得到精确的估计,这可能是由于序列存在分形,特别是在大的风险转折时,历史模拟的VaR难以体现当前的风险变动。Delta-正态方法在各置信度下的估计也偏于保守,这是由于其本身的收益率序列存在明显的尖峰厚尾现象,与个体服从正态分布的假设不符,且统计过程的时变性也导致不能前瞻的预测风险。而基于EMD的VaR估计方法在各个置信水平上都表现出了较高的精度,且总体上优于传统的GARCH类方法。总的来说,对比上述几种常见的计算VaR的方法,本文所提出的方法展现出了较显著的优越性,具备了对金融市场的大幅波动的优异刻画能力。这为更加深入、全面把握金融市场的定量波动特征,进而增强对市场极端风险的刻画和预测能力,都有重要的理论和现实意义。

4 总结

本文以企业债为实证对象,提出了一种基于EMD的VaR估计方法。为了验证该方法的有效性,应用Kupiec检验实证对比了该方法与多种传统计算方法所估计的VaR精度。结果表明:(1)复杂的市场情形下传统的估计方法很难得到满意的估计精度;(2)债券价格序列存在明显的长期记忆性,具有分形特征;(3)对比传统的计算VaR的模型,本文提出的方法结合了EMD和分形理论,具有非线性处理能力,得到了更高的计算精度。这说明,基于复杂科学的风险计算方法拥有比传统的计量方法有着更好的刻画和预测能力。因此本文的研究也为EMD在金融方面的应用提供了另外一种思路。

[1]Huang N E,Shen Z,Long S R,et al.The Empirical Mode Decomposition and The Hilbert Spectrum for Nonlinear and Nonstationary Time Series Analysis[J].Royal Society of London Proceedings Series A,1998,454.

[2]Kupiec P.Techniques for verifying The Accuracy of Risk Measurement Models[J].Journal of Derivatives,1995,(2).

[3]Stanley H E,Amaral L A N,Gabaix X.Similarities and Differences between Physics and Economics[J].Physica A,2001,299.

[4]Mandelbrot B,Vanness J W.Fractional Brownian Motions,Fractional Noises and Application[J].Slam Review,1968,10(4).

[5]陈秋雨等.分形市场理论的产生和演变述评[J].社会科学家,2010,(11).

[6]郑伟.金融市场的分形和混沌研究综述[J].技术经济与管理研究,2012,(7).

[7]谢朝华.中国股票市场分形与混沌特征:1994~2008[J].系统工程,2010,28(6).

猜你喜欢
记忆性置信区间分形
不同方法诱导小鼠产生CD8+记忆性T细胞的研究
Maxwell分布参数的最短置信区间研究
p-范分布中参数的置信区间
多个偏正态总体共同位置参数的Bootstrap置信区间
感受分形
器官移植中记忆性T细胞的研究进展
分形之美
分形——2018芳草地艺术节
列车定位中置信区间的确定方法
分形空间上广义凸函数的新Simpson型不等式及应用