王哲璇 尹俊添 鲁锐
摘要 Hurst指数反映了事物发展过程的长记忆性程度,揭示了事物发展过去、现在和未来之间的内在联系,并以时间序列的自相似性和长程相关性体现了事物的发展变化情况。本文基于Hurst指数,对软件失效时间间隔数据进行Ma tlab处理,进而分析得到其长程相关性。并通过移动Hurst指数处理,获得更为准确的分析结果。
【关键词】Hurst指数 移动Hurst 指数 长相关特征 软件失效
1 引言
在当今社会,计算机技术飞速发展。人类对于计算机系统需求的增长,要求人类设计、实现、测试和维护这些系统的能力应得到相应的提升,否则将产生严重的计算机失效危机。显然,提高计算机软件系统的可靠性,对于计算机开发者以及软件维护人员来讲,是一个艰巨且重要的挑战。
2 分析方法
2.1 Hurst指数
Hurst指数是水利专家Hurst在研究尼罗河水库水流量和贮存关系时,提出的用来描述分形布朗运动特性的参量。Hurst指数反映了事物发展过程的长记忆性程度,揭示了事物发展过去、现在和未来之间的内在联系。通过研究Hurst指数随时间尺度的变化规律,可合理预测事物变化发展的趋势。在估计Hurst指数时,R/S分析法(重标极差法)最为常用。
log(R/S)n=Hlogn+loga
式中,R/S为重标极差,a和H为常数,称H为Hursr指数。用最小二乘法对log(R/S)。与logn作回归,回归直线的斜率即为Hurst指数H的估计值。
2.2 Hurst指数与长程相关性的关系
(1) H=l/2时,该时间序列为独立同分布的随机序列,即过去状况与未来趋势之间不存在相关性。
(2)H≠1/2时,该时间序列为非随机序列,即过去状况与未来趋势之间有关。
(3) 1/2
(4) O
3 分析对象
本文利用间隔时间单位为秒的软件失效时间间隔数据进行Hurst指数分析。数据来源于软件失效测量系统SYS3的检测结果,共有数据207个。
前三个数据为:39,10,4。以前三个数据为例,我们对数据含义进行解释:第一次软件失效与第二次软件失效的时间间隔为39秒,第二次软件失效与第三次软件失效的时间间隔为10秒,第三次软件失效与第四次软件失效的时间间隔为4秒。我们利用以上数据来进行Hurst指数估计。
4 计算软件失效的Hurst指数
如图1所示,通过运行我们编写的MATLAB程序,我们获得了Hurst指数的图像,趋势为一条向右上方倾斜的曲线,波动范围较小,类似于线性图像。因此我们利用线性拟合,做出该图形的线性拟合图像。由R/S分析法知,该线性图形的斜率即为Hurst指数。结果为H=0.6337>0.5。通过在本文第二部分的分析中我们可以了解到:这组数据序列具有长期相关性(或称长期记忆性),即未来趋势与过去趋势一致,且对初始条件有敏感依赖性。尽管序列相关性并不强,但在一定程度上说明软件失效时间并没有呈现出随机游走的特性,并不是一个独立过程,而是表现出相互依存的关系。这表明进行软件时间间隔的分析是有规律可循的。从另一方面来讲,说明了在未来的研究中,我们可以进一步探究失效时间的规律性,可以进行下次失效时间的预测。
5 计算软件失效的移动Hurst指数
5.1 移动Hurst指数
Hurst指数能进行长程相关性的分析,但是无法分析信号的时变特性,因此我们接下来将引入移动Hurst指数。移动Hurst指数即对单步的Hurst指数进行移动平均处理,使处理后的Hursr指数序列,既保留了原Hurst指数序列的趋势性,又提出Hurst指数波动的偶然性波动。由于移动Hurst指数反复计算了序列,所以比原始的Hurst指数有更好的准确性和代表性。我们可以更加确信通过移动Hurst指数获得的结果。同时也从侧面证明了Hurst指数确实可以表明序列是均值回复还是反持久性的。
5.2 计算软件失效的移动Hurst指数
通过数据波形与移动Hursr指数图2我们可以发现:
(1)移动Hurst指数大部分时间位于0 5以上,与Hurst指数计算结果相符。表示软件失效时间并没有呈现出随机游走的特性,不是一个独立过程,而是表现出相互依存的关系。因此对于软件失效时间间隔分析是有规律可循的。
(2)由图2我们看到,数据波形与Hurst移动平均指数均是曲线形状,且走势类似。但有部分点存在原始数据波形与Hurst移动指数呈现出相反趋势的情况。将图形放大,得到接下来放大了的前一百个数据局部图3。
通过前一百个数据的放大的局部数据波形与移动Hurst指数图3,我们可以发现:
图像中可以找到一些异常点,如50,57,99。在原始数据波形中,第50号、57号数据在局部中一直处于上升趋势;而在移动Hurst指数图像中,两点所在位置均为局部的最低点。这表明,第50号、第57号数据有极大可能为异常点,将不再符合原来趋势上升,而是在接下来一段时间内出现下降趨势。而第99号数据与以上两点相反,因具有局部最高的移动Hurst指数,原始数据很有可能不再符合原始规律继续下降,而是转为上升。在第100号数据以后的107个数据中,具有此类性质的还有第136,第147,第196号数据等等。这说明,在总体情况下,移动Hurst指数表征了数据的长程相关性,但同时也存在一些异常点,也可称作离群点。在以后的研究中,要注意到此类数据的存在,特殊处理,才能达到最优的分析效果。
6 结语
本文基于Hurst指数,进行了软件失效数据时间间隔的数据处理与分析。通过Matlab软件计算Hurst指数,得到其结果大于0.5,表明了本数据的长程相关特性。此外,应用了移动Hurst指数,进行了更为准确的分析处理,发现处理结果与Hurst指数处理结果基本相符,但同时也发现仍存在少量异常点,这些数据需要在今后分析中进行特殊处理。在未来的工作中,计划建立Hurst指数与系统负载、故障事件之间的关联,诊断出导致软件失效衰退的构件,规避软件失效,实施积极的恢复策略。
参考文献
[1]吕金虎.混沌时间序列分析及其应用[M].武汉:武汉大学出版社,2015: 157 -160.
[2]叶建萍,资本市场的Hurst指数估计[D].广西师范大学,2010.
[3]谢幼琼,顾圣平,城市用水时间序列的Hurst指数研究[J].水电能源科学,2012,30 (12): 27-29.
[4]徐建,张琨,游静,刘凤玉,基于分形的软件衰退预测[J].系统仿真学报,2007 (03):549-551.