基于自回归模型的软件可靠性预测方法研究

2021-09-26 06:21陈静
河南科技 2021年24期

陈静

摘 要:随着人们对高可靠和高质量软件需求的日益增长,这种需求迫使软件开发人员不断提高软件的可靠性。本文提出了一种基于自回归模型的软件可靠性预测方法,并利用最小二乘估计方法对模型中的参数进行估计。使用开源软件Firefox的真实故障数据,利用SPSS软件对可靠性模型进行验证分析,实验结果表明本文提出的模型是有效的。

关键词:自回归模型;软件可靠性;最小二乘估计;SPSS

中图分类号:TP183        文献标识码:A       文章编号:1003-5168(2021)24-0023-04

Research on Software Reliability Prediction Method Based on Autoregressive Model

CHEN Jing

(College of Information Engineering, Guizhou University of Traditional Chinese Medicine, Guiyang  Guizhou 550025)

Abstract: With the increasing demand for the peoples pursuit of the high reliability and high-quality software, this demand forces software developers to continuously improve the reliability of software. This paper put forwards a software reliability prediction method based on an autoregressive model, and uses the least square estimation method to estimate the parameters in the model. The real failure data of the open source software Firefox and SPSS software were used to verify and analyze the reliability model,and the experimental results show that the model proposed in this paper is effective.

Keywords: autoregressive model;software reliability; least square estimation; SPSS

對系统软件故障的管理研究主要是对一些有严重故障或容易表现出错的软件模块进行分析识别,并为其创建软件故障管理预测系统模型,为其提供软件维护使用指南。通过对整个软件系统可靠性进行测试,找出对整个软件系统可靠性具有重大影响的软件错误。近年来,随着信息技术的飞速发展和广泛普及,计算机软件可靠性技术已经将相关软件设备存在的运行状态故障情况作为研究依据。人们对使用软件的迫切需求也不断提高,从而直接推动了我国软件技术的不断进步。随着软件结构的设计复杂性的日益增加,直接导致了各种软件维护系统故障的结构复杂性也随之增加,随之而来的是软件开发和安装维护软件过程中的成本也相应加大。因此,利用软件测试过程中产生的故障数据,对软件可靠性进行分析预测是当前研究的一个重要问题。

自回归模型是一种在社会统计学中已经得到广泛研究运用的时间序列分析方法,目前已经广泛应用在经济学、信息学、自然科学等现象的分析预测上,是在20世纪70年代由美国现代统计学中的学者博克思(Box)和詹金斯(Jenkins)联合提出的一种预测和分析三维时间序列的计算方法。马飒飒等人将软件可靠性测试阶段获得的失效数据作为时间序列进行多尺度分解,对分解到不同尺度上的数据分别利用不同的时序预测模型进行分析,提出了软件可靠性多尺度预测模型[1]。贾治宇等人对基于求和自回归滑动平均模型(ARIMA模型)的软件可靠性预测方法进行了研究,提出了利用ARIMA(p,d,q)模型来对软件可靠性进行预测[2]。吴烨清介绍了时间序列理论的基本知识,研究了随机时间序列方法在软件可靠性建模中的应用[3]。Cao等人提出了一种结合ARIMA和分形模型的混合方法,以利用ARIMA和分形模型在建模中的独特优势,提出了一种基于ARIMA和分形的混合软件可靠性模型,提出了软件失效机理研究的新思路[4]。Chatterjee等人建立了一种ARIMA模型来预测软件的可靠性,所提出的模型已使用一些实际的软件故障数据进行了验证,结果显示较好[5]。Choudhary等人提出了一种基于Cuckoo搜索算法、集合经验模态分解和ARIMA时间序列的混合软件可靠性模型,该模型提供了更准确的故障预测[6]。自回归综合移动平均模型(ARIMA或Box-Jenkins技术)和人工神经网络(ANN)都是传统可靠性分析方法(如Weibull分析、泊松过程、非均匀泊松过程和马尔可夫方法)的可行替代方案。通过ARIMA或ANN进行故障间隔时间(TBF)的时间序列分析没有传统方法的局限性,如先验假设的要求/假设或TBF的统计独立且分布均匀的观测值。Dindarlo等人通过对TBF的分析研究了LHD装置的可靠性。季节性自回归综合移动平均值(SARIMA)用于建模和预测故障,并将结果与基于ANN的模型进行比较,最优ARIMA模型在预测LHD的TBF方面优于人工神经网络[7]。Kumaresan等人提出了一种时间序列SARIMA方法,用于开发能够提供显著改善的可靠性预测模型。使用实时的公共可用软件故障集,将其与以前的可靠性模型进行比较,时间序列SARIMA方法较好[8]。