基于AHP、ARIMA算法的电力信息系统负载预测研究与应用

2018-01-02 09:09王旭陈潇一
电网与清洁能源 2017年8期
关键词:系统资源利用率信息系统

王旭,陈潇一

(1.国网陕西省电力公司,陕西西安 710048;2.国网陕西省电力公司电力科学研究院,陕西西安 710100)

随着国家电网公司信息化进程的发展,信息系统在日常运行时,会对底层软硬件造成负荷[1]。IT监控系统每分钟要从这些信息系统采集上万个系统运行数据,这些数据包含了与信息系统运行相关的动换、网络、主机、存储、中间件、应用、运维等大量信息,任何一种资源负载过大,都可能会引起系统性能下降甚至瘫痪。针对目前存在的问题,以陕西电网信息系统为研究对象,通过统计、评价、预测等大数据分析技术探索适合公司的信息系统及网络设备运行状态诊断的方法,解决公司目前被动应对信息系统的状态异常及故障的问题。通过建立基于运行状态的故障诊断模式,创新运维管理方式,不断提升信息系统运行水平,确保系统安全稳定运行[2]。

近年来,已有一些学者使用数据挖掘技术对信息系统负载进行了研究,例如:文献[2]有机结合负载预测的主动控制技术和基于实际系统状态信息的被动控制技术,利用大数据挖掘技术,采用马尔科夫链筛选组合模型预测未来时刻的工作负载情况[3];文献[4]基于ESPRIT分解算法,实现短期电力负荷预测,且具有较高的拟合度[4];文献[5]建立改进型SVR模型对电力信息系统负荷进行预测[5];文献[6]对南京城市电网核心区短期负荷特性进行分析及预测[6];文献[9-13]使用时间序列算法对电力负载进行预测。

1 负载情况对负载运行状态的影响

本研究根据应用系统的负载情况,从系统运维和系统应用过程两个角度分析影响信息系统负载的运行状态。

1)系统运维问题分析:业务系统的负载受到软件、硬件、中间件、网络、外部接口系统等各方面因素的影响,系统出现不稳定的因素可总结为以下几种,如图1所示。

图1 系统运行不正常问题鱼刺分析图Fig.1 Fish-bone analysis diagram of system operation abnormalities

程序问题:主要为业务系统程序编码不够严谨或安全,存在bug或漏洞,运行可造成系统无法运行、内存泄露等问题。

软件问题:主要是数据库、中间件等软件进程的漏洞而引起的系统不稳定。

网络问题:在硬件设备运行正常的前提下,系统的某一网段存在超过网络负载的情况。

2)系统应用过程分析:从业务系统应用过程的角度分析,主要是对外服务能力和内部处理能力。其中对外服务能力主要体现在系统对用户的响应速度或并发量,影响内部处理的因素有数据量大小、程序逻辑处理能力、数据库读写能力、调用其他系统接口的响应能力等。

本文首先根据获取的指标,使用AHP算法计算各个指标的权重值,然后结合虚拟机权重计算指标资源利用率,从而计算系统资源利用率,之后分别从系统资源利用率和系统性能指标采用ARIMA和HOLT-WINTERS指数平滑预测方法对系统负荷进行预测,并对系统运维负载分级预判和系统性能预判系统负荷状态,其技术路线如图2所示。

图2 电力信息系统负载预测技术路线图Fig.2 Roadmap of load forecasting technology for power information system

2 基础算法

2.1 AHP

AHP算法[7-8]全程为层次分析法,是将多目标或多方案的决策方法,首先根据决策目标、影响决策目标的因素、决策的对象建立层次结构模型,构造各个层次中两两因素之间的相对权重,并对判断矩阵进行一致性检验,最终确定某层所有因素对总目标相对重要性的权值,从最高层到最低层逐渐进行。AHP法在对事物进行决策分析时,能对定性问题进行综合处理,得出明确的定量的结论[14]。

AHP算法的核心在于构造判断矩阵,将决策者对事物的评价由定性评价转换为定量评价,在此,首先引出构造判断矩阵两两元素间的相对权重,如表1所示。

表1 比例的标度及其含义Tab.1 Scale of scale and its meaning

将两两元素进行重要性程度对比,并根据对比结果,将数值填入对应位置的矩阵中,构造两两元素相互比较后的判断矩阵,记为

式中:p表示某层中的元素个数;eij表示某层中元素i对元素j的相对重要性度量值。元素i对元素j的重要性与元素j对元素i的相对重要性是互逆的,即eji=1/eij,且E为对称矩阵。

判断矩阵E的最大特征根λmax,及其对应的特征向量Wf={w1,w2,…,wp},然后对思维的逻辑进行一致性判定,其一致性检验公式为

式中:CR为一致性比率;CI为一致性指标;RI为随机一致性指标。具体数据见表2所示。

表2 九阶段矩阵RI值Tab.2 The RIvalue of Nine stage matrix

为了获得合理的权属分配和满意的一致性,需要满足条件为CR<0.1,一旦不满足该条件,需要重新调整判断矩阵的值,再重新计算CR,直到满足条件为止。

归一化权重向量计算公式为

为了方便,归一化后的权重向量为Wf={w1,w2,…,wp},且向量中每个值均介于0和1之间,累计值为1,由此得到元素的权重,之后引入系数α,且α∈[0,1],得到指标权重向量为

最终计算各指标权重,结果如表3所示。

表3 某指标权重Tab.3 The weight of an index

2.2 ARIMA模型

时间序列分析方法中ARIMA模型是应用很广泛的[9]。其大体思路是:首先判断序列是不是平稳的,可通过时序图和ADF进行检验,经检验后如果序列不平稳,需通过差分方法处理成平稳时间序列,之后绘制平稳后的ACF和PACF图,并根据截尾和拖尾的性质,对模型进行最终判定,得到模型的类型以及模型阶数和未知参数,并对模型进行有效性检验,最后基于建立的模型预测未来时序对应的目标值。ARIMA模型一般记为ARIMA(p,d,q)[10-13],即d次差分后将平稳序列Xt拟合为ARMA(p,q)模型,该模型的表达式为

式中:p为自回归阶数;φ1,φ2,…,φp为自回归系数;Xt为平稳数据序列;{εt}为白噪声序列,形式为W~N(0,σ2)。

P阶自回归模型AR(p),表达式为

q阶滑动平均模型MA(q),表达式为

ARIMA时间序列模型建模过程如图3所示。

2.3 Holt-Winters指数平滑预测

Holt-Winters模型是较常见的预测模型,由Winters提出,又由后人不断改进。当时间序列图显示的时间序列的季节变动大致相等时,采用加法模型,当时间序列的长期趋势大致成正比时,应该采用乘法模型。本文数据规律与加法模型相符合,选择加法模型,假设进行指数平滑的序列为{Xt},则Holt-Winters三参数指数平滑模型为式中:bt为长期趋势值;γ为加权值;S为季节调整因素;π为季节性时间的长度;α,β为调整因子;Xt为现行数值;at为平滑值;t为当前时间。

预测值由下式计算:

式中:k为向后平滑期数,即决定预测未来几个月份的序列的参数;y值即所预测系统资源利用率和系统响应时间序列。

图3 ARIMA时间序列建模过程图Fig.3 The procedure chart of ARIMA time series modeling

3 实证研究

3.1 数据来源

本文电力业务信息系统的负载评价主要从业务应用和系统资源两方面进行评价,从这两个方面出发,涉及到的基础指标如表4所示,采取的负荷预测的相关数据的日度数据,历史数据区间定位为2017年5月20日至2017年6月20日。

3.2 实验分析结果

1)系统资源利用率各指标权重:本文使用系统资源利用率的CPU使用率、内存使用率和磁盘/文件系统使用率等相关指标,完成系统资源利用率各指标权重计算。具体实现过程如图4所示,系统资源利用率使用AHP算法得到的各指标的权重如表5所示,且通过一致性检验。

2)系统资源利用率和系统响应时长的ARIMA、Holt-Winters指数平滑预测:使用计算的系统资源利用率、系统响应时长相关指标,完成系统资源利用率和系统响应市场的短期预测计算。具体实现过程如图5所示。

表4 系统负载评价模型基础指标Tab.4 The base index of System load evaluation model

图4 系统资源利用率各指标权重实现过程Fig.4 Realization process of each index weight of system resource utilization rate

表5 系统资源使用率各指标权重Tab.5 The system resource utilization weight of each index

图5 系统资源利用率、系统响应时长预测实现过程Fig.5 The prediction process of system resource utilization rate and system response time

通过使用ARIMA和Holt-Winters指数平滑预测方法分别对系统资源利用率和系统性能指标(系统平均响应时长)进行3天的预测,其中系统资源利用率的ARIMA模型和Holt-Winters指数平滑法模型结果如表6所示。

表6 ARIMA和Holt-Winters结果对比Tab.6 Comparison of ARIMA and Holt-Winters results

综合对比ARIMA和Holt-Winters指数平滑法的结果,得到ARIMA(2,1,1)模型具有更小的AIC值和MSE值,且根据模型建立的预测趋势与实际趋势一致,信息系统资源利用率的ARIMA(2,1,1)模型的预测值误差绝对值、误差绝对率分别在0.001~0.008和0.49%~3.77%,平均误差绝对值为0.005,平均误差绝对率为2.57%,具有较佳的预测性能,最终选择ARIMA(2,1,1),同理系统平均响应时间。ARIMA模型预测结果如下表7,表8所示。

表7 系统资源利用率ARIMA预测模型结果Tab.7 The ARIMA predicted model results of system resource utilization

表8 系统平均响应时间ARIMA预测模型结果Tab.8 The ARIMA predicted model results of System average response time

3)系统负荷评价:分别对资源利用率和系统响应时间进行分级评价,记系统资源利用率X在t时刻的预测值为Xt,样本标准差为s,通过加减3个标准差构造基线,结果为[Xt-3s,Xt+3s],当资源利用率小于Xadb-3s时候资源利用状态空闲,当资源利用率大于Xt+3s时候资源利用状态过载,当资源利用率位于[Xt-3s,Xt+3s]之间,资源利用状态正常。系统响应时间分级评价,记平均响应时间的阀值为T,当平均响应时间超过T则认为响应时间超长,处于服务繁忙状态,反之处于服务正常状态。综合系统资源利用率和平均响应市场的状态对业务系统负载做出最终评价,评价标准见表9所示。最终业务信息系统负载状态评价如表10所示。

表9 业务系统评价标准表Tab.9 The table of business system evaluation standard

表10 业务信息系统负载状态评价结果Tab.10 The results of business information system load status evaluation

4 结论

本文以电力业务信息系统收集到的系统资源指标信息(CPU使用率、内存使用率、磁盘使用率)、系统应用指标信息(系统平均响应时间)为基础,从系统资源和系统性能两个角度分别定量研究,从而完成了系统负载评价任务。实验结果表明本文提出的系统负载评价模型是有效的,且具有较高的预测准确率,有效提升了整体资源利用率。下一步,将结合系统负载模型研究成果,对系统从其他维度进行更深层次的扩展,使系统负载评价模型更加全面。

[1]张根周.大数据在智能电网领域的应用[J].电网与清洁能源,2016,32(6):114-117.ZHANG Genzhou.Applications of big data in the field of smart grid[J].Power System and Clean Energy,2016,32(6):114-117(in Chinese).

[2]罗杰,刘元丹,龚旭龙.基于贝叶斯与粗糙集方法的电网故障诊断的研究[J].电子设计工程,2015,23(2):28-31.LUO Jie,LIU Yuandan,GONG Xulong.The fault diagnosis for power grid based on rough set and bayesianetwork[J].Electronic Design Engieering,2015,23(2):28-31(in Chinese).

[3]张栋梁,严健,李晓波,等.基于马尔可夫链筛选组合预测模型的中长期负荷预测方法[J].电力系统保护与控制,2016,44(12):63-68.ZHANG Dongliang,YAN Jian,LI Xiaobo,et al.Mid-long term load forecasting based on markov chain screening combination forecasting models[J].Power System Protection and Control,2016,44(12):63-68(in Chinese).

[4]马哲,舒勤.基于ESPRIT分解算法的短期电力负荷预测[J].电力系统保护与控制,2015,43(7):90-96.MA Zhe,SHU Qin.Short term load forecasting based on ESPRIT integrated algorithm[J].Power System Protection and Control,2015,43(7):90-96(in Chinese).

[5]钱志.基于改进型SVR的电网短期负荷预测[J].中国电力,2016,49(8):54-58.QIAN Zhi.Short term power load forcasting based on improved SVR[J].Electric Power,2016,49(8):54-58(in Chinese).

[6]朱斌,姜宁,霍雪松,等.南京城市电网核心区短期负荷特性分析及预测[J].中国电力,2016,48(2):67-72.ZHU Bin,JIANG Ning,HUO Xuesong,et al.Forecasting andstudiesonloadcharacteristicsofnanjingcenterareapower network[J].Electric Power,2016,49(8):54-58(in Chinese).

[7]陶鸿飞,孙艺新,吴国威,等.基于大数据和层次分析法的电力信息系统成熟度评估[J].中国电力,2016,49(10):114-118.TAO Hongfei,SUN Yixin,WU Guowei,et al.Maturity assessment of power information system based on big data and analytic hierarchy process[J].Electric Power,2016,49(10):114-118(in Chinese).

[8]李蕊,李跃,徐浩,等.基于层次分析法和专家经验的重要电力用户典型供电模式评估[J].电网技术,2014,38(9):32-37.LI Rui,LI Yue,XU Hao,et al.Assessment on typical powersupply mode for important power consumers based on analyticalhierarchy process and expert experience[J].Power System Technology,2014,38(9):32-37 (in Chinese).

[9]张楷楷,燕萍.时间序列以及卡尔曼滤波在电力系统短期负荷预测中的应用[J].电气开关,2016(2):91-97.ZHANG Kaikai,YAN Ping.Application of time series and kalman filetering in short-term load forecasting of power system[J].Electric Switch,2016(2):91-97(in Chinese).

[10]邓雨荣,张炜,梁俊斌,等.基于时间序列分析的油中产气数据趋势测度[J].智能电网,2016,4(8):744-748.DENG Yurong,ZHANG Wei,LIANG Junbin,et al.Prediction of the trends in the data of dissolved gas production in transformer oil based on time series analysis[J].Smart Grid,2016,4(8):744-748(in Chinese).

[11]田波,朴在林,王慧.基于时间序列建模在风力发电功率短期预测中的研究[J].电网与清洁能源,2016,32(3):115-120.TIAN Bo,PIAO Zailin,WANG Hui.Short term prodiction of wind power based on time series modeling[J].Power System and Clean Energy,2016,32(3):115-120(in Chinese).

[12]麦鸿坤,肖坚红,吴熙辰,等.基于R语言的负荷预测ARIMA模型并行化研究[J].电网技术,2015,39(11):3216-3220.MAI Hongkun,XIAO Jianhong,WU Xichen,et al.Research on ARIMA model parallelization in load prediction based on R language[J].Power System Technology,2015,39(11):3216-3220(in Chinese).

[13]张鹏飞,瞿海妮,肖其师,等.基于气象因素和时间序列分析的配电网故障数量预测[J].陕西电力,2016,44(1):68-72.ZHANG Pengfei,QU Haini,XIAO Qishi,et al.Distribution network faults prediction based on meteorological factors and time series analysis[J].Shaanxi Electric Power,2016,44(1):68-72(in Chinese).

[13]李存斌,宋易阳.基于AHP-熵权法的电力企业信息化应用效果模糊综合评价 [J].陕西电力,2015,43(7):48-53.LI Cunbin,SONG Yiyang.Performance fuzzy comprchensive evaluation of electric power enterprise informatization application based on AHP-entropy[J].Shaanxi Electric Power,2015,43(7):48-53(in Chinese).

猜你喜欢
系统资源利用率信息系统
企业信息系统安全防护
民用飞机综合模块化航电系统资源状态监控技术研究
2019年全国煤炭开采和洗选业产能利用率为70.6%
基于访问控制列表机制的Android权限管控方案
化肥利用率稳步增长
基于区块链的通航维护信息系统研究
浅议如何提高涉烟信息的利用率
WCDMA网络资源故障及解决方案研究
信息系统审计中计算机审计的应用
基于SG-I6000的信息系统运检自动化诊断实践