陈浩 陈莉 王冬阳 董晓岚 陶静 赵传伟
摘 要:文章提出一种基于神经网络模型的机房IT设备故障在线诊断的方法。IT设备的主要特征向量作为故障的主成分,通过对IT设备的故障样本和正常运行的样本数据进行不断学习和训练,将IT设备的故障与模型的连接权值和阀值的形式表现出来,当对故障诊断有一定的要求时,通过不断调节阀值就可获得精确的故障诊断结果。仿真实验结果表明,文章算法能夠提高机房IT设备故障诊断的准确率和速度,效果令人满意。
关键词:机房IT设备;故障诊断;健康分析;失效预报
1 概述
文章将机房IT设备的CPU温度,主板温度及CPU负载、内存负载率、可用物理内存等可检测参数作为IT设备健康分析的目标,利用神经网络算法建立机房IT设备的故障在线诊断检测模型,通过一段时间的在线检测,将在某一负载水平下的相关参数的检测值与期望值进行匹配,将匹配结果作为故障诊断的结果反馈给运维人员,为故障的排除提供了准确依据。从而提高了机房IT设备运行的安全性和可靠性,降低了运维人员的工作负担。
2 机房IT设备运行参数的特征提取
在进行机房IT设备故障在线诊断、健康分析及失效预报的过程中,首先需要对机房IT设备的CPU温度,主板温度及CPU负载、内存负载率、可用物理内存等可检测参数的特征进行提取。
3 IT设备故障在线诊断、健康分析及失效预报系统的实现
3.1 建立IT设备在线诊断的神经网络模型
用于机房IT设备故障在线诊断的RBF神经网络模型是由输入层、隐含层和输出层这三部分构成的,为前向型神经网络。在IT设备故障在线诊断的神经网络模型中,输入层与隐含层存在线性关系,隐含层与输出层存在非线性关系。为了提高故障诊断的速度,在神经网络模型中引入了动量学习法,对各层之间的连接权值和阀值中加入了附加动量项。
机房IT设备的神经网络模型对IT设备的故障样本和正常运行的样本数据进行不断学习和训练,将IT设备的故障与模型的连接权值和阀值的形式表现出来,当对故障诊断有一定的要求时,通过不断调节阀值就可获得精确的故障诊断结果,同时引入的附加动量项提高了诊断速度,满足了在线诊断的要求。
3.2 机房IT设备故障在线诊断、健康分析及失效预报系统的实现过程
(1)建立IT设备故障在线诊断的初始样本集。对机房IT设备的CPU温度,主板温度及CPU负载、内存负载率、可用物理内存等可检测参数的运行情况作为研究对象,采集运行数据并进行处理和分析,将得到IT设备的故障特征作为条件属性,与其对应的故障类型作为故障诊断的输出期望,建立包括多种故障类型的初始样本表。(2)提取故障主成分。由于原始的故障数据中包含多维的故障信息,利用上面阐述的故障特征提取方法提取故障特征,并删除冗余特征,将保留的故障特征作为神经网络模型的输入数据。(3)故障在线诊断过程。对IT设备的故障样本和正常运行的样本数据进行不断学习和训练,将IT设备的故障与模型的连接权值和阀值的形式表现出来,通过调整阀值获得最优模型的参数,最终得到准确的故障诊断模型。(4)诊断结果的分析。将IT设备故障的样本数据输入神经网络模型的输入量,如果不能满足诊断要求,则不断调整阀值,直至获得满意的诊断结果。并将诊断结果作为IT设备健康分析与实效预报的依据。
4 实验结果及分析
4.1 实验参数设置
为了验证文章算法在机房IT设备故障诊断方面的有效性,需要进行一次仿真实验。利用仿真软件matlab7.1构建机IT设备故障诊断的实验环境。文章的故障诊断的神经网络模型的参数设置如下:输入层神经元的数目为8个,隐含层神经元的数目为34个,输出层神经元的数目为6个,模型的初始学习速度为0.2。利用传统算法进行机房IT设备故障诊断的对比实验。
4.2 不同算法实验结果比较与分析
文章算法和传统算法的实验结果用表1进行描述:
根据表1中的实验数据能够得知,文章算法的IT设备故障诊断正确率和诊断速度要远高于传统算法,这是由于文章算法在故障诊断的神经网络模型中引入了附加动量,加快了使模型的收敛性有了大幅度提高,这就提高了故障诊断的速度;利用神经网络模型不断对IT设备的故障样本和正常运行的样本数据进行不断学习和训练,从而提高了故障诊断的准确率。充分表明文章算法在机房IT设备故障诊断方面的优势。
5 结束语
对机房IT设备故障进行及时诊断,能够提高系统的安全性、可靠性并减少运维人员的工作负担。同时,通过文章故障诊断系统的建设,保障了机房内设备的稳定运行,使设备的使用寿命与稳定性延长,也使得客户的满意度、服务质量、企业形象都得以很大提升,真正做到经济效益和设备效益双丰收。
参考文献
[1]刘江,左正军.通用航空器故障诊断专家系统研究[J].科技经济市场,2013,8:5-9.
[2]马廷方.民用航空器维修与无损检测的浅析[J].中国科技博览,2014,31:260-260.