李勇伟 郑庆华 孙艳军 杨 蕊
数据中心高压冷水机组定性故障诊断模型构建
李勇伟1郑庆华1孙艳军1杨 蕊2
(1.中国移动通信集团山西有限公司数据中心 太原 030000;2.山西省农业科学院农业科技信息研究所 太原 030031)
为提高数据中心空调系统的可靠性和安全性,全面掌握系统各部件的内在复杂的因果关系,采用定性的图论方法构建系统分层有向图模型,利用符号有向图和论域有向图描述系统部件的结构和影响关系。以高压离心式冷水机组为例,构建模型并进行故障推理验证。结果表明,该模型层次明确、准确有效,实现了系统潜在故障实时预测和诊断,能够为系统运行提供指导。
符号有向图;分层有向图;数据中心;离心式冷水机组;故障诊断
互联网应用日益激增,网络的稳定性和持续性影响用户的体验效果。数据中心作为互联网支撑的基础载体,机房设备的正常与否制约着网络的运行状态。机房负载及外部天气环境实时变化;高压冷水机组作为空调系统的核心制冷系统,对持续控制机房温度参数在合理区间起到了至关重要的作用。空调系统对高压冷水机组的稳定性要求极高,当高压冷水机组的某个部件失效或发生故障时,轻则使系统局部处于异常运行状态,重则使整个系统停运,造成不可挽回的重大经济损失。因此,为保障数据中心安全可靠地运行,同时实现经济效益最大化,迫切需要建立一套高压冷水机组故障诊断模型,对数据中心空调系统实际生产过程中可能发生的故障准确高效实时地诊断和预测,以提高数据中心的安全性和经济效益[1]。
本文采用一种定性的图论方法分层有向图模型进行建模,符号有向图(Signed Directed Graph,SDG)能够利用定性的知识描述变量和设备部件间复杂的影响关系和大量潜在因果关系,该模型具有较强的完整性、适应性和鲁棒性[2-5]。针对高压冷水机组特定的系统结构和运行工况进行分析,首先建立描述其工作原理的符号有向图,在其基础上,利用基于可达性的分层方法构建分层有向图模型。该模型能够根据图的传播关系分层次描述,故障诊断推理方向为单向传播,能够减少故障源搜索的空间。
本文采用文献[3-5]提出的改进分层有向图模型的定义。
定义 1系统的分层有向图模型的数学表
其中,分层有向图模型由二元组符号有向图G和论域有向图G构成。
分层有向图模型由符号有向图模型演变而来,建立系统的符号有向图G是构建模型的关键。模型中,G具有完备性,能够反映测量节点间的因果定性关系,G反映了分层后节点间的论域关系,描述了任一节点分层后所在的层次。
根据符号有向图的性质可得,故障信息只能通过相容通路传播。
可达矩阵可通过邻接矩阵得到利用经典Warshall算法[6]计算得出。
定理 1矩阵为系统的邻接矩阵,若存在置换矩阵,使得EAE运算后为分块三角阵,则称该系统可分层;反之,该系统不可分层[5,7]。
将符号有向图G分层后得到分层有向图模型,该模型利用分层结构划分故障源的层次,即每一层节点的故障偏差只能对本层和比之更低层的节点传播或产生影响,而不会影响比之更高层的节点。模型层次分明,故障传播方向自上而下,故障诊断时减少了故障源搜索回溯的路径,其特性直接影响潜在的故障源候选节点数量下降。
采用文献[8]中基于可达性的分层方法,具体步骤如下:
第一步根据符号有向图G得到系统的邻接矩阵A。
第二步利用定理1判断系统能否分层,若可分层,则进行第三步;若不可分层,则退出。
第三步将得到的邻接矩阵A利用Warshall算法转化为可达矩阵P。
第五步将第四步中所有上层节点的行和列在可达矩阵P删除,便得到除去上层节点后的可达矩阵。
第六步重复第四步,计算得到第2层的节点集,重复以上步骤直到处理完所有的节点,便可以建立分层有向图模型。
数据中心冷水系统主要由高压冷水机组(主要包含蒸发器、冷凝器、压缩机、截流元件)、冷却塔、循环水泵、集水器、分水器和末端设备等部分组成[8],工作原理图如图1所示。
图1 数据中心冷水系统工作原理图
本文研究对象为离心式高压冷水机组,机组采用频率为50Hz的3相10kV电压,制冷剂为R134a,制冷量为7032kW;各部件的参数符号如表1所示。
续表1 高压冷水机组各部件参数符号
符号有向图的建模方法常用的有4种,分别是基于数学模型的方法、基于经验知识的方法、基于流程图的方法和结合仿真技术的符号有向图方法[8],本文采用基于流程图的方法和基于经验知识的方法,得到离心式高压水冷机组的符号有向图模型G,如图2所示。
符号有向图G定性地表示了离心式高压冷水机组各部件的内部结构和因果关系,节点和支路包含了大量潜在信息,故障诊断时可以通过故障偏差的传播路径及其演变加以描述[5]。高压水冷机组的各参数被抽象为节点,各节点均为可测节点,节点的测量值有超过阈值“+”、正常“0”和低于阈值“-”三种状态,节点间相互影响关系由箭头表示,实箭头代表正影响,虚箭头代表负影响。
图2 高压冷水机组的符号有向图模型GS
为进一步挖掘符号有向图G中节点间的内在关系,采用基于可达性的分层方法建立离心式高压冷水机组的分层有向图模型,如图3所示。由图3可知,该模型共有5层,第一层节点称之为根节点,该层节点只有子节点无父节点,各层节点的支路箭头均指向下一层的节点,由此可以看出节点的偏差值只能自上而下传播,不会反向传播,每层节点抽象为节点集合,作为论域有向图G的节点,层间的支路抽象为论域有向图G的支路集合,其论域有向图G如图4所示。
图3 高压冷水机组的分层有向图模型G
分层有向图模型中,层数=5,各层节点集合为v,v={,W1,P1,D,P,W,R,,L,L1,F,1},v={F1,F,R,0,M,T1},v={T,T1},v={T,T,N,T1},v={C}。
图4 高压冷水机组的论域有向图模型GT
论域有向图G中,各层节点抽象为单个节点,各层间连接关系用多个箭头表示,且关系简明,传播方向固定,为进一步的故障诊断提供了模型依据。
故障推理方法常用的有正向推理和反向推理两种。若模型的节点状态是未知的,采用正向推理方法,即从原因节点向后果节点回溯,搜索并标记独立完备的相容通路,最后判断互相隶属且独立通路的合理性,正向推理可称为评价模式。若模型已获得全部节点的状态样本,则采用反向推理方法,从样本的后果节点向原因节点搜索,记录并判断各通路的相容性和独立性,反向推理又可称为诊断模式。在实际中,可以联合使用两种推理方法,称为混合推理[5,9]。
分层有向图模型中,故障由上往下传播,上层节点的故障将导致下层节点测量值产生偏差,当给出节点状态样本时,可从节点中首先找出最高层偏差的节点,最高层的节点是导致系统节点发生偏差的主要因素。由3.2可知,各节点均可测,表2给出了8个节点的状态样本,由此可以分解出案例1-3的SDG通路,如图5所示。根据定义2.3判断各支路均为相容通路。
案例1中,最高层发生偏差节点的集合为{},因此蒸发器污垢系数F是故障源节点。案例2和3中,最高层发生偏差的节点集合为{},因此压缩机电流是故障源节点,压缩机电流偏小时说明机组工作在低负荷工况下,热负荷较低的话易引起冷水机组喘震;机组热负荷较小而压缩机电流偏大时,压缩机能耗增加,机组能效比降低机。
表2 节点状态样本
图5 各案例的SDG通路
本文针对数据中心的高压冷水机组构建了定性分层有向图故障诊断模型,实现了系统变量参数等信息的获取,以图的形式表示,便于在计算机中存储,利用图模型简化现场工业流程系统的同时又能包容大量的信息。高压冷水机组分层有向图故障诊断模型定性地从系统全局变量进行描述,当系统的某个部件失效或发生故障时,能够实现整个系统的故障状态的实时诊断和预测。上述诊断方法对保证数据中心机房安全稳定生产、提高数据中心动环系统的安全性和经济效益起到了积极作用。
[1] 王路瑶,吴斌,杜志敏,等.基于长短期记忆神经网络的数据中心空调系统传感器故障诊断[J/OL].化工学报,1-9[2019-02-13]. http://kns.cnki.net/kcms/detail/11.1946. TQ.20181013.1003.012.html.
[2] 宋其江,徐敏强,王日新.基于分层有向图的航天器故障诊断[J].航空学报,2009,30(6):1058-1062.
[3] 杨蕊,谢刚,陈泽华.基于改进分层有向图的故障诊断方法[J].热力发电,2014,(6):108-111,126.
[4] 杨蕊,谢刚,陈泽华,等.分层概率符号有向图在热力系统故障诊断中的应用[J].热力发电,2014,(9):137-141.
[5] 杨蕊.基于定量知识的分层有向图故障诊断方法及其应用[D].太原:太原理工大学,2014.
[6] Berger UIrich, Schwichtenberg Helmut, Seisenberger Monika. Warshall algorithm and Dickson's lemma: Two examples of realistic program extraction[J]. Journal of Automated Reasoning,2001,26(2):205-221.
[7] 陈侃,李昌禧.故障传播有向图的故障定位研究[J].自动化仪表,2011,32(4):14-17.
[8] 韩华,谷波,任能.基于主元分析与支持向量机的制冷系统故障诊断方法[J].上海交通大学学报,2011,9(20): 1355-1361,1373.
[9] 刘静.基于粗糙集的分层有向图故障诊断方法研究及其应用[D].太原:太原理工大学,2011.
Construction of Qualitative Fault Diagnosis Model for Data Center High Voltage Chiller
Li Yongwei1Zheng Qinghua1Sun Yanjun1Yang Rui2
( 1.Data Center, Shanxi Branch, China Mobile Communications Group, Taiyuan, 030000; 2.Institute of Agricultural Information, Shanxi Academy of Agricultural Sciences, Taiyuan, 030031 )
In order to improve the reliability and safety of the data center air conditioning system, and comprehensively grasp the inherent complex causal relationship of the various components of the system, the qualitative graph theory method was proposed to construct hierarchical directed graph model of the system. The structure and influence relationship of system components were described by the signed directed graph and domain directed graph. Taking the high voltage centrifugal chiller as an example, the model was constructed and fault reasoning is verified. The results show that the model was clear, accurate and effective, which can realize the real-time prediction and diagnosis of potential faults of the system, and can provide guidance for system operation.
signed directed graph; hierarchical directed graph; data center; centrifugal chiller; fault diagnosis
TB657.2
A
1671-6612(2020)01-053-04
李勇伟(1985.10-),男,硕士研究生,工程师,E-mail:2011@139.com
2019-03-27