曹 洁,祝令凯,张元正,李洪海,刘守刚
(1.国家电投集团河南电力有限公司沁阳发电分公司,河南 焦作 454150;2.国网山东省电力公司电力科学研究院,山东 济南 250003;3.山东鲁能软件技术有限公司,山东 济南 250002;)
近年来,随着GPU、云计算等技术的快速发展,计算机计算速度与计算能力得到大幅提高,有力推动了工业大数据技术和神经网络算法的发展应用[1-3],为推动国家新一代人工智能技术的发展奠定基础。人工智能技术在商业互联网行业应用广泛而且技术成熟,工业行业由于积累了庞大数据量,为响应国家新一代人工智能技术的发展,转变工业生产制造模式,我国工业正在积极探寻人工智能技术与大数据在工业设备智能诊断、预警以及工业生产指标寻优等方向的运用。其中,设备智能诊断技术在工业领域得到很大重视,生产设备的安全运行关系着企业的安全责任和经济效益。
设备故障往往是宏观的、系统的,而设备故障原因却是部件级、材料级的。近几年来在设备故障诊断方面的技术层出不穷,如基于故障树、基于规则、基于案例推理、基于神经网络、基于粗糙集理论、基于Petri 网络等,由于上述理论技术均脱离业务逻辑,难以实现行业通用,尤其面对复杂的设备系统时,现有算法在准确性和稳定性方面存在诸多问题,因此,大型设备的故障原因查找还需要依赖专家进行问题推导和定位。
基于业务逻辑和推荐算法结合的思想,通过修正关联分析值,构造设备故障诊断逻辑,进行设备故障相似因素的推荐。以某核电站冷却剂泵为例,进行实例分析,分析结果表明该算法在故障定位方面具有较高准确性。
推荐算法主要分为3 类:经典推荐算法、特定推荐算法和混合推荐算法。其中,经典推荐算法包含协同过滤推荐算法和基于内容的推荐算法[4-6],设备故障诊断逻辑主要采用经典推荐算法。在工业生产中,基于内容的相关设备故障推荐算法需要故障设备大量历史数据作为挖掘对象,由于生产实践过程中积累的正样本与负样本数据往往是不平衡的,单个设备的故障数据量少,在实际使用故障推荐算法时优先使用基于协同过滤的故障相关设备推荐算法。
协同过滤推荐算法的基本假设是:为用户推荐感兴趣的内容,找到与该用户偏好相似的其他用户,将他们感兴趣的内容推荐给该用户。文献[7]将协同过滤方法分为基于记忆方法和基于模型方法。
基于记忆方法采用所有的设备历史数据或1 个样本集来生成预测。每个设备都有1 个与其有着关联性较强的设备,被称为邻居,通过识别设备的邻居状态,可以预测设备在该状态下的发展趋势。
基于模型方法采用统计、机器学习和数据挖掘等方法,根据设备历史数据构造状态模型,并据此进行推荐,适合样本量较大的场景。
协同过滤推荐算法的核心是计算目标设备与评分矩阵中各设备的相似度,然后将各个相似度进行排序,较高相似度的设备作为目标设备的近邻集。计算关联度时,仅从算法方面解决或仅从业务逻辑方面解决都难免顾此失彼,结合相关系数计算的关联度与业务逻辑分析的关联度,使用加权平均的方法将两种关联度计算结果结合,得到最终的关联度,可弥补业务和算法在关联分析中的不足。
使用相似度指标计算方法如相关系数、互信息以及相关距离公式等[8],依托历史大数据计算参数两两之间的关联度,进一步计算关联设备各指标之间关联度的均值,得到设备之间的关联度。取Pearson 相关系数作为相似度度量,其计算公式为
式中:Iuv为设备u 与设备v 共同评分的项目集合;Ru,i与Rv,i分别为设备u和设备v对项目i的评分;分别为设备u 和v 设备对已评价项目的评分均值。
基于算法计算出的设备关联度需要由具体业务逻辑支撑和修正。以核反应堆冷却剂泵业务逻辑为例,其逻辑关联情况如图1 所示。主泵设置的冷水入口流量直接影响主泵设置的冷水出口流量,而主泵设置的冷水流量差值也间接影响了设置的冷水温差,从而影响对温度敏感的主泵定子线圈以及主泵振动等相关部件与参数。实际分析中,需要业务人员根据业务逻辑中各相关因素相关强度赋予相应关联度值。
图1 冷却剂泵冷水流量与主泵状态关联示例
通过业务专家对设备关联性分析,并赋予相应的关联度值D(u,v),结合式(1),进行加权,修正算法相似度计算的不足,其修正公式为
式中:σ 为调节参数,取值范围为(0,1),可通过历史数据交叉验证,当专家推理结果可靠性较大时,增大σ 值,反之减小。
计算出设备之间的关联度之后,还应挖掘设备之间历史故障的频繁项。以故障类型作为分组依据,找出导致设备故障发生的指标作为频繁项集,计算相关概率作为该频繁项集对于该故障发生的支持度。以主泵振动和设备冷却水系统热交换器异常为例,各频繁项支持度值如表1 所示。
通过关联度值找到异常设备的邻近设备,由关联度值和支持度的乘积得到各设备的推荐评分矩阵,取最佳推荐评分对应的设备作为推荐结果。
根据上述理论,提出协同过滤推荐算法与业务逻辑相结合的设备故障诊断方法,该方法以协同过滤推荐算法为核心,结合业务逻辑修正关联度分析值,实现业务和算法相结合,提高故障诊断的效率和准确性。协同过滤推荐打分流程如图2 所示。
表1 频繁项集支持度
图2 协同过滤推荐打分流程
通过上述流程,关联分析找到异常设备相关的近邻设备,并结合频繁项集,获得邻居设备推荐评分。当频繁项集的支持度为0,则支持度不参与推荐评分计算,取最佳推荐评分作为设备故障诊断的最终结果。当某个故障设备的历史数据较少,无法挖掘出故障频繁项时,系统基于设备关联度值,找出与故障设备关联度高的相似设备,即同类型设备。基于协同过滤的故障相关设备推荐逻辑如图3 所示。
以冷却剂泵为例,使用协同过滤推荐算法与业务逻辑相结合的设备故障推荐方法进行故障诊断推进分析,并通过准确率ra和推荐率rr进行指标评价。
图3 基于协同过滤的故障相关设备推荐
准确率越高表明冷却剂泵故障诊断推荐系统的推荐质量越高。准确率计算公式为
式中:N 为故障诊断推荐系统正确预测的故障频繁项集数;M 为频繁项集总数。
项目推荐率rr主要用于衡量同类型设备的查找效率,在相同准确率下,项目推荐率的数值越大说明算法的推荐效率越高。项目推荐率在项目推荐时,设一个故障设备的故障频繁项目集为W={w1,w2,…,wP},P 表示故障频繁项目集合的数量,wi(i=1,…,Q)为待推荐的故障频繁项目集,Q 为待推荐的故障频繁项目集数量,由于该故障设备同类型设备中没有发现关于wi的频繁项目集,而导致wi无法被推荐,故不能被推荐的项目总数为Q(Q≤P),则称比值为关于该故障设备的推荐率。
考虑到反应堆冷却剂泵涉及核安全,因此核电站所使用的冷却剂泵质量要求高,故在收集数据进行试验时,考虑到算法对数据量的需求,选取的反应堆冷却剂泵历史数据集来自同类型的设备数据,使其尽可能反映大数据规律。选取数据集中75%的数据作为训练样本,对其采用业务逻辑与算法结合的方式进行挖掘以生产推荐的关联度,其余25%的数据集作为测试集进行测试,与只使用业务逻辑和只使用算法挖掘关联度推荐相比较,试验结果如图4和图5 所示。
由此可知,随着同类型设备样本的数据逐渐增多,协同过滤推荐算法与业务逻辑相结合的故障设备诊断系统的准确率相比于只使用业务逻辑或只使用协同过滤推荐算法的故障推荐系统要高得多。而且基于业务逻辑与算法结合的故障设备诊断系统相应的推荐率随着样本的数量增多相比其他两种推荐系统也更有优势。
图4 不同分析方法对应的设备故障诊断准确率
图5 不同分析方法对应的设备故障诊断推荐率
采用基于协同过滤的故障推荐方法,通过引入业务逻辑,将专家经验和算法相结合,改进了传统协同过滤算法关联度计算的方法,在样本量充足的条件下,该方法表现出了较高的推荐精度,可为生产过程中的设备故障诊断提供理论参考。