钟文晶,陆 陆,胡伯勇
(1.浙江省火力发电高效节能与污染物控制技术研究重点实验室,杭州 310000;2.浙江浙能技术研究院有限公司,杭州 310000)
继电器在电厂中有广泛的应用,特别是保护用的继电器,对机组的稳定运行具有重要意义。近年来,随着机组控制系统老化,由继电器引起的跳机事件开始出现。由于继电器属于相对容易忽视的对象,热工相关人员对其选型和维护有一定的盲目性,对继电器所发生的故障进行分析显得十分重要。因此,有必要对热工保护用重要继电器故障常见的原因进行分析。
热工保护用继电器的检测工作开展的较少,对热工保护用继电器故障数据分析的文献也相对较少。关联规则挖掘是数据挖掘的一种重要方法,能从客观的数据中发掘隐藏的内部联系,提供有价值的信息[1]。该方法在电厂中运用也有先例,如电站运行优化目标值[3,4],辅机设备故障分析[5]等。基于此,本文将尝试着把关联规则挖掘方法应用在热工保护用继电器故障分析中,得出影响继电器故障的主要因素。
表1 测试数据离散化后整理表Table 1 Test data after discretization table
本文数据取自浙能集团所属各电厂继电器测量数据,共包括10 个电厂,22 台机组,1724 条数据,其中包括100条不合格数据。由于测量时间跨度较大,表格格式都不一样,因而需要对原始数据进行整理。数据内容统一为:电厂名称、继电器位置、端子号、继电器类型、动作值、返回值、线圈电阻、动作时间、问题表现、继电器电压、使用年限等。对缺失的数据进行补充,使数据准确。
参照厂家资料和实际使用情况以及相应的标准,以下继电器列为故障继电器。
1)动作电压大于90%额定电压。
2)返回电压小于10%额定电压。
3)线圈电阻偏离额定50%。
4)动作时间大于100ms。
5)导通后触点电阻大于1Ω。
本文采用的Apriori 算法属于布尔型关联规则算法[2],只能处理分类型变量,不能处理数值型变量。因此,需要对整理后的数据再进行整理,数据类型为离散型,离散化后的数据参考样式如表1 所示。
其中,检测结论1 对应无故障,2 对应故障。
继电器使用时长:因机组大修周期为5 年,所以1 对应小于5 年,2 对应5 ~10 年,3 对应10 年以上。
常带电:因有些继电器常带电,有些不常带电,所以1 对应常带电,2 对应不常带电。
继电器品牌:继电器品牌较多,具体分类Allen-Bradley 对应1,C 系列对 应2,OMRON 对应3,KUEP 对应4,RR3P 对应5,TYCO 对应6,YSMY0 对应7,其他对应8。
继电器额定电压:电厂常用继电器额定电压包括:DC24V 对 应1,DC48V 对 应2,DC110V 对 应3,DC220V对应4。
关联规则挖掘算法中最经典的是Apriori 算法,它是由R.Agrawal 和R.Srikant 提出的一种挖掘关联规则频集的算法。该算法采用的是逐层搜索迭代的方式,先产生候选集Ck,然后计算所有k 项集的支持度,若支持度满足大于最小支持度阈值要求,则成为频繁k 项集Lk,接着在Lk基础上产生候选集Ck+1,然后通过判断最小支持度来确定频繁(k+1)项集Lk+1,以此类推,直到找不到下一个频繁项集为止。由每个频集中的项组成关联规则,分别计算出规则的置信度,若置信度大于最小置信度阈值,则生成关联规则,同时满足最小支持度和最小置信度要求的规则成为有效规则。因此,Apriori 算法分为两步,第一步产生频集,第二步产生关联规则。
2. 《江苏省产前诊断(筛查)技术质量管理要求》(包括遗传咨询、血清学产前 筛查、产前超声诊断、介入性产前诊断取样操作技术、胎儿染色体分析产前诊断技术、孕妇外周血胎儿游离 DNA 产前筛查与诊断、单基因病产前诊断技术、染色体微阵列分析产前检查等八类技术)。
定 义 一 个 关 联 规 则:A=> B 其 中,A 和B 表 示 的 是两个互斥事件:A 称为前因(antecedent),B 称为后果(consequent),上述关联规则表示A 会导致B。关联规则的强度可以用它的支持度(support)和置信度(confidence),S(A=> B)=P(AB),C(A=> B)=P(B|A)=P(AB)/P(A)
可以看出,支持度即两个事件同时发生的概率,置信度即在前因发生的条件下,后果发生的概率。在选取规则时通常会对这两个值设一个最低阈值最小支持度minsup和最小置信度minconf。注意由关联规则分析得出来的关联规则并不保证具有因果关系。
项集(itemset)被定义为包含0 个或多个项的集合,支持度大于阈值minsup的项集被称为频繁项集(frequent itemset),频繁项集中置信度大于阈值minconf的规则称为强规则(strong rule)。关联规则的目的就是找到频繁项集与强规则。由概率出发不难得到关于频繁项集的一个性质:频繁项集的所有子集都是频繁的,即P(A)≥P(AB)≥minsup;非频繁项集的超集都是非频繁的,即minsup≥P(A)≥P(AB)。这一性质能大大减少搜索频繁项集时的搜索空间。
数据挖掘一般通过软件或自己编程实现,Clementine数据挖掘软件有界面简单、功能齐全等特点,能够满足本文的需求,采用Clementine 数据挖掘软件进行挖掘[6]。
挖掘过程
建立挖掘流程:数据源采用离散化后的热工保护用继电器测试数据。
表2 继电器测试数据关联规则挖掘结果Table 2 Mining results of association rules of relay test data
图1 Clementine软件使用示例Fig.1 Clementine software usage example
挖掘参数设置:综合对比不同阈值下多次处理结果差异,最终设置最小支持度10%,最小置信度为10%,前项最大项目数为4。
将结果按照支持度大小排序呈现,见表2。
如第一条,后项为继电器故障,前项为继电器品牌OMRON,电压为24V,不常带电。它的支持度为33.5%,它的置信度为10%。
从表2 中的结果可以得到以下几点:1)强关联因素为继电器品牌和继电器使用时间;2)品牌为OMRON 的24V继电器与继电器故障率关联度最高;3)继电器使用时长超过10 年,故障率开始大幅上升;4)继电器常带电和不常带电并不影响继电器的故障率,不常带电的故障率反而更高。
图2 OMRON 24V继电器外观Fig.2 Appearance of OMRON 24V relay
数据挖掘只是根据结果进行分析,具体原因要结合实际。如图2 所示,OMRON 24V 继电器。该继电器两侧有孔,直接与空气相连,内部空间较大,南方湿气较重,灰尘和水汽都能进入继电器内部,从而造成触点氧化,容易引起继电器故障。而一般的24V 继电器如:C5-M20,如图3 所示。密封性较好,灰尘较难进入继电器内部。
建议:
1)热工保护用继电器建议选择密封性较好的继电器,且尽量保证继电器所在的电子间环境的灰尘较少,湿度较低。
2)运行时间10 年以上的继电器故障较高,建议5 年做一次继电器检测。
图3 C5-M10 24V继电器外观Fig.3 Appearance of c5-m10 24V relay
本文通过使用关联规则算法对热工保护用继电器故障数据进行分析,得出继电器类型和继电器使用时长是产生继电器故障的强关联因数,从而给出了热工保护用继电器选型和维护的建议,以减少继电器故障。