(国网湖北省电力有限公司武汉供电公司,湖北武汉 430077)
随着电网快速发展,投运的变电站数量愈来愈多,二次设备投运数量也在快速增多。与此同时,二次设备出现缺陷的概率也在上升,使检修人员需要更多时间去处理设备缺陷,降低工作效率。
通过查阅二次设备缺陷处理记录,发现某些设备缺陷之间一定程度上存在关联性。面对大量的缺陷处理记录,采用数据挖掘算法使得厘清缺陷之间的关联性成为可能[1-2]。
文中利用韩嘉炜等人于2000年提出的关联分析算法即FP-Growth算法,对变电站二次设备产生的缺陷进行关联性分析[3],能为供电公司检修人员提供缺陷预测功能,可在一定程度上提升工作效率。
在当前技术条件下,武汉市尚在运行的变电站包括综合自动化变电站和智能变电站两种。两种变电站的二次设备在实现方式上存在较大的区别,综合自动化变电站的功能由设备和电缆回路共同决定,而智能变电站则通过网络直接将设备连接起来,实现数据以及资源的共享、功能的集成化。
因此需借助关联规则挖掘算法FP-Growth,分别对两类变电站的设备缺陷进行关联规则分析,以便发掘出其中存在的关联性[4-6]。文中采用FP-Growth算法[7]中支持度与置信度这两种指标来发掘各类设备缺陷之间的关联规则。查阅了过往的缺陷处理记录之后,不难将缺陷分为以下6种类别:主变压器二次设备的缺陷、110kV及220kV线路二次设备的缺陷、母线保护装置的缺陷、10kV线路二次设备的缺陷、备自投装置的缺陷、故障录波装置的缺陷。接下来通过数据挖掘的方式,对以上6类设备的缺陷进行关联性分析[8-9],找到设备中出现故障频次较高的部分,使检修人员的工作效率更高。
由于变电站二次设备缺陷数量多、类型复杂,为了能够进一步分析其中的关联规则,就需要建立相应的模型以便进行数据挖掘。模型建立的流程图如图1所示。
图1 变电站设备缺陷关联规则建模流程图
进行数据挖掘前,需要对数据进行预处理。首先将二次设备的缺陷,按照变电站类型分为智能变电站和综合自动化变电站的缺陷;然后按照前文提到的缺陷分类方式分为6种;然后将设备中常发生故障的部位(易损部位)罗列出来;随后对经数据挖掘得到的关联规则进行支持度和置信度的验证,即可实现二次设备缺陷与易损部位之间的关联性分析;最后将得到的关联规则存入缺陷关联性分析数据库中。
文中采用FP-Growth算法进行关联规则分析。为确定挖掘到的关联规则是否可靠,文中引入支持度与置信度来判定关联规则的可靠性。以下范例中,以项目集N为例,分析事物X与事物Y之间的关联规则:
(1)支持度(support)。在所有的数据中,{X,Y}出现的可能性,即项目集中{X,Y}同时出现的概率,如式(1)所示。
其中N表示项目集的总数。该指标是判断关联规则可靠性的约束条件,能计算出关联规则的出现频率,通过设定最小支持度的阈值(minsup),删去出现频次较低的无意义规则,使频繁出现的关联规则得以保留,筛选出满足式(2)的项集Z,即为频繁项集。
(2)置信度(confidence)。在关联规则中的事件X已经发生的情况下,另一关联规则事件Y发生的概率,即含有X项集情况下,同时含有Y项集的概率,如式(3)所示。
在经过支持度、置信度验证后,剔除出现频率低的干扰因素,筛选出符合条件的关联规则。
以供电公司提供的近3年变电站二次设备缺陷处理记录为例,对变电站二次设备缺陷进行关联规则分析。
经数据预处理后,筛选出共计1560条数据采用FPGrowth算法进行挖掘,寻找其中存在的关联规则;结合专家经验,设置最小支持度为25%,最小置信度为65%。
为验证关联规则分析的准确性,文中将前两年共计1060条数据作为训练样本集,建立设备缺陷关联性分析数据库;再将第三年共计500条数据作为测试集,对挖掘到的关联规则进行匹配与验证。
表1 训练样本集中发现的关联规则
首先对训练样本集的1060条数据进行数据挖掘,将置信度与支持度作为约束条件得到可靠的设备缺陷关联规则,如表1所示。
接下来对训练样本集进行数据学习,挖掘二次设备缺陷与易损部位间存在的关联规则并存入关联性分析数据库。
我们将第3年的500条数据作为测试集,对训练样本集中发现的关联规则进行验证:将挖掘到的关联规则、易损部位与测试集实际得到的关联规则结果进行对比,根据结果得出文中所采用方法的适用性。
通过数据挖掘出的关联规则,从表1中的序号2来看,发现综合自动化站的备自投装置若出现缺陷,可能由于保护装置插件出现故障,能指导检修人员对备自投装置的插件增强维护力度,降低故障发生概率,提高可靠性。而通过表1中的序号5来看,能发现智能站母线保护装置出现的故障,有较大概率是光纤故障引发,可指导检修人员加强光纤的维护。借此建立数据库,发现变电站设备存在的易损部位。
以两个月的时长为分类方式,统计最后一年的数据,如表2所示,用以验证文中算法在综合自动化变电站和智能变电站的适用性。从缺陷查准率的结果中可知,综合自动化变电站较之智能站要高出10%,是由于智能站的大量数据通过网络传输,出现故障的部位分散性较大,不利于检修人员进行维护;而综合自动化变电站通过线缆及继电器实现二次设备的继电保护,出现故障更易处理,故查准率较高。因此文中所采用算法更适用于综合自动化变电站的二次设备缺陷预测。
表2 文中算法在两类变电站的缺陷查准率
文中将二次设备的缺陷按照变电站类型分为综合自动化站和智能站进行分析,采用FP-Growth算法筛选出二次设备缺陷与易损部位之间的关联规则,得出该算法适用性。
结果表明:利用文中算法,能剔除干扰数据,较为高效发现变电站特别是综合自动化变电站中二次设备缺陷与易损部位之间的关联规则,协助检修人员发现二次设备缺陷,保障电网安全稳定运行。