智能变电站三层两网结构下二次系统运检关键点分析

2021-11-15 09:21邹子豪
湖北电力 2021年4期
关键词:项集关键点关联

邹子豪,邓 辉

(国网湖北省电力有限公司武汉供电公司,湖北 武汉 430014)

0 引言

目前来看,智能变电站的占有率呈逐年上升的趋势,三层两网这一结构亦更加的完善。但这也给运检人员带来了新的关注点,三层两网结构的关键点还不明确,目前需要花费较多时间进行经验总结,影响了工作效率。关键点则指的是其中功能较为重要,需要重点关注的设备,一旦发生故障将会对整个三层两网结构造成较大影响。

因此运检人员对三层两网的关键点进行分析,通过查阅实际工作中记录的数据,可以发现关键点中存在着一定的相关性。那么引入数据挖掘算法[1-8],对关键点进行关联性分析[9-15]便成为了可能。

文中利用经典关联分析算法Apriori 算法[16-24],对智能变电站三层两网结构中的关键点进行关联规则挖掘[25-30]。借助该算法可协助运检人员更快找出三层两网结构中的关键点,在某些方面提高变电站运行稳定性。

1 关键点分析

对于智能变电站来说,三层两网结构是由站控层、间隔层、过程层、站控层网络、过程层网络五个部分共同组成。站控层包括监控主机、数据通信网关、数据服务器、综合应用服务器、PMU 数据集中器和计划管理终端等;间隔层包括继电保护装置、测控装置、故障录波装置、网络记录分析仪、稳控装置等;过程层包括合并单元、智能终端、智能组件等;站控层网络包括站控层中心交换机和间隔交换机;过程层网络包括GOOSE网络和SV网络。

面对三层两网结构中数量如此庞杂的设备,寻找并发现其中存在的关键点,能够为变电站稳定运行提供有力的支持。然而仅凭运检人员的经验总结,无法量化分析关键点。因此借助数据挖掘算法中的关联分析算法Apriori,可以对运行过程中出现的大量数据进行高效准确分析,并寻找出其中的关联规则,便于三层两网结构关键点的确定,并且指导运检人员更精确地对三层两网结构关键点出现的设备故障进行处理。

2 关键点关联规则建模

面对智能变电站三层两网结构中涉及到的大量设备,可采用关联分析算法进行数据挖掘并寻找出其中的关键点。为了直观分析其中的关联规则,建立了相应的算法模型以便理解。建模的流程图如图1所示。

图1 三层两网关键点关联规则建模流程图Fig.1 Three-layer two-network key point association rule modeling flowchart

数据挖掘开始之前,应当进行数据预处理。随后将智能变电站三层两网结构中涉及到的设备,按照结构分为五大部分,分别是:站控层、间隔层、过程层、站控层网络以及过程层网络。随后分别对各个部分进行关联分析,采用Apriori 算法,引入支持度、置信度以及提升度,从3 个维度来验证所得出关联规则的可靠性与准确性,从而得出每个部分的关键点所在。最后利用得出的关联规则,即可形成关键点分析数据库,为智能变电站三层两网结构关键点的确定提供支持。

3 利用Apriori算法进行关键点分析

文中采用的Apriori 算法是一种古典关联分析算法,其原理是:如果某个项集是频繁的,那么它的所有子集也是频繁的。同时研究人员指出Apriori 算法可以帮助减少计算量,它能够按照专家经验设置的支持度、置信度、提升度,对数据集进行反复迭代的同时剔出不符合条件的数据,从大规模数据集中寻找事物间的隐含关系,即频繁项集。基于这种特性,借助该算法可以从变电站二次系统海量数据中发现其中的关键点之间存在的关联规则,从而实现三层两网结构关键点的确定。

在关联规则分析中,通常需要引入限定条件,来使得分析结果更加准确。文中采用的是支持度、置信度以及提升度3个限定条件来对分析结果进行处理。接下来,以项目集N为例,处理事物X与事物Y之间的关联规则。

1)支持度(support):在所有的数据中,{X,Y}出现的可能性,即项目集中{X,Y}同时出现的概率,如式(1)所示。

式(1)中,N表示项目集的总数,是判断关联规则可靠性的约束条件,能计算出关联规则的出现频率。通过设定最小支持度的阈值(minsup),消去出现频次较低的非频繁项集,使频繁出现的关联规则得以保留,筛选出满足式(2)的项集Z,即为频繁项集。

2)置信度(confidence):在关联规则中的事物X已经出现的情况下,另一关联规则事物Y出现的概率,即含有X项集情况下,同时含有Y项集的概率,如式(3)所示。

3)提升度(lift):指事物X和事物Y一同出现的频率,提升度大于1且越高表明正相关性越高,提升度小于1且越低表明负相关性越高,提升度等于1表明没有相关性,如式(4)所示。

经过支持度、置信度以及提升度的筛选,即可消除非频繁项集,得出有效的关联规则。

4 算例分析

为寻找三层两网结构的关键点,从供电公司搜集了近3年某市110 kV以及22 kV智能变电站三层两网设备发生的全部异常运行情况,对三层两网设备与发生在其中的故障进行关联规则分析。

经数据预处理后,筛选出共计1 028条数据用于数据挖掘,分析了三层两网设备与设备故障之间的关联规则;结合专家经验,设置最小支持度为0.3,最小置信度为0.7,采用Apriori 算法对数据集进行挖掘,寻找其中存在的关联规则,并在得出关联规则结果后,计算其提升度,删去提升度小于1的项集。

为验证关联规则分析的准确性,文中将前两年共计630 条数据作为训练样本集,建立设备缺陷关联性分析数据库;再将第三年共计398条数据作为测试集,对挖掘到的关联规则进行匹配与验证。

首先对训练样本集的630 条数据进行数据挖掘,将置信度与支持度作为约束条件得到三层两网设备与发生在其中的故障之间关联规则,如表1所示。

表1 训练样本集中发现的关联规则Table 1 Association rules found in the training sample set

然后对训练样本集进行数据学习,挖掘三层两网设备与发生在其中的故障之间存在的关联规则并存入关键点分析数据库。

分析数据挖掘出的关联规则,从表1中的序号2可以得出,运检人员在日常工作时,对间隔层的继电保护装置光纤应着重注意,如若出现故障会影响保护装置正常运行,可以视为三层两网结构的一个关键点。而通过表1中的序号4能够发现,站控层中心交换机是站控层网络中至关重要的一环,若出现故障将影响全站的通讯功能,有可能使得变电站陷入半瘫痪状态。通过Apriori 算法挖掘到的关联规则建立数据库,能够发现智能变电站三层两网结构中存在的关键点。表1筛选出的8 条数据,其提升度均大于1,可以认为它们之间存在着强关联规则,即可认为以上8 条关联规则即为智能变电站三层两网结构中存在的关键点。

之后将第3年的398条数据作为测试集,对训练样本集中发现的关联规则进行验证:将训练样本集通过数据挖掘得出的三层两网关键点(如表1所示)与测试集中通过实际统计得到的三层两网关键点结果进行对比,根据结果得出文中所采用方法的准确性,如图2所示。

图2 三层两网关键点分析验证流程图Fig.2 Three-layer two-network key point analysis and verification flow chart

最后,将验证的结果进行统计,如表2 所示,以便直观得出文中方法对智能变电站三层两网结构关键点分析的准确性。为排除季节对三层两网设备的影响,将时间划分为四季,分时间段验证准确性。从结果可看出,文中提出的方法对于三层两网关键点的查准率可达85%以上。

表2 文中算法的关键点查准率Table 2 The key point precision rate of the algorithm in the article

5 结语

文中将智能变电站三层两网的结构按照结构类型分为5 种进行分析,采用Apriori 算法筛选出三层两网设备与发生在其中的故障之间的关联规则,得出该算法的准确性。

结果表明:利用文中算法,可较为高效发现智能变电站中三层两网设备与发生在其中的故障之间的关联规则,能够发现其中的关键点,为运检人员的日常维护检修工作提供支持。

由于智能变电站三层两网结构较为复杂且重要,而运检人员的经验尚不够丰富,无法高效发现三层两网结构中的关键点。而借助文中的关联分析算法则能够对大量的历史数据进行有效的处理,并得出其中存在的关键点,协助运检人员在日常工作中对三层两网结构的关键点进行重点维护,为变电站稳定运行提供支持。

猜你喜欢
项集关键点关联
基于共现结构的频繁高效用项集挖掘算法
论建筑工程管理关键点
肉兔育肥抓好七个关键点
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
建筑设计中的防火技术关键点
“一带一路”递进,关联民生更紧
基于矩阵相乘的Apriori改进算法
奇趣搭配
不确定数据中的代表频繁项集近似挖掘
智趣