王慧 孙国法 付龙海
摘要:针对现有故障预测模型无法兼顾不同类型数据的特性,预测精度和效率较低等问题,提出了一种将计及罕见变量的动态关联规则挖掘模型和模糊推理系统相结合用于输电线路故障预测。使用外部环境数据(连续和离散特征)用作输入数据,连续特征由集成模型处理,离散特征由计及罕见变量的动态关联规则挖掘模型处理。通过算例对预测方法的性能进行比较分析,验证了该方法的优越性。结果表明,与传统的预测方法相比,该预测模型考虑了不同类型输入数据的特征,可以进一步提高预测效果,有一定的参考价值。
关键词:输电线路;故障预测;环境数据;动态关联;推理系统
中图分类号:TM711.2文献标志码:A文章编号:1001-5922(2023)05-0183-05
Comparativeanalysisof transmissionlinesafetyoperationdatabasedonimprovedDARMmcrmodel
WANG Hui1,SUN Guofa2,FU Longhai1
(1. Yantai Vocational College,Yantai 264000,Shandong,China;
2. Qingdao University of Technology Qingdao 266000,Shandong,China)
Abstract: Aiming at the problems that the existing fault prediction models cannot take into account the characteris? tics of different types of data and low prediction accuracy and efficiency,a dynamic association rule mining model considering rare variables and fuzzy reasoning system were proposed for transmission line fault prediction. External environment data(continuous and discrete features)were used as input data,with the continuous features pro? cessed by the integrated model,and the discrete features processed by the dynamic association rule mining model considering rare variables. The performance of the prediction method was compared and analyzed through an exam? ple to verify the superiority of the method. The results showed that compared with the traditional prediction meth? ods,the prediction model considered the characteristics of different types of input data,which could further im? prove the prediction effect and has a certain reference value.
Keywords: transmission line;fault prediction model;external library data;dynamic association rule;fuzzy infer? ence system
近年来,电网结构不断优化,输电能力和供电水平不断提高[1]。然而,输电线路长期暴露于大气环境,易发生导线外部材料老化进而导致粘连等情况,且部分线路由于材料质量较差,无法有效承受较大荷载电力,导致输电线路极易破损。其可靠运行与气象环境密切相关,如何有效防治输电线路故障,仍是当前研究的重点[2]。利用先进的智能技术预测输电线路故障,进行差异化运行维护,降低输电线路故障发生的可能性,提高供电可靠性。因此,对输电线路故障预测方法进行研究具有重要的实际意义。
国内外学者从多方面对输电线路故障预测方法提出了一些可能的解决方案,取得了一些优异的成果。提出一种结合朴素贝叶斯算法和时间序列相似性匹配相构建输电线路故障预警模型。与传统预测模型相比,该模型能更好地挖掘故障因子,预测结果更准确[3]。提出了一种将BP 神经网络与改进的粒子群优化(PSO)算法相结合的输电线路雷电故障预测方法。该方法预测雷击的准确性在80%以上,有一定的参考价值[4]。将改进自组织映射聚类算法用于电力系统连锁故障预测模型。该方法能在更短的时间内预测故障线路,覆盖率达97%。这不仅有效地缩短了预测时间,而且扩大了预测范围[5]。将最小二乘支持向量机算法、模糊评价和粒子群优化算法相结合用于输电线路故障率预测。该方法可以顯著提高预测精度,更适合于输电线路故障率的预测[6]。
基于此,提出了一种将计及罕见变量的动态关联规则挖掘(DARMmcr)模型和模糊推理系统(FIs)相结合用于输电线路故障预测。使用外部环境数据(连续和离散特征)用作输入数据,连续特征由集成模型处理,离散特征由DARMmcr模型处理。通过算例对该预测方法进行验证。研究结果可为线路故障预测提供参考依据,且可为线路老化、导线粘接等情况提供参考。
1 模型构建
1.1 模糊推理系统
模糊系统是在模糊集合上定义输入、输出和状态变量,模糊系统模拟人的综合推理,它能较好地解决非线性问题,在自动控制、模式识别、决策分析等领域应用广泛[10-12]。
模糊推理是指基于模糊逻辑的映射,它有2种类型:Mamdani 和Sugeno[13]。但它们之间的区别主要在于输出决策方法。更常用的 Mamdani 型模糊推理系统输出隶属度函数是模糊集,而Sugeno型为线性或常数。本文采用 Mamdani 型模糊推理系统分析概率模糊风险。
典型的模糊推理系统结构如圖1所示。主要由3部分组成,模糊化、模糊运算、去模糊化。
1.2 计及罕见变量的关联规则挖掘模型
鉴于研究主要针对长期预测,由于数据量较小,执行时间相对可控[14]。因此,文中主要目标不是减少算法的执行时间,因此关联规则挖掘算法采用 FP-growth算法。
FP-growth 算法基于AprilI原理。它通过在 FP (Frequent Pattern)树中存储数据来检测频繁项集,但不能检测数据之间的关联规则。FP-growth 算法只需要扫描数据库2次,而AprilI算法需要为每个潜在的频繁项集扫描数据集一次,FP-growth 算法计算速度大大提高[15]。FP-growth算法流程如图2所示。
FP-growth 算法使用相同和固定重要性的诊断标准评分计算方法和阈值设置方法,罕见变量被丢弃,但实际故障与丢弃变量有一定的关联性。
评价指标如下,输入环境元素集合 I {v1. v2. v3.…},故障记录为 D {t1. t2.…. tm}。
支持度为输入数据库中含有 X 的记录占总数的比例,如式(1)所示[16]。
式中:D 为输入数据库;X 为输入元素集合的子集。置信度为同时含有 X 和 Y 的记录数量占 X 的百分比,如式(2)所示。
式中:Y 为目标变量。
提升度为 X 和 Y 共同出现的频率大于预期,如式(3)所示。
信服度为 X 出现与 Y 未出现2个概率的乘积与同时满足概率的比值,如式(4)所示。
杠杆度为并非完全独立的期望下与无此期望下 X 和Y 同时出现在 D 中的概率的差值,如式(5)所示。
因此,基于上述诊断标准,提出了相应条件形式分数计算方法,进一步挖掘HILP元素。如果关联规则Xg +Xr喻 Y 包含特定环境特征 fj 中的罕见环境元素,得分计算方法如式(6)所示[17]。
式中:Rg为数值区间,[2,(n +1)];i =2,3, … , ( m +1)为 Dy 的一行;Xg、Xr分别为常见和罕见变量集。
1.3 计及罕见变量的动态关联规则挖掘
在前面模型基础上,结合环境风险指数(ERI)和时间风险指数(TRI),建立双重风险指数TFRI的计算模型[18]:
式中:mE、mT为相应权重,文中采用mE = mT =1;θhS为一个季度的TRI 数值;θej. k为单个元素ej.k的ERI 数值。
预测模型的应用将影响ERI 和TRI,因为在不同的时间段,由于不同的故障,持续时间会发生变化[19]。
Dy eD ={D1.D2.D3.….Dy .….Dz}为输入数据库 D 中任一年份的数据,基于此设置,TFRI 模型的参数每年自适应动态调整1次;图3为DARMret模型的预测流程。
2 算例结果与分析
2.1 算例参数设置
为了验证方法的性能,将通过算例分析该方法在各种场景下的性能。设备为联想PC。文中的输入数据来自某省高压输电系统,能够提供足够的故障样本,满足研究预测方法的需要。分析采用2016年至2021年系统110 kV及以上线路的故障,气象数据由中国气象局提供,数据每1 h更新1次。采用9个环境特征和9个气象特征进行预测,表1所示为气象特征和包含的元素。
2.2 算例分析
2.2.1 专家权重优化分析
为了减少预测过程中的误差,共测试了9组。FIs 和DARMmcr预测模型各专家权重比分别为9/1、8/2、7/3、6/4、5/5、4/6、3/7、2/8和1/9,优化专家权重的过程使用AUROC 作为实际预测效果的度量标准;不同权重的误差变化如图4所示。
从图4可以看出,在所有3种故障处理结果的预测中,采用9/1专家权重时,误差降低幅度均为最大。然而,误差值本身的数值结果表明,当分别使用8/2、5/5和9/1的专家权重时,预测结果误差最小。综合考虑,本文采用9/1、7/3和9/1的专家权重,后续可以进一步测试找到最优权重。
2.2.2 预测结果分析
根据不同的预测对象,根据3类故障的结果,将这些故障记录分为3组进行验证。在算例中,首先,对于表1中的离散特征,通过诊断标准计算方法挖掘每个环境特征的罕见环境元素。初始阈值分别设置为 min supp 0.2、minconv01.1、minlift00.6、 minconv01.1、minleve00.1。离散特征通过DARMmcr模型进行分析,罕见元素如表2所示。
通过一个实例将本文所提预测模型与DARMmcr预测模型和FIs 的预测结果进行了比较;不同模型预测结果的比较如表3所示。
首先,在算例中基于ROC 曲线比较了本文模型、DARMmcr模型和FIs 模型的预测结果,比较结果如图5所示。
结合图5和表3的预测结果可以看出,与FIs 和DARMmcr预测模型相比,提出的模型在AUROC 的得分最高,AUROC 得分平均增加了6.9%、9.9%。模型的预测结果MaxKS距离最大,与FIs 和DARMmcr预测模型相比,分别提高了18.5%和19.9%。说明所提预测模型在3类故障预测中取得了良好的预测效果。
2.2.3模型对比
将提出的模型与文献[20]的预测模型进行对比分析。提出的模型与文献[20]模型的预测结果比较,具体如表4所示。
由表4可知,所提处的预测模型在雷击、动物、数目、违法施工、设备故障方面的预测准确率都优于文献[20]的预测模型。文献[20]模型相较于正常ARM 模型有一定的提升,这是因为提出的预测模型能够利用几乎所有环境特征,提高了模型的适应性和全面性。
3 结语
针对现有故障预测模型无法兼顾各类数据的特征,预测精度和效率不高的问题,提出了将DARMmcr模型和FIs 相结合用于构建输电线路故障预测模型,外部环境数据(连续和离散特征)用作输入数据,连续特征采用文中集成模型处理,离散特征采用DARMmcr模型处理。预测3种故障处理结果,在综合考虑误差值和误差降低幅度时,专家权重比9/1、7/3和9/1被用作处理结果预测为“成功”、“合格”和“失败”的权重比。该研究具有一定的实用价值。与传统的预测方法相比,文中的方法具有一定的实用性。
【参考文献】
[1] 何昕雷.基于模糊 PID 算法的自动控制研究[J].粘接,2022,49(3):177-181.
[2] 谢桦,亚夏尔·吐尔洪,陈昊,等.基于支持向量机算法的配电线路时变状态预测方法[J].电力系统自动化,2020,44(18):74-80.
[3] 郑茂然,余江,陈宏山,等.基于大数据的输电线路故障预警模型设计[J].南方电网技术,2017,11(4):30-37.
[4] 吴琛,苏明昕,谢云云,等.基于BP 神经网络的输电线路雷击故障预测[J].电力工程技术,2020,39(5):133-139.
[5] 宋玉琴,赵攀,周琪玮.基于改进自组织映射聚类算法的连锁故障预测模型[J].科学技术与工程,2021,21(3):1037-1044.
[6] 方权,刘闯,宋敏,等.模糊评价与PSO 优化的LSSVM 架空输电线路故障率预测[J].水电能源科学,2021,39(1):171-175.
[7] 余梦天,熊炜.计及冲击风险及分布熵的电网连锁故障预测[J].电力科学与工程,2019,35(5):19-25.
[8] 费春国,霍洪双.基于电流振幅与SVM的输电线路故障分类[J].电力系统及其自动化学报,2019,31(4):139-144.
[9] 鄒豪,曾祥君,喻锟,等.基于零序电压调控的故障选线选相新方法[J].电力系统保护与控制,2020,48(15):69-76.
[10] 常安,宋云海,张晗,等.考虑参量有效性的输电线路状态评估方法研究及应用[J].高压电工,2017,53(6):72-78.
[11] 尹桂来,李侣,陈田,等.吸能超双疏防覆冰涂层对输电线路防覆冰影响研究[J].粘接,2022,49(4):37-40.
[12] 童晓阳,余森林.基于随机矩阵谱分析的输电线路系统故障检测算法[J].电力系统自动化,2019,43(10):101-115.
[13] 易俊,卜广全,郭强,等.巴西“3·21”大停电事故分析及对中国电网的启示[J].电力系统自动化,2019,43(2):1-9.
[14]LiHJ,HabibiS,AscheidG. Handoverpredictionfor long-termwindowschedulingbasedonSINRmaps[C].2013 IEEE 24th Annual International Symposium on Per? sonal,Indoor,andMobileRadioCommunications(PIM? RC). London,UK:IEEE Press,2013.
[15] 王毅星.基于深度学习和迁移学习的电力数据挖掘技术研究[D].杭州:浙江大学,2019.
[16]DHIMISH M,HOLMES V,MEHRDADI B,et al. Photo? voltaicfaultdetectionalgorithmbasedontheoretical curves modelling and fuzzy classification system[J]. Ener? gy,2017,140(1):276-290.
[17] 胡程平,陈婧,胡剑地,等.配电台区线损率异常自动检测系统设计[J].粘接,2022,49(5):188-192.
[18] 曹海红.基于双DSP的异步电机控制系统设计[J].粘接,2021,47(8):143-146.
[19] 李振璧,张坤,姜媛媛,等.基于变分模态分解与近似熵的输电线路两相接地故障诊断[J].科学技术与工程,2018,18(5):70-75.
[20]DOOSTANM,CHOWDHURYBH. Powerdistributionsystem fault cause analysis by using association rule min? ing[J]. Electric Power Systems Research,2017,152(1):140-145.