基于气象数据挖掘的输变电设备故障预警

2016-08-17 01:57黄灿王东殷舒怡徐梦婵唐晨涛
新型工业化 2016年5期
关键词:项集数据挖掘关联

黄灿,王东,殷舒怡,徐梦婵,唐晨涛

(南京工程学院电力工程学院,江苏南京211167)

基于气象数据挖掘的输变电设备故障预警

黄灿,王东,殷舒怡,徐梦婵,唐晨涛

(南京工程学院电力工程学院,江苏南京211167)

目前,分析气象环境对电网安全的影响,大都分析高温、大风、雷击等单因素对电网故障影响,忽略了输变电设备实际运行中应处于多维气象环境中,并难以确定气象因素与电网故障的定量关联关系。本文将数据挖掘技术中的关联规则应用到输变电设备故障与气象因素关联分析中,通过Apriori算法挖掘大量历史相关数据,分别建立了一维极端气象、多维气象因素与输变电设备故障的关联规则。通过算例验证了算法的可行性。在此基础上,建立基于气象数据挖掘的输变电设备故障预警流程,可根据气象预报信息对输变电设备故障预警。

电气工程;Apriori;数据挖掘;输变电设备;故障预警

本文引用格式:黄灿,王东,殷舒怡,等.基于气象数据挖掘的输变电设备故障预警[J]. 新型工业化,2016,6(5):33-39.

0 引言

近年来,全球恶劣极端天气频发,导致国内外电网事故不断增多。雷电、暴雨、大风、浓雾、高温、低温等气象因素均有可能导致输变电设备损坏。2008年1月我国南方地区低温雨雪冰冻灾害造成大范围电网瘫痪,直接经济损失达1516亿元[1]。2009年8月27日,受局地大风灾害影响,石家庄栾城县发生多处倒杆、断杆、断线,有6条线路和 4 座变电站全部停电[2]。2009年11月10日,由于闪电暴雨引发电力线路故障,巴西最大的2个城市里约热内卢和圣保罗以及周边地区发生大停电,超过 1/4 的巴西人突然遭遇黑暗[3];2012年7月30日,由于高温湿热天气,印度国家电力设施因为负荷过重、设备过热而崩溃,导致印度 14个州出现停电状况,6亿居民的生活受到严重影响[4]。2005年 1 月 8 日和9 日,瑞典西南部遭遇飓风袭击,致使当地 40 多万户家庭和机构停电,直接损失几十亿瑞典克朗。由此看出,分析气象条件对电力系统的影响以便日后采取针对性措施来抵御和减轻事故损失是十分必要的。

目前,国内已有学者对气象因数与电网安全的影响做过相关的研究,文献[1]通过复杂网络理论仿真表明在恶劣气象条件下电网的脆弱性,文献[2-3]主要论述了停电防御系统应考虑气象信息,提高电网可靠性,文献[20]分析了气象因素对江苏电网的影响,并提出建立电网灾害监测及预警系统的总体防御思路,文献[21]介绍了用因子分析法,提取了温度因子、降水因子等主要因素,基于 Logistic 回归建立了气象因素对电力事故的影响模型,通过算例验证了其准确性。

本文以江苏省2014年变压器故障数据、气象数据为例,通过Apriori算法挖掘气象因素与变压器故障之间关联性,并建立关联规则,验证Apriori算法应用于输变电设备故障预警的可行性。在此基础上建立基于气象数据挖掘的输变电设备故障预警流程,为建立输变电设备气象环境防御系统作基础[6]。

1 基于关联规则的数据挖掘技术

1.1关联规则的基本概念

数据挖掘一般是指利用算法从大量数据中探索、发掘隐藏信息的技术,故数据挖掘亦称作知识发现。关联规则挖掘是数据挖掘技术的一种,若两个或多个变量的取值之间存在某种规律性就称为关联。

关联规则可定义为:设I={i1,i2,…,id}为所有项的集合,D为所有事务的集合,每个事务T是一些项目的集合,即T={t1,t2,t3,…,tn},每个事务T包含的项集都是I的子集,即且每个事务T由被称为TID的识别器唯一标识,事务集D中的关联规则表示为蕴涵式X→Y,且X∩Y=Φ,一般X称为前提或先导,Y称为后续或后继。

关联规则表述的是一种关联关系,这种关联关系在一定概率约束下才有意义。关联规则强度可以通过它的“支持度”和“置信度”来衡量。

支持度指X和Y这一事件组合在总事务记录中出现的概率。关联规则在D中的支持度(S),记为:

置信度指X和Y这一事件组合发生次数除以Y事件的所有发生次数。关联规则在D中的置信度(C),记为:

支持度是对关联规则的重要性的度量,表示关联规则的频度;可信度是对关联规则的准确度的度量,表示规则的强度。当规则的置信度和支持度分别大于专家或用户设定的最小支持度、最小可信度时,我们认为规则是有效的,称为强关联规则。当数据项集X的支持度大于最小支持度时,称之为频繁项集或高频数据项集。频繁项集按其集合内数据项个数N可将其命名为频繁N项集,例如所有含有3个数据项的频繁项集称为频繁3项集。

1.2Apriori算法

关联规则挖掘的一个经典算法是RakeshAgrawal 于1993年提出的Apriori算法。该算法思想比较简单,采用递归的方法来发现频繁项集[23]。

Apriori算法的核心思想是把发现关联规则的工作分为两步:第一步通过迭代检索出事物数据库中的所有频繁项集;第二步从频繁项集中构造出满足用户最低信任度的规则。Apriori算法的运行依据以下两条基本原则:某频繁项集的所有子集都是频繁项集;非频繁项集的所有超集都不是频繁项集。利用这两条原则,可以快速剔除多元素项集中低于最小支持度的项集,一定程度上缓解数据I/O过大的问题、提高算法运行效率。

Apriori算法的描述如下:

1. 扫描数据库,将所有第一次扫描到的项加入频繁1项候选集C1,同时对C1中所有项进行计数统计。

2. 修剪频繁1项候选集C1,即进行关联规则支持度检验,剔除C1中低于最小支持度的项并生成频繁1项集L1。

3. 将L1中的元素两两结合生成频繁2项候选集C2,扫描数据库,对C2中所有项进行计数统计。

4. 修剪C2,生成频繁2项集L2。

……

5. 取频繁K项集LK的(K+1)元素子集CK+1,修剪CK+1,生成频繁K+1项集LK+1。

6. 重复上述过程,直至集合L中的元素个数为0。

2 基于数据挖掘气象因素与输变电设备故障关联规则

2.1气象因素对输变电设备的影响

在所有输变电设备中,绝大多数长期暴露于室外无遮挡环境,如杆塔、各电压等级线路、室外变压器等。一般情况下可以认为,设计合理的输变电设备的故障、损坏,主要来自于:偶发的人为因素如车辆撞倒杆塔、长期暴露于自然环境带来的设备老化或特殊气象环境造成的设备故障[5]。本文认为:前两种情况可以通过加强管理或按期检修解决,而特殊气象状况与输变电设备故障之间存在可被发掘的关联规则,这些关联规则在长期、大量的故障数据中以概率的形式呈现。例如:在电网实际运行中,狂风气象往往会伴随着倒杆、断线等事故[4]。此时,倒杆、断线等故障的发生概率是高于气象正常情况的。即:狂风与倒杆或狂风与断线这两种组合中的项存在一种关联规则。

目前,电力公司大都已与当地气象部门展开合作[13-16],实现气象预报、实时气象信息共享,部分电力公司对重要的高压变电站和输电线路安装了微气象在线监测装置[8],以江苏为例,截止2014年,江苏地区共安装了85台,通过大量的天气信息,可为电网安全提供预警和实时评估。本文选取江苏省2014年历史气象数据,以及对应电力故障数据,通过Apriori算法挖掘气象因数与输变电设备故障之间的关联规则。

2.2输变电设备故障与气象因素特征量选取

气象因素与输变电设备故障之间的关联规则可由关联规则蕴含式X→ Y表达,其中:

X= {气象因素1,气象因素2,……,气象因素n}

Y= {设备故障1,设备故障2,……,设备故障n}

通过Apriori算法挖掘以上关联规则X→ Y,首先需要选取关联规则分析中的数据项集:

I={x1,x2,…,xn,y1,y2,…,yn}

在实际运行中,气象状况往往与地理位置相关,例如江苏地区较东北三省,寒冷气候持续时间短、气温高。数据挖掘算法中应对此予以考虑,本文不作过多探究,仅以江苏地区为例验证算法可行性。

结合江苏地区长期气象状况与中国气象局部分气象等级划分标准,本文选取24种气象因素并作等级划分,见表1。各等级对应气象因素特征量x1-x24。同时,选取如表2所示的26种常见输变电设备故障类型,对应故障特征量y1-y26。所有气象因素特征量x与故障特征量y共同组成前述关联规则数据项集I。

表1 气象因素等级分级表[9-10]Tab.1 Classification table on meteorologic factors

表2 输变电线路故障分类表[7]Tab.2 Fault classification table on transmission lines and transformers

2.3气象因数与输变电设备故障之间的关联规则分析

利用前文所述Apriori算法,对气象因素特征量X={x1,x2,…,x24},输变电故障Y={y1,y2,…,y26}的相关性进行分析,寻找X→Y。

实际运行中,某些特殊气象出现次数极少,此情况下的关联规则往往因为支持度过低而被算法过滤,但设备在这类情况下故障概率的提高却是客观存在的。因此,对新的故障数据,必须进行关联规则的更新。而Apriori算法的主要缺陷之一是数据I/O过大,每次对某数据项集进行计数统计都需完整扫描一遍数据库。对某一新故障数据的加入,进行完整的算法运行是不科学的,浪费了时间与计算资源。

基于以上问题,本文对Apriori算法的关联规则挖掘及关联规则更新作如下修改[11]:

1.首次挖掘关联规则时,不对候选项集进行修剪,保留所有关联规则,并记录所有候选项集支持度、置信度计算公式中的计数信息,建立候选项集数据库。

2.加入更新机制:对于新故障数新,首先分析其包含的x、y信息,得到此事务的候选1项集合,即Ix={xi,xj,xk,…,yi,yj,yk,…},然后对Ix中的元素进行取并集计算,再将计算结果与候选项集数据库进行比对。对于比对完全一致的关联规则,将其支持度、置信度计算式做如下修改:

3.最后将候选项集数据库中事务T总数加一,并重新计算所有支持度、置信度。

候选项集数据库的数据量相比于对原始故障、气象数据库的数据量,已大为减少。气象、故障特征数量变化一般来说是很小的,而所有更新操作仅为修改候选项集数据库中的计数值,并不会造成候选项集数据库的规模增长。故以上修改大幅降低了计算资源,其流程图表述如下:

2.4算例分析

本文收集了江苏省2014年全年的变压器故障数据以及当时的气象数据。但受限于数据量,本文仅对变压器常见故障y1-y13及气温、相对湿度x1-x9进行分析。有效数据共837组。

运算结果中置信度、支持度最高的两组组关联规则为:

湿润(x8)→硅胶潮解变色(y7)

潮湿(x9)→硅胶潮解变色(y7)

两组关联规则的置信度都超过了50%,支持度都超过了20%。显然,运算结果与实际情况是一致的。故Apriori算法应用于电网设备与气象数据的关联规则挖掘是具有一定可行性的。

流程图

3 建立基于气象数据挖掘的输变电设备故障预警流程

基于以上分析,输变电设备的某些故障在统计层面上是和特定的气象因素存在较大关联性的,并且这些关联关系可以通过Apriori算法在长期大量的故障数据中发现。所以,建立基于气象数据挖掘的输变电设备故障预警流程对输变电设备长期运行过程中的故障预防和检修安排有一定作用[17-19]。

预警流程描述如下:

1.建立数据库。收集以往所有输变电设备故障信息及故障发生时间段的气象数据。

2.对数据库进行Apriori算法分析,发现初始关联规则X→Y。

3.对所有已知的关联规则制定相应预案。

4.在电网运行检修过程中,即时接收气象部门对未来气象的预报信息,将预报信息与已知的关联规则比对,预测可能发生的输变电故障并按照预案进行预防部署。

5.在发生故障后,首先鉴别发生原因,排除非气象因素影响的故障,如人为误操作造成的故障等。鉴别后将新的故障数据加入故障数据库,并对故障关联规则重新分析。

6.重复步骤3,4,5

其流程图如图所示。

4 结论

本文介绍了Apriori算法并将其应用于输变电设备故障数据与气象数据之间,利用算例验证了其可行性。建立了基于气象数据挖掘的输变电设备故障预警流程。在预测气象状况带来的输变电设备故障和提高电网运行可靠性方面具有实际意义。

[1] 薛禹胜,费圣英,卜凡强.极端外部灾害中的停电防御系统构思(一):新的挑战与反思[J].电力系统自动化,2008,32(9):1-6. XUE Y S,FEI S Y,BU F Q. Upgrading the Blackout Defense Scheme Against Extreme Disasters PartⅠNew Challenges and Reflection[J]. Automation of Electric Power Systems,2008,32(9):1-6.

[2] 薛禹胜,费圣英,卜凡强.极端外部灾害中的停电防御系统构思(二):任务与展望[J].电力系统自动化,2008,32(10):1-5. XUE Y S,FEI S Y,BU F Q. Upgrading the Blackout Defense Scheme Against Extreme Disasters PartⅡTasks and Prospects[J]. Automation of Electric Power Systems,2008,32(9):1-5.

[3] 郑元兵,孙才新,李剑,等.变压器故障特征量可信度的关联规则分析[J].高电压技术,2012,38(1):1-7. ZHENG Y B,SUN C X,LI J,et al. Association Rule Analysis on Confidence of Features for Transformer Faults[J]. High Voltage Engineering2012,38(1):1-7.

[4] 熊小伏,王尉军,于洋,等.多气象因素组合的输电线路风险分析[J].电力系统及其自动化学报,2011,23(6):11-15,28. XIONG X F,WANG W J,YU Y,et al.Risk Analysis Method for Transmission Line Combining of Various Meteorological Factors[J]. Proceedings of the Chinese Society of Universities for Electric Power System and its Automation,2011,23(6):11-15,28.

[5] 张腾,董洁,张波,等.计及气候影响的配电线路可靠性分析[J].山东大学学报:工学版,2003,33(6):632-634,698. ZHANG T,DONG J,ZHANG B,et al. To evaluate the reliability of distribution system for weather factor[J]. Journal of Shandong University:Engineering Science,2003,33(6):632-634,698.

[6] 林智敏,林韩,温步瀛.天气条件相依失效模型的电力系统可靠性评估[J].华东电力,2008,36(1):81-84. LIN Z M,LIN H,WEN B Y. Power System Reliability Evaluation Based on Weather Dependent Failure Models[J]. East China Electric Power,2008,36(1):81-84.

[7] 孟海东,李丹丹.基于数据场的量化关联规则挖掘方法设计[J].新型工业化,2012,2(9):12-17. MENG H D,LI D D. Design of quantitative association rules mining method based on data field[J]. The Journal of New Industrialization,2012,2(9):12-17.

[8] 鲁慧民,冯博琴.基于数据挖掘的电网故障关联性分析与研究[J].微电子学与计机,2008,25(12):110-113. LU H M,FENG B Q. Power System Fault Correlativity Analysisand Research Based on Data Mining [J]. Microelectronics & Computer,2008,25(12):110-113.

[9] GB/T 28591—2012《风力等级》[S].

[10] GB/T 28592—2012《降水量等级》[S].

[11] 牛丽敏.Apriori算法分析与改进综述[J].桂林电子科技大学学报,2007,27(1):27-30. NIU L M. Review of the optimization and analysis of Apriori algorithm[J]. Journal of Guilin University of Electronic Technology,2007,27(1):27-30.

[12] 邓宏贵,罗安,曹建关,等.关联度分析在变压器故障诊断中的应用[J].电力系统自动化,2005,29(18):73-75. DENG H G,LUO A,CAO J G,et al. Application ofthree-level dependent degree for transformer faultdiagnosis[J]. Automation of Electric Power Systems,2005,29(18):73-75.

[13] 聂倩雯,高玮.基于关联规则数据挖掘技术的电网故障诊断[J].电力系统保护与控制,2009,37(9):8-19. NIE Q W,GAO W. A power network fault diagnosis method based on data mining association rules[J]. Power System Protection and Control,2009,37(9):8-19.

[14] 赵宏波,朱朝阳,于振,等.电力微气象监测与预警系统研究[J].华东电力,2014,42(5):912-916. ZHAO H B,ZHU C Y,YU Z,et al. Electric Micro-Meteorological Monitoring and Early Warning System[J]. East China Electric Power,2014,42(5):912-916.

[15] 王志利,赵晓锋,武国亮,等.电力微气象灾害监测与预警系统的设计与实现[J].电力与能源,2014(6):712-716+734. WANG Z L,ZHAO X F,WU G L,et al. Design and Realization of Micro-meteorological Disaster Mornitoring and Pre-warning System in Power Grid[J].Power & Energy,2014(6):712-716+734.

[16] 张继芬,张世钦,胡永洪.福建电网气象信息预警系统的设计与实现[J].电力系统保护与控制,2009,7(13):72-74. ZHANG J F,ZHANG S Q,HU Y H. Design of the meteorological forewarning system for power grid[J]. Power System Protection and Control,2009,37(13):72-74.

[17] 程政,雷霞,柏小丽,等.关联规则在输电网安全性评价中的应用[J].四川电力技术,2011,04:52-54. Cheng Z,LEI X,BAI X L,et al. Application of association rules in security evaluation of transmission network[J]. Sichuan Electric Power Technology,2011,04:52-54.

[18] 李彦斌,韩颖,张嵘,等.气象因素对电力安全事故影响的模型[J].电网技术,2013,37(6):1683-1687. LI Y B,HAN Y,ZHANG R,et al. Research on impactmodel of meteorological factors on the power accidents[J]. Power System Technology,2013,37(6):1683-1687.

[19] 李俊.基于气象信息的电网风险预警系统应用[J].广西电力,2013,36(5):25-27. LI J. Application of Power Grid Risk Warning System Base onMeteorological Information[J].GUANGXI ELECTRIC POWER,2013,36(5):25-27.

[20] 路永玲,陶风波,周志成,等.气象灾害对江苏电网设备的影响及防御分析[J].南京信息工程大学学报(自然科学版),2015,7(5):469-474. LU Y L,TAO F B,ZHOU Z C,et al. Analysis of influence and prevention of meteorological disasters on Jiangsu's power grid equipment[J]. Journal of Nanjing University of Information Science & Technology (Natural Science Edition),2015,7(5):469-474.

[21] 张嵘.基于气象因素的电网安全预警模型研究[D].北京:华北电力大学,2014. ZHANG R. Research on Grid used on Security Early Warning Model Meteorological Factors[D]. BEIJING:North China Electric Power University,2014.

[22] 吕锋,李华,李延忠,等. 基于支持向量机的故障诊断方法研究[J].新型工业化,2015,5(4):34-39. LV F,LI H,LI Y Z,et al. A Study of Fault Diagnosis Method Based on SVM[J]. The Journal of New Industrialization,2015,5(4):34-39.

[23] Frequent Data Itemset Mining Using VS_Apriori Algorithms[J]. International Journal on Computer Science and Engineering,2010,2 (4):1111.

Fault Prognosis in Power Transmission Equipment Based on Meteorological Data Mining

HUANG Can, WANG Dong, YIN Shu-yi, XU Meng-chan, TANG Chen-tao
(School of Electric Power Engineering, Nanjing Institute ofTechnology, Nanjing 211167, China)

At present, analyses conducted onthe influence of the meteorological environment for grid security were mostly based on single factorssuch as high temperature, wind, lightning, et al, which ignoring the multidimensional meteorological environment the power transmissionequipment working in, and it is difficult to determine the association between meteorological factors and the grid fault quantitative relationship. In this paper, the association rules in data mining technology were applied to the power transmission equipment failure associated with meteorological factors.This paper established the one-dimensional association rules and multi-dimensional association rules of power transmission equipment failure through the Apriori algorithm by mining a large amount of historical data. The feasibility of this algorithm was verified by an example. Establishingthe earlywarningprocess onpower transmission equipment based on meteorological data mining, which couldpredict information for power transmission equipment fault by mining on weather forecast.

Electrical engineering; Apriori; Data mining; Power transmission equipment;Fault Prognosis

10.19335/j.cnki.2095-6649.2016.05.006

HUANG Can, WANG Dong, YIN Shu-yi, et al. Fault Prognosis in Power Transmission Equipment Based on Meteorological Data Mining[J]. The Journal of New Industrialization, 2016, 6(5): 33-39.

江苏省大学生创新创业训练计划(201511276021Z)

黄灿(1995-),男,本科在读,主要研究方向为电力系统自动化;王东(1995-),男,本科在读,主要研究方向为电力系统自动化;殷舒怡(1996-),女,本科在读,主要研究方向为电力系统自动化;徐梦婵(1995-),女,本科在读,主要研究方向为电力系统自动化;唐晨涛(1995-),男,本科在读,主要研究方向为电力系统自动化

猜你喜欢
项集数据挖掘关联
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
探讨人工智能与数据挖掘发展趋势
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
“一带一路”递进,关联民生更紧
基于矩阵相乘的Apriori改进算法
不确定数据的约束频繁闭项集挖掘算法
奇趣搭配
智趣
一种基于Hadoop的大数据挖掘云服务及应用
高级数据挖掘与应用国际学术会议