(华南理工大学工商管理学院 广东 广州 510640)
现阶段,国民经济的发展速度日益增加,人们在用电方面的需求也逐渐增大,进而使电网的规模也在增大,各地区内电网的关联性也逐渐增强。在此现状下,电力系统运行的经济型得以提升,但电力系统受个别地区的电网故障影响的范围更加宽广。虽然现阶段运用了较多的设备、管控及保护措施对电力系统进行维护,但仍存在一定的可能性出现电网故障。当出现多种或者较为繁杂的故障时,调度员难以在极短时间内对大量的告警信息进行分析并做出决策对其处理,尤其是出现信息缺失现象时,难度将进一步增大。因此,利用数据挖掘技术对电网故障进行预测可使调度员提前做好相应的准备工作,及时高效的解决电网故障,具有较大的现实意义。
电网发生故障的原因多种多样,具体如下:在稳定且合理的电压下,电网的输电线路绝缘子保障了在内部和大气过电压以及系统长时间运行下的可靠程度,但输电线路大部分时间内都是暴露在大气中,在恶劣环境或天气如大雨、冰冻、大雪等作用下会受到一定的侵蚀,会减少甚至破坏其绝缘度。在导致电网出现故障的所有因素中,雷电是最为主要的因素之一,电网线路会因雷击人出现过电压现象,甚至相应的设备都会出现损坏现象;而严寒环境则会使电网线路结冰,当冰层超过一定厚度时则有可能导致相关设施倒塌进而使线路损坏出现故障;在电网线路相关设施上还会因鸟兽的巢穴或者排泄物使绝缘子串联出现污闪和闪络现象;除自然因素以外,电网出现故障还有可能是某些违法分子偷盗国家电力设备资源,使电网的线路大范围停电。
在电网中,常常会出现以下几种电网故障。其一,当强度较高的电弧或者短路电流经过短路点时会对故障元件产生破坏作用;非故障元件在电流强度较大的短路电流经过时产生的热量以及电动力影响下会出现损坏或者使用寿命减少的情况;电力系统的电压会在故障发生时受到影响而降低,进而对人民群众的日常生活产生影响,出现数量较多的废品;电力系统中各发电厂之间的并联关系的平稳性会在电网发生故障时受到影响,使系统整体产生振荡,甚至会使系统崩坏。
电网故障的类型大体上可分为短路和断路故障。短路故障以接地项数量为标准可细分为两项接地和单项接地故障,以接地情况为标准可细分为不接地和接地故障。在所有故障类型中,短路故障是最常发生的,亦是危害范围最大的故障类型。
从具有随机、模糊、量大等特征的数据中收集可明了的、有效的等信息的过程就是数据挖掘。其并非只是数据查找,而是归纳总结数据,供给相应的依据或有效数据于相关的决策中。
数据挖掘在信息发掘过程中是没有清晰的假设的,这也是其与传统数据分析的最大差别。而该种技术所获取的信息存在以下特点:实用性、有效性、未知性。
基于电网可靠性预测方法,发展出了电网故障预测方法,其是在造成故障产生的因素数据以及电网发生故障时数据的基础上,对电网故障及影响因素之间的联系进行研究分析,之后采用一定的方式搭建出一个故障预测模型,预测电网在某个区域在某个时间段内可能出现的故障。现阶段,其预测的区域及时间划分并未拥有一个明晰的标准,大多数情况下都是根据模型最优准则以及电力公司的需求来对其进行明确的。
数据挖掘技术中,数据分析能力极为强大,电网故障产生的原因及范围都可在其分析能力下被发掘出来,在此基础上,拟定出与之对应的解决方案,使故障发生的可能性在一定的手段下得以降低,进而使电网运行稳定、收益提升。因此,我们可基于数据挖掘技术构建一个电网故障预测模型。
确定任务、数据准备、挖掘建模以及结果分析应用是数据挖掘的四个过程。本文基于数据挖掘的特征,于电网故障预测当中运用了该技术,具体过程如下:第一步,确定任务。该过程就是在真实需求的基础上,将电网故障预测的目标以及所需完成的工作进行明确。第二步,数据准备。在该步骤中又细分了五个环节。其一,数据提取。研究探讨电网故障预测中的问题,对数据挖掘的目标明确。调查研究并分析现存的数据,选取出存在一定保障性的数据源,按照有效、可靠、相关三方面的规范提取数据。其二,数据预处理。采用数据变换、集成、清理等方法处理所提取的数据,对原始数据中的可用性及质量等问题进行处理。其三,利群样本分析。在进过上一环节之后,数据相对不是特别驳杂,但仍存在部分数据明显不同于其它数据的可能性,而该类数据并不能使用,因此该部分数据就需通过离群样本检测技术去除掉。其四,数据探索分析。在数据挖掘建模过程中,数据在经过以上环节进行处理后基本上都可直接应用。但存在多种因素导致电网发生故障,因此需在该环节中研究探讨故障与其影响因素间的关系等。其五,特征选取。量化电网故障中的某种影响因素后,其便成为了故障特征变量,从所有特征中选取有效性最高的特征、去除重复的特征等就是该环节所需完成的工作。第三步,挖掘建模。在上一步骤结束后,运用合适的数据挖掘算法在数据挖掘目标的基础上建立电网故障预测模型,在模型选取时采用模型评价法进行。第四步,结果分析应用。该步骤就是对电网故障预测模型采用模型解释法、数据可视化等方法解释评价,基于此,可将故障预测结果运用于电网完善、决策等方面。
在近几年的发展中,我国的电网信息系统建设速度飞快,电网的运维数据倍数增加,数据规模足以支持电网故障预测工作。而基于数据挖掘技术建立的电网故障模型,仅需通过相应的需求选取相应的信息就可完成故障预测工作,使电网的资源配置合理、管控能力提升等等,其存在一定的可能性作为电网运维决策的主要依据。