王连庄,王海天
(国网天津市电力公司宝坻供电分公司,天津 301800)
近年来,随着国家对电网运行维护检修重视度和关注度的不断提高,电网“大检修”体系不断完善,全国各地的电网建设如火如荼,变电站规模稳步扩大,电网运行系统结构日趋复杂,突发性设备故障、外界环境等时常影响电网的正常运行,变电设备发生故障的概率随之增大。一方面,在电网系统运行过程中,传统故障排查方法的可靠性、科学性不断降低;另一方面,不同来源的维护检修数据相互独立,形成数据孤岛的问题,导致难以满足现阶段快速发展的市场需求,电网运行维护效率降低。因此,针对国家电网的维护检修现状,利用目前成熟且广泛应用的大数据挖掘技术和分析方法,探讨变电设备的故障检测、预警示警和动态维护检修等,具备重要理论价值和现实意义。
根据设备发生故障的原因,变电设备的故障可以分为三种类型,针对不同数据的相关特征,本研究以皮尔逊相关性分析方法探究设备故障发生的影响因素。在研究变电设备故障发生的因素前提下,建立相关性系数反应变量之间指标的线性相关关系,以温度、连线负载率和油温等诸多参数为例,通过皮尔逊相关分析方法探究设备发生故障的可能性和概率。首先,就设备负载率问题而言,变电设备运行故障的主要影响因素以月平均负载率为基本特征向量,通过皮尔逊相关性分析方法,分析得到其相关系数为0.931,整个设备故障率和负载率存在着强相关关系,结果示意见图1[1]。
图1 设备故障率和负载率关系
其次,探究设备运行年限对变电设备发生故障可能性的影响,为了探讨该故障发生可能和投资运行年限之间的关系,利用皮尔逊相关性分析方法得到最终的相关系数为0.748 4[2],也就是说,设备故障率和投资运行的具体年限存在着较强的正相关关系,其试验结果见图2。
图2 设备故障率和投资运行年限关系
接着,对温度和湿度等影响变电设备发生故障的可能性因素进行分析,分别计算其故障发生的相关性可知,变电设备温度因素与故障发生的相关性系数为0.617,因为湿度原因发生设备故障的可能为0.062。整个试验研究表明,温度和湿度均与设备的故障率发生存在着较强的正相关关系,试验结果见图3、图4[3]。
图3 设备故障率和湿度关系
图4 设备故障率和温度关系
基于大数据挖掘技术的变电设备故障诊断系统架构示意见图5,由图可知,变电设备故障诊断系统主要包括了处理层、通信层和数据采集层等。其中,数据采集层主要负责对变电设备故障发生的可能进行全方位的数据信息采集,采集设备主要利用多种传感器设备和装置,设备所采集到的数据信息包括变电设备正常运行过程中的状态、标志属性及所处的外部环境和内部运行条件等[4];通信层主要负责将所采集到的相关数据信息以快速高效的方式传递到信息平台中,并进一步将信息平台中心运营的相关控制指令反向传递到数据信息采集层,同时指导数据信息采集层获取相关参数。考虑到设备故障诊断过程中可能存在的某些需要,本研究构建的诊断系统的通信方式以有线传输为主,以总线采集的方式将相关数据信息传递到信息平台,其他距离较远的部分设备的数据信息采集则主要以无线网络通信技术来实施。处理层是由数据信息平台和设备故障诊断两大模块组成,其中,数据信息平台主要负责接收所收集到的相关数据信息,并对其进行存储和分析,设备故障诊断模块则主要基于大数据挖掘技术对变电设备故障发生的相关原因进行深入分析,结合数据挖掘技术和信息融合方法等,对变电设备发生故障的可能性进行全面科学且快速实时的判定。
图5 系统架构示意
变电设备故障诊断系统的故障诊断信息处理与融合,主要包括了基于数据信息分类的变电设备故障信息诊断融合和基于模糊理论的故障信息融合处理两部分内容。就基于模糊理论的故障信息处理问题而言,由于设备的故障诊断往往需要综合考量变电设备运转状态及诊断过程中其他参数信息,而不同因素和变电设备发生故障的因果关系较为错综复杂,如何对变电设备故障发生涉及到的多种信息进行高效率的分析处理,成为变电设备故障诊断和分析的关键。
在变电设备正常运转的过程中,变电设备存在着部分模糊性较强的数据信息内容,该类信息内容往往并不能够以正常和不正常为分界线区分,对此可引入数学模糊理论,将该类数据信息以0~1 区间内的任意参数值进行预处理,从而构建适当的隶属函数,以模糊数学理论的方式对变电设备运行的相关参数信息进行处理,采取模糊统计等方式确定其实际参数,并将该参数应用到变电设备故障诊断过程中,充分挖掘该类参数信息所含的各项数据价值,为变电设备故障诊断提供技术支撑[5]。
聚类算法是基于大数据挖掘技术判别变电设备故障的重要诊断方法之一,主要是利用成熟聚类方法,该方法是目前使用较为广泛的方法,主要是将变电设备簇中心与离其最近的中心点连接,再确定簇中心点过程中,首先应该确定整个变电设备发生故障可能涉及的具体对象,在确定了聚类的选择后得到较为理想的聚类效果,从而通过引入轮廓系数判别聚类效果的有效性。在对分离度进行量化的基础上,计算类的相关元素和所有元素距离该元素之间的距离,找到其中距离最小的簇中元素,再计算其他元素的相关系数,最终得到类的整个轮廓系数。
状态参量相关性分析算法,主要是基于变电设备运转的状态参量,针对设备之间的相关性关系进行充分挖掘,加强对设备故障发生原因的更科学的系统性认识。状态参量相关性分析方法,能够实现设备不同状态参数之间的高效率组合的特征量的提取,进而确定变电设备故障的影响因素。
基于相关性矩阵的故障诊断方法,主要是考虑变电设备运转过程中不同的状态参数之间、变电设备状态参数之间、状态参数对应的故障模式之间的相关性关系。同时,应考虑在变电设备某一具体的状态参量发生异常时,与之对应的故障模式发生的可能性,在求得不同的状态参量和设备故障发生可能的相关信息后,得到设备故障模式的诊断结果,进一步计算诊断矩阵的相关性参数,再利用皮尔逊相关方法进行计算。
本研究以某电网公司500 kV 电压等级的变压器套管中的故障案例作为其数据挖掘对象,对其进行故障诊断分析。首先,对数据进行预处理,将待挖掘的相关参数之间的数据进行提炼,重点包括变电设备故障点缺陷点的相关案例数据,在设计案例代号和状态参数代码的基础上,根据变电设备的具体故障类别和表征信息进行相应的状态材料复制,通过知识图谱构建变电设备状态参量或者是变电设备运行异常过程中相关参数等值挖掘的数据信息,从而明确该状态材料是否处于异常。在这一过程中,仅需要设置二元化模式,并不需要对变电设备的具体状态等级、状态量优化或者劣化程度进行计算。根据本研究所收集到的原始数据当中的22 组故障案例进行层次的聚类分析,在初步分析状态下,将变电设备的故障类型分为4~8 类,进一步选取45678 作为聚类系数,然后通过计算不同聚类的参数值得到轮廓系数,具体结果见图6,由图可知,将其故障模式分为6 类时,实际的聚类效果最为理想,也就是说,本研究所研究的变压器套管的故障设备主要分为6 类。
图6 不同K 值下的轮廓系数
最后,对本研究所研究的案例进行设备状态参量的相关性分析和基于相关性矩阵的故障诊断分析,在对其相关性参数进行分析时,以置信度和支持度作为其关联规则中最重要的参数,确保合理的置信度参数和支持度参数值,保证该设备的故障参数挖掘得到有价值的关联规则。由于状态量数据多,因此本研究所设置的支持度不宜过大,文章设定为0.1,而为了获得更高的可信度和关联度,将其置信度参数设置为0.8,由此得到较为高关联度的关联规则。圆的面积越大,则其对应的支持度越大,圆的颜色较浅,则表示相关性较小,由此能够得到高强度关联规则,进而能够根据其关联度规则进一步分析变电设备的状态参数量,说明状态参数量所对应的不同故障类型后,能够进一步得到参数值异常时的具体表现,使变电设备运行时的电阻数值降低,也就使整个判断过程和现场实际操作过程情况相符。针对不良连接等故障类型以及红外测温、套管接线等状态量出现明显的异常,在该类状态提取的结构模式下,能够得到异常状态参量和状态参量的相关性系数,最终能够得到状态参数和故障模式的相关性关系,其结果示意见图7。由此可知,红外测温、套管接线等关键性能的相关性系数均较高,在变电设备连接处于不良状态时,连接不良点导致的电阻值的增加,会使得变电设备的发热现象较为明显,红外测温能够较好地测得其具体的连接不良点位置,从而为变电设备的状态分析和故障排查提供依据。
图7 相关性关系结果示意
本研究以基于大数据挖掘的变电设备故障诊断与预警为研究内容,在探究变电设备故障的影响因素的基础上,对变电设备故障诊断系统构建中的系统架构、变电设备故障诊断信息处理和融合等内容进行深入分析,然后详细梳理了聚类算法、状态参量相关性分析算法、基于相关性矩阵的故障诊断等设备状态评价关键技术,最后对设备故障诊断预警案例进行分析,通过对大数据挖掘技术和智能机器的深度学习,对电网系统运行过程中的变电设备故障可能性进行探究,分析两者之间的关联性,构建出基于变电设备特征的故障识别和风险判断模型,实现对电网运行过程中变电设备运转状态,尤其是非正常运转状态的超前预警和示警,以辅助电网系统管理人员做好设备故障的排查与防范工作,制定具有可操作性和实践性的差异化的运行维护措施,进而通过对变电设备进行维护保养、周期巡视等措施,确保电网系统变电设备的运营安全,最终实现电网“零抢修、零故障、零跳闸”的“三零”维护目标。