廖绍成
(国网浙江新昌县供电有限公司,浙江绍兴 312500)
公用变压器的稳定运行是安全供电的基础保障,因此需要及时且准确地了解公用变压器的状态信息[1-3]。传统变压器状态信息聚类方法计算速度慢,准确度较差,因此在原有聚类方法的基础上,提出了基于5G 通信的公用变压器状态信息聚类方法。通过定权判断变压器的状态和健康等级,详细介绍了其聚变算法和聚变过程。利用5G 通信对数据的处理优势,能够有效提升聚类计算速度,明确公用变压器的运行状态,有利于及时发现变压器故障,对于变压器的维修和升级具有重要意义。
相比传统的人工故障检测方法,定权法不易出现误差,并且计算速度快,准确率较高,能够有效提升公用变压器的检测效率[4-5]。
公用变压器之间的相关支持度和置信度的计算如式(1)和式(2)所示:
其中,Q表示所计算状态在某一时间段内出现的次数;m表示某一测试时间段内的总状态量;e表示计算常数;v表示状态信息采集速度;n表示状态信息采集量。从上式可以看出,相关支持度描述某一状态出现的频率和出现的时间,而置信度描述该变压器对此状态的依赖程度[6]。
通过参考公用变压器厂常出现的故障,将变压器的运行状态分为正常运行、过热运行和放电运行3 种,其中过热运行和放电运行属于故障类型,根据采集状态数据的权重计算结果,将权重高于20%列为Ⅰ级故障,权重在10%~20%列为Ⅱ级故障,权重在5%~10%列为Ⅲ级故障,权重低于5%视为正常运行,故障等级为Ⅳ,公用变压器运行状态对应的权重如表1 所示[7-8]。
表1 公用变压器运行状态对应的权重
状态信息的权重计算公式如式(3)所示:
其中,N表示总状态信息数量,xi表示采集信息i的规则先导数值。结合相关支持度和置信度计算出权重数值,数值越高,则表示公用变压器的运行环境越恶劣,危险系数越高[9-10]。
为提高计算速度,简化聚类计算流程,在5G 通信的基础上,采用k 均值(簇均值)聚类算法,人为选定簇(k 值),减少选取的盲目性,其聚类算法的主要步骤如下所示:
1)首先设置空间半径r,在空间范围内随机选取一组或一类状态信息数据,每个数据的维度为D,并初始化数据各自的中心点。
2)计算每个数据点到空间中心点的距离,距离最近的空间中心点即为数据点的聚类中心。距离计算公式为:
其中,jil表示某个数据点具有的维度。
3)将此类数据中的中心数据作为新的中心点,计算每个数据点到新中心点的距离,计算公式如式(5)所示:
其中,R表示一类数据范围的空间半径。
4)重复上述计算步骤,直到每一类中心到达某一确定数据,从而选择出运行结果最准确的数据点。
具体到公用变压器的状态信息聚类上,其数据点则代表当前变压器运行的数据,数据点的各个维度则代表变压器状态的健康等级,在应用5G 通信加快聚类速度的同时,对数据点的维度取值规则也做出了优化,规定在允许范围内维度的取值由轻到重选取最佳整数值[11-12]。
基于5G 通信的公用变压器状态信息的聚类过程分为主成分分析和聚类分析两部分,其具体过程如图1 所示。
图1 公用变压器状态信息聚类
主成分分析也叫作PCA,分析原理是通过降维方法,将公用变压器的多个状态指标转换为少量状态指标,简化变压器状态分析过程。变压器状态指标主要包括相关系数矩阵、特征值和特征向量,得到公用变压器的最大特征值。主成分分析法在简化分析流程的同时要保证数据的精确性,主成分分析法将采集到的变压器状态指标合理地放入一个直角坐标系中,通过各个指标间的线性图像,计算公用变压器的指标权重值p[13-14]。
聚类分析的工作原理是运用数据建模进行数据分类,主要的工作是将不同的公用变压器的各个状态簇进行有理分类,有利于变压器状态出现故障时的维修。聚类分析算法首先对主成分分析得到的变压器数据进行初始化,得到状态簇k,然后根据k 均值聚类算法对状态簇进行状态指标分类,k 均值聚类算法的核心是以状态簇为核心对状态指标进行分类处理,最后将聚类结果进行分析,得到公用变压器的状态信息[15-16]。
该文实验研究为检验整体聚类方法的有效性,对公用变压器的健康状态信息聚类结果及5G 通信状态下变压器训练样本的分类器分类性能进行对比分析,进而对比不同方法的聚类效果。
实验研究的采样地区电网系统共装了100 台220 kV的变压器及150 台110 kV的变压器。利用5G通信方式将缺陷统计数据传导至实验空间中,并将统计数据作为聚类分析的实验对象。选取簇半径为8的聚类数据样本,利用Canope 算法获取计算的k值,选择5G 通信的内部数据流通道将k 值信息由外联网络传输至k-means 算法处理中心。由此对样本总体数据进行聚类调整,调整后的簇中心点与坐标轴原点间的距离关系如表2 所示。
表2 距离关系表
结合表2 信息,联系变压器状态信息评价系统指标可得,当簇中心点与坐标轴原点间的距离越远,则表示该聚类分析对象的健康状态越差,反之,当簇中心点与坐标轴原点间的距离越近,则表示该聚类分析对象的健康状态越好。为此,以簇中心点与坐标轴原点距离数据作为聚类结果的分析指标,对变压器健康状态信息进行等级划分。共分为1~5共5个等级:从1 级至5 级,变压器的健康状态逐渐好转。其中,1 级状态变压器样本数量占总体状态变压器样本数量的5%;2 级状态变压器样本数量占总体状态变压器样本数量的12%;3 级状态变压器样本数量占总体状态变压器样本数量的19%;4 级状态变压器样本数量占总体状态变压器样本数量的25%;5 级状态变压器样本数量占总体状态变压器样本数量的39%。
按照以上变压器健康状态等级的划分,可将检修效果较优的资源放置到健康等级较高的变压器中,便于变压器的调节与安全保护操作。同时可及时提醒处于较低健康状态的变压器调整负荷运作系统,避免因负荷过重而导致变压器损坏现象的产生。为检验聚类方法的有效性,分别随机抽取完成等级划分后的一台变压器作为检测对象,进行指标对照检验操作。实验对比图如图2 所示。
图2 实验对比图
根据图2,当检测的变压器样本健康状态等级由1~5 级变化时,该文方法研究抽取的样本指标取值呈现下降趋势,表示变压器的健康状态良好,且优于其他两种传统方法,聚类分析的有效性得到较好的验证,聚类效果最优。由于该文方法研究在变压器状态信息聚类分析的过程中匹配变压器的健康状态信息,对应不同的信息情况选取不同的算法,解决聚类分析中产生的异常数据,减轻聚类分析的负担,划分不同的聚类层次,排除了人为因素的干扰,突出关键指标的重要性,充分挖掘5G 通信中的变压器状态信息,可有效指导变压器的检测以及评估方向的问题。
采用DBSCAN 算法对变压器的色谱状态信息进行聚类处理,为获取良好的聚类效果,该文降低ε数值,逐渐提升密度阈值,控制ε数值的变化区域为0.1~1 之间,变动幅度最佳数值为0.1。控制密度阈值的变化区域为5~10 之间,变动幅度最佳数值为1。所得聚类结果如表3 所示。
表3 聚类结果
从表中可以看出,数据样本被划分为两个聚类2,簇号数值为0 和1,分别表示正常的样本操作簇与故障的样本操作簇。从两种簇中挑选100 条变压器状态信息样本数据,作为训练样本的分类器载体。将该文方法研究的分类器记为分类器1,将传统基于时间序列分析的聚类方法研究的样本数据分类器记为分类器2,将传统基于历史信息挖掘的聚类方法研究的样本数据分类器记为分类器3。选取30 组变压器测试样本作为实验研究的研究数据集,分别对经过样本训练的3 个分类器进行分类性能检测,并构建实验对比图,如图3 所示。
图3 分类性能对比图
由图3 可知,基于5G 通信的公用变压器状态信息聚类方法研究的训练样本的分类器分类性能远远优于其他两种传统方法,表明该文研究的变压器状态信息聚类方法具有最佳的聚类效果。该文在进行平衡聚类训练后,调整了各簇变压器样本信息,各簇变压器样本信息可缓解聚类分析在操作中产生的误差分析问题,基本保障变压器状态信息分类样本训练过程中对于正常样本与异常样本的平衡性的需求,便利了聚类操作,提升了分类器的分类性能,进而获取了较高的聚类效果。
根据上述研究可知,文中提出的基于5G 通信的公用变压器状态信息聚类方法,能够实现公用变压器运行状态的快速采集和计算,通过聚类算法的公式原理和计算流程,分析得到公用变压器的各个状态提升了变压器维修的便捷性。实验结果表明,基于5G 通信的公用变压器状态信息聚类方法具有良好的聚类效果,可直接归类未进行评估的部分变压器数据,快速聚类大量变压器状态信息,提升对变压器状态检测的指导性,具有较高的研究价值。