基于SCD文件聚类分析自动生成接线图的方法

2022-11-29 12:31范力栋丰继华王星宇
计算机仿真 2022年10期
关键词:接线图团体聚类

范力栋,丰继华,王星宇

(1. 云南民族大学电气与信息工程学院,云南 昆明 650500;2. 中国电建四川电力设计咨询有限责任公司,四川 成都 610041)

1 引言

随着建设坚强智能电网战略的推进,大量智能变电站建成投运,相比传统变电站大量使用电缆进行信号传输和数据采集,智能变电站采用通信网络进行信息传递。智能变电站采用IEC 61850[1]标准,便于智能电子设备(IED)之间进行互操作和功能扩展,通信网络和二次设备的功能、参数都在智能变电站配置描述文件(SCD)中进行配置[2-4],缩短了智能变电站的建设、调试周期。但是SCD文件采用的智能变电站配置语言(SCL)较为抽象,配置信息专业性强,设备间的虚连接[5-8]关系较为隐秘,特别是对一次拓扑关系的描述信息较少,文件内容不直观,不能展示变电站主接线情况,给工作人员的理解造成了巨大困难,严重影响工作效率。

目前,针对SCD文件的可视化应用[9-11]已有较多研究。国外,采用一款IEDScout[12]软件可对智能变电站中不同厂家的IED设备进行图形化界面管理、测试以及报文分析。文献[13],设计了一套智能变电站虚端子多视角图形化查看系统,可方便设计、调试人员查看虚端子连接情况。文献[14],采用了聚类的方法,对相似间隔的IED之间、同类型IED双重化配置之间可能存在的差异进行了对比分析。这些研究主要是对IED之间的连接关系进行研究,可视化展示了二次部分的信息,并未涉及到一次设备和主接线图的自动生成。文献[15],根据SCD文件中的虚连接关系,获取到一次设备拓扑结构,自动生成主接线图,取得了良好效果,但该方法只对命名描述规范的文件有效。现实中,SCD文件中描述规范与不规范并存的情况较为常见,因此,该方法通用性受到限制。

本文通过对IED之间的连接关系进行分析,设置连接权重,利用图团体聚类[16]的方法,采用模块度评估聚类的效果,得到按间隔划分的IED聚类结果,然后根据间隔之间的拓扑关系自动生成主接线图。最后通过对多个实际SCD文件测试分析,验证在不同命名规范情况下所提方法的准确性和有效性。

2 图团体聚类原理

在关系网络中常见的属性是团体结构,它们将网络节点划分为连接密集的网络团体,但团体之间是稀疏的连接关系。发现和分析这些团体可以为理解和可视化网络拓扑结构提供帮助。图团体聚类算法相比于k-Means、基于密度的聚类方法,无需提前知道团体数量和确定簇半径等优点,具有计算效率高、聚类准确性高等优点,适合于在复杂的连接网络中准确地发现各团体。

2.1 发现团体结构

团体结构的发现类似于分割图的过程,但是需要寻找一种基于顶点之间连接相似性或强度指标的自然分割方法,以降低人为因素的干扰。

将图网络中的顶点看作相互独立的个体,顶点之间的相似性用某种方法进行量化计算。采用分裂的思想进行团体融合,寻找具有最低相似度的顶点对,然后将其之间的边移除,其目的在于找到网络中各节点间具有最大“介数”的边,这种边起到增强两顶点连接的紧密程度,同时降低两顶点外部边聚合力的作用,意味着两端点之间相似度非常高,更可能融合为一个新的团体。

根据上述原理,可将团体结构发现的步骤归纳如下:

a.节点计算网络系统中所有边的介数值;

b.寻找最高介数值的边,并从网络中将其移除;

c.重新计算剩余边的介数值;

d.重复步骤b的操作,直到所有边都被移除。

此过程可以形象地用图1所示的树状图进行表示。随着迭代的进行,树的叶子节点融合形成更大的团体,如图中虚线所示,在任意层级的横截面,可以得到该次迭代的各团体构成。算法通常会在某一层级终止,得到合理的聚类结果,而不会执行到最顶部。

图1 聚类树状效果图

2.2 评估图团体聚类效果

对于事先未知其团体结构的网络,需要一种量化指标来评判发现的团体结构是有意义的。聚类算法将团体结构划分以树状图的结构,为评估聚类效果和作为算法流程执行终止的依据,引入了一个简单易计算的量:模块度(modularity)[17]的概念。

假设一个可划分为k个团体的网络,首先定义一个k×k阶的对称矩阵e,元素ei,j表示第i个团体和第j个团体所连的边数占总边数的比例(此处总的边数为初始时的所有边数量,聚类之后的边数由于团体融合而减少,会少于初始时候的边数量)。矩阵的迹

Tr(e)=∑ieii

(1)

eii表示团体i内部节点间的边所占比例,矩阵的迹即为所有团体内部边数之和占总边数的比例,一个良好的聚类结果应该具有较高的迹值。若所有节点都在一个团体时,Tr(e)=1,为最大值,但是却并不能提供任何有用信息,于是引入了变量ai=∑jeij,表示所有与团体i相连的边的比例,定义模块度的计算方法

(2)

通常采用改进的计算公式降低计算复杂度

(3)

其中,m为边的总数,v,w为两不同节点。

(4)

当节点v与w相连时Avw值为1,否则值为0。

(5)

kv为节点v的度,为与其相连的节点总数。

(6)

如果节点i,j属于同一团体,函数取值为1,为不同团体取值为0。

通过评估模块度增益,确定聚类结果优劣,即将节点i放入团体C时,若计算得到的心模块度增大,则为合理的团体融合,模块度增益为

ΔQ=Q′-Q

(7)

Q为上一次计算得到的模块度值,Q′为改变节点所属团体时计算得到的模块度值。

3 聚类及接线图自动生成

3.1 连接权重计算

SCD文件中将IED装置间的连接关系配置在Inputs节点中。通过解析该节点的各属性值,可以得到连接到的对应IED装置以及该连接发送/接收的GOOSE、SV信息和数量。通过遍历每个IED节点的ExtRef子节点集合,可将本IED接收到的外部IED设备信息数量进行统计。对于一个IED设备,可能与多个其它IED设备连接,分别记录与每个外部设备的数据收发条数,计算得到总的数据量。使用这些数据可以进行边的权重值计算。处理得到的数据文件如图2所示。

图2 IED数据集

利用IED节点和IED之间的关系构造一个无向图网络模型。G={V,E}

其中V={v1,v2,…,vn}为所有IED节点的集合,n为IED节点数量,E={e1,e2,…,em}为去重之后的边的集合,m为边的总数。式(3)中Avw根据实际节点连接特点取得相应权重值

(8)

式中:考虑了两节点类别信息和节点间虚连接数量这两个主要特征。num为一对IED之间的连接数量,total为某IED下所有的连接数量。当两IED类别不相同时,如主变/母线、线路/断路器等,边的权重较小,取值区间为(0,1),k≥1,为比例系数,用于调节划分的粒度;当类别相同时,如都是线路设备,权重为一较大值,取值区间为(1,2)。

3.2 聚类流程

聚类算法的执行流程如图3所示,主要分为两个部分:数据预处理和聚类执行。

图3 聚类流程

数据处理部分通过解析SCD文件获取所有IED节点信息及相互之间的边连接数据,从而构造出一个图网络,以邻接矩阵进行表示,并计算得出边的权重值。

聚类算法执行部分又可分为两个阶段。

第一阶段:初始时,每个节点当作独立的团体,对其进行编号,并计算初始模块度Q1。对每个节点,考虑将其从自身所在团体移出,放入邻近的相连节点所在团体,此时得到一个模块度增益,对所有与其相连节点执行此操作,取模块度增益δ的最大值,若δ>0,则进行该节点与对应邻近相连节点所在团体合并,否则保持各自所属团体不变。对所有节点重复此过程,直到所有节点都被遍历完成。

第二阶段:在一轮迭代处理之后计算此时的模块度Q2,若ΔQ小于定义的增量阈值,聚类将停止迭代,并输出结果;否则,将其各团体作为新的节点,新节点之间的边权重为各团体间连接的边权重之和,同一个团体内的节点之间的连接构成回环,不参与权重计算,更新图网络结构,并更新初始模块度Q1=Q2,然后重复第一阶段的计算过程,进行新的团体融合。

每进行一轮上述两过程,团体数将迅速减少,重复进行此迭代运算,直到团体不再有变化为止,算法收敛到最佳聚类结果。

3.3 接线图自动生成

接线图自动生成流程如图4所示。加载预定义好的图元模板文件,利用聚类算法得到各线路、主变、断路器、母线等间隔划分,然后在此基础上建立变电站主接线拓扑模型,利用绘图模块,实现接线图的绘制,最终输出SVG文件,结束整个流程。

图4 图形自动生成流程

4 实例分析

通过编写的软件工具,对多个实际的智能变电站SCD文件进行处理,与文献[15]中的方法进行对比,对所提方法进行验证。

4.1 聚类方法准确性验证

对5个命名规范的SCD文件进行测试,聚类结果均与文献[15]中的拓扑结构相同。以文件1为例进行说明,其中IED节点共144个,边662条,k=10,边权重如表1所示,列举其中十条记录。

表1 IED网络边权重

聚类的收敛性如图5所示,只需要2轮迭代算法就收敛,最终的模块度为0.89207,执行聚类的时间基本在秒级。聚类得到的分组共19个,与文献15方法结果一致,分别得到了主变、线路、母线、母联、分段等间隔,多次重复聚类得到的结果一致,表现稳定,结果准确。

图5 模块度变化曲线

4.2 聚类方法有效性验证

对于命名不规范的SCD文件2,IED节点206个,边818条,由于文献[15]中的方法完全依赖于IED命名规范,无法处理此类文件。采用提出的方法进行处理,得到的聚类按间隔划分如图6所示。

图6 命名不规范的SCD文件聚类结果

其中第1、2行为1#、2#主变间隔,第3~10行为220kV线路间隔,命名不规则,第21、22行为母联间隔,命名中设备类别和编号部分的定义与智能变电站系统配置描述文件技术规范[18]的规定不符合,如第22行中的ML1110设备,按照规范定义,代表的是线路合并单元,在此SCD文件中它是110kV母联合并单元,即便人为识别也容易产生混淆,但聚类算法能准确有效地进行区分,通过输出结果可准确了解各间隔的IED配置情况,自动生成的接线图如图7所示,通过与变电站实际接线对比,生成的接线图拓扑结构与实际一致。

图7 自动生成的主接线图

通过对命名规范的SCD文件IED进行随机混淆处理,模拟实际中可能出现的各种不规范的SCD文件,再进行聚类,也能得到和实际拓扑结构一致的结果,聚类方法有效。

5 结束语

智能变电站的数字化程度越来越高,智能变电站配置文件地位也越显重要,以往的SCD文件存在对拓扑结构的描述较少,配置命名规范也不完全同一,相应可视化工具在自动展示一次接线图的功能性上也有所不足。本文提出了基于IED按间隔聚类自动生成主接线图的方法,解决了之前研究中不能在配置命名不规范情况时自动生成接线图问题,将接线图自动生成的技术通用性大大增强。

最后分别通过对规范和不规范的SCD文件进行了实测验证,证明了所提方法在准确性和有效性上都达到了预期的效果,这一技术可以方便地与其它系统进行集成,加快变电站接线可视化应用开发。

猜你喜欢
接线图团体聚类
中国队获第63届IMO团体总分第一名
中国队获第59届IMO团体总分第三名
面向WSN的聚类头选举与维护协议的研究综述
元件投影图在电拖接线图中的应用
改进K均值聚类算法
基于Spark平台的K-means聚类算法改进及并行化实现
基于加权模糊聚类的不平衡数据分类方法
维修电工线路板的接线技巧分析
基于PLC的高压密封试验台的电控系统的设计
美团体打广告抗议“中国制造”