基于相似度匹配的智能站虚端子连接准确性判断方法

2021-06-04 07:49戴志辉邱小强耿宏贤李金铄
关键词:字符预处理端子

戴志辉, 邱小强, 耿宏贤, 李金铄, 方 伟

(华北电力大学 电气与电子工程学院,河北 保定 071003)

0 引 言

常规变电站二次系统中,各端子之间一一对应的关系靠电缆连接实现,导致二次电缆数量庞大。在智能站中,通信网络传输的数字信号取代了传统二次回路传输的物理电气信号,二次设备之间通过光纤传输数据,光纤数量少,单根光纤传输多路数据,需通过虚端子保证数据传输的正确性[1-4]。

目前,虚端子的连接工作主要由设计院或现场集成商完成。虚端子数量多、工作量繁重,各设备厂家对虚端子描述存在差异,若设计人员对虚端子的含义理解不够清晰、凭经验连接虚端子易导致虚端子连接错误。虚端子连接一旦出错,会影响二次系统功能的实现[5-8]。

目前关于虚端子连接准确性的判断方法研究很少,多数集中在虚端子自动连接技术方面,以提高虚回路配置效率[9-12]。如文献[9]提出了一种根据特征字自动匹配的虚回路自动生成办法;文献[10-11]利用关键字符匹配实现虚回路的自动设计;文献[12]提出一种基于距离权重向量优化模型的虚端子自动连接方法。也有不少研究集中在虚回路的可视化和监测方面[13-16],如文献[14]构建了虚回路综合监视技术体系;文献[15]提出了一种基于综合评价识别法的虚回路在线状态监测技术;文献[16]基于短地址模型的虚回路监视方案。但是,对于虚端子连接准确性判断方法的研究很少,主要靠调试仿真的方法进行测试,文献[17]提出了一种基于制造本文的通信规范MMS通信的跨间隔联合测试方法,文献[18]设计出了一种数据核对和开出传动自动化验证的二次仿真自动测试系统。现场目前主要靠二次回路整体测试来检验虚端子连接是否正确。

为此,提出一种智能变电站虚端子连接准确性判断方法。首先分析了输入输出虚端子在数据格式和中文描述上具有一定相似度,提出一种新的相似度计算方法,并搜索输入输出虚端子间的最大相似度,通过最大相似度匹配原则判断输入输出虚端子连接的准确性。最后通过算例验证了方法的有效性。

1 虚端子及其数据格式

在智能站二次系统中,一根光纤可传输多路数据,需借助虚端子保证数据传输的一一对应关系。虚端子不是真实存在的端子,是用来标识二次设备间的回路信号,是GOOSE和SV报文传输过程中的信号连接点,从信息传输角度来看包括输入虚端子和输出虚端子两大类;而从报文类型来看,包括SV虚端子和GOOSE虚端子两大类[19-20]。

以某合并单元和保护装置为例,虚端子连接示意如图1所示,合并单元和保护装置通过一根光纤相连(图中带箭头实线),信息单向传输,以数据集形式发送,通过虚端子连接形成虚回路(图中带箭头虚线),从而实现数据的一一对应。

图1 虚端子连接示意图Fig.1 Virtual terminal connection

IEC 61850是智能变电站二次设备之间的通信标准,为不同设备之间的互操作性提供了保障[19]。IEC 61850数据建模技术是面向对象的,其树形的数据结构具有很强的层次化特点,从上到下的顺序依次为:PD物理设备(physical device)、LD逻辑设备(logical device)、LN逻辑节点(logical nodes)、DO数据对象(data object)、DA数据属性(data attribute),这种数据结构中的每个对象在模型里都有唯一的数据索引[12]。IEC 61850标准规定的虚端子数据格式为:LD/LN.DO.(DA),对应为逻辑设备/逻辑节点.数据对象.(数据属性)。于SV虚端子而言,DA即数据属性一项一般为空。因此,在IEC 61850标准下保证了虚端子在数据格式具有很大的相似性。

此外,各制作厂商在设计设备时,为方便达到各厂商设备的互操作性,让设计人员更好地理解和区别虚端子,往往会在虚端子加上一小段中文描述作为“虚端子定义”。相同虚端子在定义上也有很大的相似性,如“电压A采样值1”和“(电压 A)Ua”都含有“电压”、“A”等关键字符。本文即利用输入输出虚端子在数据格式和中文描述的相似性,建立虚端子连接准确性的相似度评估模型,对虚端子连接准确性进行判断。

2 基于相似度匹配的虚端子连接准确性判断方法

对虚端子连接准确性判断首先需要获得输入输出虚端子的连接关系,根据虚端子的特点对相似度计算方法进行改进,并以最大相似度匹配为原则建立更精准的虚端子连接准确性评判方法。

2.1 虚端子连接关系

SCD文件为智能变电站配置文件,包含了全站配置信息,由5部分组成:Header(信息头),Substation(变电站描述),IED(智能电子设备描述),Communication(通信系统描述)和DataTypeTemplates(数据类型模板)。描述虚端子连接关系的Inputs部分则保存在IED下的LNode(逻辑节点)中,即装置Inputs部分描述了装置的采样值或GOOSE连线,每个连线都包括了输入输出虚端子信号信息,它们的关系是一一对应的[19]。在实际数据传输过程中,采样值或GOOSE以数据集形式发送,数据集中的FCDA(功能约束数据属性)成员就是采样值或GOOSE输出虚端子。同理,输入数据集的FCDA成员就是输入虚端子,系统配置工具就是在相互通信的装置输出和输入虚端子间作逻辑连线来完成虚端子的连接。因此,可通过SCD文件的解析来获取虚端子连接关系,为虚端子连接准确性判断提供判断对象。

2.2 虚端子特点

目前,不同厂家在虚端子名称和定义没有完全统一,对同一虚端子的描述存在差异,甚至同一厂家由于设计人员不同,虚端子的描述也可能不同[5]。虚端子描述存在以下特点:

(1)虚端子的名称和定义主要由字母和汉字构成,如虚端子“保护A相电压Ua1”,这些字母和汉字是区别不同虚端子的关键依据,理解错误或不清都有可能导致虚端子连接错误,因此虚端子名称和定义可看作一种由关键性的字符串组成的集合。

(2)连接正确的输入输出虚端子在虚端子名称和定义上具有较高的相似度。这是因为虚端子名称采用IEC 61850标准规定的数据格式,在虚端子的定义上一般也含有“电压”、“电流”等关键字符。

(3)对于相同虚端子,不同厂家或设计人员对其的描述有长短详尽之分。如采样值输入虚端子“保护A相电流Ia1”和与其对应的采样值输出虚端子“保护Ia1”,对于字符串较短的虚端子,其含有的关键字符比重越大,设计人员对其含义的理解也更依赖每个关键字符。

(4)虚端子的名称和定义中除了字母和汉字等,还有一些无实际意义的标点符号字符,如虚端子“(保护电流_A)Ia”,“(”、“)”、“_”等。

根据上述前两个特点,虚端子的名称和定义具有一定的相似度,可利用相似度来对虚端子连接准确性进行判断,但后两个特点会对影响相似度的准确性,因此提出一种改进的相似度判断方法。

2.3 改进Dice距离相似度

Jaccard距离和Dice距离常用来描述两个集合之间的相似度,如用于文本的相似度比较(字符串可以理解为一种集合)进行文本查重等。

Jaccard距离定义公式如式(1)所示。

J(A,B)=|A∩B|/|A∪B|

(1)

式(1)中,A和B表示两个用于相似度计算的集合,在本文中对应输入输出虚端子的命名和定义字符集合。分子表示两个集合的共有部分,分母表示两个集合的并集,Jaccard距离表示两个集合相同部分在两个集合中所占的比重。

Dice距离定义公式如式(2)所示。

S(A,B)=2|A∩B|/(|A|+|B|)

(2)

式(2)利用2|A∪B|≥|A|+|B|对式(1)进行改进,因此有S(A,B)≥J(A,B)。

利用虚端子名称和定义的相似性,对输入输出虚端子的连接准确性进行判断。根据2.2节虚端子的特点,若直接用Jaccard距离和Dice距离对虚端子连接准确性进行判断,会降低准确性。如一些无实际意义的字符和长短不同的虚端子描述都会增大式(1)和式(2)的分母,从而减小其Jaccard距离和Dice距离相似度计算结果。

为此,在Dice距离的基础上进行改进,以适应虚端子的特点。由于描述字符长短不同,会造成2|A∩B|≪|A|+|B|,使得计算的相似度偏低,影响虚端子连接准确性的判断。描述字符越短,其关键字符比重越大,故利用|A|+|B|>2 min(|A|,|B|)对Dice距离进行改进,改进Dice距离如式(3)。

(3)

虚端子名称和定义中含有无实际意义的标点符号字符,在相似度计算时会导致计算结果偏低,影响对虚端子连接准确性的判断。故在相似度计算之前对虚端子进行预处理,去除无实际意义的标点符号字符,即在用公式(3)计算相似度之前,A和B应为去除无实际意义的输入输出虚端子字符串。去除无实际意义的标点符号字符,可借助MATLAB等软件的字符操作库函数实现。

2.4 基于相似度匹配的虚端子连接准确性判断流程

提出的虚端子连接准确性判断流程如图2。

图2 虚端子连接准确性判断流程Fig.2 Accuracy judgment process of virtual terminal connection

其主要步骤如下:

(1)输入虚端子关系表。虚端子关系表是指已连接的虚端子,包含输入输出虚端子的名称和定义。虚端子关系表可以直接从设计院提供的虚端子联系表中获得,也可以利用厂家提供的SCD解析工具对SCD文件解析获得。SCD文件中的Input节点描述了虚端子连接关系,每个连接关系都包括了输入输出虚端子信号信息,通过外部输入信息(IED、LD、LN、DO和DA)和内部输入信息(intAddr引用地址)可获得IED之间的虚端子互联关系,即输入输出虚端子连接关系[21]。

(2)虚端子预处理。在计算改进Dice距离之前,为提高输入输出虚端子在字符相似度的精度,需对输入输出虚端子进行预处理。借助MATLAB库函数,如siletter、sisspace、isstrprop函数,对虚端子进行预处理操作:去除每个虚端子所包含的相同字符,如对于合并单元的虚端子名称中都含有“MU”字符;去除虚端子中含义重复描述的字符,如虚端子“保护A相电流Ia1”,字符“A”和“a”意义相同,字符“电流”和“I”相同;去除虚端子中一些无实际意义的标点符号字符,如虚端子“(保护电流_A)Ia”中,去除“(”、“)”、“_”等无实际意义字符;对于一些非标点符号字符,如字母、汉字和数字等,一般具有实际意义,应予保留。

(3)计算输入输出虚端子的改进Dice距离:包含所有输入输出虚端子之间的改进Dice距离。若有N输入虚端子和N个输出虚端子,则每个虚端子(输入或输出虚端子)需计算其与所有虚端子的改进Dice距离,一共需要计算N×N个输入输出虚端子改进Dice距离。

(4)判断是否为最大相似度匹配:判断在所有输入输出虚端子的改进Dice距离中,连接的输入输出虚端子的改进Dice距离是否为最大。若连接好的输入输出虚端子改进Dice距离是该输入虚端子与所有输出虚端子的改进Dice距离中最大的,则判断该对输入输出虚端子连接正确,否则判为连接错误。

3 算例分析

3.1 数据及平台

参照某220 kV智能变电站中的线路间隔二次设备,其合并单元和保护装置均为国电某厂设备。利用MATLAB编写程序进行相似度计算。

3.2 虚端子连接准确性判断

第一步:输入虚端子关系表。

利用SCD解析工具解析SCD文件并导出合并单元和保护装置虚端子表如表1所示,表1所示为已连接好的输入输出虚端子,含有虚端子名称和定义。为验证方法的有效性,对序号为1、2、5和13的输入输出虚端子进行错误连接。

表1 输入输出虚端子表

第二步:虚端子预处理。

参照2.3节虚端子预处理操作,利用MATLAB字符处理库函数对虚端子的名称和定义进行字符预处理,去除了每个虚端子所包含的相同字符,去除了虚端子中含义重复描述的字符,去除了虚端子中一些无实际意义的标点符号字符,最后对表1中虚端子预处理结果如表2所示。

表2 输入输出虚端子相似度

第三步:利用式(3)计算输入输出虚端子改进Dice距离,并判断该连接的输入输出虚端子是否满足最大相似度匹配原则。

为体现改进Dice距离的优点,对比相似度计算的差异,利用式(1)、(2)同时计算Jaccard距离和Dice距离,结果如表2所示。可以看出,Jaccard距离、Dice距离和改进Dice距离计算的相似度依次增大,其中本文提出的改进Dice距离提高了准确性。这避免了虚端子名称和定义上的长短详尽差别导致的相似度下降问题,如表2中第3、7、9、11和14对输入输出虚端子在计算改进Dice距离的相似度达到1。

此算例中,部分输入输出虚端子之间的相似度很高,区别只在于相别和双AD数据名,如表1中前12对虚端子,输入虚端子靠字符“1”和“2”来区分双AD数据顺序,而输入虚端子靠字符“Q”来区分双AD数据顺序。为提高虚端子连接准确性判断方法的准确性,采取最大相似度匹配原则,以搜索出来的输入输出虚端子的最大相似度和连接的输入输出虚端子的相似度进行对比,若连接的输入输出虚端子的改进Dice距离最大,即输入输出虚端子连接正确。如表2中第1、2和13对输入输出虚端子在计算的相似度上都很高,但还可以搜索出更高相似度的输入输出虚端子,例如1号输入虚端子和2号输出虚端子改进Dice距离为1,因此判断其连接错误。最终通过最大相似度匹配原则,找出了预设连接错误的第1、2、5和13对输入输出虚端子。

3.3 结果分析

本例中连接错误的虚端子均能被找出,验证了方法的有效性。进一步分析可得:

(1)通过虚端子的名称和定义的相似度计算,可在一定程度上判断输入输出虚端子连接的准确性,连接正确的输入输出虚端子在虚端子名称和定义的相似度上更高。

(2)为进一步提高虚端子连接准确性判断精度,对虚端子中的名称和定义进行了预处理,提高了输入输出虚端子的相似度精度。

(3)改进Dice距离提高了虚端子连接准确性判断的准确性。相比于Jaccard距离和Dice距离,虽然所有的改进Dice距离相似度都相对变大了,但连接正确的虚端子在相似度上增幅更大。这是因为式(3)增加了输入输出虚端子在相同部分的比重,提高了连接正确虚端子的相似度计算的灵敏性。改进Dice距离有效提高了准确性,甚至部分连接正确的输入输出虚端子相似度达到1。

(4)最大匹配判别原则保证了虚端子判断的准确性。部分连接正确的输入输出虚端子之间的相似度不能达到1。主要原因是对于相同含义的输入输出虚端子的描述不同,如第4、6、8、10和12对输入输出虚端子,但其仍然服从最大匹配判别原则,可正确判为虚端子连接正确。

智能变电站虚端子数量巨大,算例选用部分典型合并单元和保护装置的虚端子进行分析;数量增多也是逐条寻找输入输出虚端子改进Dice距离中最大的进行比对,故虚端子数量不会影响本方法判断的准确性。

4 结 论

IEC 61850保证了虚端子在数据格式具有很大的相似性,据此本文提出了一种基于相似度匹配的虚端子连接准确性判断方法。首先对输入输出虚端子的命名和定义做预处理,然后利用改进Dice距离计算输入输出虚端子的相似度,通过搜索输入输出虚端子间的最大相似度,以此最大匹配相似度和连接的输入输出虚端子的相似度对比,即最大相似度匹配原则,判断输入输出虚端子连接正确性。

提出的基于相似度匹配的虚端子连接准确性判断方法具有有效性和通用性,实现简单方便。算例验证了方法的有效性。在虚端子连接设计、维护时,计算出连接虚端子的改进Dice距离,可找出相似度较低的、连接错误的虚端子,提高虚端子检查效率,进而整体提高设计效率和质量。虽然各厂家的产品有差异,但在IEC 61850标准框架下,输入输出虚端子在数据格式上有约束规范,因此输入输出虚端子具有很大程度的相似性,保证了本方法的通用性。相比于依靠现场整组传动试验验证虚端子连接正确性的方法,本方法实现起来更加简单方便,减少了工作量。

猜你喜欢
字符预处理端子
KR预处理工艺参数对脱硫剂分散行为的影响
求解奇异线性系统的右预处理MINRES 方法
汽车新型搭铁端子的设计与应用
粉末预处理对钨坩埚应用性能的影响
一种优化的手写字符自动分割算法
污泥预处理及其在硅酸盐制品中的运用
论高级用字阶段汉字系统选择字符的几个原则
2011 款大众EOS 车发动机偶尔无法起动
字符代表几
图片轻松变身ASCⅡ艺术画