大数据视角下相近SCD 文件的差异分析方法

2021-03-06 02:56李劲松童晓阳李文琢
电力系统自动化 2021年4期
关键词:文件名校核端子

李劲松,童晓阳,张 炜,李文琢,赵 娜

(1. 电力调度自动化技术研究与系统评价北京市重点实验室(中国电力科学研究院有限公司),北京市100192;

2. 西南交通大学电气工程学院,四川省成都市610031)

0 引言

近几年来,智能变电站在国家电网有限公司倡导 下 得 到 大 力 建 设[1-4]。 变 电 站 配 置 描 述(substation configuration description,SCD)文件在智能变电站运行与调试中起到重要的作用[5-6]。近年来,国内逐渐重视变电站文档管控、同站不同版本SCD 文件比对、SCD 文件校验等工作,取得了许多成果。

智能变电站调试阶段存在不同版本的SCD 文件,国内厂家已研发比对工具用于发现不同版本SCD 文件的差异。文献[7]将每组变电站配置描述语言(substation configuration description language,SCL)元素基于二维表数据结构的主键逐一比对各节点(包括虚连接)的相同、新增、删除结果。但是,已有比对工具缺乏对虚连接的虚端子引用、两侧虚端子数据类型一致性等的校验。针对SCD 文件设计上的许多不规范,文献[8]依据智能变电站技术工程规范对SCD 文件中各项不规范进行检查,但对虚连接的规范性校验仍不够深入。

已有SCD 文件比对与校核工作存在一些不足:一是侧重于同站不同版本SCD 文件的差异比较,没有与相关不同站SCD 文件虚连接进行差异比较以借鉴其设计;二是现有SCD 文件比对和校核在功能上相对独立,没有将虚连接比对与虚端子规范检查相结合来发现影响设备运行的虚端子问题;三是虽然已有文献研究了文件管控系统[9-10],如文献[11]提出基于构件技术记录智能电子设备(intelligent electronic device,IED)软硬件及配置参数等备份信息的版本管控系统设计方案,文献[12-13]研发智能变电站SCD 文件管控系统的循环冗余校验(cyclic redundancy check,CRC)、文件比对等功能,但目前仍主要通过手工收集不同版本SCD 文件进行比对。

近年来,大数据技术得到了快速发展,通过采集、抽取、存储、分析、形成结果等手段进行数据分析,帮助企业降低成本、提高效率、做出更明智的业务决策[14]。大数据技术为智能变电站二次系统调试尤其是SCD 文件的差异分析提供了新思路。本文尝试在大数据视角下,利用大量历史SCD 文件构造历史数据库,采用智能匹配算法,在历史数据库中搜索同站不同版本或不同站相近的SCD,实现两个相近SCD 虚连接快速比对,改进虚连接设计。对两个相近SCD 进行全面比对,在发现虚连接差异同时对虚连接的有效性、一致性校核。充分挖掘历史SCD 文件,提高SCD 差异分析的广度与深度,发现设备潜在问题。目前,大数据视角下不同站SCD 文件的差异分析工作在国内尚不多见。

本文收集大量历史SCD 文件,构建历史SCD文件数据库,智能搜索同站不同版本或不同站SCD文件,进行快速比对和全面比对,对虚连接引用虚端子有效性、两侧虚端子类型一致性等进行检查,以发现虚端子问题。

1 问题的提出与整体思路

1.1 问题的提出

对于同站不同版本的SCD 文件比对,目前已有做法是对两个SCD 文件中各类信息进行比较,给出其差异,虽然能够找到两个SCD 文件的虚连接差异,但没有给出差异原因,也缺乏对虚连接的虚端子引用准确性、虚端子数据类型一致性等的校验。本文在这方面予以加强。除了发现同站不同版本SCD 文件的错配与漏配,通过与不同站相近SCD 文件虚连接的比较,发现本站SCD 文件的虚连接相比于其他站相同接收与发送IED 虚连接设计的不足。因此,需要收集同站不同版本SCD、不同站SCD 文件进行差异分析。

1.2 整体思路

针对同站不同版本SCD 文件、不同站同电压等级SCD 文件,运用电压等级匹配与字符串相似度匹配 算 法 RKR-GST(running Karp-Rabin greedy string tiling,结合KR 的贪心串覆盖算法)相结合的搜索策略,在历史数据库中搜索到同站不同版本SCD 文件或不同站相近SCD 文件。

对于当前SCD 文件和搜索到的相近SCD 文件,从三个维度或层次进行差异分析和校核。

第1 个维度是两个相近SCD 文件的虚连接快速比对,对两个相近SCD 文件中对应IED 的虚连接进行双向快速比对,可先初步掌握两个SCD 文件的虚连接设计上的差异。

第2 个维度是对两个不同版本或不同站相近SCD 文件进行全面比对,通过逐级逐对比较,给出虚连接详细比对、采样值(sampled value,SV)的通道数目不相等、SV 或面向通用对象的变电站事件(generic object oriented substation event,GOOSE)控制块未引用、无效的IED 等比对细节。

第3 个维度是对两个SCD 文件中各IED 的控制块及其数据集、虚连接的有效性、类型一致性等进行校核,尤其是发现与虚连接相关的设计问题。

将发现的比对差异和校核问题,从宏观到细节分类展示,帮助快速交叉查找造成差异的原因。

系统结构如图1 所示。基于历史数据库的相近SCD 文件差异分析的流程如图2 所示。

图1 基于大数据的SCD 文件差异分析的系统结构Fig.1 System structure of difference analysis for SCD files based on big data

图2 基于历史数据库的相近SCD 文件差异分析流程Fig.2 Flow chart of difference analysis for similar SCD files based on historical database

2 历史SCD 文件数据库的构建

本文从多个变电站收集大量不同电压等级的SCD 文件和同一个变电站不同版本的SCD 文件,构造和保存到历史SCD 文件数据库,作为差异化分析的参照物。

人们关注于相同电压等级、相似变电站SCD 文件中相同或相近IED 的虚连接比较,需要解析SCD文件中SCL 节点下Header,Substation 节点,获得该SCD 文件基本信息,在数据库中保存。再解析和构造SCD 文件中各IED 具有完整引用路径、虚端子描述的虚连接信息,以快速对不同SCD 文件中相同或相近IED 的虚连接进行比较。

设计数据库中的表SCDsInfo,其字段包括编号SCDNo、SCD 名 称SCDname、SCD 描述SCDdesc、版本号version、SCD 文件名SCDfilename、电压等级Vol。加载SCD 文件,获得其文件名,解析Header和Substation 节点,获得版本号、SCD 文件名称、SCD 文件描述、电压等级等,形成SCDsInfo 表中一条新记录。

设计表RelatedPair,它包含关联对号SCDNo 和id_RP、发送IED 名、发送IED 编码、发送IED 类型、接收IED 名、接收IED 编码、接收IED 类型。设计表Vlinks,它保存各IED 的虚连接信息,包含发送虚端子引用Output_Vport_Ref、发送虚端子描述Output_Vport_Desc、接收虚端子引用Input_Vport_Ref、接收虚端子描述Input_Vport_Desc、关联对号id_RP。解析SCD 文件中各IED 的数据集DataSet下功能约束数据属性(functional constrained data attribute,FCDA),以IEDnameldInst/prefixlnClassln Inst.doName.daName 形式构造FCDA 的完整路径,从相关daName 节点获得该对象描述;再解析各IED 的Inputs 集合中所有ExtRef 节点,获得虚连接ExtRef 节点下的接收虚端子intAddr 和发送虚端子各属性,将发送虚端子的各属性daName,doName,iedName,ldInst,lnClass,lnInst,prefix 组 织 成 与intAddr 类似的引用路径形式,然后在当前IED 和发送IED 中查找对应的DOI 对象,获得接收虚端子、发送虚端子描述,连同该虚连接所在的关联对号一起保存到表Vlinks。

3 历史数据库中搜索目标SCD 文件与快速比对

3.1 从历史SCD 文件数据库中搜索相近的目标SCD 文件

1)RKR-GST 算法

RKR-GST 算法结合了GST 算法与RKR 算法的优点[15],其思路是模式串对待比较文本字符串中每个元素不需要一一比较,只需在模式串子串的散列值与文本串子串的散列值相同时才比较和模式匹配,运行效率较高。首先指定最小匹配长度,再指定一个搜索长度s 对两个字符串T 与P 进行划分,使用同一个散列函数分别计算每个划分的散列值并存储,比较这些散列值,若散列值相同就认为这两个长度为s 的子串匹配,紧接着对这两个子串后面的字符串进行贪婪匹配,如果后面字符依然相同,则继续匹配,直到不能匹配为止,同时记录这个匹配长度和在字符串T 中开始匹配的位置m 与字符串P 中开始匹配的位置n,存储这些信息,继续匹配其他长度为s 的子串,每对能够匹配的子串都贪婪匹配,记录匹配的长度、开始位置等,形成一个匹配链表。当所有长度为s 的子串全部匹配完毕,再做标记过程。最后,计算各匹配子串长度之和的两倍除以两个字符串长度之和得到匹配度。

2)电压等级匹配与字符串相似度RKR-GST 算法相结合搜索相近SCD 文件

历史SCD 文件数据库已保存大量不同电压等级的SCD 文件。表SCDsInfo 有文件名SCDname、SCD 文件名称、SCD 文件描述、电压等级Vol 等字段。现需要为当前SCD 文件名src 找到同站不同历史版本或相同电压等级不同站相近SCD 文件的目标文件名obj,采用电压等级匹配与RKR-GST 算法相结合的搜索方法。

如果搜索同站不同版本SCD 文件,则先根据当前SCD 文件电压等级cur_Vol,从当前SCD 文件名获得变电站名的核心词Core_word(如安宁),在表SCDsInfo 中 检 索 字 段Vol 等 于cur_Vol、字 段SCDname 包含Core_word 的记录,得到满足条件的SCD 文件名。然后,采用RKR-GST 算法给出当前SCD 文件与这些SCD 文件名之间的相似度。

如果搜索相同电压等级不同站相近的SCD 文件,则先在表SCDsInfo 中检索字段Vol 等于cur_Vol、字段SCDname 不包含当前变电站名核心词Core_word 的SCD 文件名,它们是与当前SCD 文件具有相同电压等级的不同站SCD 文件,这样过滤掉同站不同版本SCD 文件。然后,针对通过过滤的这些SCD 文件名,采用RKR-GST 算法,将它们与当前SCD 文件名一一进行字符串匹配,获得对应的相似度。

这样循环处理完所有SCD 文件名,将相似度排在前列的各scdfile,列为候选的目标SCD 文件,将其中相似度最大的作为最相近的SCD 文件名,避免了非相同电压等级SCD 文件(如500 kV 与220 kV变电站)的比对,并找到不同站相近的目标SCD文件。

如果对从历史数据库中搜索的目标SCD 文件结果不满意,可通过手工筛选,运用关键词匹配方法,从当前SCD 文件名src 取出多个关键词,如取出电压等级数字、kV、变电站名称中核心词等,再针对表SCDsInfo 中查询到的所有SCD 文件名,依次检查每个文件名scdfile 是否包含了这些关键词,如果包含则将该文件名作为筛选后的目标SCD 文件名,然后再罗列这些相近的SCD 文件名,供操作者选择合适的目标SCD 文件。

3.2 两个相近SCD 文件的虚连接快速比对

对于两个同站不同版本或不同站相近SCD 文件,人们希望能够先对两个SCD 文件中各IED 的虚连接进行快速比对,发现它们之间的虚连接差异。为此,在将历史SCD 文件入库时提前解析各IED 的虚连接,组织得到各虚连接中发送与接收虚端子的完整引用与描述,方便后续虚连接快速比对。对于当前源头SCD 文件(src)和目标SCD 文件(obj),掌握它们中相同或相近IED 的虚连接差异,进行快速校对和借鉴。

目标SCD 文件各IED 的虚连接已在虚连接表Vlinks 中有发送虚端子引用、发送虚端子描述、接收虚端子引用、接收虚端子描述,针对源头SCD 文件,做同样处理,得到源头SCD 文件中所有IED 的虚连接。

针对src 中每个IED(srcIED),提取IED 名,到obj 的所有IED 名中查找名称相同的目标IED。如果找到了目标IED(objIED),则按照“接收虚端子描述相同”或“接收虚端子引用相同”的策略,分别对srcIED 和objIED 的各条虚连接进行交叉比较和匹配,依次对两侧的每条虚连接进行匹配,为它们分别找到完全匹配的目标虚连接(即发送虚端子引用、发送虚端子描述、接收虚端子引用、接收虚端子描述分别相同),如果未能在对侧文件中匹配到相同的虚连接,则分别标记为新增或删除的标志。

对于两个SCD 文件中相同IED 的所有虚连接比对结果,对照列出两个SCD 文件中每个IED 的虚连接个数,每对接收IED 和发送IED 的每个虚连接的4 项信息,提供给操作者比较,这样可先初步掌握与定位不同版本或不同站相近SCD 文件之间虚连接的差异。

4 两个相近SCD 文件的全面比对与校核技术

4.1 两个相近SCD 文件的全面比对

借鉴已有SCD 文件的比对思路,对两个SCD文件进行全面比对。对两侧SCD 文件中各级节点进行逐级解析,以树形结构为单位,嵌套比较每个节点及其子孙。

每个节点用标签名、主键值区分。标签名代表节点类别,节点主键属性一般是name,虚连接ExtRef 主键为intAddr,个别节点主键由多个属性组合,如LN 的主键由lnClass,inst,prefix 组合。当两侧SCD 两个节点的父节点相同,同时它们的标签名相同,表明它们是同类节点,再检查它们的主键值是否相同,如果相同,则它们是相同节点。

对于src 侧某节点node1,先得到其父节点fa,再在obj 侧找到与fa 相同的父节点fO(即node1 在obj侧的父节点),在obj 侧fO 节点下属儿子集合中依次找到与node1 同类的各节点,将其主键值、节点指针加入临时obj 侧同类节点Hash 集合。

对于该obj 侧同类节点Hash 集合,带着src 侧node1 节点的主键值在该Hash 集合中检索。如果该Hash 集合包含node1 的主键值,就说明src 侧node1节点在obj 侧找到了相同节点node1O,分别为src 侧node1、obj 侧node1O 做出节点相同标记,否则认为node1 是新增节点,为它做出新增标记。

同理,对obj 侧节点node2 进行类似处理,查找和形成src 侧同类节点Hash 集合。如果在该Hash集合中没有检索到node2 的主键值,则说明node2 在src 侧没有相同节点,为node2 做出删除标记。

对于两侧相同节点node1 和node1O,再递归比较node1 与node1O 下属各儿子之间的差异。对于node1 的一个儿子,同上在node1O 的儿子中查找与其相同的节点,给出相同或新增标记;反之,对于node1O 的一个儿子,如果无相同标记,同上在node1的儿子中查找,如果找不到相同节点,做出删除标记。这样处理完两侧相同节点的所有儿子,返回到父节点的下一个儿子,做下一步比对处理。

在比对两侧同类节点时,对于一些主要节点如IED,LN,DOI 等,除了为它们在对侧SCD 中查找相同节点,还关心两侧相同节点的非主键属性差异。例如对两侧两个相同IED 节点,检查它们的版本configVersion、描述desc、制造商manufacturer、类型type 属性值的差异,做法是对两侧两个相同IED 节点,分别提取它们的各非主键属性及其数值集合,将一侧IED 节点的每个属性,到另一侧IED 的属性与数值集合中查找到相同属性,再比较两侧两个属性值是否相同,如果不相同,则设置该属性不相同标记,辅助查找差异的原因。

通过以上两侧SCD 文件同类节点的主键值交叉检查,比较两侧各节点及其子孙,给出两侧节点的相同、新增、删除、非主键属性不同等差异结果。

4.2 两个相近SCD 文件虚连接的校核

根据智能变电站系统调试经验,SCD 文件自身不规范也会影响设备运行,依据国家电网有限公司最新规范的校核规则可参见附录A 各规则。本文重点研究了校核影响虚连接质量的几个关键点,包括:①检查两个SCD 文件中各控制块数据集的各条目一致性;②检查发送数据集中输出虚端子是否被正确引用;③检查虚连接正确性,即检查每条虚连接中发送虚端子的IedName,ldInst,lnClass,doName,daName 是否存在,对于接收虚端子intAddr,校验其短地址格式正确性,校验所属IED 是否有此短地址,校验端口是否在PhysConn,intAddr 是否在当前IED 的do 或da 存在;④检查发送虚端子与接收虚端子的数据类型bType 一致性。其流程图如附录A 图A1 所示。

对src 侧某IED 下虚连接集合Inputs 节点下虚连接ExtRef 集合,在obj 侧找到相同IED 的Inputs 节点下虚连接集合,除了按照上述对两个IED 的虚连接集合中各虚连接进行双向交叉比较,还增加检查两侧每条虚连接的发送虚端子的正确引用。提取src 侧中每个虚连接ExtRef 的属性iedName,ldInst,lnClass,lnInst,找 到 发 送IED 对 应LN 节 点,连 同ExtRef 的daName 和doName,在发 送IED 下各控制块的数据集DataSet 下各条目FCDA 中逐个比较,检查该发送虚端子是否在发送IED 数据集中存在,如果不存在,则说明该发送虚端子不是有效的,否则记录该发布虚端子在发送数据集的索引号。同理,处理obj 侧相同虚连接的发送虚端子,再比较两侧发送虚端子索引号的不同,从而完成两侧发送虚端子的有效性检查。

然后从当前ExtRef 的属性intAddr,解析出daName,doName,ldInst,lnClass,lnInst,prefix,在当前IED 中找到对应DOI 对象,检查当前接收虚端子是否有效存在,完成接收虚端子有效检查。

再根据接收虚端子所在的LN 节点,获得类型属性lnType,按照下面方法找到相应的类型属性bType,检查该接收虚端子数据类型是否有效存在。

再检查虚连接的发送与接收虚端子的数据类型bType 的 一 致 性。 先 提 取ExtRef 的iedName,lnClass,lnInst,到发送IED 找到相应LN 节点,获得对 应lnType,根 据lnType 和lnClass 到DataType Templates 节点下查找对应LNodeType 节点,再根据ExtRef 的doName 在该LNodeType 节点下找到对应DO 节点,根据其type 属性值,在该DO 下找到其id 属性值等于该type 属性值的DOType 节点,根据ExtRef 的daName 找到该DOType 节点下对应DA 节点,提取其数据类型属性bType 的数值。

同理,对ExtRef 的接收虚端子引用路径intAddr,从中解析daName,doName,ldInst,lnClass,lnInst,prefix 属性,由以上类似方式,为接收虚端子查找到其数据类型属性bType 的数值。

最后,比较这条虚连接的发送虚端子、接收虚端子的数据类型bType 值是否一致。

多轮嵌套查找虚连接中发送虚端子与接收虚端子的数据类型bType 的过程如附录A 图A2 所示。可以看出,为该条虚连接找到的发送虚端子与接收虚端子的数据类型都是BOOLEAN,它们是一致的。

为了更清晰地查看各种差异点,按照从概述到细节分类给出比对结果。先给出所有比对结果概要,再给出各差异点的详细内容(即详细比较),然后分别给出其他类差异与校核结果,包括控制块数据集的条目信息比较、SV 通道数目一致性、SV 或GOOSE 控制块未引用等。“详细比较”类中各差异点大多是由数据集的条目信息、SV 通道数目一致性、SV 或GOOSE 控制块未引用等原因造成。通过分类显示差异,不仅能看到各差异细节,而且能够快速在其他类比对结果中交叉找到差异原因。

5 技术实现与应用

根据上述基于历史SCD 文件的相近SCD 文件差异分析思路,构建历史SCD 文件数据库,收集了200 多 个SCD 文 件,约 有18 000 MB,包 含 约1 150 000 条虚连接,对它们提取信息存入数据库,方便集中管理SCD 文件。借鉴相关设计[16-18]后设计了本文的比对系统。

对于同站不同版本SCD 文件,对实际变电站“220 kV 安宁变scd140710.scd”在历史数据库中搜索到最匹配目标SCD 文件“220 kV 安宁变scd140702.scd”,两个文件名的相似度为0.882。对两个SCD 文件进行虚连接快速比对,对照结果界面如附录B 图B1 所示。两个SCD 文件中PM2201B来自各发送IED 的虚连接被找到,分别给出这些虚连接的细节。

从附录B 图B1 可以看出,左侧220 kV 安宁变scd140702.scd 中PM2201B(220 kV 母线保护B 套)来自MM2201B(220 kV 母线合并单元B 套)的虚连接个数为13,而右侧220 kV 安宁变scd140710.scd中PM2201B 来自MM2201B 的虚连接个数为19,后者增加6 条。需通过全面比对,查看这些虚连接的差异细节。

再对这两个同站不同版本SCD 文件进行全面比对,首先给出了两个SCD 文件比对结果概述,说明了各类差异和校核的统计数量,如附录B 图B2所示。

分别给出了两个SCD 文件中各IED 虚连接的详细比对、SV 的通道数目不相等、SV 或GOOSE 控制块未引用、无效的IED 等比对细节,如附录B 图B3 至 图B6 所 示。 从 图B3 可 看 到,SCD1 的PM2201B 来自MM2201B 的虚连接比SCD2 的相同接收与发送IED 增加6 个虚连接的差异细节。

通过分类比对结果,可帮助工程师及时发现两个SCD 各方面的差异,尤其是虚连接差异及其虚端子不规范问题。例如,由附录B 图B3 虚连接详细比对结果的81 行看到一个差异,设备:[PL1101]110 kV 城 南 线161 保 护,位 置:PL1101(装 置)/0x401c(SV 控 制 块)-ML1101 MU/LLN0.smvcb0(SvID)/保护电压A 相(接收虚端子),结果:外部序号:15→13。这说明两个SCD 文件中PL1101 这条虚连接内容相同,但发送虚端子MU/TVTR2.Vol在发送IED(ML1101)的控制块smvcb0 对应数据集中的序号从15 变成了13。

接着在附录B 图B4 中SV 的通道数目不相等第1 行找到了原因,设备:[ML1101]110 kV 城南线161合并单元,位置:ML1101(装置)/0x401c(SV 控制块)-ML1101MU/LLN0.smvcb0(SvID),结果:通道数目:33→25。原来是SCD1 中ML1101 的控制块smvcb0 对应数据集的通道数目是33 个,而在SCD2中该IED 对应数据集的通道数目为25 个。通过检查虚连接中发送虚端子引用的一致性,以及SV 的通道数目及其序号,发现了这些问题,它们可能会给设备运行带来一定的隐患。

对于不同站SCD 文件的比对,例如对SCD1“浙江宁波110 kV 白岳变20180329.scd”,从历史数据库中找到包含“浙江”和“110 kV”的不同站多个相近的SCD 文件,采用RKR-GST 算法找到其中“浙江湖州110 kV 吴山变20180211.scd”,作为最相近SCD(SCD2)。

首先,对两个相近SCD 文件进行虚连接快速比对,比对结果如附录C 图C1 所示。从图C1 可以看出,SCD1 中CL1101(梁政白1126 线测控装置)的虚连接总数是83,SCD2 中CL1101(110 kV 甘山1743线测控)的虚连接总数是93;SCD1 侧CL1101 接收来自ML1101B(梁政白1126 线第2 套合并单元)虚连接个数是11,而SCD2 侧CL1101 来自ML1101B(110 kV 甘山1743 线合并单元B 套)虚连接个数是19,比SCD1 侧 多8 个 虚 连 接;SCD1 侧CL110 接 收来自IL1101(梁政31126 线智能终端)虚连接个数是71,而SCD2 侧CL110 接收来自IL1101(110 kV 甘山1743 线智能终端)的虚连接个数是74,比SCD1侧多3 个虚连接;SCD1 中CL110 接收来自CM1101(110 kV Ⅰ段母设测控装置)的虚连接个数是1,而SCD2 侧无此发送设备。然后,对两个SCD 进行全面比对,可看到两侧CL110 的各发送IED 的虚连接差异细节,如附录C 图C2 所示。给出了SCD2 侧新增的8 个虚连接等细节,此处不再赘述。这样对于SCD2 的CL110,就能从SCD1 侧同名IED 的虚连接设计上得到一些借鉴。通过两个相近SCD 中相同IED 的虚连接比较,发现了虚连接错配、漏配,从而及时提示操作者检查、纠正这些虚连接问题。

与已有的SCD 文件比对做法相比,本文增加了构造历史数据库保存历史SCD 文件,采用RKRGST 算法找到同站不同版本、不同站SCD 文件,利用库中已构造虚连接进行快速比对,初步看到差异,再对两个SCD 文件全面比对,给出虚连接差异细节,并增加了虚端子有效性、一致性等校核。将比对结果从概述到细节分类展示,帮助交叉查找虚连接差异与出错的原因,并在测试中发现了少量虚连接的发送与接收虚端子数据类型不一致的情况,这可能会带来潜在的问题。

相对于已有的文件管控系统[12-13],本文不仅管理各类文件,而且增加了利用历史数据库智能搜索相近SCD 文件、两个SCD 文件虚连接快速比对、SCD 文件全面比对同时几个关键点的校核等功能。

6 结语

本文从大数据视角出发,收集大量SCD 文件,构建历史数据库。采用电压等级匹配与字符串相似度RKR-GST 算法结合,在历史数据库中搜索相近的SCD 文件,进行虚连接快速比对,以提高比对效率。对两个相近SCD 文件的各级节点进行逐级的全面比对,并着重对两个SCD 文件中虚连接中虚端子的有效性、唯一性、两侧类型一致性等进行校核,帮助发现虚端子的潜在问题。从概述到细节分类展示,帮助工程师更有条理地查看比对差异细节,与其他差异校核结果进行交叉印证,发现差异原因,保证设备配置的正确性。下一步工作是收集更多SCD文件,加强该数据库的完备性,从而将SCD 文件的比对与校核工作更好地结合。

本文得到“电力调度自动化技术研究与系统评价北京市重点实验室(中国电力科学研究院有限公司)开放基金(智能变电站ICD、CID、SCD 一致性校核与SCD 自动校核技术研究,DZB51201901096)”的资助,特此感谢!

附录见本刊网络版(http://www.aeps-info.com/aeps/ch/index.aspx),扫英文摘要后二维码可以阅读网络全文。

猜你喜欢
文件名校核端子
发电机进相试验失磁保护与低励限制配合关系的校核
电线电缆及端子
通行费校核分析方法探究
2011 款大众EOS 车发动机偶尔无法起动
右键调用多重更名更方便
Excel轻松提取文件名
把我的秘密藏起来
熔断型端子压接模具研究
基于Mathematica的失磁保护与低励限制配合的校核
倍福 接线端子盒EJ系列