邹国惠,魏嘉隆,王超,张勇
(南方电网广东珠海供电局,广东 珠海 519000)
在我国物联网技术快速发展的背景下[1],电网发展正步入一个全新的时期,质量、效率等等诸多方面的提升都推动着电网在技术层面上的改革和创新,促使电网技术体系向智能化、信息化、自动化方向升级。随着电网投运电力设备数量的激增,电网企业对设备运维检修的投资加大,运检人员面临更多的电力设备巡视、维护和检修任务。为确保电力系统的安全和稳定运行,必须对电力设备进行全方位且精确的评估,准确掌握设备的当前状态及发展趋势,以便及早发现故障并进行必要的维护[2]。然而,传统评估方法往往依赖于运行经验,缺乏客观数据支撑,且未充分考虑设备运行环境和气候因素对不同区域电力设备状态的影响程度[3-4]。此外,评分方式未充分考虑到不同数据类型的特征以及数据生成频率的异质性,难以实现对电力设备健康状态的数据融合和精确评估。利用知识图谱信息可以将全域多维电力设备数据在语义层上联系起来,一方面在实体基础上实现多源数据聚合,另一方面将设备外态势信息联系起来用于情报挖掘及辅助决策。针对繁杂数据资源利用率低的问题,周俊宇等设计了基于知识图谱算法的搜索引擎系统,但是该系统的搜索准确率有待提高[5]。针对核电设备健康管理问题,熊奥等提出基于知识图谱的核电设备健康管理知识建模与分析方法,应用实体关系模型构建维修知识图谱本体框架,根据核电企业实际的维修工单数据,从统计分析和关联分析2个方面取得良好的实践效果,但将该方法应用于其他设备的实践效果有待提高[6]。针对光谱匹配方法在高光谱图像目标识别过程中对先验知识和空间信息利用不足的问题,王海晏等提出利用知识图谱构建地物属性及其关联关系对目标进行识别;该方法依托先验知识,将语义信息与定量描述的算法进行关联,针对高光谱图像数据特点,给出近似真彩色图像颜色转换方法和基于特征点匹配的轮廓识别方法[7]。但是,知识图谱技术在电力领域的构建与研究还有待深入[8]。
针对变电设备检修被动且效率低下问题,本文提出一种基于知识图谱的变电设备画像方法。为准确分析变电设备特征,利用知识图谱对设备信息进行映射,并结合图谱分类对映射数据进行多维度属性类别的划分;采用多视图理论和深度学习方法,构建一种融合多种技术的设备健康状态评估模型。在此基础上,运用模糊数学层次分析法,对变电设备的状态进行全面评估。最后,通过实验对所提出方法的有效性和可行性进行验证。
电力设备的安全运行知识图谱用于提取有关信息,并将计算机收集的资料加以整理和汇总归类,在查找时能获得准确、全面的解答[9]。在电力系统建设速度越来越快的背景下,出现了海量的相关数据。数据有结构化和非结构化之分:结构化数据是指按某种格式表达的表、库等,一般可直接应用于知识图谱的建构;半结构化数据为文本、音频、视频、图片等,需要对它们进行信息抽取才能进一步构建知识图谱。当拿到不同来源的数据时,需要对数据进行融合,将多源数据集合并成一个数据集,得到最终的数据,在此基础上构建相应的知识图谱。以三元组为知识图谱基本单位,构建其步骤主要分为收集多源异构数据、知识获取、知识融合和知识加工。对于文本型数据这类非结构化数据而言,知识获取主要有实体识别、关系抽取、属性抽取3种途径。实体识别指在一段文本中识别哪些词代表实体,并打上标签(进行分类)。关系抽取指识别文本(或其他数据)中实体之间的关系,具体方法又包括基于特征模版的方法[10]、基于核函数的监督学习方法[11]、基于深度学习的方法[12-13]等。属性抽取指提取实体的特定属性信息,为实体提供更详细的描述,使知识图谱更加丰富具体。
变电系统由一系列不同类型(型号)的电力设备和相应配套的设施共同组成。由于复杂的设备构成以及设备本身复杂精密的特点,以变电设备为典型评估对象,依托本文提出的基于三元组的知识图谱对其进行画像,可以有效提高知识检索与设备运行检修效率。图1为变电设备知识图谱构建流程。
图1 变电设备知识图谱构建流程Fig.1 Substation equipment knowledge graph construction flow chart
变电设备各类状态信息作为数据来源,其体量庞大、来源复杂且零散。本文用到的数据具体内容如下。
a)监视对象:变压器、断路器、电容器、隔离开关、高压并联电抗器等,这些设备可以反映设备的重载、电压、频率、压力等状态。
b)告警信号:变压器设备非电气保护中的油温等信息,可用于检测设备在实时运行过程中的健康状态。
c)辅助检测:监视范围为变压器、断路器中的油色谱、接地电流、套管介损、弹簧压力等。
从监测设备和信息监测的相互关系中可找出从不同设备监测到的信号间的逻辑关系。按照对其他相关系统产生的效果及紧迫性可以将信息监测划分为5类:事故、异常、偏差、位移、报告。以某变压器为例的设备子谱如图2所示,该变压器作为中心节点,该设备的特征属性、电力系统内的其他设备、指标体系等均可以藉由特定的关系描述与该变压器连接,从而形成丰富的知识图谱。
现在通用的抽取标准有2种:Direct Mapping和R2RML[14-15]。Direct Mapping是一种简单的知识抽取标准,它将文本中的实体、属性和关系直接映射到数据库表的列和行。具体来说,Direct Mapping通过指定1组规则或模板,将文本中的实体抽取为数据库表的记录,将文本中的属性抽取为表中的列,并使用关系表示实体之间的关联。R2RML是一种标准化的语言和映射规范,用于将关系型数据库(relational database,RDB)中的数据映射到资源描述框架(resource description framework,RDF)格式,从而支持数据的语义表示和知识图谱构建。R2RML提供了一套规则和术语,描述了如何将数据库中的表、列和关系映射到RDF三元组的主题、属性和对象。对于非结构文本信息中获取数据一般使用模式匹配、统计机器学习、监督学习和卷积神经网络(convolutional neural network,CNN)等。
变电设备的深度综合分析评估涉及不同系统、不同型号的设备以及大量实例等复杂情况[16],对应的体系级知识图谱必然要涵盖这些分立的知识图谱,因此需要构建融合知识图谱。基于知识图谱的知识融合方法主要有2类。第1类为基于逻辑推理的知识图谱法,利用逻辑推理技术,将来自不同源的知识表示为统一的语义模型;然后使用图数据库或知识图谱技术将这些三元组融合成完整的知识图谱,可以通过查询和推理来获取全面的实体、属性和关系知识。第2类为知识图谱补全法,在已有的知识图谱基础上,通过自动或半自动方式从外部数据源中获取新的实体、属性或关系,并将其合并到现有的知识图谱中。这类方法可以扩展和丰富现有知识图谱的内容,提供更全面的知识视图。在融合知识图谱的构建和应用过程考虑2个主要问题:①体系作为新的本体,如何融入已有的设备库中;②不同设备的子谱之间是否存在关系的冲突或冗余。
变电设备画像技术结合了知识图谱高效地组织多维知识与层次化建模功能以满足其本身对于知识定位、全面评价等综合性、高效性与实时性要求。以大量丰富数据资源为支持,采用补全图谱方法并应用各种先进技术实现知识图谱决策推理及下游任务扩展应用[17]。精确的语义识别与分析,功能完备强大的多线程检索引擎的提出,使知识需求得到快速解析,知识要素得到精确匹配,知识结果得到有效输出。
电力设备状态可以划分为4个等级:正常状态、注意状态、异常状态、严重状态[18-19]。正常状态是指能源设备的各个部件均处于正常工作状态,且所有状态变量的值均在警告值(注意值)之内。注意状态是指设备个别状态变量达到注意值,但设备各部件和系统能保持一定时间内基本完好。如果观察到某一状态变量超出了警告值范围,则认为该系统处于异常状态,需要对其进行处理,异常程度可分为轻度、中度、重度3种等级。当异常发生时,电力生产过程会受到影响,甚至造成事故。当电力设备状态中某一因素或某一指标明显超出警戒值时,其劣化曲线呈现出近似于指数级的变化规律,则认为设备处于严重状态。当设备发生故障时,其表现出的这种变化特性称为“异常”特征,即表征了该时刻电力设备运行状况恶化的程度。
电力系统是由一系列具有不同级别特性的一级和二级用电设备构成的复杂拓扑结构[20-21]。根据不同特征可以将电气设备分成多个层级进行管理,运用层次分析法(analytic hierarchy process,AHP)构建相应的分析模型[22]。模型第1层(指标层)为设备层和最底层系统评价的双重目标层,其目的是对被评对象进行总体描述。第2层(中间层)为组件层,其目的是更好地识别器件的缺陷和不足。第3层为控制层,它被视为关键指标,是构成评价体系的基础和主要组成部分。
通过对电气设备状态评估标准中各状态量的权重系数进行等级划分,并对指标层的元素进行两两比较,以推导各状态量指标之间的相互关系,得到指标层中k个不同元素相对于中间层相应元素的权重的判断矩阵W,其阶数为k:
W=(wmn)k×k,m,n=1,2,…,k.
(1)
式中:wmn为指标层元素m的权重系数与中间层元素n的权重系数的比值,wmn>0,wmn=1/wnm,当m=n时,wmm=1。在构建判断矩阵时,由于主观经验所决定的权重系数存在误差,特征根与特征相量之间的巨大偏差难以避免,需要引入一致性的校准公式:
(2)
式中:CR为一致性比率;λmax为判断矩阵W的最大特征值;CI为度量一致性偏差的标准;RI为度量随机一致性偏差的标准。
以变压器为例,基于AHP的电力设备状态评估如图3所示,以绝缘聚合度、绕组介质损耗、总碳氢化合物含量、吸收比/极化指数等指标为基础建立一个评估体系。
图3 基于AHP的电力设备状态评估(以变压器为例)Fig.3 State evaluation of power equipment based on AHP (transformer as an example)
参照油浸式变压器条件评价准则确定各条件量值的权重系数,得到判断矩阵
(3)
计算得到判断矩阵W的最大特征值λmax=6.1。对应的特征向量经归一化后的初始权重向量α6=(0.23 ,0.15 ,0.15 ,0.15 ,0.23 ,0.09)。
采用AHP将多源异构数据整合到统一的评估系统中,通过计算得到某一元素的初始权重向量,该过程中存在较大的主观经验,因此需要运用模糊数学来解决边界模糊的难题[23]。采用模糊隶属度函数对初始权重向量进行修正,以提高评估结果的客观性。为了解决边界模糊集合中某一元素隶属程度的问题,提出一种可行的隶属度函数解决方案,其取值范围为0~1。
采用模糊数学评估方法,很难量化各指标权重及装备劣化程度。针对这一问题,提出了一种基于模糊集理论的多级加权模糊评价模型,状态量综合评分采用参考导则评分评估方法,以基本打分值与权重系数之积作为评价依据。采用隶属度函数计算得到状态量指标评价的初始权重,并获得各个指标在设备图谱中间层所占的权重,从而定量地描述出当前设备健康状态。具体参数见表1。
表1 非数值型量化隶属度评估方法Tab.1 Non-numerical quantitative membership evaluation method
为验证文中设计的应用大数据分析的电力设备运行综合评估方法在使用中的合理性,采用Neo4j绘制知识图谱。
此次实验对象设定为电力公司生产的220 kV的设备。在实验过程中,为提升结果的有效性与准确性,将实验对象设定为2个部分,其中一台实验设备选用正常运行的设备,另一台设定为故障的设备。
4.2.1 评价指标
为了有效评估算法的数据异常识别以及电力设备故障检测的准确率,选取数据清洗率和故障漏检率2个评价指标。数据清洗率是指成功识别并清除异常或噪音数据的比例,故障漏检率是指未能成功检测电力故障设备的数量占总电力设备的比例。
4.2.2 对比方法
为了体现本文算法的有效性和先进性,分别将本文算法与传统方法和深度学习算法进行比较,通过不同的实验分析,验证本文算法的性能,并且通过这些实验研究不同方法的性能表现,以便为数据清洗和电力设备故障检测提供更准确的指导和推荐。
a)传统方法。针对数据清洗与电力设备故障检测,选择能量强度方法和Harris角点检测法进行对比实验,这2种方法在数据处理和故障检测中具有代表性。在实验中,重点关注迭代次数对数据清洗率和电力设备故障漏检率的影响。
能量强度方法是一种基于数据振幅和能量分布的处理方式[24],常用于数据清洗。其原理是通过测量数据的振幅变化来识别可能的异常点或噪音。在本文实验中,观察不同迭代次数下,能量强度方法的数据清洗率。
Harris角点检测法[25]是一种经典的特征检测方法,常用于图像处理和故障检测。该方法基于图像局部区域的强度变化来识别角点,通常被应用于电力设备故障检测。本文实验对比不同迭代次数下Harris角点检测法在发现电力设备故障方面的表现,以评估其漏检率。
b)深度学习算法。随着深度学习的发展,其在数据清洗与电力设备故障检测人工智能算法领域表现出越来越大的优势。因此,除了与传统方法对比之外,本文还选取了MuKEA、GPFL、DocTr几种深度学习算法[26-27]进行比较,以验证本文算法的先进性。
4.3.1 传统算法对比实验结果分析
本文算法与2种传统算法的数据清洗率如图4所示。可以看出,Harris角点检测方法的数据清洗效率平均为72.0%,能量强度法为79.5%,而本文算法的数据清洗效率高达96.0%。本文方法以图的形式存储数据,这与知识图谱的本质非常契合。图数据库能够捕捉实体之间的关系,更自然地表示知识图谱中的实体、属性和关系。因此,本文算法在数据清洗方面表现出更高的效率。
图4 数据清洗率Fig.4 Data cleaning rate
3种方法的电力设备异常漏检率如图5所示。可以看出,3种检测方法对电力设备异常漏检率的影响存在差异。针对这一问题,提出一种基于模糊理论的方法对设备进行综合评判。当数据量达到10 GiB时,能量强度法在电力设备异常漏检率方面表现不佳,漏检率25%,Harris角点检测与本文方法的漏检率分别为15%和1.2%;当电力设备的数据容量达到60 GiB时,Harris角点检测方法和能量强度法的漏检率几乎达到18.5%,本文方法漏检率仅为3%。相较于其他2种传统方法,本文方法的电力设备异常漏检率显著降低。
图5 电力设备故障漏检率Fig.5 Missing detection rate of power equipment fault
4.3.2 深度学习算法对比实验结果分析
本文算法与3种深度学习算法的对比结果见表2。可以看出,在数据清洗效率以及电力故障漏检率2个指标上,本文算法均明显优于3种深度学习算法。其中,数据清洗效率最多提升了14%,电力故障漏检率最多降低了1.7%,验证了本文算法的先进性。
表2 本文算法与深度学习算法的对比结果Tab.2 Comparison of experimental results between the proposed algorithm and deep learning algorithm
作为电网智能化的重要组成部分[28],电网设施智能化在线巡检监测系统提供了全面的数据支持,为电网设备状态评估和相关诊断功能提供了有力的保障。该系统融合了传感嵌入技术、实时检测技术以及故障排查诊断,为电网智能在线巡检监测提供了全方位的支持。
在知识图谱下游任务中,研究将智能巡视与知识图谱画像相结合的方法,通过知识图谱展示智能巡视的结果,并以知识图谱所描绘的设备健康状态指导智能巡视系统的运行。具体流程如图6所示。
图6 知识图谱与智能巡检协同应用流程Fig.6 Collaborative application of knowledge graph and intelligent inspection
a)巡检任务的管理:管理人员下达巡检任务并分配巡检任务,巡检系统在接受任务时根据任务内容完成现场巡检工作。
b)巡检数据采集:进行巡检数据采集时,需按照规定线路导航,引导标准操作流程,逐一实施巡检任务,以确保实现作业全过程的规范化。利用智能语音播报器将操作指令以文字形式告知巡检员,确保巡视工作顺利进行。建立故障知识库,根据历史维修情况分析可能出现问题的原因,制订针对性措施。
c)故障排查与远程协助:终端可以通过巡检模型对巡检过程进行巡检指导,用图谱形式展示设备画像模型、工作原理、常见故障的处理办法等。现场工作人员遇到技术难题时,可通过远程协助获取专家意见。
随着经济的迅速发展,电网规模不断扩大,其所包含的电力设备数量激增。如何高效地利用和分析各类海量的电力设备信息成为了一个重要课题。由于设备类型繁多,且不同种类的设备之间存在差异,目前基于设备本体的状态评估模型不能很好地满足实际应用需求。针对这些迫切需要解决的问题,本研究进行了一系列工作。利用知识图谱对设备信息进行映射,结合图谱分类对映射数据进行多维度属性类别的划分,深入分析每个设备的特征。基于多视图理论和深度学习方法,构建了一种融合多种技术的设备健康状态评估模型。在此基础上,运用模糊数学层次分析法对变电设备的状态进行全面评估,并通过实验验证其数据清洗率与故障漏检率。