基于知识图谱的配电网综合评价

2023-01-08 14:40朱晓荣彭柏司羽吴佳娄竞席嫣娜
现代电力 2022年6期
关键词:结构化图谱配电网

朱晓荣,彭柏,司羽,吴佳,娄竞,席嫣娜

(1.华北电力大学电气与电子工程学院,河北省 保定市 071003;2.国网冀北电力有限公司信息通信分公司,北京市西城区 100053;3.国网冀北电力有限公司,北京市西城区 100054;4.国网北京市电力公司,北京市西城区 100031)

0 引言

随着人工智能时代的到来,智能电网成为电网技术发展的必然趋势。为了适应城市发展,解决配电网设备陈旧、规划不合理等问题,亟需对配电网进行科学合理的评估,找到现存的薄弱环节,为配电网改造和规划提供目标和方向支持。然而,对配电网进行综合评价涉及复杂的评价知识以及大量的多源异构数据[1-2],通常需要专家及工作人员参与;当评价过程中出现问题时,工作人员难以获知具体原因,无法实现实时、高效、准确的评价。除此之外,电网设备、环境要求具有不确定性、多样化的特点,相关评价理论知识日益丰富且极大依赖于文本等传统形式储存,配电网综合评价工作的标准化、公共化、智能化水平不足,不便于工作人员快速掌握。因此,提升配电网数据的感知能力和机器认知的智能水平具有重要意义。

面对复杂多变的大数据环境,由人工智能技术发展而来的知识图谱(knowledge graph,KG)这一新兴认知方法在电力领域获得了初步的应用,越来越多的研究者将知识图谱应用于电网调度[3-4]、电力设备运检[5]、电力营销等电力领域。文献[6]详细论述了电力领域知识图谱的发展历程,分析了图谱构建方式及图谱应用方法,同时对电力领域知识图谱的潜在应用方向进行了阐释;文献[7]以电网故障处置预案文本为研究对象,利用深度学习技术,解决了电网故障处置图谱构建过程中涉及的电力领域知识抽取问题;文献[8]面向智能调控领域,构建了线路故障处置知识图谱,提出了多场景的知识图谱应用方案。

目前,尚未有专家学者对配电网综合评价领域进行知识图谱的构建与研究。本文基于上述研究成果,针对配电网综合评价问题,提出了基于知识图谱的配电网综合评价方法,从配电网综合评价知识图谱构建过程、图谱分类及关系、主要构建技术、知识推理技术和基于知识图谱的配电网综合评价流程等方面展开详细论述,重点分析由评估导则等文本中获得配电网综合评价知识的技术路线,最后结合实际配电网评价案例进行图谱展示与应用,对于应用知识图谱理清配电网评价系统知识、提升工作人员的认知能力、优化数据管理进行了有益的探索。

1 配电网综合评价的知识图谱构建

1.1 知识图谱构建方式

知识图谱的构建目的,是让机器具备认知能力,可以实现理解、推理、解释等任务。类似人脑的思维逻辑,知识图谱可以分为模式层与数据层2个层次[9]。本文针对智能配电网综合评价建立知识图谱,由于综合评价体系的核心构成要素相对固定,因此可以利用已有知识实现知识图谱自顶向下的构建,与此同时,构建图谱的部分要素的确定会涉及类型多样的半/非结构化信息,例如,在确定评价方法、评价模型时,会涉及网页知识、评估导则等数据。为确保知识图谱本体的完备性,本文采用自顶向下、自底向上相结合的本体构建方式,既可以充分应用配电网综合评价领域专家的经验和传统知识模型,又可以巩固、更新现有知识。从原始的知识或数据到形成知识图谱,经历了数据模型构建、知识抽取、知识融合、知识加工等步骤,构建过程参见附录。

1.2 基础数据和图谱类型

在建立的配电网综合评价知识图谱中,结构化数据指电网中的关系型数据库,包括电网实时及历史运行数据、设备资产信息数据库、电网设备属性及其拓扑结构,还包括气象数据、电网周围环境、用户负荷等信息。半结构化数据,包括电力知识百科或电力专业词库中关于配电网评价的数据等;非结构化数据主要指文本数据,包含配电网运行管理规定、评估导则、配电网历史评价案例等。结合以上数据及传统综合评价体系,本文将配电网综合评价知识图谱分为评价逻辑图谱、配电网实体图谱和案例图谱3种类型,图谱之间的关系如图1所示。其中,数据模型由模式层构建而来,用于指导评价逻辑图谱的构建,是综合评价体系的顶层设计。

图1 配电网综合评价知识图谱所需数据及图谱分类Fig.1 Required data and classification of knowledge graph for comprehensive evaluation of distribution network

本文定义的评价逻辑图谱是传统评价体系中评价指标、指标权重以及综合评价判据等具体评价逻辑的网络化、结构化信息表达。按照数据模型所定义的评价要素,指导评价逻辑图谱的生成,应用自然语言处理、知识提取、信息结构化等技术手段,可获得如评价指标的定义、指标计算方法、指标权重设计过程、以及评价判据模型等具体内容。

配电网实体图谱表征实际配电网的网络拓扑结构,其作用是为评价逻辑图谱提供实体查询和匹配服务。以电网中母线、变压器、线路、开关、分布式能源等配电设备作为知识图谱中的实体,设备间的连接情况用知识图谱中的关系表示,各电力设备的参数、电压、功率、频率等信息以属性形式存储在知识图谱中。

案例图谱主要提取评价过程中的时间、评价目的、评价内容、评价结果等数据,以特征关键词形式来表示历史评价并存储在结构化案例库中,案例的更新由机器自动生成,在进行新一次的评价时,自动搜索匹配相关记录,可推送评价历史及评价建议,形成对于单次评价任务的历史关联和多角度分析。

1.3 知识图谱构建技术

对于能量管理系统中包含的电网拓扑结构化数据,可直接抽取实体三元组,转化为RDF格式,其他如生产管理系统中的设备数据,还需经历数据库间的知识融合,才能获得电网实体知识图谱构建所需的数据,此部分内容涵盖范围广泛,本文不做详细说明,本文重点研究由评估导则等文本类的非结构化数据处理,这些文本类数据需要经历数据模型构建、知识抽取、知识融合、知识加工以及知识更新等过程获得结构化的评价逻辑图谱和案例图谱,其中评价逻辑图谱可以细化为指标库、评价方法和模型数据库,以下对核心技术展开详细论述。

1.3.1 数据模型构建

构建的数据模型包括评价逻辑图谱中的指标本体,如清洁性、经济性等指标,配电网实体图谱主要包含反映设备概念与连接拓扑的实体本体,案例图谱中包括反映评价结果的如分数、等级、水平等本体,通过本体库可形成数据冗余度低且易扩充、知识组织条理性好的知识库[10]。基于配电网综合评价领域的知识,本文建立的数据模型

可以由评价专家来人工制定。

1.3.2 知识抽取

知识抽取是将半/非结构化数据转换为结构化数据的技术手段,主要包含实体、关系、属性知识要素的抽取[6]。常用实体识别技术有基于传统机器学习的方法,如条件随机场[11],还有基于深度学习的识别方法如长短期记忆(long short term memory,LSTM)模型[12]等。配电网综合评价体系中的大部分设备实体通过已有数据库即可获得,还需从文本中抽取的实体包括评价判据、评价方法、各类型指标等建立评价逻辑图谱所需的内容。

关系抽取是将各孤立的实体联系起来形成知识网络的过程,是知识组织的基础性环节。近年来,基于深度学习框架的神经网络模型[13]不需要进行复杂的特征工程就可以实现关系的抽取。配电网综合评价知识图谱需要从文本中抽取的关系主要包括并列关系、分类包含等上下位关系。

属性抽取的目的是实现对实体的完整描述与刻画。实体与其属性值即构成一种实体关系,因此属性抽取任务可视为关系抽取任务[3]。在配电网评价逻辑图谱中,属性抽取任务主要指从评估导则、规程手册中提取相关指标的指标值要求,如变电容载比最佳取值范围等内容。

1.3.3 知识融合

知识融合是去除冗余、模糊信息,以提供更全面、高质量知识图谱的过程。知识融合包括共指消解、实体消歧和知识合并[14]。例如在一些评价案例中,“层次分析法(analysis hierarchy process,AHP)”或“AHP”的表述指的都是“层次分析法”,此时需要利用共指消解手段将其对应至规范的实体名称,常用的方法有基于机器学习的方法[15]、隐共指树模型[16]、基于中心理论的算法等[17];而当实体库中存在多个与表述同名的实体, 则需要利用实体消歧技术[18]消除歧义。在配电网综合评价知识图谱中,知识合并是将已有的配电网结构化数据库,与抽取的综合评价知识进行知识合并。

1.3.4 知识加工

为了获得结构化的知识体系,知识融合后所得到的基本事实表达需要进行知识加工过程。知识加工主要包括知识发现和质量评估。知识发现在已有的知识库基础上,利用数据挖掘或机器学习等方法挖掘新的隐性知识。比如,当配电网中涉及新能源出力时,在对配电网进行评价时,通常需要加入新能源相关的评价内容,涉及哪些具体的评价指标,从而总结出新的知识。质量评估的意义是评估知识图谱中知识的可信度,降低知识错误率,从而保障知识质量[14]。

1.3.5 知识更新

配电网中设备、装置、结构都处于不断更新的状态,相应的各类电网运行规程、评价导则等知识也日益丰富,因此,知识更新环节是对知识图谱的各类知识信息进行扩展或变更的过程,如当配网中新增某设备时,需要在配电网实体图谱中增加实体节点,而当出现运行限值变化时,则需对实体节点的属性进行改变。例如,模式层的更新是指新增数据后获得了新的概念,需要自动将新的概念添加到已有的概念图谱中,从而保证知识图谱的与时俱进。

1.4 综合评价知识推理技术

在本文所研究的配电网综合评价行业知识图谱中,知识推理技术应用于2方面,一方面是依据生成的配电网关键信息、配电网综合评价知识库和案例图谱,使机器智能推送针对评价对象的相关评价知识,从而辅助实际应用中评价逻辑图谱的建立,另一方面应用在评价结果分析环节,即针对具体指标表现,应用电网运行规则和专家经验,推理出配电网存在的隐含问题。本文所用知识推理方法包括案例推理和逻辑规则推理,详细说明参见附录。

2 基于知识图谱的配电网综合评价流程

本文设计的配电网综合评价知识图谱应用流程包括综合评价知识图谱形成、数据收集及预处理、数据处理计算、评价结果分析、评价结果应用和人机交互6个环节,流程图可参见附图A3。

2.1 知识图谱的形成

首先确定评价地区,依据配电网已有的电网实体数据,利用图谱构建技术,构建配电网实体图谱。结合专家经验库中包含的综合评价模型,以及由评估导则等文本数据经过1.3节中技术手段获得的结构化知识网络,初步形成评价逻辑知识图谱,即建立综合评价指标库、评价模型库。具体应用时,在配电网实体图谱之上应用数据生成、机器学习、深度学习、特征提取等技术自动提炼配电网关键特征,如:配电网属于城网还是农网、设备种类、有无新能源并网、变电站等级等特征信息,再采用信息分词或实体识别技术将这些信息结构化以方便机器理解和计算。基于上述关键特征,利用1.4节所述综合评价知识推理技术,使机器自动推荐与评价目标相符的评价知识。另外,为确保机器推荐的准确性,需要人工进行评价指标筛选和评价模型、方法的确认。至此,完成详细有针对性的配电网综合评价逻辑图谱构建。

2.2 数据收集及预处理

在评价时,需要依据配电网评价逻辑图谱中指标运算、权重计算以及指标评分所需数据进行数据收集任务。这些数据来源于不同的数据库,为得到格式统一、满足要求的数据,需要进行数据的预处理工作。数据预处理的过程通过处理评价工作的业务系统向外提供数据接口,与其他系统之间通过安全文件传输协议(secure file transfer protocol,SFTP)服务接口读取数据流或以安全文件传输的方式获取数据。调用的数据需要经过单位、精度等格式的统一化、标准化处理。

2.3 数据处理计算

在获得格式统一的标准化数据后,按照评价逻辑图谱中包含的公式化逻辑库,可以直接进行指标值、权重值的计算以及对指标表现的评价工作,可以得到某一评价目标下配电网的综合评价结果。

2.4 评价结果分析

在评价规则的支持下,评价结果分析包括电网运行状态、存在的薄弱环节、电网发展水平以及实际效益等方面内容。依据配电网的评价结果及措施,可以在实体图谱之上进行实体查询,对需要改进的环节进行具体位置标识,该过程的实现可以按照设备类型如变电站、线路和配变台区等,分析其对应的指标表现,对存在的问题分别进行统计[19],以此查找具体薄弱点,并以可视化的形式进行展示,提醒工作人员及时采取措施改善薄弱环节。对此次配电网评价任务进行一次案例记录,提取案例特征,形成结构化信息并存入数据库中。

2.5 评价结果应用

在评价结果应用环节,可用于电网规划辅助决策、设备运行状态预测、检修策略智能推荐等方面。配电网综合评价结果对电网近期、远景改造和建设项目及优化规划工作可起到辅助指导的作用。设备运行状态预测是从电网运行状态、设备实时运行和历史运行数据出发,结合评价结果,可以发现某些指标或关键参数的变化规律,进而实现设备未来情况的预测。综合设备状态评估及预测结果,可以为电力设备智能检修策略的制定提供依据。

2.6 人机交互环节

在构建评价图谱时,计算机需要向评价人员提供配电网的关键信息、指标库、评价方法库等内容,在实际评价过程中,一些评价方法如德尔菲法,需要专家制定相关数据,录入判断矩阵,因此也需要利用人机交互的技术。此外,评价人员可以实时查询评价信息,计算机可以智能推送评价结果以及历史案例信息,并以文字、图表等多种形式进行呈现,使人机交互过程更加直观、多角度。

3 配电网的综合评价知识图谱应用

按照上文所述的图谱构建流程及构建技术,选取长春经济技术开发区某区域实际配电网[20],以该电网的数据库和《城市配电网运行水平和供电能力评估导则》、《南方电网公司110 kV及以下配电网规划设计技术导则》非结构化知识作为数据基础,结合专家意见,对模式层、各个图谱的应用进行了讨论。

3.1 配电网综合评价模式层

配电网综合评价体系的模式层包含评价者、评价对象、评价环境、评价目标、评价指标体系、评价方法和模型在内的评价要素,其中评价指标体系细化为指标内容、指标权重、指标评价判据3方面。各要素之间的关系示意可参见附录。

3.2 配电网实体图谱

配电网实体图谱融合了该区域配电网的实时运行数据、电网拓扑结构、设备资产数据等多种结构化知识,可以为配电网的综合评价逻辑图谱的建立提供关键信息支持。由建立的配电网实体图谱得知该配电网无新能源供电,因此相应的评价指标不涉及新能源相关指标,且变电站等级全部为66 kV/10 kV,评价目的为评价该区域的供电及运行情况,因此可以应用《城市配电网运行水平和供电能力评估导则》作为非结构化知识构建评价逻辑图谱。另外,在得出评价结果的基础上,应用实体匹配技术,对存在的薄弱环节实体与电网实体图谱进行匹配,完成漏洞标示。

3.3 配电网综合评价逻辑图谱

评价逻辑知识图谱将抽象的智能配电网综合评价知识,利用人机交互技术以图形化的方式呈现出来,让使用者对评价知识有更加直观形象的认识。本文采用文献[7]中所述方法,对应用到的《城市配电网运行水平和供电能力评估导则》等文本进行知识抽取。构建的配电网的评价指标逻辑图谱可视化如图2所示,该评价逻辑图谱针对配电网的运行水平和供电能力进行综合评价,将评价逻辑知识图谱分为评价指标内容、权重逻辑和评价逻辑3部分。

图2 配电网综合评价知识图谱(部分)Fig.2 Knowledge graph of comprehensive evaluation of distribution network (part)

3.3.1 评价指标内容

评价指标内容部分,各指标实体之间的关系主要为并列或包含,各指标具体属性包括指标计算方法、实际值、指标权重以及对应评价。指标计算数据可以通过数据收集和数据预处理手段获得,例如,在进行如线路重载比例、电压合格率、供电可靠率、故障停电率等指标的计算时,需要线路总条数,用户数量,各个用户的停电情况,电压检测点的电压状态等信息。其中,线路总条数、用户数量信息存储于电网设备数据库、用户信息库中,可以直接调用数据库中的数据,而各个用户的停电情况,电压检测点的电压状态等需求信息则需对历史数据进行统计计算得到,可利用描述统计方法,开发相应程序实现。

上述思路即利用评价逻辑图谱的知识推理和路径搜索功能,查找指标计算所需数据,再利用计算机数据收集及预处理手段得到相应数据,最后依据指标计算规则实现指标值的生成。部分指标计算公式见附录。

3.3.2 指标权重逻辑

指标权重逻辑部分,该图谱通过德尔菲法获得主观权重,因此需要专家人员给定判断矩阵,同时结合反映指标权重值变异程度的客观熵权,最终得到指标综合权重,该过程需要利用人机交互技术输入数据。具体实现步骤见附录。

3.3.3 综合评价逻辑

综合评价逻辑采用模糊综合评价法,由专家制定相关评分参数,如隶属度参数。如图2中所示,对于某一评价指标的评分等级,需要利用模糊评价模型,对指标值、隶属度函数、评分标准以及指标权重多种数据进行处理计算得到。具体模糊综合评价逻辑见附录。

对应于模式层中的评价方法和模型这一要素,该图谱所需评价方法及模型包括层次分析法、熵权法、模糊综合评价模型,所需数据包括已有配电网的结构化数据库和评价专家制定的相关数据。

3.4 配电网综合评价案例图谱

配电网综合评价案例图谱储存了该区域的历史评价案例信息,可以提供历史评价目标、评价内容、评价方法、模型以及各指标历史表现等案例特征,进而计算不同时间段内案例的相似度,实现配电网跨时间维度的性能对比,一方面可以挖掘存在的潜在问题,另一方面,相似度高的评价案例可以为本次评价任务提供参考依据。

3.5 应用实例流程

利用图2所示图谱,输入真实数据,对该区域配电网评价过程如图3所示,图中简要示出部分内容。由于《城市配电网运行水平和供电能力评估导则》提取出的评价知识与评价目标、配电网关键信息相契合,因此,可直接应用由文本生成的评价知识,包括导则中规定的运行水平和供电能力2大类评价指标,并按3.3节评价逻辑图谱中定义的评价方法和模型进行评价。

图3 配电网综合评价知识图谱应用实例流程Fig.3 Flow path of application example of knowledge graph for comprehensive evaluation of distribution network

首先,利用评价逻辑图谱的知识查询功能,完成数据收集工作,对所需数据进行预处理工作,除此之外,由于采用的德尔菲法,需要由专家人员录入判断矩阵,在指标的隶属度确定环节,图谱中存储部分由文本提取出的隶属度参数,专家需要进行填补或确认,获得全部数据后,按图谱逻辑进行计算,可以得到各指标的值、权重、综合评价等级等信息。按照图谱中定义的层次分析逻辑,最终可以确定该区域配电网运行水平和供电能力均为较高水平。

依据获得的一级指标的等级水平,可以了解该区域配电网改造的具体方向,例如,该电网D类电压合格率表现一般,需要进行改进工作。从权重设置看,各二级指标中,供电可靠率权重最大,可看出其对综合性能指标的影响最为重要。可见,由该图谱生成的评价结果为涵盖较大信息量的向量,实现了对配电网运行水平和供电能力的高精度描述。

按照设备类型对电网存在的问题分别进行统计,可以实现薄弱点的定位,该例中,中压线路L1、L2、L6存在的问题较多,中压线路末端电压不合格比例较高,可以对线路负荷进行切改,缩短其供电半径,从而提高线路末端电压质量。应用配电网实体图谱的实体匹配技术标识需要改进的位置,便于工作人员及时采取措施。最后,提取评价信息并储存于评价案例图谱中。利用人机交互技术,工作人员可以方便快速地查询任一评价环节的信息,实现了处理评价工作的深入性和高效性。

4 结论

知识图谱在电力领域的应用尚处于起步阶段,技术实现仍不成熟,实际应用场景还很受限,如何以更合理的方式将知识图谱应用于电力领域,构建开放互联的“知识之网”,推动Web3.0时代的到来,还需要人们做更多的探索与研究。

(本刊附录请见网络版,印刷版略)

猜你喜欢
结构化图谱配电网
促进知识结构化的主题式复习初探
改进的非结构化对等网络动态搜索算法
绘一张成长图谱
结构化面试方法在研究生复试中的应用
左顾右盼 瞻前顾后 融会贯通——基于数学结构化的深度学习
配电网FTU配置优化方法研究
10千伏配电网线损原因与管理策略探析
关于城市10kV配电网自动化实施的探讨
补肾强身片UPLC指纹图谱
主动对接你思维的知识图谱