电力数据的知识图谱构建及典型应用

2024-05-07 00:27曾丽君刘玉玺
中国新通信 2024年3期
关键词:知识图谱

曾丽君?刘玉玺

摘要:随着新一代信息技术的不断应用,电力数据量不断增加,这些数据包含重要的电力价值信息。因此,对电力数据进行分析和利用有助于降低电力运营的风险。本文引入知识图谱,建立了电力数据知识图谱,分析了电力数据各实体的数据价值。并以电力故障停电事件为案例,探讨了电力数据知识图谱的应用场景和结果。研究表明,建立电力数据知识图谱有助于压缩电力运营成本,并推动电力业务流程的效率。

关键词:电力数据;知识图谱; 典型应用

电力能源对国家经济和人们正常社会活动具有重要影响,为人们的经济活动提供基本条件。电力数据作为电力业务运行的基本结果,具有重要的价值,能够展现电力网络、电力设备运行以及电力资源利用等状态,是不可或缺的基本电力要素。因此,对电力数据的分析和处理以获得电力价值是人们不断研究和探索的重要方向。随着时间的不断积累,电力数据的收集和处理复杂度不断增加。目前,电力数据的收集处理呈现零散化和局部化的趋势,通常在各地数据中心进行处理和分析。然而,由于电力设备的网络化覆盖程度还未广泛深入到偏远地区,一些基础数据存在丢失和遗漏情况,数据分析的地域性较强,可能影响决策的实施。随着电力智能化终端的不断升级,网络化覆盖程度日益提高,电力运行中的数据量也日益增加,数据的集中收集和处理难度不断提高。因此,需要更高效地利用信息化手段,规范化和机构化地处理数据,以进一步提升电力数据的分析能力和价值。

知识图谱在不断发展中广泛应用,能够全面化、结构化地为数据处理提供手段。知识图谱的关键要素主要包括實体、关系和属性,能够存储各实体元素并相互关联。在电力领域,学者们对知识图谱的分析和应用进行了探索和应用。学者李冬在电力调控中加入知识图谱进行分析,能够为决策提供参考。学者沈文首次将电力图谱的框架进行了研究和设计,标志着知识图谱的发展进入了实用阶段。另外,学者乔振将知识图谱运用到电力故障监测中,并对故障数据分析做了应用尝试,这也是知识图谱的第一次实践运用,对后续研究具有重要指导意义。

本文通过收集和分析电力相关的能耗数据以及电力经营数据,整合电力系统内的大数据,形成知识架构,进而提出电力数据知识图谱的构建和验证,并对电力数据知识图谱进行应用的分析,以提高数据的处理和分析效率。这样的应用有望为电力领域的决策和发展提供重要支持和指导。

一、基于电力数据知识图谱构建相关技术

电力数据知识图谱的构建需要从电力一、二类设备中采集基础数据,并提取相应的知识,然后通过识别电力数据的能耗和经营数据信息,综合形成对象的知识。利用这些知识进行分析和处理,自动识别数据的价值,并预测数据的趋势。一般的流程包括以下几个步骤。

(一)电力数据采集

电力数据采集是数据处理和分析的前提,是从电力一、二类设备中提取的一手数据。这些基本数据信息包括电力设备信息、经营数据信息、设备诊断信息、故障预警信息等。一旦获得这些原始数据,就需要对其进行规范化处理,以形成电力原始数据集。

(二)知识数据的加工

对于电力数据采集的原始数据集,需要进行加工处理。加工的手段主要包括数据中的价值分析,即知识提取分析,以及数据的处理审核,也就是知识的处理过程。接着,有价值的数据需要进行分类和提取,最后进行数据的融合,并将融合后的知识加入知识图谱中。这样可以更好地整合、分析和利用电力数据,从而提供更多有价值的信息和见解。

(三)知识图谱及价值服务

知识图谱将采集到的有价值数据作为知识点进行表示,其模型使用实体、属性、联系等要素来描述。价值服务是从众多知识数据中提供的一些与电力设备信息、经营数据信息、设备诊断信息,以及故障预警信息等紧密相关的知识服务。

二、电力数据知识图谱搭建方法

电力数据知识图谱的构建主要涉及流程层和数据层两方面。流程层主要包括流程中的实体、属性和关系,并对其进行描述的一种架构。数据层主要是采用高效的方法对数据进行实体的选择和关系的确定。流程层和数据层之间相互关联、相互联系,共同构成了电力数据知识图谱。

(一)流程层搭建

电力数据的价值分析主要关注电力设备信息、经营数据信息、设备诊断信息以及故障预警信息等。将本文电力数据分析分为以上四个部分,并对应分析每个部分的实体、关系和属性,也就是实现流程层的搭建。详细模块实体联系如下:

电力设备信息模块:电力设备信息模块的主要实体有设备读数、设备温度、设备运行时间、环境湿度等,对应的联系有设备温度影响设备读数和设备运行时间,环境湿度影响设备读数和设备运行时间。

经营数据信息:经营数据信息主要实体有基础设施及维护成本、电量售价、使用电量、销售利润、经营指标等,对应的联系有维护成本影响电量售价和销售利润,电量售价影响使用电量、销售利润和经营指标。

设备诊断信息:设备诊断主要是指电力设备检修等的诊断,主要实体有电力设备运行状态、电力设备上线时间,电力设备的精度,电力设备的损耗程度等,电力设备的上线时间、损耗程度影响着电力设备的精度和运行状态。

故障预警信息:故障预警是设备的智能化研判结果,主要实体有故障类型、故障时间、故障等级、故障环节,故障维修成本等,故障类型,等级,环节影响故障的维修成本,故障发生时间影响故障的等级和维修成本等。

(二)数据层搭建

电力数据的数据层搭建主要是数据模型的搭建,电力数据知识图谱包括实体元素、关系元素以及知识集合。因此,可用集合来表示知识图谱,定义kg表示知识图谱集合,Et为图谱中的实体元素集合,R为图谱中的所有实体的关系元素集合,Kl为各实体与关系提取的知识集合。如式(1)所示。

Kg={Et,R,Kl }    (1)

数据层的搭建主要是从流程层中的各实体中提取实体之间的关系元素,并进行知识的融合和不断地更新。

1.实体提取

对于电力数据知识图谱有基本的实体,属性作为支撑,不同的实体均有对应的属性和携带信息,然后通过流程相连,也就是实体下有一个流程,流程下包括属性和属性信息。属性可以有多个,但一个属性对应的实体和流程是唯一的。本文电力数据的知识图谱主要实体关注电力设备信息、经营数据信息、设备诊断信息以及故障预警信息等。知识提取主要采用機器学习算法进行识别和抽取,具体流程和方法如下:电力设备信息、经营数据信息、设备诊断信息以及故障预警信息均为名词实体,本文选取深度双向编码模型也就是bert模型,来对各电力数据的实体进行提取。流程如下:

①通过标签定义的方式形成实体的原始集合,作为输入来对双向模型进行训练,标签主要是依据实体的特征进行定义,标签主要包含实体头部特性,实体中部特性,实体尾部特性以及其他非实体特性。

②选取电力数据的原始数据,一般为设备中可导出的excel文件,主要是对文件内的表头以及元组名进行识别,识别成功后,提取实体及关联数据。

③选取故障预警信息的原始数据集,其中包括序号、时间、设备名、类型、描述、级别、当前值、报警值、恢复值、用户、响应时间等。对这些实体进行识别提取,并标注,如实体头部信息日、设、类、级、报、当、恢等,尾部信息间、名、型、别、值等。对2200条记录进行特征标签,在样本中选择1900个作为训练集,其他300作为验证集。模型验证可选择时间、设备名、类型、级别、当前值、报警值以及恢复值等结果。

2.关系提取

电力数据知识图谱的包含的基本关系R可用式(2)来表示。

R=(NS→[RN:P]→NE) (2)

记NS为头特征实体、NE为尾特征实体,RN为关系名,P为实体的属性。箭头指向说明关系的指向。各实体之间通过机器学习双向编码模型识别进行提取。

3.知识融合

知识融合是电力数据知识图谱中关键的环节,也就是将各实体中基本释义相近的结合成单个实体统一表示,如式(3)所示。

E={E1,E2,…,En } (3)

式中,记E1,E2,…,En表示n个释义接近的实体,E为结合后的整实体。

对于电力数据知识图谱的构建中,知识融合的方法存在部分问题:如对于实体的选取中,各实体的名称还存在一定的差异,存在有实体名简称以及实体名的相近名称等,如在告警信息的提取中,存在设备名-变量名、事件类型-告警类型、等级-级别、日期时间-告警时间等。这些实体均为同一实体,只是名称有所变化,此种情况对于规则的制定情况比较复杂,也难以制定统一规则,因此知识融合可以采用聚类算法开展,也就是首先遍历原始数据中的各个实体信息,通过相似度评估来统计实体之间的相似度,并设定相似度比较值,高于比较值的实体被认定为相近实体进行融合,相似度Sm计算如式(4)所示。

式中:X为实体1经过拆分单个名词统计到单词的出现频率,y为实体2经过拆分单个名词统计到单词的出现频率,X、Y均是一个向量。相似度越高,表明X和Y实体相似度越高。

4.知识更新

由于信息网络的不断覆盖,电力数据的维度和广度不断扩大,因此数据量也变得十分庞大。为了保证电力数据知识图谱模型的分析有效性,需要及时进行知识的更新。目前,电力数据的维度有限,但随着智能化电力设备及设施的不断开发和建设,一些其他数据的价值也不断凸显。因此,需要对电力数据知识图谱的数据层进行相应的调整和变更。新加入的实体及属性信息也需要经过知识融合后才能形成完整的知识图谱。同时,需要对不适用的关系和流程进行更新和剔除,以确保知识图谱的时效性和准确性。

(三)电力数据知识图谱的可视化

通过高性能Neo4j数据库对本文电力知识图谱进行页面展现,可以集中展示电力数据知识图谱中的实体、属性和联系。这种展示不仅能清晰展现电力数据知识图谱的结构,还可以支持快速的查找功能。特别是针对设备状态和告警信息,快速查找功能可以帮助快速定位问题并有效处理,进一步提高工作效率。

三、电力数据知识图谱的典型应用

本文以电力数据中的设备故障告警事件为案例,以分析和建议电力数据知识图谱在该事件中的应用,并进一步分析结果。在2020年湖南省某村镇突然出现大面积断电的事件中,当地供电公司迅速组织了排查工作,并成立临时保障小组,进行了指导、勘察、排除和检修等一系列环节。经过6个小时的排查和检修,最终成功恢复了供电。事故的原因在于该乡镇的300多台电力终端中有一台发生故障,导致了全线停电。从上述案例中可以看出,虽然供电公司响应及时,但是排查问题的速度需要进一步提高,无法在规定的2小时内完成供电的恢复,从而造成了该地工业产业方面的损失。为了快速解决此类事件,可以通过电力数据知识图谱来分析设备状态和故障告警信息,从而快速定位到故障终端,并进行维修和通电操作,以减少工业企业的损失。

本文基于终端搭建的停电事件数据知识图谱,通过收集上表终端设备中的各类信息,通过收集终端设备中的各类信息,可以快速识别出可疑终端Vm74。尽管这台终端没有出现设备告警信息,但是通过知识图谱结合设备运行状态、设备温度、设备使用时间和设备读数时延等多种信息进行综合评判,人们可以找到运行状态、温度、使用时间等异常的终端,并根据算法权重计算风险指数,发现Vm74设备温度达到了33.4度,设备读数延迟达到了11.3秒,综合风险指数达到了90%。因此,Vm74成为了需要关注维修的重要设备。这与实际事故检修的结果一致,识别率较高。

四、结束语

本文基于电力数据的发展现状,旨在研究电力数据的潜在价值,并利用知识图谱与电力数据相结合,搭建了电力数据知识图谱。通过对电力关键指标数据的分析,能够快速定位电力数据的影响因素。同时,通过一个电力停电故障的实例,分析了电力数据知识图谱在提升电力业务效率方面的有效性。

猜你喜欢
知识图谱
国内外智库研究态势知识图谱对比分析
国内信息素养研究的知识图谱分析
国内图书馆嵌入式服务研究主题分析
国内外政府信息公开研究的脉络、流派与趋势
基于知识图谱的产业集群创新绩效可视化分析
基于知识图谱的产业集群创新绩效可视化分析
基于知识图谱的智慧教育研究热点与趋势分析
国内酒店品牌管理研究进展的可视化分析
从《ET&S》与《电化教育研究》对比分析中管窥教育技术发展
专家知识图谱构建研究