基于图数据库的配电网拓扑建模方法研究

2022-03-29 21:49周嘉刘飞王栋
机电信息 2022年5期

周嘉 刘飞 王栋

摘要:针对关系数据库越来越不能满足电网对大数据快速访问和分析需求的问题,提出了一种基于Neo4j的配电网拓扑建模方法。在遵循电网CIM模型的基础上,将CIM模型中的设备类对象建模为图数据库中的节点,将对象之间的连接关系建模为图数据库中的关系。最后,通过一个10 kV配電网算例的最短路径查询性能对比,验证了所提建模方法的有效性。

关键词:配电网拓扑;图数据库;最短路径查询

中图分类号:TM711  文献标志码:A  文章编号:1671-0797(2022)05-0013-03

DOI:10.19514/j.cnki.cn32-1628/tm.2022.05.003

引言

随着电网规模的不断扩大,传统的基于关系数据库的配电网关系模型极大地限制了配电网结构数据检索的性能,给电网设备及其拓扑连接查询带来了严峻的挑战。图数据库作为一种新型的非关系数据库,更适合处理网络类型数据,为大规模电网拓扑查询问题提供了新的解决方案。文献[1]提出了一种基于Neo4j的变电站数据管理方法,并验证了在数据检索中使用图数据库管理变电站设备的优势。文献[2]验证了Neo4j图数据库在遍历数据方面的优势,但没有提供配电网图模型的具体建模方法。

图数据建模的常用方法有Neo4j图数据建模[3]、GraphX图数据建模[4]等。图数据库常用技术主要包括数据库存储技术[5]、图索引机制[6]、图查询分析技术[7]等,图数据库存储技术主要是利用数据结构来存储和表达图,图数据库的基本存储单元是节点、关系、属性。由于图数据库符合电力系统网络特点的技术优势,其在电网计算中的应用越来越受到重视。文献[8]在继承CIM模型的基础上,提出了一种Neo4j图数据库中功率数据的建模方法,但没有进一步分析这种方法的优越性。文献[9]基于Neo4j图数据库提出了3种不同配电网图模型的建模方法,但没有与对应关系型数据库进行一些数据检索性能方面的对比。

因此,本文结合Neo4j图数据库的优势,提出了一种面向配电网CIM模型的拓扑建模方法。

1    图数据库和Neo4j

图数据库是以“图”的形式存储数据的数据库,其中数据存储的形式主要是节点和关系。这种设计模式可以快速解决复杂的关系问题,而不需要使用传统的关系数据库,因此图数据库非常适用于存储配电网拓扑等网络特征数据。而传统的关系数据库需要进行大量的连接表操作来查找数据之间的关联。

Neo4j是图形数据库中的一种流行产品,它具有性能好、可扩展性强、可靠性高等特点。如图1所示,Neo4j通过定义两个数据结构(节点和关系)来进行信息建模。一个节点可以有一个或多个标签,一个关系只能有一种类型;同时,节点和关系可以定义多个键值对的属性特征。

2    配电网图模型的建模原理

配电网CIM模型主要由连接节点类、设备端子类和设备类组成。图2显示了配电网CIM模型中最基本的拓扑连接方式,这些设备类节点将连接到0~2个设备端子,每个设备端子节点只连接一个连接节点,形成最终的拓扑结构。

以图2为例,“导线”设备连接到“分段开关”设备。如果使用原CIM模型的数据结构进行计算,需要先查找与“导线”相连的设备端子节点T1的ID,然后根据设备端子节点T1查找连接节点C1,再根据连接节点C1查找所连接设备T4的设备端子节点,最终找到“分段开关”设备节点。整个过程涉及4次搜索,数据规模是冗余的。因此,考虑到配电网拓扑结构分析方法要求的高遍历性能,在CIM原理建模方法的基础上,可以剔除对象类中的连接节点类、设备端子类节点,仅保留设备类节点。

因此,为了提高对配电网拓扑设备的连通性查询效率,保证配电网图模型的完整性和一致性,在使用Neo4j建模配电网图模型的过程中,应遵循配电网CIM模型,将模型中的对象类建模为图数据库中的节点数据格式,将对象之间的连接关系建模为图数据库中的关系数据格式,映射关系如表1所示。

3    算例分析

为验证基于图数据库的配电网图建模方法的有效性,选取一个10 kV的简单配电网为例。如图3所示,系统由11条线路、8个开关等组成。

根据CIM模型的规则,只保留配电网中的每个设备节点,不包括设备终端节点、连接节点等。基于Neo4j构建的图模型如图4所示,图模型由31个节点和30条边组成。

配电网拓扑结构是研究设备之间连通性的基础,因此,有必要验证图建模方法与关系数据库相比在最短路径查询性能方面的优势。以母线到负载组LP3的最短路径查询为例,图5所示为关系数据库中图3所对应的配电网拓扑数据的表达式,不同类型的设备存储在不同的元件表中,元件之间的连接关系存储在连接表中。

在关系数据库MySQL和图数据库Neo4j中查询10 kV配电网母线到负载组LP3的最短路径所需时间结果如表2所示,从中可以看出,在关系数据库中,查询时间为8.46 s;而在图数据库中,查询最短路径只需要2.23 s,由此可对比出图模型遍历的高效性。

4    结语

图数据库存储方法因其适应了电网拓扑结构的特点,正逐渐应用于电力系统领域。因此,本文在遵循电网CIM模型的基础上,提出了一种基于图数据库的配电网图模型建模方法。首先,基于Neo4j图数据库,将CIM模型中的设备类对象建立为图模型中的顶点,将设备之间的连接关系建立为图模型中的边。其次,基于某10 kV配电网算例,通过与关系数据库的比较,证明了基于图模型的最短路径搜索是更有效的。

[参考文献]

[1] PER?覶UKU A,MINKOVSKA D,STOYANOVA L.Modeling and processing big data of power transmission grid substation using Neo4j[J].Procedia Computer Science,2017,113:9-16.

[2] 马义松,武志刚.基于Neo4j的电力大数据建模及分析[J].电工电能新技术,2016,35(2):24-30.

[3] COMYN-WATTIAU I,AKOKA J.Model driven reverse engineering of NoSQL property graph databases:The case of Neo4j[C]//2017 IEEE International Conference on Big Data (Big Data),2017:453-458.

[4] DEUTSCH A,XU Y,WU M X,et al.TigerGraph:A native MPP graph database[EB/OL].[2021-11-28].https://doc.paperpass.com/foreign/arXiv190108248.html.

[5] HUSAIN M F,DOSHI P,KHAN L,et al.Storage and retrieval of large RDF graph using hadoop and mapreduce[C]//IEEE International Conference on Cloud Computing,2009:680-686.

[6] HE H H,SINGH A K.Closure-tree:An index structure for graph queries[C]//22nd International Con-

ference on Data Engineering(ICDE′06),2006:38-49.

[7] ZHAO P X,HAN J W.On graph query optimization in large networks[J].Proceedings of the VLDB Endowment,2010,3(1/2):340-351.

[8] PAVKOVIV,APKO D,VUKMIROVIS,et al.Modeling power system data using NoSQL database[C]// IEEE 2017 25th Telecommunication Forum (TELFOR),2017:1-4.

[9] PAN Z H,JING Z X.Modeling methods of big data for power grid based on graph database[C]// 2018 International Conference on Power System Technology(POWERCON),2018:4340-4348.

收稿日期:2021-12-06

作者簡介:周嘉(1982—),男,江苏南通人,高级工程师,研究方向:电网规划、电网建设。