贾贺 刘辉 卜新魁 姜佩奇
摘 要:针对泵站运行方案制定智能化水平低、运行过程中受环境变化影响难以在计划时间内完成提水量的问题,提出一种基于知识图谱的泵站运行方案智能推荐与优化方法。基于2013—2022 年南水北调东线邓楼泵站历史运行数据构建知识图谱,结合数值相似度匹配方法为泵站运行推荐可靠的方案。通过分析泵站运行过程中的性能数据,确定泵站机组运行的性能曲线,结合实时监测的流量和净扬程数据对泵站运行方案动态调控。应用情况表明,推荐的所有运行方案的效率均在67.00%以上,能够满足泵站的运行要求,并且实现了泵站运行过程的动态优化。
关键词:泵站运行;知识图谱;方案推荐;性能曲线;邓楼泵站
中图分类号:TV675;TP391 文献标志码:A doi:10.3969/ j.issn.1000-1379.2024.04.021
引用格式:贾贺,刘辉,卜新魁,等.基于知识图谱的泵站运行方案智能推荐与优化[J].人民黄河,2024,46(4):125-130.
泵站在现代水资源管理中起着至关重要的作用。然而,传统的泵站运行方案制定往往受到智能化水平的限制,难以应对复杂多变的环境因素,泵站在運行过程中会出现提水量未在计划时间内完成的问题。这不仅导致水资源的浪费,还可能对生态环境和社会稳定造成负面影响。因此,提高泵站运行方案的智能化水平成为当前亟须解决的问题。
关于泵站运行方案的研究已取得不少成果,例如:肖若富等[1] 采用逆序递推动态规划法调整泵站站内机组的组合,单位时间内泵站能耗降低了18.6%;Zessler 等[2] 结合泵站运行过程电价分布情况,采用动态规划法制定了能够降低泵站运行成本的运行时间表;Zhao 等[3] 基于水力特性和在线算法寻求并联泵组优化策略,优化变频泵投入运行台数和转速分配;汪安南等[4] 应用逆序动态规划法,以最小化泵站运行费用为目标,确定了泵站开机台数、机组运行角度和最优运行曲线;Lansey 等[5] 采用非线性网格仿真模型,将运行成本和能耗作为优化目标,实现了多机组运行方案的优化。此外,机器学习算法如蚁群算法和遗传算法被广泛应用,持续迭代以选择最优运行方案[6-7] 。以上研究均对泵站运行方案进行了优化设计,但只考虑了理论状态的泵站运行方法。泵站在实际运行中受到不断变化的约束条件的影响,会引起净扬程波动,从而导致按照原有方案运行时,提水量无法满足实际需求。
知识图谱[8] 是一种结构化的知识表示方法,用于描述现实世界中的实体、概念、关系和属性,以及它们之间的相互关系。知识图谱由节点(实体或概念)和边(关系或属性)组成,可以帮助机器理解和推理关于世界的知识。目前,知识图谱已经在水利行业得到广泛的应用,如:郑慨睿等[9] 利用知识图谱技术开展了BIM 模型自动化规范审查研究;侯征军等[10] 构建了珠江三角洲水资源配置工程知识图谱,实现了水利各业务的知识融合;刘雪梅等[11] 融合知识图谱技术与深度学习技术,创建了一种水利工程方案智能生成模式,为水利工程抢险及应急提供了合理的处置方案;金菊良等[12] 通过构建知识图谱对水资源承载力进行细致的分析和评价。
基于知识图谱的优势,本文将知识图谱自身的推理能力与相似度匹配方法相结合,对泵站运行方案进行智能推荐,针对泵站运行过程中的净扬程变化,动态优化运行方案,以期在满足泵站提水量的同时,减少运行成本。
1 泵站运行方案总体设计
泵站运行方案总体设计见图1,其整个过程包括构建知识图谱、推荐运行方案、性能曲线分析、泵站运行实时监测及运行方案动态优化。其中:构建知识图谱包括知识模式层构建、数据收集、知识抽取、存储与表达;方案推荐将根据提水量需求确定各个时段的叶片安放角、流量;性能曲线分析主要是基于泵站机组的历史运行数据,分析各个变量之间的关系,为泵站优化提供指导。最后通过监测提水量实现泵站运行方案的动态优化。
2 方法介绍
2.1 知识图谱构建方法
构建知识图谱通常采用两种方式:自顶向下和自底向上。自顶向下的构建方式专注于特定研究领域,由领域专家定义知识模式层和数据模式层,然后将从中抽取的实体添加到知识库[13] 。相反,自底向上的构建方式主要依赖于离散的数据,通过自动学习这些结构化知识,直接将从数据中抽取的实体、关系和属性合并到知识图谱中[14] ,以避免重复信息的生成。为实现泵站运行方案智能推荐,需要确定一个合理的知识模式层,因此本文采用自顶向下的构建方式。构建知识图谱的流程为:1)构建知识模式层,为数据存储提供指导;2)收集泵站运行数据并以.xlsx 文件格式进行保存;3)知识抽取,即采用python 语言读取保存数据的文件,将数据的字段表示为关系标签,泵站名称作为根节点;4)知识存储与表达,即调用python 的py2neo 函数库将抽取的知识写入,形成关系型数据结构,最后形成知识图谱并存储在Neo4j Desktop 图结构数据库中。
泵站运行知识模式层见图2,主要包括运行方案、约束条件、设计参数。运行方案是根据约束条件进行制定的。
2.2 知识图谱推理技术
知识图谱在推理方面表现出明显的优越性,越来越多的学者选择将其作为底层数据支持应用于智能搜索回答、智能对话、个性化推荐、方案生成等领域。知识图谱通过对三元组的学习,能够推理出新的知识。本文采用基于距离的TransE 推理模型进行知识推理,其核心思想是将三元组的实体和关系映射到低维连续的向量空间,将关系视为实体间的转移。通过设计得分函数来衡量三元组的有效性,得分越高说明三元组成立的可能性越高。TransE 模型有如下假设:
t =h+r (1)
式中:t 为尾实体向量,h 为头实体向量,r 为关系向量。
TransE 模型涉及两个目标函数,分别为L1 范数(曼哈顿距离)和L2 范数(欧几里得距离),L1 范数计算公式如下:
式中:xi为向量X 的第i 个属性值。
使用L1 范数可以衡量X1、X2 两个向量之间的差异性,也就是两个向量的距离,计算公式为
式中:x1i 、x2i分别为X1、X2的第i 个属性值,Dis 为距离函数。
使用L2 范数同样可以衡量两个向量之间的差异性,计算公式为
根据上述TransE 的假设,可以知道,对于1 个三元组而言,头实体向量和关系向量之和与尾实体向量越接近,说明该三元组越接近正确的三元组;相反,差距越大,这个三元组越不正常。目标是正确的三元组的距离越小越好,错误的三元组的距离越大越好。表达式如下:
式中:(h,r,t)为正确的三元组,(h′ ,r′ ,t′ )为错误的三元组,D 为正确的三元组集合,D′ 为错误的三元组集合,γ 为正样本和负样本之间的距离,[x]+ 为(0,x)区间内的最大值。
选择L1 或L2 范数作为度量距离的方式,其中:L1范数通常更适合处理稀疏数据,而L2 范数更适合处理稠密数据。原因是L1 范数对于离群值的敏感性较低,而L2 范数对于整体数据分布更为敏感。由于本文的基础数据为连续数据,因此选用L2 范数作为度量函数。
2.3 相似度匹配方法
相似度匹配方法是用于评估两个实体之间的相似程度关系,对运行方案中关键要素实体的相似性进行度量,是进行实体匹配和方案推荐的关键。考虑到实体类型较多,采用属性信息度量相似度,当属性为数值类型时,考虑属性值的距离并进行归一化处理,如α为某个数值属性,α0和αi 分别为方案s0和si的α 属性值,数值属性距离Dαs0,si计算公式为
将数值属性距离转化为相似度并归一化后的结果如下:
式中:Simαs0,si为方案s0和si 的数值属性相似度,Dα 为α数值属性距离取值集合。
当属性为类别类型时,类别属性相似度计算公式如下:
式中:Simβs0,si为方案s0 和si 的类别属性相似度,β 为某个类别属性值,b0和bi分别为方案s0和si的β 属性值。
2.4 性能曲线分析方法
泵站运行需要考虑泵站性能曲线,其中流量Q、净扬程H、效率η、有效功率P、叶片安放角? 之间的关系需要确定。本文主要考虑? 不变的高效区段,η 计算公式为
η =QHρg / (P×1 000)×100% (10)
式中:ρ 为抽取液体的密度,g 为重力加速度。
确定泵站性能曲线需要先获取泵站历史运行数据(H、Q、η),然后采用多项式分析方法进行插值拟合,建立净扬程与流量关系曲线(H—Q)和效率与流量关系曲线(η—Q),拟合公式形式为
H =AQ2 +BQ+C (11)
η =aQ2 +bQ+c (12)
式中:A、B、C、a、b、c 均为常数。
3 应用分析
3.1 工程概况
邓楼泵站是南水北调东线工程第十二级抽水梯级泵站,泵站枢纽工程位于山东省梁山县梁济运河与东平湖新湖区南大堤相交处。工程任务是实现南水北调东线工程的梯级调水目标。邓楼泵站采用4 台液压全调节式3100ZLQ-4 型立式轴流泵,其中1 台备用,泵站总装机容量为8 960 kW,機组设计扬程为3.57 m,机组设计流量为33.5 m3 / s,额定功率为2 240 kW。该泵站已经进行了数字化改造,被水利部列为第一批先行先试的数字孪生工程项目之一。邓楼泵站安装了多个参数感知设备,可实现泵站机组振动、摆度、油温、流量、叶片安放角、净扬程、有效功率等的监测。
3.2 开发环境
基于Windows10 系统研发,编译器采用Pycharm2021 版,python 选用3.6 版本,知识图谱构建工具采用Neo4j Desktop 1.5.8 版本。
3.3 知识图谱构建
构建的知识图谱数据源自2013—2022 年邓楼泵站历史运行数据,4 台机组中的1#机组在2022 年5 月5 日运行的相关数据见表1,其中流量和净扬程随时间变化曲线见图3。
分析表1、图3 可知,当叶片安放角不发生变化时,随着泵站运行,净扬程变化较小,变化范围可控制在0.05 m 内,流量波动相对较大且净扬程与流量之间存在一定的负相关关系。
为保证后续推荐运行方案具有较高的效率,需要对收集的数据进行初步筛选,剔除运行效率低于67%的历史运行方案。读取筛选后的优质数据,并存入Neo4j Desktop 图结构数据库。通常使用Neo4j Desktop构建知识图谱,包括建立节点、关系等操作,但其过程较为烦琐。为了简化操作,将python 与Neo4j Desktop联合使用,建立节点和关系全部在python 中进行,通过表2 中代码可实现对Neo4j Desktop 软件的访问,建立节点和关系过程中需要用第三方库py2neo,其主要用于与Neo4j Desktop 建立联系。
基于上述代码,将数据整理成图结构数据,构建的知识图谱见图4。
构建的泵站运行知识图谱可增强信息检索和问题解答的效果,可以更准确地理解用户查询信息并提供有关实体之间关系的详细信息。将泵站运行约束条件和泵站运行方案映射到知识图谱中的实体,系统可以利用关系和属性生成更精准的个性化推荐方案。从知识图谱中可看到邓楼泵站各机组的运行过程监测数据,实现了监测数据的图结构化。
3.4 泵站性能分析
泵站的性能分析为后续方案动态优化提供基础支撑。采用二次多项式插值曲线拟合的邓楼泵站单机组运行性能公式见表3,拟合的性能曲线见图5、图6。
由图5 可知,叶片安放角调节流量的规律性较好,当叶片安放角不变时,效率与流量曲线呈现抛物线的形式,效率先增大后减小。当叶片安放角为-5°时,泵站的运行效率最高。
由图6 可知,在同一叶片安放角情况下,净扬程与流量负相关。相同净扬程下,随叶片安放角为-9° ~-1°,流量逐渐增大,说明叶片安放角接近0°时,有利于提高扬程。
3.5 运行方案智能推荐及动态优化
1)运行方案智能推荐。邓楼泵站运行方案智能推荐综合考虑了泵站机组特性和实际需求。该泵站有4 台型号相同的机组,其中1 台为备用机组,确保在任何情况下泵站都能稳定运行。根据调度流量的不同,灵活调整泵站运行机组的数量,即当流量小于35 m3 / s时,单台机组即可满足需求;当流量为35~66 m3 / s时,开启2 台机组;当流量超过66 m3 / s 时,启用3 台机组以保证提水效率,同时保持1 台机组备用。在制订每日提水计划时,泵站会依据月总提水量进行合理分配,并始终遵循优先运行3 台机组的原则,以实现泵站运行的高效与稳定。此外,运行过程中每台机组的流量都不得低于20 m3 / s,以确保机组的正常运行和延长使用寿命。这一智能推荐方案不仅提升了泵站的运行效率,也为泵站的长期稳定运行提供了有力保障。
基于知识图谱推荐5 组不同约束条件的方案,见表4。根据真实约束条件,推荐运行时间为5 h、运行效率为67.00%以上的方案,且泵站的提水量满足约束条件中的提水量要求。
2)方案动态优化。2021 年5 月7—8 日泵站运行部分数据见图7,运行过程中净扬程逐渐增大,流量降低。针对这个现象,可以认为泵站运行是一个不断变化的过程,净扬程的变化导致流量发生变化,紧接着影响提水量。为保证提水量满足计划要求,需要实时监测泵站运行过程中的流量、净扬程变化。将动态优化时段设为1 h,当运行时间超过1 h 时,计算累计提水量并与当前时刻计划提水量进行对比,若满足计划要求,则无须进行优化。优化过程还需要参考泵站机组性能曲线,当提水量不满足要求时,需要增大叶片安放角,一般增量不超过1°。调节后,继续监测流量和净扬程,1 h 后再次判断提水量,若提水量不能满足提水量要求,则需要继续增大叶片安放角;若满足,则不再进行方案调整,减少叶片安放角调整次数。该过程循环进行,直到满足当日提水量要求。动态优化的具体流程见图8。
4 结论
本文以邓楼泵站为研究对象,对其历史运行数据进行收集整理并构建知识图谱,结合知识图谱的推理能力和相似度匹配方法进行方案推荐,各方案的运行效率都大于67.00%。通过分析泵站历史运行数据,发现其在运行过程中净扬程波动较小,净扬程与流量负相关。采用二次多项式拟合邓楼泵站单机组运行性能曲线,发现随流量增大,效率先增大后减小;随叶片安放角增大,流量呈现增大的趋势。建立动态优化机制对泵站进行调控,在保证提水量满足要求的前提下,确保了运行效率、节约了能耗。
参考文献:
[1] 肖若富,龚诗雯,周玉国,等.泵站站内机组运行组合的优化研究[J].中国农村水利水电,2020(12):164-166,171.
[2] ZESSLER U,SHAMIR U.Optimal Operation of Water Distri?bution Systems[J].Journal of Water Resources Planning andManagement,1989,115(6):735-752.
[3] ZHAO T Y,ZHANG J L,MA L D,et al.On?Line OptimizationControl Method Based on Extreme Value Analysis for ParallelVariable?Frequency Hydraulic Pumps in Central Air?Condi?tioning Systems[J].Building and Environment,2012,47(l):330-338.
[4] 汪安南,伍杰.大型轴流泵站最优运行方式探讨[J].农田水利与小水电,1993(11):36-38.
[5] LANSEY K E,AWUMAH K.Optimal Pump Operations Con?sidering Pump Switches [ J]. Journal of Water ResourcesPlanning and Management,1994,120(1):17-35.
[6] BORKOWSKI D,WETULA A,BIE? A.Design,Optimization,and Deployment of a Waterworks Pumping Station ControlSystem[J].ISA Transactions,2012,51(4):539-549.
[7] 晏毅,赖喜德,陈小明,等.基于改进粒子群算法的泵站优化运行研究[J].中国农村水利水电,2022(8):150-155.
[8] 徐增林,盛泳潘,贺丽荣,等.知识图谱技术综述[J].电子科技大学学报,2016,45(4):589-606.
[9] 郑慨睿,温智鹏,徐盛取,等.基于知识图谱的水利工程BIM模型自动化规范审查研究[C]// 第八届全国BIM 学术会议论文集.北京:中国建筑工业出版社,2022:286-291.
[10] 侯征军,张兆波,覃家皓,等.知识图谱在智慧水利工程中的构建与应用[C] //2022 中国水利学术大会论文集(第四分册).郑州:黄河水利出版社,2022:30-36.
[11] 刘雪梅,卢汉康,李海瑞,等.知识驱动的水利工程应急方案智能生成方法:以南水北调中线工程为例[J].水利学报,2023,54(6):666-676.
[12] 金菊良,陈鹏飞,陈梦璐,等.基于知识图谱的水资源承载力研究的文献计量分析[J].水资源保护,2019,35(6):14-24,57.
[13] 高海翔,苗璐,刘嘉宁,等.知识图谱及其在电力系统中的应用研究综述[J].广东电力,2020,33(9):66-76.
[14] 侯梦薇,卫荣,陆亮,等.知识图谱研究综述及其在医疗领域的应用[J].计算机研究与发展,2018,55(12):2587-2599.
【责任编辑 栗 铭】
基金项目:水利部重大科技项目(SKS-2022133)