配水管网管段改造排序的PageRank算法

2015-03-20 01:33李飞宇石振锋吴晨光于美婷袁一星
哈尔滨工业大学学报 2015年8期
关键词:管段水力网页

李飞宇,石振锋,吴晨光,于美婷,袁一星

(1.哈尔滨工业大学市政环境工程学院,150090哈尔滨;2.哈尔滨工业大学数学系,150001哈尔滨)

配水管网管段改造排序的PageRank算法

李飞宇1,石振锋2,吴晨光1,于美婷2,袁一星1

(1.哈尔滨工业大学市政环境工程学院,150090哈尔滨;2.哈尔滨工业大学数学系,150001哈尔滨)

针对城市配水管网管段改造比选排序问题,提出了基于PageRank的改进的MPR-Pipe算法,实现了对管网节点和管段多种水力属性的PR值求解.利用经济流量和管段单位水力坡降PR值,定义了管段改造的重要性度量,并以此作为改造比选排序的依据.理论计算表明该算法求解效率较高,工程应用案例表明该算法提出的管段改造比选排序方案有效、可行.

配水管网;管段改造;PageRank;单位水力坡降;管段重要性

结合我国配水管网的实际情况,管网急需改造的原因主要包括:管网设备陈旧与老化;管网运行负荷较重;管网布局欠合理;水源新建及改造;更高的水质安全需求;节能降耗.因此,在对供水管网进行改造过程中应用管网水力模型,分析供水管网的工况,合理地对供水管网进行改造,特别是通过优化管网改造的顺序可以节约投资,最大限度地降低能量消耗,而且可以提高整个供水系统的安全性能,对于企业和社会都具有重要意义.为此,国内外开展了管网改造方面的研究,主要包括:管段老化模型研究[1]、管网运行现状模型研究[2-3]、管网运行成本模型研究[4]及管网改造决策模型研究[5-6],其中管网改造决策模型的建立与求解是最主要的研究方向,其结果可以直接指导管网改造问题[7].管段老化模型、管网运行现状分析、管段运行成本经济型分析,一般在构建和求解管网改造决策模型中起辅助作用[8].同时,国内外还建立了多种优化改造模型用于管网的改造,如基于多目标优化的管网改造决策模型[6]、基于遗传算法的管网优化模型[9].这些模型建模的思想、形式、复杂程度差异性较大,各有侧重.

赋予静态属性和动态的状态属性后的供水管网在应用过程中可抽象为网络.管网改造过程中管段的排序问题即可转化为网络中对连接边的排序问题.Google网页搜索过程中,通过网页间的链接来评价网页的重要性,这就是Google网页搜索引擎中的核心算法——PageRank算法[10].随着对 PageRank算法的广泛研究,其不仅在自身网页排序中应用效果显著,在很多领域都得到了应用,如图书管推荐技术、网络安全评估、Web数据挖掘等.借鉴PageRank算法在其他行业中的应用,利用管网改造管段排序问题和网页排序问题的相似性,将PageRank算法引入城市配水管网改造的应用中目前未见报道.本文首先介绍了PageRank算法,并评述了其优缺点.结合城市配水管网的特殊性,提出了适于管网改造排序应用的改进的PageRank算法,并定义了管段的重要性度量,进而给出管段改造排序的计算方法.最后,根据管段排序的结果并通过实例验证,表明该算法描述管段重要性度量的定义是合理的、可行的,可为城市配水管网提供可行的科学改造方案.

1 PageRank算法简介及评述

1.1 PageRank算法简介

PageRank算法是Google网页搜索引擎中的核心算法,由Google的创始人Sergey Brin和Lawrence Page[10]于1998年提出并得到了成功应用.其基本思想主要来自传统文献计量学中对文献引用的研究和分析[11],即一篇文献被其他文献引用的越多,说明文献的质量就越高.假设网页A链接网页B,则可看作是网页A对网页B进行投票,根据投票数来判断网页的重要性(PageRank值,简称PR值).PageRank技术根据整个Web的链接结构来计算各个网页的重要性值,构造有向网页图G=<V,E>,其中顶点V为所有的网页集合,边 E为网页中所有的链接集合,网页A存在一条指向网页B的链接即表示为网页有向图的边E.PageRank算法的基本定义为

1.2 PageRank算法的不足

PageRank算法在Web页面重要性应用中存在两个主要的不足,即P R值沉淀现象和“黑洞效应”.在多个网页彼此链接后形成的有向图中,当网页链接形成的有向图之外的网页链接到该有向图内部的网页时,就会出现有向图内部网页传递不出去PR值而导致传递进来的PR值一直滞留在此有向图内部,即PR值沉淀现象.图 1解释了该现象.在图1中,网页A、B、C、D内部相互链接,无向外链接,网页E、F分别链接网页B和D,在应用PageRank算法进行迭代计算中,网页E、F的PR值不能在网页A、B、C、D形成的组内贡献出去而出现沉淀的现象.为此,Sergrey Brin和Law Page对PageRank算法进行改进[13],引入衰退因子D(Pi),对应某一网页的初始PR值,改进算法即

其中‖P R(Pi)‖=1.

在求解式(2)描述的方程组时,其收敛性问题是关键.对于连通的有向Web图G=<V,E>,设其中某个顶点的入度为0,由于其没有对外贡献PR值,P R值会逐渐减少,经过有限次迭代之后,该连通图内所有顶点的PR值将全部为0,这就是PageRank算法存在的“黑洞效应”,即入度为0的顶点就像黑洞一样,将整个有向图内的P R值全部慢慢“吸收”.然而,针对“黑洞效应”,Google并没有公布其处理办法,有些研究者认为可以将Web有向图内所有的网页均作为入度为0网页的链接,这样就能有效避免“黑洞效应”.

针对PageRank算法存在的上述两个不足,在管段排序应用中,应该根据给水管网的实际特点,对PageRank算法进行适当改进.

2 面向管网改造管段排序的改进的PageRank算法——MPR-Pipe

2.1 改进的PageRank算法——MPR-Pipe

为将PageRank算法更好地应用在给水管网的管段改造排序问题,对PageRank算法作如下两点改进:

1)在网页模型中,网页的属性值只体现了链接数,各个链接只是数值上平分此网页的PR值.给水管网中,每个管段具有更多实际意义的属性值,如流量、流速、单位水头损失等,不同的管段属性值对管段的最终改造排序结果有重要的影响,因此,在管网模型中应以管段属性信息值的比例来分配该管网节点的PR值.本文选用单位水力坡降.

2)根据PageRank算法的介绍,由式(1)可知,PageRank的名次和该网页被链接的数目基本一致,无论该网页链接多少网页均几乎不会影响PR值.相反有多少网页链接该网页从根本上决定网页P R值的大小.本文提出对管段进行排序的改进的PageRank算法由管网节点的正向链接和反向链接共同决定,这种改进一方面结合了管网模型的实际情况,另一方面也有效地避免了在网页模型中PageRank算法存在的沉淀现象和“黑洞效应”.

记I(Ji,Jj)为管网节点Ji到节点Jj的单位水头损失,I(:,Ji)为所有流入节点Ji,并与节点Ji链接的节点构成的Ji单位水头损失总和,I(Ji,:)为流出节点Ji,与节点Ji链接的节点构成的Ji单位水头损失总和.在节点总数为NJ的给水管网中,改进的PageRank算法(modified PageRank for pipe,MPRPipe)可以概括为如下线性方程:

式中:i=1,2,...,NJ;

In(Ji)为流入管网节点 Ji的管网节点集合;Out(Ji)为从管网节点Ji流出的管网节点集合;c1和c2分别为流入与流出权重系数(介于0~1的常数),且c1+c2=1;d为阻尼因子,用于保证线性方程(3)的收敛性.

2.2 管段重要性度量的定义

通过方程组(3)求得供水管网中每个节点在流量、绝对水头和自由水头等属性上的PR值.然而,管网改造过程中都是基于管段进行的,因此,需要利用每个节点的PR值定义管段重要性的度量.考虑到管段的单位水力坡降和流量是刻画管段输水能力和经济指标计算时的重要指标,本文将结合管段的单位水力坡降和实际计算流量与经济流量之间的关系来定义管段的重要性.设连接管段Pi的两个节点分别为和的实际计算流量为,其经济流量为.则定义管段改造的重要性程度为

其中e1+e2=1.本文取e1=e2=0.5,利用供水管网中管段的单位水力坡降属性来定义管段重要性度量,并称为管段的PR值.由式(4)可以看出,当管道实际流量越大于经济流量时,管段的PR值就越大,据此排序在前,表明管段越急需改造,因此,式(4)具有明显的物理意义.该PR值标明了所有管段改造的顺序(不考虑管段改造的经济成本等因素).当实际流量远小于经济流量时,从物理意义上讲也急需改造.在实际工程应用中,对这种管道的改造一般采用关阀改变供水管网逻辑拓扑结构,或调整阀门开度改变这部分管道的水力工况状态等方案来实现管网的改造,不在本文的讨论范围之内.

2.3 MPR-Pipe算法的数值求解

给定管网有向图G=<V,E>,定义管网的邻接矩阵P,若管段i链接管段j,且水流方向为从管段i到管段j,则Pi,j=I(Ji,Jj),否则Pi,j=0.即

其中m=m(x)=(I-d)eTx=(I-d)‖x‖1为常数,于是可将式(6)简化成线性方程组.记B=I-d(c1P1+ c2P2T),m=(I-d)v,则式(6)的求解过程转化为对线性方程组(8)的求解,即

注意到管网中的节点数量通常较大,基于高斯消元法进行求解效率较低.为此,本文采用Jacobi迭代法,建立迭代公式

则MPR-Pipe算法转换后的等效线性方程组Bx=m的Jacobi迭代矩阵为

综上,MPR-Pipe算法可描述为

算法1面向管段改造排序的改进的PageRank算法

Input管网水力计算结果数据文件;阻尼因子d;流入和流出权重系数c1,c2;迭代终止精度ε;最大迭代次数MAX_Iter;

Output城市供水管网管段和节点的PR值;

Step 1读取供水管网水力计算结果数据文件;

Step 2建立管段邻接关系矩阵A_E;

Step 3由流入和流出权重系数c1,c2,建立与邻接矩阵A_E相关的水力工况参数系数矩阵C_E;

利用线性方程组的Jacobi数值求解算法求解公式(6);

ifδ<εgoto Step 5;

end

Step 5根据节点的PR值,计算管段的PR值;Step 6保存管段和节点的PR值信息为数据文件.

3 结果及分析

3.1 数据结构设计

设计如下数据结构实现MPR-Pipe算法:

■节点的数据结构描述如下:

struct NODE{ //节点结构

long innNo;//内部编号

double dFlow_PR; //流量PR值

double dSpeed_PR; //流速PR值

double dFall_PR; //压降PR值

};

■管段的数据结构描述如下:

struct PIPE{ //管段结构

long innNo; //内部编号

long from_innNo; //流出节点内部编号

long to_innNo; //流入节点内部编号

double dFlow_PR; //流量PR值

double dSpeed_PR; //流速PR值

double dFall_PR; //压降PR值

double dFall_1000_PR;//单位水损PR值

};

■管网拓扑结构描述如下:

typedef struct ADJACENT_ELEMENT {

int no;

PIPE∗pipe;

}A_E;

typedef struct COEFFICIENT_ELEMENT {

int col;

double value;

}C_E;

typedef struct WaterPipeNet {

vector<PIPE>pipe_list; //管段数组.

vector<NODE>node_list; //节点数组.

vector<vector<A_E>>row_type;//邻接矩阵

vector<vector<A_E>>col_type;//邻接矩阵

vector<vector<C_E>>cem;//系数矩阵

}GRAPH;

3.2 计算实例及分析

本文基于Embarcadero RAD XE 5平台,利用C++编程实现了MPR-Pipe算法.以北方某市部分管网为例进行了仿真计算和分析,其管网拓扑如图2所示.

在该管网拓扑结构中,由291条管段、259个节点及6个水厂构成.在水力计算过程中,共计算了24个时段,水力计算的边界约束不做列出.利用本文的MPR-Pipe算法针对该管网24个时段水力计算结果中的管段流量、流速、水头损失和单位水头损失等动态水力属性分别进行求解,花费的总计算时间为0.058 s.图3给出了上述管网在23时、9时、14时和18时的管段改造重要性排序示意图.

图3中4个子图中共标识了8条管段,其在24个时段中,有超过18个时段均具有较大的P R值.也就是说,从管段改造应用的意义上看,这8条管段为急需改造的管段,也是上述管网中的较“薄弱”管段.对于具有相同管材的管段,其阻力系数C值会随着敷设年代的增加而逐渐变小,在相同的用水形式下,其单位管段水力坡降也会变大.根据管段重要性的定义,对于单位水力坡降较大的管段,如果计算得到的流量小于经济流量的管段,则其重要性将按照指数级(小于1)平缓;对于实际计算流量大于经济流量的管段,其重要性将按照指数级(大于1)提升,从而加速这部分管段的排序,成为急需改造的管段.

3.3 MPR-Pipe算法与传统分析方法的比较

为了验证本文算法的合理性和有效性,以高日高时为水力计算的基本工况,与传统的管段运行负荷计算方法[14]得到的结果进行了比较,结果如图 4所示.其中管段运行负荷中的经济指标等因素与本文中计算经济流量时设定的参数相同.可以看出,本文得到的8条急需改造的管段,其运行负荷普遍高于其他管段.在这一点上本文定义的重要性较好地包括了传统的管段运行负荷分析的范畴.然而,在运行负荷分析方法中,有较多的管段处于略低负荷、经济负荷及略超负荷等,尚不能较好地给出管段改造的排序结果.本文提出的管段重要性度量可较好地对运行负荷偏高的管段实现数值上较大范围的放大,而运行负荷较低的管段则实现了数值上较大范围的缩小,从而可更有效地实现管段重要性两个不同层级上的区分,也更有利于快速实现急需改造管段的选择.因此,从传统的管段改造角度看,本文算法得到的排序结果要优于通过管段运行负荷分析得到的改造的管段集合.

综上,本文提出的改进的PageRank算法快速地实现了对管段改造方案的比选排序,该排序结果综合反映了管段的单位水头损失和经济流量的情况.对于敷设年代较久远的管段,因其单位水力坡降较大而可能成为排序中急需改造的管段.本文算法得到的排序结果已成功应用于该城市这部分供水管网的实际改造.由于管径的优化选择不在本文的讨论范围之内,这里仅给出了需要改造管段的优先顺序,而未给出这些管段改造后的管径选择方案.

4 结 论

1)基于PageRank算法,提出了面向城市配水管网改造管段排序应用的改进的 PageRank算法——MPR-Pipe算法.

2)基于MPR-Pipe算法,定义了管段改造排序的重要性度量——管段改造的PR值.

3)基于管段改造的PR值得到管段改造排序方案,实现了对北方某城市部分管网的实际改造应用,表明本文的方法具有实用的工程意义和理论意义.

[1]WATSON T,MASON A.A hierarchical Bayesian model for the maintenance of water pipe networks[C]//Proceedings of the 7“International Conference on Hydroinfor-Matics.France:Nice,2006:2991-2998.

[2]GYERGYEK L,PERSEN S.Simulation and optimal control of large water distribution systems[J].Mathematics and Computers in Simulation,1982,96(2):214-216

[3]舒诗湖,何文杰,赵明,等.供水管网漏失检测技术现状与进展[J].给水排水,2008,34(6):114-116.

[4]SAVIC D A,WALTERS G A.Genetic algorithms for least-cost design of water distribution networks[J].Journal of Water Resources Planning and Management,1997,123(2):67-77.

[5]MALM A,SVENSSON G,BäCKMAN H,et al.Prediction of water and wastewater networks rehabilitation based current age and material distribution[J].Water Science&Technology:Water Supply,2013,13(2):23-28.

[6]ROSHANI E,FILION Y R.Multi-objective rehabilitation planning of water distribution systems under climate change mitigation scenarios [J]. Bridges,2014,10:9780784412312.321.

[7]SARGAONKAR A,KAMBLE S,RAO R.Model study for rehabilitation planning of water supply network[J].Computers,Environment and Urban Systems,2013,39:172-181.

[8]BEALE D J,MARLOW D R,COOK S.Estimating the cost and carbon impact of a long term water main rehabilitation strategy[J].Water Resources Management,2013,27(11):3899-3910.

[9]KANTA L,ZECHMAN E,BRUMBELOW K.Multiobjective evolutionary computation approach for redesigning water distribution systems to provide fire flows[J].Journal of Water Resources Planning and Management,2011,138(2):144-152.

[10]BRIN S,PAGE L.The anatomy of a large-scale hypertextual web search engine[J].Computer Networks and ISDN Systems,1998,30(1):107-117.

[11]GIBSON D.Device discovery and power management in embedded systems[C]//Proceedings of the Linux Symposium 2003.Ottawa:[s.n.],2003:213-224.

[12]AUSTIN D.How Google finds your needle in the web’s haystack[J].American Mathematical Society Feature Column,2006,10:12.

[13]PAGE L,BRIN S,MOTWANI R,et al.The PageRank citation ranking:bringing order to the web[J].Stanford Infolab,1999,9(1):1-14.

[14]赵洪滨.给水管网系统理论与分析[M].北京:中国建筑工业出版社,2003:312-313.

(编辑 刘 彤)

PageRank-based selection sort of pipe renewal in water distribution system

LI Feiyu1,SHI Zhenfeng2,WU Chenguang1,YU Meiting2,YUAN Yixing1

(1.School of Municipal and Environmental Engineering,Harbin Institute of Technology,150090 Harbin,China;2.Department of Mathematics,Harbin Institute of Technology,150001 Harbin,China)

A novel modified Page Rank algorithm for pipe renewal(MPR-Pipe)is presented to realize selection sort and provide Page Rank values of static and dynamic attributions of junctions and pipes in water distribution systems.The measurement of pipe renewal significance,well defined on the grounds of economic flow and unit hydraulic gradient,can be taken as the criterion for the selection sort of pipe renewal.Theoretical calculations confirm the high efficiency of the algorithm,and engineering application cases indicate the effectiveness and feasibility of the renewal plan based on MPR-Pipe algorithm.

water distribution system;pipe renewal;PageRank;unit hydraulic gradient;pipe significance

TU821.3

A

0367-6234(2015)08-0025-05

10.11918/j.issn.0367-6234.2015.08.006

2014-06-20.

国家自然科学基金(51178141);水体污染控制与治理科技重大专项(2012ZX07408-002-004-002).

李飞宇(1981—),男,博士研究生;袁一星(1957—),男,教授,博士生导师.

吴晨光,wu.cg@126.com.

猜你喜欢
管段水力网页
高温气冷堆核电站蒸汽发生器可拆管段拆装系统研究
末级压出室水力结构对多级离心泵水力性能的影响
贫甲醇泵的水力设计与数值计算
管段沿线流量简化前后水头和流行时间差异性分析
供热一级管网水力计算及分析
基于HTML5与CSS3的网页设计技术研究
基于CSS的网页导航栏的设计
基于HTML5静态网页设计
基于URL和网页类型的网页信息采集研究
电站配管设计中的旋转角度分析及计算