基于用户水质投诉信息的供水管网污染源的追踪定位

2014-05-10 06:42:58信昆仑项宁银
关键词:污染源管网水质

信昆仑,刘 龙,陶 涛,项宁银

(同济大学环境科学与工程学院,上海 200092)

随着居民生活水平与安全意识的提高,供水水质安全问题已成为影响公众身体健康、生活质量和社会安全的热点问题.供水水质安全包含两方面的含义:①供水水质在使用中不应该给人体带来短期或长期的健康危害;②供水系统对遭受突发事故的威胁,应具有良好的预防、保护、应急和恢复功能[1-2].供水管网突发污染事故的污染源追踪定位,是指根据管网水质数据,结合供水管网属性,推求污染物注入节点位置及其他信息的方法.定位追踪技术实际上是反演技术的一种,是通过部分已知输出状态,推求输入状态的方法[3].

目前国外在环境领域污染源追踪定位方面的研究比较多.Laird等[4-5]于 2005年提出了非线性化的程序方法直接求解逆水质问题,来估算配水管网中污染源的时间和地点,并于 2006年对该方法进行了改进,使该方法可以从非唯一的方案中选取出最可能的注入情景.Guan等[6]于2006年提出了模拟最优化方法来解决供水系统中的非线性的污染源和释放等历史问题.Liu等[7]于2007年提出一种采用遗传算法根据新的观测值实时估计污染节点位置的动态方法.Cristo等[8]于 2008年通过比较最小化模拟值和测量值之间的差值,利用比例矩阵(water fraction matrix)[9]转化成线性求解最优化问题来确定污染源的方法.Kim等[10]在2008年提出了一种利用人工神经网络识别致病微生物污染源的方法以及时隔离污染区域减小危害.Propato等[11]在 2010年提出了一种利用线性代数的方法缩小污染源范围,通过求最小相对熵的方法确定污染源.Liu等[12]于 2011年探究了一种基于种群的遗传算法,利用自适应动态优化技术对污染事件进行实时响应以识别污染源.国内学者中,王康乐[13]利用关系树-线性规划算法对供水管网污染源进行追踪,通过求解线性规划问题,得到污染源节点位置及污染注入属性.李红卫等[14]根据实验数据,利用改进的模拟-优化反追踪方法定位污染源并分析模型的主要影响因素.

以上方法均基于供水管网中水质在线监测信息充足且准确的假设条件.但目前实际供水管网中,很少能有足够的水质在线监测数据可供利用.在管网中水质主动监测信息不足的条件下,用户投诉可作为评价与改善管网运行状态的重要信息,用以进行污染源的追踪定位.笔者提出的方法即是基于对用户水质投诉信息的分析,将每一个用户看作一个“水质监测设备”,通过分析用户投诉在时间和空间分布的特征,建立针对此类信息的模式识别模型并求解,从而确定污染源的实际发生位置.

1 方法介绍

当污染物自某一节点注入供水管网中,随着水在管网中的流动,其他节点将有不同的水质变化响应,这种水质响应表现出时间、空间以及浓度上的差异性.当用户感知到水质变化而向供水企业投诉时,这些投诉信息也相应存在时间和空间上的差异性.尽管用户投诉很少发生在污染物刚刚到达用户节点的时刻,但用户感知水质变化的时间先后与节点开始污染时间仍有较好的正相关关系0t t t= +Δ,即如果将用户发生投诉的位置和时间看作是突发污染事故发生后的一种管网水质变化响应模式,那么不同的污染源发生位置将对应不同的响应模式.因此,供水管网污染源追踪定位问题可转换为一类模式识别问题进行求解.

人工神经网络模式识别是模式识别方法的一种,相对于传统的识别方法具有要求对问题了解少、可对特征空间进行较为复杂的划分、适用于高速并行处理系统来实现等特点[15].因此本研究选用神经网络算法求解污染源追踪定位问题.即利用管网水质模型对假定某一节点污染后的管网水质变化情况进行动态模拟(通过 Matlab环境下调用 EPANet Toolkit水质模拟工具箱实现),获得管网中节点水质变化的响应模式.依次通过对不同的注入节点进行水质模拟,即可构建用于进行模式识别的神经网络训练样本.训练完成后的神经网络即用于特定污染事件发生后的污染源识别.

1.1 水质投诉信息的特征及预处理

水质投诉信息是指供水用户发现水质异常后通过各种途径向供水企业反馈的信息.一般情况下,该类信息包括用户的投诉时间、用户感知水质变化时间以及用户点水质感官性状信息(如颜色、气味、浑浊度).用户投诉又可根据水质变化的诱因分为因突发性污染物进入管网引起的水质投诉、以及因管网自身运行状况不良引起的末端水质变差而引发的投诉两类.由于突发污染引发的水质投诉往往时间集中、空间分布广、影响范围大,存在明显的外源污染,并在用户投诉的感官性状描述上也具有较强的一致性(如刺激性气味等),且与因管网本身状况引发的局部用户水质投诉(一般为浊度、色度升高)有明显的区分度,本文仅针对此类水质事件的污染源追踪问题进行探讨.

针对此类污染事件,除应将投诉信息与一般管网水质投诉信息予以区分外,此类水质投诉还存在同一节点不同时间多次投诉、不同节点相同时间投诉等不确定性情况,在利用投诉信息构建管网水质污染模式之前,需要对投诉信息进行预处理.为减小投诉节点实际污染时间和投诉时间的差异,对于同一节点的重复投诉,取最早投诉时间作为节点投诉时间,对于投诉时间相同的节点,认为投诉用户比例大的节点先发生污染.

1.2 污染源候选节点的确定

根据投诉信息可以对节点是否为污染物注入点进行初步判断,例如存在明显上下游关系的点,上游节点有投诉信息,可以初步判断下游节点不是污染物注入节点,从而简化计算量与缩短计算时间.本文根据 Kessler等[9]1998年提出的污染矩阵的概念和Cristo等[8]2008年提出的方法,确定污染源的候选点集合,具体方法参见文献[8-9].

1.3 投诉信息的样本编码

由于神经网络自身仅能够处理数据,所以对于需要神经网络完成的任务,都必须首先将其转化成神经网络所能接收的输入和输出[16].

如前所述,由于用户投诉时间存在一定程度的不确定性,为减小这种不确定性对识别正确率的影响,本研究以用户投诉时间先后顺序而非具体投诉时间作为待识别的特征模式.同时,由于用户时间先后顺序无法充分表征污染物扩散的空间特征,仅考虑投诉时间先后顺序作为识别特征量很难对管网中空间位置相近的注入节点进行识别,因此增加用户投诉时间间隔顺序作为模式识别的第 2个特征.以下举例说明对投诉信息的处理与编码方法.

假设投诉信息如表1(第1、2列)所示,投诉信息包含节点 ID与节点投诉时间两部分.投诉节点个数为m(此处m=6),投诉节点ID反映的是投诉节点空间信息,投诉时间反映的是投诉节点开始污染时间信息.首先对不同节点进行数字编号,编号取 1~m 之间的整数(如表1第3列所示),将相邻编号节点投诉时间相减得到相邻投诉节点投诉时间差,并进行顺序编号,编号取值为 1~(m-1)之间的整数(如表 1第4、5列所示).由此,构造包含投诉时间先后信息的特征模式列向量P为

表1 假设投诉信息Tab.1 Supposed complaint samples

Q即为用于模式识别的神经网络输入样本.

1.4 模式识别系统的设计

根据本研究的问题特征,选择 BP神经网络(back propagation neural network)作为进行模式识别的基本网络结构[15],网络设计为两层.根据输入样本编码结构特征,神经网络输入层神经元个数为 m2+(m-1)2.在输出层,若污染源候选节点个数为 n,则输出样本可表达为

因此,所构建神经网络输出层神经元为n个.

网络结构如图1所示.

图1 神经网络结构示意Fig.1 Structure of neural network

进行神经网络训练所使用的输入和输出样本构造方法如下.

按照分别向每一个污染源候选节点持续注入一定浓度的污染物的方式构造管网水质污染情景,并利用EPANET水质模拟器对管网进行水质模拟,可获得管网各节点不同时刻的水质状况.假定当污染物浓度大于污染物感知限 RL时,节点所在的用户才能够感知水质异常并有可能投诉.根据模拟结果,即可得到污染发生后各节点用户最早可感知到污染的时刻.

考虑到实际情况下,用户用水习惯与投诉方式均存在一定程度的不确定性,各节点首先投诉的时刻距离实际发生污染的时刻存在一定程度的滞后(记为Δt),且该滞后量具有一定的随机性.目前,针对该随机变量的研究较少,尚无法确定其所服从分布,本研究中假定Δt服从自然中最常见的正态分布,并将其以噪声的形式加入节点开始污染时刻,以模拟实际投诉发生时间的不确定性,即

式中:t为节点投诉时刻;0t为节点开始污染时刻;tΔ为投诉滞后时间.

针对不同的候选污染源节点进行水质模拟,并采用式(7)的方式模拟实际投诉时间的不确定性,即可以得到若干组节点投诉信息样本,按照第 1.3节、第1.4节所述方法编码即可分别构建用于神经网络训练的输入样本及输出样本(见图 2).本文中采用 1,000组样本进行神经网络训练.

图2 方法流程Fig.2 Flow chart of the method

1.5 污染源节点的识别

将实际污染事件的投诉信息按照第 1.3节所述方法进行编码,编码后的向量输入训练后的神经网络即可得到污染物注入节点.

2 算例分析

以图3所示管网为例,该管网由97个节点(其中包含 2个水源节点、3个网中水塔节点)和 119条管段(包含 2个泵站)组成.假定水源节点 10发生污染,并在管网中 7个节点收到投诉,投诉节点及污染源候选点的位置如图 3所示.为不失一般性,本研究假定污染物为保守型物质,即仅随水体迁移扩散而不发生反应,污染源注入初始质量浓度为ρ0=25,mg/L,人体对此类物质的感知限ρL=1.0,mg/L.考虑到投诉信息的不确定性,投诉发生时刻处理为污染物实际到达时刻加上投诉滞后时间Δt,Δt在 0~4,h之间随机选取,处理后投诉信息如表2所示.

图3 管网拓扑模型Fig.3 Topology of example network

表2 整理后的投诉信息Tab.2 Organized complaint information

按照第 1.2节方法得到候选点 ID集合为{10,101,105,117,119,River,Lake},由于节点 Lake、10、101处于同一干管上,且沿线无支管,仅凭投诉节点的时间信息无法进一步判断污染源具体是哪一个,因此任选其中之一作为代表点,此处选择节点10.

以第1.3、1.4节所述方法生成带有噪声的训练样本,对神经网络进行训练,得到噪声信号训练的神经网络.

2.1 计算结果

由表2所示投诉信息知,节点开始污染时间顺序为ζ1=[1,2,3,4,5,6,7]T,污染时间间隔顺序为ζ2=[1,3,5,2,4,6]T. 加入投诉滞后时间噪声后,投诉时间顺序为 η1=[1,2,3,4,5,6,7]T,投诉时间间隔顺序为η2=[4,3,2,1,5,6]T.按照第 1.3节所述方法可以将投诉时间顺序与投诉时间间隔顺序编码为神经网络可识别的输入.

将编码后的投诉信息作为输入通过训练后的神经网络进行模式识别,结果输出显示污染源为节点10,与此前假定的污染源发生位置吻合.

2.2 结果讨论

由于缺乏足够的实际数据对投诉样本的统计学特征进行分析,本研究设计服从不同分布的投诉滞后时间(Δt)对神经网络进行测试,以检验算法对投诉信息不确定性的抗干扰能力.

(1)假定Δt服从不同均值的均匀分布,即在节点开始被污染后一段时间内得到用户投诉的可能性完全相同.制作Δt为服从在区间[t1,t2]上均匀分布的投诉样本,其中区间下限 t1=0,区间上限 t2随组别变化.每组样本测试 1,000次,测试参数与测试结果如表3和图4所示,其中测试样本噪声服从均匀分布.

表3 均匀分布噪声信号训练神经网络识别能力测试结果Tab.3 Test results of recognition ability of the neural network trained with uniform distribution noise samples

图4 识别错误频率与样本变异性关系Fig.4 Relationship between identification error frequency and the sample variance

测试结果表明,所建立的神经网络模型对噪声为均匀分布的样本有很好的识别能力,如果用户在所在节点发生污染后 5.5,h内投诉,神经网络正确识别率大于 95%;如果用户在 8,h内投诉,正确识别率约为85%.

(2)假定Δt服从伽马分布.为便于比较,各分布Δt均值均设定为 4,h.同时,考虑到伽马分布为左偏分布,构造对应的右偏分布(记为Λ分布)以比较分布的偏态性质对神经网络正确识别率的影响,并构造公式为

式中:S1为服从Λ分布的随机样本;S0为服从伽马分布的随机样本;0( )E S 为S0的数学期望.

按照以上方法构造投诉样本,每组样本训练1,000次,测试结果如表 4所示,测试样本均值均为4,h.

表4 伽马及Λ分布噪声信号训练神经网络测试结果Tab.4 Test results of recognition ability of the neural network trained with Gamma distribution and Λ distribution samples

由结果可见,该方法的识别正确率与实际Δt所服从分布形式(如图 5、图 6所示)有关,并受Δt分布的变异性影响明显.如图7所示,Δt标准差较小(σ<10,h)时,识别错误率与标准差呈线性关系,分布偏态性对识别效率影响不大.当Δt标准差较大(σ>10,h)时,识别错误率随Δt分布的标准差的增大,增长速率减慢,主要是由于随Δt的标准差进一步增大,使得Δt对投诉顺序与节点开始污染顺序差异影响变小.此外,本方法对Δt服从伽马分布比服从 Λ分布的投诉样本识别能力差,主要是由于构造 Λ分布相同的方式使得Λ分布中Δt取得0,h周围的概率大于伽马分布(见图5和图6),使得投诉时间不确定性的影响变小.可见,Δt所服从分布的标准差与其取值在 0,h周围的概率是影响本方法识别能力的主要因素.显然,如果投诉滞后时间Δt越一致并且其取值越接近于0,h,其对投诉模式不确定性的影响越小.

图5 伽马分布概率密度曲线Fig.5 Curves of the probability density of Gamma distribution with different parameters

图6 Λ分布概率密度曲线Fig.6 Curves of probability density of Λ distribution with different parameters

图7 识别错误率与标准差关系曲线Fig.7 Curves of relationship between identification error frequency and corresponding standard deviation

根据以上分析结果,由于Δt表示节点受污染时间与投诉时间的差,其样本标准差表现了用户作息习惯的差异及投诉习惯的差异,也同时反映了投诉信息不确定性对于本方法识别污染源位置的影响.在现实情况中,一般可认为各节点投诉用户作息和投诉习惯差异不大(如Δt标准差小于 8,h),同时通过对投诉数据的预处理,即取位置接近的用户中首先投诉的时间作为该节点位置的代表性投诉时间,可有效降低各投诉滞后时间Δt之间的差异性,因此本文方法可以有效根据实际中投诉识别污染物注入位置.

3 结 语

本研究基于模式识别方法进行供水管网污染源的追踪定位,利用因水质异常引发的用户投诉信息,通过分析用户投诉的先后顺序以及用户投诉时间间隔顺序形成的特征模式,可短时间快速识别污染物注入节点的位置,克服了以往此类研究必须依靠在线水质监测数据进行污染源追踪分析的缺陷,有助于在我国现状管网水质在线监测设备普遍缺乏的情况下,增强对管网水质突发事故的响应决策能力.同时,本方法通过在训练样本引入噪声,使得训练后的网络对具有较强不确定性的投诉样本仍有良好的识别能力.此外,研究表明所构建的神经网络识别能力主要受实际投诉滞后时间(Δt)变异性等因素的影响,在投诉用户作息习惯及投诉习惯一致的情况下本方法识别能力更为突出.

需要说明的是,鉴于投诉信息的不确定性以及非定量特征,该方法只能识别污染物注入节点位置信息,而无法进一步确定污染物注入浓度、注入历史时间模式等更详细的信息.对污染物注入浓度、注入时间等更详细的污染源信息的辨识,需要进一步结合水质监测等技术手段进行分析确定.

[1] 童祯恭,刘遂庆. 供水管网水质安全及其保障措施探讨[J]. 净水技术,2005,24(1):49-53.

Tong Zhengong,Liu Suiqing. Protection measures for the safety of water quality of distribution system[J].Water Purification Technology,2005,24(1):49-53(in Chinese).

[2] 袁志彬. 提高我国城市供水水质的关键问题研究[D].北京:清华大学环境科学与工程系,2003.

Yuan Zhibin. Key Issues to Improve the Quality of Water in Cities of China[D]. Beijing: Department of Environmental Science and Engineering,Tsinghua University,2003(in Chinese).

[3] 吕 谋,王梦琳,孙贤忠. 供水管网突发污染试验模拟及污染源定位研究[J]. 青岛理工大学学报,2009,30(6):1-7.

Lü Mou,Wang Menglin,Sun Xianzhong. Experimental simulation of contamination events and investigation of contamination source determination in water supply systems[J]. Journal of Qingdao Technological University,2009,30(6):1-7(in Chinese).

[4] Laird C D,Biegler L T. Contamination source determination for water networks[J]. Journal of Water Resources Planning and Management,2005,131(2):125-134.

[5] Laird C D,Biegler L T. Mixed-integer approach for obtaining unique solutions in source inversion of water networks[J]. Journal of Water Resources Planning and Management,2006,132(4):242-251.

[6] Guan Jiabao,Aral M M. Identification of contaminant source in water distribution systems using simulationoptimization method:Case study[J].Journal of Water Resources Planning and Management,2006,132(4):252-262.

[7] Liu L,Downey B E,Mahinthakumar G,et al. Considering demand variability and measurement uncertainties in adaptive source characterization in water distribution networks[C]//Proceedings of World Environmental and Water Resources Congress. Florida,USA,2007:1-8.

[8] Cristo C D,Leopardi A. Pollution source identification of accidental contamination in water distribution networks[J].Journal of Water Resources Planning and Management,2008,134(2):197-202.

[9] Kessler A,Osfeld A,Sinai G. Detecting accidental contaminations in municipal water networks[J]. Journal of Water Resources Planning and Management,1998,124(4):192-198.

[10] Kim M,Choi C Y,Gerba C P,et al. Source tracking of microbial intrusion in water systems using artificial neural networks [J].Water Research,2008,42(4/5):1308-1314.

[11] Propato M,Sarrazy F,Tryby M. Linear algebra and minimum relative entropy to investigate contamination events in drinking water systems[J].Journal of Water Resources Planning and Management,2010,136(4):483-492.

[12] Liu L,Ranjithan S R,Mahinthakumar G. Contamination source identification in water distribution systems using an adaptive dynamic optimization procedure[J].Journal of Water Resources Planning and Management,2011,137(2):183-192.

[13] 王康乐. 供水管网污染源追踪定位技术与软件模拟方法研究[D]. 上海:同济大学环境科学与工程学院,2010.

Wang Kangle. Study on Location Tracing and Computer Simulation of Contamination Source in Water Distribution Networks[D]. Shanghai:College of Environmental Science and Engineering,Tongji University,2010(in Chinese).

[14] 李红卫,王梦琳,吕 谋,等. 给水管网污染源定位模拟及影响因素分析[J]. 浙江大学学报:工学版,2011,45(1):81-86.

Li Hongwei,Wang Menglin,Lü Mou,et al. Simulation of contamination source identification in water supply system and analysis of influencing factors[J].Journal of Zhengjiang University:Engineering Science,2011,45(1):81-86(in Chinese).

[15] 杨淑莹. 模式识别与智能计算:Matlab技术实现[M].

北京:电子工业出版社,2011.

Yang Shuying. Pattern Recognition and Intelligent Computing:Matlab Technology[M]. Beijing:Electronic Industry Publishing House,2011(in Chinese).

[16] 但小容,王 瑞,杨 莉. 基于人工神经网络的模式识别[J]. 软件导刊,2007,12(3):87-89.

Dan Xiaorong,Wang Rui,Yang Li. Pattern recognition based on artificial neural network[J]. Software Guide,2007,12(3):87-89(in Chinese).

猜你喜欢
污染源管网水质
水质抽检岂容造假
环境(2023年5期)2023-06-30 01:20:01
持续推进固定污染源排污许可管理全覆盖
一月冬棚养虾常见水质浑浊,要如何解决?这9大原因及处理方法你要知晓
当代水产(2019年1期)2019-05-16 02:42:04
管网独立是妥协还是改革
能源(2018年8期)2018-09-21 07:57:20
从管网独立看国企改革
能源(2018年8期)2018-09-21 07:57:20
管网改革虚实
能源(2018年8期)2018-09-21 07:57:18
基于污染源解析的空气污染治理对策研究
十二五”期间佳木斯市污染源排放状况分析
织起一张共管网
中国公路(2017年8期)2017-07-21 14:26:20
看不见的污染源——臭氧