李 芸,田 欢,张明顺,王文海
(1.北京建筑大学,北京100044;2.中国新时代控股(集团)公司,北京100034)
目前,农业面源和城市地表径流是两大面源污染,其中雨水径流污染是除城市生活污水和工业废水之外的第二大城市水环境污染源[1],深圳市统计表明雨水径流污染已超过点源污染[2]。准确评估雨水径流污染负荷,将有助于分析和评价径流污染对流域水体的影响程度,为受纳水体水质控制和管理提供量化数据,为海绵城市建设提供参考依据[1,2]。但是,我国雨水径流污染负荷评估研究性模型居多[3-5],应用性模型少,经验性模型有明显地域性要求而难以推广[6,7];机理模型需要连续的长序列数据支持,工作量大[8,9]。同时,由于我国开展雨水研究起步晚,相关工作不到位,即使水文气象监测站可提供当地连续完整降雨数据,但当地雨水径流水质数据依旧非常匮乏。即便是在一些发达地区,只有一些比较重要的管道和排水口有相关的监测数据,绝大多数的地区,尤其是一些老城区,雨污合流制的排水方式,雨水径流污染负荷评估更是难上加难[10]。因此,基于我国当前状况,研究利用有限的数据评估雨水径流污染负荷的方法已是迫在眉睫。
近年来,众多学者运用BP网络评估城市需水量[11-13],但应用BP网络来评估雨水径流污染的相关研究目前在国内尚未开展。雨水径流污染负荷影响因素众多,雨量变化大,下垫面复杂,污染物不单一、关系复杂[14]。人工神经网络[15]互联大量神经元成为网络进行抽象模拟工程可以解决一些关系复杂的非线性问题,建立BP神经网络对径流污染负荷进行综合评估不失为一种方法。本文以深圳光明新区某监测区域2014-2015年20场次降雨作为样本数据,引入BP神经网络模型对雨水径流污染负荷进行评估,并使用Schueler法[16]对结果进行验证,以此讨论BP神经网络模型在深圳光明新区径流污染负荷预测的适用性。
研究区域选取国家水体污染控制与治理科技重大专项中《水体污染与治理——城市道路与开放空间低影响开发雨水系统研究与示范工程》(2010ZX07320-002)深圳光明新区示范工程。自2013年始,北京建筑大学不间断委派实验室工作人员进驻项目现场开展科研工作,尤其是针对新城公园(原牛山科技公园)、公园路、28号路及育新中学雨水花园等地的进行了有序的监测和深度研究,开展的监测工作包括降雨监测、地表以及管道径流监测。其涉及的地表特征类型有山体、绿地(包括下凹式绿地、植草沟、雨水花园)、传统道路、新型道路(包括道路中央隔离带、单体树池、组合树池、生物滞留带),另监测特征类型还包括明渠和管渠,并对一些重要地表特性以及地段还进行了对比段监测。测定了相应汇水面雨水口、明渠和管道流量;现场气象自动监测包括温度和雨量2项参数;现场收集包括雨水口径流水样、植草沟水样,明渠水样、旱溪水样以及管道和道路雨水径流(包括植草沟、雨水口、管道以及雨水井)水样;实验室测定包括SS、CODcr、TP、TN、氨氮(NH+4-N)以及硝氮(NO-3-N),共计6大基本指标。
光明新区位于深圳市西北部,近5 a年均降水量约1 615 mm,全年86%的雨量出现在汛期(4-9月),汛期又分为前汛期(4-6月)和后汛期(7-9月)。夏季长达6个多月(平均夏季长196 d),前汛期受锋面低槽、热带云团、低空急流、季风低槽等影响,雨水迅速增加,多暴雨天气。后汛期主要受热带气旋(台风)、东风波、辐合带的影响。7- 9月平均有3- 4个热带气旋(台风)影响深圳。雨季一般结束于 9 月中、下旬。7- 9月监测区域内降雨频繁,冲刷严重,径流污染严重,在数据样本中,可选取7-9月中典型的小、中、大、暴四种类型的降雨反映全年降雨,从而降低样本维度。
图1 深圳市1981-2010年各月平均降雨累年平均值(1-12月)Fig.1 Shenzhen average annual months average rainfall in December in 1981-2010 (1-12)
对2014-2015年所有监测数据进行整理,将缺少降雨量、流量或者污染物指标三项数据中任何一项的测定场次排除,依据Thomson等人的研究表明至少对一个地区15~20场降雨径流的实测才能较好的得出该地区的径流平均浓度[3],故而整理出20项包含小、中、大、暴四类降雨数据的完整降雨进行汇总,计算单场降雨历时、径流总流量以及各个污染物的EMC值,绘制出场次降雨的流量过程线。通过分析可知,公园各污染物EMC呈正偏态分布;EMC最大值与最小值相差倍数分别为23.37、5.17、9.62、44.40、312.75、21.86;EMC标准差分别为71.89、20.99、0.29、1.13、3.20、0.43;离散系数在0.46~1.70之间,监测场降雨之间的EMC差距相对较大。
依据《室外排水设计规范》(GB50014-2006)和《建筑与小区雨水利用工程技术规范》(GB50400-2006)以及《海绵城市建设技术指南——低影响开发雨水系统构建(试行)》中规定,可将监测区域进行分类,定义公园为绿地,其雨量径流系数为0.15,流量径流系数为0.25;道路设为混凝土和沥青路面,其雨量径流系数为0.8~0.9,流量径流系数为0.9。
所涉及生物滞留带监测区域由于包含绿地以及道路,故而参见综合径流系数定义可进行相关计算,综合径流系数为:
(1)
式中:Ψ为综合径流系数;Si为单一下垫面面积,m2;Ψi为综合径流系数;S为下垫面总面积,m2。
监测区域雨量径流系数相关计算结果见表2。
表1 2014-2015年20场降雨特征数据Tab.1 Data of 20 rainfall characteristics in 2014-2015
注:-表示数据缺失;污染物指标单位:mg/L。
表2 监测区域雨量径流系数Tab.2 Monitoring regional rainfall runoff coefficient
注:*中的数据参考Google卫星地图。
美国心理学家McCulloch和数学家Pitts于1943年共同提出了人工神经网络(Artificial Neural Network,即ANN)数学模型[15]。1985年Rumelhart等提出了误差逆传播算法(Error Back Propagation,称作RBP或BP)算法[17],在神经网络中引入了隐神经元,使得神经网络具备了分类和记忆能力,解决了多层神经元网络中隐单元层连接学习的相关问题,实行从后向前计算并可以对误差进行校正。BP网络是一个多层神经网络模型,其主要有输入层、隐层和输出层组成,隐层可以是一层也可是多层。
通过查阅相关文献,对监测数据归为3类:一是下垫面特征,雨量径流系数、汇流面积、绿地率;二是降雨特征,其主要包含降雨量、降雨历时、降雨间隔时间、最大降雨强度;三是流量特征,也就是地表径流量。主要从上述3个方面考虑影响因子。
表3 2014-2015年污染负荷影响因子统计Tab.3 Statistical analysis on the influence factorsof pollutant total amount in 2014-2015
由于绿地率单独作为一个变量表达的只是一个比例值,只有同汇流面积结合起来使用,才能表达应有的含义变为赋值的有效数值,故将汇流面积与绿地率相乘得到绿地面积作为X3变量输入。整理所有数据按照时间的先后顺序进行排序见表4。
为使所有影响因子具可比性,需要对以上含有量纲的数据进行无量化(Nondimensionalize)处理。应用SPSS 22.0软件所提供的Zscore函数(Zero-mean Normalization)进行相关处理:
(2)
表4 2014-2015年污染物总量影响因子数据Tab.4 Impact factor data of pollutant total amount in 2014-2015
注:X3输入量在这里已经由“绿地率(%)”替换成“绿地面积(m3)”。
采用主要成分分析法[18]来提取合理数量的主要影响因子来降低维度。计算出各个因子的特征根和方差贡献率,具体见表5。可以看出,最开始选取的8个影响因子的贡献率均大于40%,通过使用主成分法分析提取的因子1、因子2和因子3可以解释全部因子的76.9%,他们的特征值分别为3.337 9、1.728 2和1.086 8,符合因子分析特征值大于1的原理,所以,提取主成分数目为3(也即m=3)。故而可以选取8个因子中的前3个替代原变量。
表5 分解方差主成分影响因子提取Tab.5 Decomposition variance principal componentinfluence factor extraction
列出前3个成分因子负荷矩阵如表6。可以看出变量Zscore(X2)、Zscore(X3)在主成分因子1上均有很高的负荷,相关系数不低于0.800;变量Zscore(X5)在因子2上有很高的负荷,其余相关系数均低于0.550;变量Zscore(X6)在因子3上有很高的负荷,其余相关系数均低于0.500。综上分析可以选用汇流面积(m2)、绿地率、降雨历时(min)和降雨间隔时间(min)四项影响因子构成变量输入。
选取使用主成分分析法得出的4个影响因子[汇流面积(m2)、绿地率、降雨历时(min)和降雨间隔时间(min)]作为输入单元,也就是说输入层包含的神经单元节点个数为4;径流污染物总量(以SS计)作为输出单元,即输出神经单元包含的节点个数为1,选用的期待输出值为SS的EMC值;隐层神经单元节点通过试算法确定,初始节点数依据“2N+1”(其中N表示输入节点书)经验设值为“2*4+1=9”,也就是说隐层初始节点数设置为9[15]。
表6 主要因子负荷矩阵Tab.6 Main factor load matrix
权值学习函数使用L-M优化算法,即trainlm;采用非线性的连续可导的激发函数,选用连续可微且具有一定阈值特质的Sigmoid函数,即双极性S函数(双曲正切函数)tansig;节点的传输函数为purelin。具体模型参数[15]见表7。
从而建立如下3层的BP神经网络,其拓扑结构见图2。
图2 BP网络结构拓扑图Fig.2 BP network structure topology
将1~18号的数据组作为样本输入所建立的BP网络进行训练。训练过程中,使用MATLAB中Premnmx函数对上述原始数据进行归一化,使得数据集合在[-1,1]之间,BP网络训练样本结果见表8。
BP网络训练完成的模型收敛速度良好、均方根误差逐渐减小,其误差通过泛化性能测试。将评估数据带入训练完成的BP网络,由计算结果可以看出,误差基本不超过2%,计算结果优良。
在评估面源污染负荷时,通常需计算径流排放引起的污染物总量,常采用年污染负荷,然而污染物径流加权平均浓度需要多场降雨和时段的浓度资料才可获得,这通常是比较困难的。
表7 模型参数选取Tab.7 Model parameter selection
表8 BP网络训练样本数据及结果Tab.8 BP network training sample data
表9 BP网络计算结果Tab.9 BP network calculation results
此时,可将上述采用BP模型计算的结果替代污染物径流量加权平均浓度,结合美国学者Schueler法[16](1987年)提出一种简便计算模型,用于估算污染物负荷:
(3)
式中:Li为计算时段(t)内径流排放污染负荷,kg;CF为用于对不产生地表径流的降雨进行校正的因子(产生径流的降雨事件占总降雨事件的比例);φ为径流区平均径流系数,m3径流量/m3降雨量;A为集水区面积,hm2;C为污染物的径流量加权平均浓度,mg/L;0.01为单位换算因子。
为了验证上述模型应用结果的可靠性,可与项目建议书进行对比分析。参考《光明新区新城公园低影响开发雨水综合利用示范工程(独立立项示范项目)项目建议书——摘要》效益分析中,年污染物削减74 t,公园雨水回用量6.9 万m3/a,下水涵养量增加3.3 万m3/a;年均雨水径流污染物总量(SS计)削减率60%以上,年均雨水径流总量控制率高达85%;可以推算出年径流污染物总量(以SS计)为:
(4)
比较二者结果可知,其相对误差为2.7%,其精确度很高。表明使用BP人工神经网络的方法计算径流污染物总量(径流污染物负荷)是可行的,从而完成了模型结果的验证。
(1)本文首次将BP神经网络模型引入雨水径流污染负荷评估,所构建的模型切实可行,尤其是在水质数据匮乏的地区,该模型可以简单高效地开展污染物负荷评估工作。
(2)使用主成分分析法确定的4个影响因子(汇流面积、绿地率、降雨历时和降雨间隔时间)科学合理,其作为输入量降低了模型的维度,简化了计算工作量。
(3)通过BP神经网络模型评估相应年份的雨水径流污染负荷,误差基本不超过2%。结合Schueler法构建年污染负荷模型并对计算结果进行验证表明其相对误差为2.7%,能满足对径流污染负荷的评估精度。
□
[1] 周飞祥.城市降雨径流污染及其控制的研究进展[J].建设科技(建设部),2014,(12):68-71.
[2] 任心欣,俞绍武,王国栋,等. 低冲击开发新理念在深圳的应用——《深圳市雨洪利用系统布局规划》浅谈[C]∥ 中国城市规划学会、重庆市人民政府.规划创新:2010中国城市规划年会论文集.中国城市规划学会、重庆市人民政府,2010.
[3] 张 伟,周永潮.城市雨水径流污染负荷计算及评价模型[J].湖南城市学院学报(自然科学版),2005,14(1):27-29.
[4] 汉京超,王红武,马鲁铭,等. 城市雨水径流污染总量核算[J]. 复旦学报(自然科学版),2013,(6):811-816.
[5] 汪迎春,刘贵平. 城市雨水径流年污染总量核算[J]. 土木建筑与环境工程,2012,(4):118-124.
[6] 车 伍,刘 燕,欧 岚,等.城市雨水径流面污染负荷的计算模型[J].中国给水排水,2004,20(7):56-58.
[7] 李海燕,车 伍,黄 宇. 北京长河湾流域径流非点源污染总量估算[J]. 给水排水,2008,(3):56-59.
[8] 黄卫东,吴春笃,汝 梅. 城市雨水径流污染模型参数优化方法研究[J]. 中国科学技术大学学报,2007,(8):1 031-1 035.
[9] 许仕荣,周永潮,张 伟. 基于Monte Carlo法的城市雨水径流污染负荷模拟[J]. 环境科学与技术,2005,(5):57-59,118-119.
[10] 姜文超,管继玲,吕念南,等.雨水径流污染与城镇排水系统规划[J].南水北调与水利科技,2010,8(3):39-41,54.
[11] 付东王,王 超,张 倩,等. 基于BP神经网络模型预测区域需水量[J]. 城市道桥与防洪,2011,(4):93-97,9.
[12] 温家鸣,郭纯青,李新建,等. 基于BP神经网络的桂林生态城市建设需水量预测[J]. 水资源保护,2012,(3):47-50.
[13] 金建华,史义雄,史永刚. 基于BP神经网络构建城市时需水量预测模型[J]. 城市管理与科技,2005,(1):29-31.
[14] Hsu K, Gupta H V, Sorooshian S. Artificial neural network modeling of the rainfall-runoff process[J]. Water Resources Research, 1995,31(10):2 517-2 530.
[15] 朱大奇, 史 慧. 人工神经网络原理及应用[M]. 北京: 科学出版社, 2006.
[16] Schueler T R. Controlling urban runoff: A practical manual for planning and designing urban BMPs[M]. Water Resources Publications, 1987.
[17] Schiffmann W H, Geffers H W. Adaptive control of dynamic systems by back propagation networks[J]. Neural Networks, 1993,6(4):517-524.
[18] Jolliffe I. Principal component analysis[M]. John Wiley & Sons, Ltd, 2002.
[19] 周飞祥.城市降雨径流污染及其控制的研究进展[J].建设科技(建设部),2014,(12):68-71.
[20] 任心欣,俞绍武,王国栋,等. 低冲击开发新理念在深圳的应用——《深圳市雨洪利用系统布局规划》浅谈[C]∥ 中国城市规划学会、重庆市人民政府.规划创新:2010中国城市规划年会论文集.中国城市规划学会、重庆市人民政府,2010.
[21] 张伟,周永潮.城市雨水径流污染负荷计算及评价模型[J].湖南城市学院学报(自然科学版),2005,14(1):27-29.
[22] 汉京超,王红武,马鲁铭,等. 城市雨水径流污染总量核算[J]. 复旦学报(自然科学版),2013,(6):811-816.
[23] 汪迎春,刘贵平. 城市雨水径流年污染总量核算[J]. 土木建筑与环境工程,2012,(4):118-124.
[24] 车 伍,刘 燕,欧 岚,等.城市雨水径流面污染负荷的计算模型[J].中国给水排水,2004,20(7):56-58.
[25] 李海燕,车 伍,黄 宇. 北京长河湾流域径流非点源污染总量估算[J]. 给水排水,2008,(3):56-59.
[26] 黄卫东,吴春笃,汝 梅. 城市雨水径流污染模型参数优化方法研究[J]. 中国科学技术大学学报,2007,(8):1 031-1 035.
[27] 许仕荣,周永潮,张 伟. 基于Monte Carlo法的城市雨水径流污染负荷模拟[J]. 环境科学与技术,2005,(5):57-59,118-119.
[28] 姜文超,管继玲,吕念南,等.雨水径流污染与城镇排水系统规划[J].南水北调与水利科技,2010,8(3):39-41,54.
[29] 付东王,王 超,张 倩,等. 基于BP神经网络模型预测区域需水量[J]. 城市道桥与防洪,2011,(4):93-97,9.
[30] 温家鸣,郭纯青,李新建,等. 基于BP神经网络的桂林生态城市建设需水量预测[J]. 水资源保护,2012,(3):47-50.
[31] 金建华,史义雄,史永刚. 基于BP神经网络构建城市时需水量预测模型[J]. 城市管理与科技,2005,(1):29-31.
[32] Hsu K, Gupta H V, Sorooshian S. Artificial neural network modeling of the rainfall-runoff process[J]. Water Resources Research, 1995,31(10):2 517-2 530.
[33] 朱大奇, 史 慧. 人工神经网络原理及应用[M]. 北京: 科学出版社, 2006.
[34] Schueler T R. Controlling urban runoff: A practical manual for planning and designing urban BMPs[M]. Water Resources Publications, 1987.
[35] Schiffmann W H, Geffers H W. Adaptive control of dynamic systems by back propagation networks[J]. Neural Networks, 1993,6(4):517-524.
[36] Jolliffe I. Principal component analysis[M]. John Wiley & Sons, Ltd, 2002.