刘 凡,李逸云,李泽文,毛莺池
(1.河海大学计算机与信息学院,江苏 南京 211100;2.南通河海大学海洋与近海工程研究院,江苏 南通 226300)
水是国家工业和农业发展的命脉,也是城市形成和发展的重要因素。近些年,由于城市化和工业化推进,我国水资源短缺的问题愈加严峻,引进新技术,充分挖掘各领域节水潜力,改善各领域节水措施,是以有限水资源实现可持续发展的根本出路。节水潜力分析是指基于研究区域用水现状,通过采取各种节水措施来挖掘该区域的最大节水量。若要实现精确分析,必须先选取最佳的预测方法对该地区进行节水潜力预测[1],了解该地区未来的用水规模和趋势,从而指导该地区供水设施的建设和供水系统的优化调整,有效应对潜在的用水危机。
目前国内外针对节水潜力预测的研究方法很多,包括传统的基于公式模型的节水潜力预测,也有引入新型技术的基于机器学习的节水潜力预测,但每种方法均有其特定的应用领域和优缺点。笔者通过梳理对比各个模型,帮助从业人员针对问题更快速地进行模型优选,从而获得优良的预测结果,实现节水潜力最大化。同时,笔者还总结分析了节水潜力的发展趋势,展望了未来深度学习、大数据等新技术在节水潜力预测研究领域的应用前景。
节水潜力预测主要针对工业用水、农业用水、城镇生活用水3个领域,除了单一领域的节水潜力预测,还有一些方法同时在多个领域得到实践。根据《全国水资源规划大纲》对节水潜力的释义,目前主要是通过综合分析各行业的用水水平现状、用水实物指标和节水指标实现对节水潜力的估算预测。根据对预测准确性要求的不同,传统的节水潜力预测分为定量计算和定性分析两种方式。定性分析是基于长期实践经验定性总结出预测结果,没有明确的测试或实践数据作为支撑,不具备很强的说服力。而定量计算则主要基于某种公式模型,实现对某行业或某地区节水现状的拟合,从而估算预测节水潜力。此外,水利部也分别提出了两种适用于多领域的节水潜力预测公式:水资源管理司公式和全国水资源综合规划公式[2]。随着当代计算机技术的发展,早期机器学习算法被应用到预测领域,使预测模型可以随着实验数据的增加获得越来越准确的预测结果。
工业节水潜力是综合现有水平年工业万元产值和规划水平年预计工业万元产值分别对应的用水总量计算出的节水量。根据节水目的、节水措施的不同,分为计划节水、工程节水、措施节水和资源节水。西方国家近年来将工业节水潜力预测和未来政策或创新趋势结合起来,如考虑到针对能源投入替代品、零部件回收等进行研究的生态创新,Levidow等[3]将生态创新带来的经济优势和减少的生态资源负担相结合,分析大型制造公司生态创新的驱动因素,以及创新带来的节水和减轻水污染的效益和前景。在技术管理层面,Mortier等[4]通过对工艺用水、环保用水和冷却水等多环节的分析,为钢铁制造领域工业用水的可持续利用管理模式提供理论依据。Demin[5]基于对苏联20世纪70年代至世纪末的用水数据的分析,提出工业水资源可持续发展的相关理论。Komatsu等[6]对水资源管理升级对水资源循环利用的影响进行了研究。Cornwell等[7]对工厂废水再次利用的环节进行了可行性分析。
我国《城市与工业节约用水手册》中介绍的对照比较分析法、节水途径分析法、单位产品分析法[8]通过不同角度实现节水潜力预测,但都限于现有工业,而节水潜力预测是面向未来的,同时包含现有工业(存量节水)和未来新兴工业(增量节水),综合分析存量节水和增量节水才能实现更准确的预测。对存量节水和增量节水同时考量,郑在洲等[9]运用定额需求计算法、用给排分别计算法,以黄淮海流域为研究实例,建立节水潜力预测模型。此外,曹型荣[10]、孟祥和等[11]分别以北京市和天津市为研究范例,做出了工业节水驱动机制经济效应可行性的相关论证分析。戴铁军等[12]结合我国主要工业生产和用水特点,提出“自顶向下”以加大政策执行力和转变工业节水编制。
农业节水潜力主要以提高灌溉用水标准为目的,综合节水成本投入和节水措施落实预计减少的用水量和耗水量[13],主要体现为当前用水量与未来采取相关节水措施后的预计用水量之间的差值[14]。国外还有很多机构将某一客观因素和农业用水、节水情况结合进行研究。德国波茨坦气候影响研究所Elliott等[15]为研究气候变化情况下未来农业灌溉水供应的制约因素和潜力,比较了10个全球水文模型和6个全球网格作物模型的供需水预测情况。聚焦欧洲气候变化下农业用水管理适应战略,Iglesias等[16]将气候变化影响与欧洲地区适应战略的发展联系起来,分析两者对农业用水管理的潜在影响,制定应对措施,降低农业部门对气候变化的脆弱性。此外,还有一些学者研究了节水设施、材料对节水潜力的影响,如为了评估雨水箱的节水和保水效率,从而得出适当的时间尺度分辨率,Campisano等[17]使用模拟雨水箱长期水平衡的行为模型,评估雨水收集(RWH)水箱的节水和雨水保留效益。Adhikari等[18]对比分析不可降解的低密度聚乙烯(LDPE)覆盖膜、可生物降解的覆盖膜和可喷涂的可生物降解的聚合物覆盖膜对农业用水效益的影响。Abidin等[19]使用模糊专家系统确定最佳供水深度,使用纤维-毛细管灌溉系统建立实验装置,验证了水和能量控制模型作为纤维毛管灌溉系统灌溉调度指标的可行性。针对灌溉水的最终去向,Molden[20]提出可回收水量、不可回收水量真实节水量等概念。
国内的农业节水潜力研究没有统一方法,各地各部门根据当前用水主体和环境的不同,建立相应的模型进行研究,但有时会出现重用、改善相似模型的情况。如同时考虑规划年节水水平和粮食需求量的增加,张艳妮[21]提出了相对节水潜力的概念以及相对节水潜力预测方法。刘建刚等[22]以水资源相对短缺的徒骇马颊河流域为研究对象,采用水资源合理配置模型(WACM)作为分析手段,提出不同尺度农业节水潜力预测方法。张霞等[23]以宁蒙引黄灌区为研究对象,提出分项计算法和综合计算法相结合的田间节水潜力预测的计算和验证。高传昌等[24]依据此方法对河南省中牟县杨桥灌区进行了节水潜力计算分析,但该方法仅计算了管理方面节水潜力,却忽略了农艺节水或其他节水的影响。马立辉[25]在对河北省农业节水潜力预测研究过程中,解决了这一问题,将节水潜力划分为狭义和广义两种,综合计算得到更为全面的节水潜力预测结果。罗树江[26]在对黑龙江灌溉节水潜力研究的过程中,提出在农业措施一致的前提下,分析和预测农业节水潜力,应考虑重复利用水的问题。按照这一计算资源型节水量的思路,排除重新利用的回归水重复算入节水潜力的影响。崔远来等[27]实现了不同环节灌溉节水潜力分析,尹剑等[28]以关中地区典型作物为主体进行了节水潜力研究。
城镇生活节水潜力预测受到城镇人口、风土习俗、基础建设、经济规划以及自然条件等因素的多重影响,可以分行业进行分别预测再进行汇总,也可以进行简单总体预测。在国外,针对城市用水需求,Ahmad等[29]为南佛罗里达州开发了一个动态模拟模型,以捕捉城市用水需求和节水潜力之间的相互关系。Rysulova等[30]设计SMART应用实现确切节水测定,重点关注家庭住宅用水量和可能节水量。为在保证节水有效性的同时降低节水成本,Karause等[31]通过对社会、政策和经济等不同领域的探讨,研究在最低经济和福利成本前提下的节水措施和策略,希望通过灰水、雨水重复循环使用,提高冲洗水节水量。Liu等[32]采用家庭水循环模型,分析了灰水循环储存停留时间对人工湿地灰水回用系统节水潜力的影响。Osais等[33]针对典型的家庭供水网络,引入新组件后箱实现冷热水逆管路压力循环,有效节约管道废水。通过利用单片机和模糊逻辑算法,Mantoro等[34]实现对家庭用水中水位的实时监控,以达到节水目的。
国内城镇节水潜力预测模型多综合考虑各领域各环节用水,高鹏[35]根据综合、生产、生活、生态四大节水指标以及经济发展五大指标,建立城市节水水平评价体系,通过层次分析法确定各体系指标权重,通过模糊综合评价方法对城市节水潜力进行评价。高传昌等[36]提出同时考虑供水、用水、排水和节水等多指标的基于属性层次模型(AHM)的城市节水水平综合评价模型,可根据所研究城市的实际情况进行指标重要性权重调整,得到准确评价。为实现各地区水资源平均分配,Su等[37]根据水生态足迹的基本原理和计算模型,分析了2004—2015年北京、上海、天津和重庆的水生态足迹(WEF)和水生态承载力(WEC),建议针对不同城市水资源规划相适应的生产结构,改善区域水不平衡,促进全国水资源均衡可持续发展。
传统的节水潜力预测方法基本上都是基于经验形成的公式模型,这类方法经过长年的发展已经步入成熟阶段,累积了大量实践经验,各地区各领域各环节都已在多年的小范围实践后,形成了属于自己的基于某段已知水平年数据进行短期规划年节水潜力预测的方法模型。但这类方法往往具有局限性,难以应对复杂系统,难以应用于当前所服务对象之外的用水主体,且数据获取和分析仅依赖于经验和人力。近些年,随着人工智能领域的发展,机器学习技术开始在各个领域得到普及应用,并逐渐应用于节水潜力预测的研究中。Abdullah等[38]利用极端学习机(ELM)算法精确预测农业用水过程中的蒸散量,而蒸散量的精确估计正是精确节水的首要步骤。此外,还有一些方法通过精确预测用水量来实现节水的预测,例如An等[39]提出粗糙集方法精确预测短期用水需求,该方法根据观察到的数据生成预测规则,使用数据中固有的统计信息来处理不完整和模糊的训练样本,实验结果表明,该方法提供的信息比通过人类专家获取知识获得的信息更精确。同样,为实现精确短期用水需求预测,Adamowski等[40]提出并测试了一种基于离散小波变换和人工神经网络耦合的城市水需求预测应用方法,并与多元线性回归、多元非线性回归和自回归综合移动平均线模型进行对比。Cahill等[41]基于蒙特卡罗方法对家庭用水与节水模型进行研究,使用蒙特卡罗抽样产生的末端用水参数概率分布,模拟单户住宅的用水量,这种建模方法可以提高对水需求的了解,并估算节水计划的成本效益。Dixon等[42]通过使用降雨时间序列连同蒙特卡罗模拟技术生成的家用水设备使用情况估计,以预测家用水重复利用系统的节水潜力。
在国内,刘炜伟等[43-44]以BP神经网络的基本结构为基础提出了基于Elman神经网络的工业节水潜力预测方法;周振民等[45]提出基于灰色系统理论的农业节水潜力估算方法对人民胜利渠灌区的水资源供需平衡问题进行探讨;雷贵荣等[46]提出基于随机前沿函数(SFA)的节水潜力预测方法,从投入产出角度研究徐州市各区域农业节水潜力;陈建耀等[47]提出了基于线性拟合的节水潜力预测方法,以一段时间内的城市规模(城市非农业人口总数)、城市性质(第三产业人口占城市非农业人口的比例)、城市园林绿地覆盖率、人均居住面积、常年平均气温、常年平均降水为因子,线性拟合出反映本城市本阶段的生活用水水准的数据作为拟定额,基于此方案的节水潜力预测量就是实际生活用水量减去拟定额[35]。金笙等[48]通过时间序列模型预测北京市未来几年草坪面积变化趋势,进而计算不同草种的节水潜力。为实现多元预测,姚鑫[49]提出了基于MATLAB的水资源预测分析理论,将Logistic人口预测模型、灰色理论、神经网络模型以及回归分析与曲线拟合等因素分别分析、综合计算,对华北各省市的节水潜力进行预测。
不同的节水潜力预测方法,预测的精确性和可操作性不尽相同。表1对基于公式模型的节水潜力预测与基于机器学习的节水潜力预测从数据收集、普及范围、可操作性以及精确性等方面进行了对比。
基于公式模型的节水潜力预测方法泛指传统的经验公式方法,收集数据较少,操作起来简便快捷,使用的范围较广,但精确性不高。基于公式模型的预测方法中,最为广泛认可和使用的是水利部分别提出的两种适用于多领域的节水潜力预测公式:水资源管理司公式和全国水资源综合规划公式[2]。水利部水资源管理司提出的节水潜力计算公式中,工业节水潜力预测是在实现工业结构、节水技术、节水意识优化后的节水量;农业节水潜力预测主要针对灌溉节水;城镇生活节水预测主要考虑管网漏失率和节水器具普及率。全国水资源综合规划公式由水利部海河水利委员会提出,又称海委计算公式,工业节水预测充分考虑非自备水源工业取水量、供水管网综合漏失率以及工业用水重复利用率因素;农业节水预测主要考虑灌溉水有效利用系数;城镇生活节水预测仅考虑供水管网综合漏失率。水利部水资源管理司计算公式综合考虑工程、工艺和管理节水3个方面,而全国水资源综合规划公式的计算结果主要来自工程节水措施,因此水利部水资源管理司节水潜力计算模型较优于全国水资源综合规划公式。此外,大多数小范围使用的公式模型一般仅对工农业、生活节水其中一个方面进行探讨。该类方法节水潜力预测指标参数相对较少,只能粗略计算某地区的节水潜力,且不太适应变化环境中实时数据监测、分析和节水策略调整。基于机器学习的节水潜力预测方法收集的数据种类和数量均相对较多,利用人工智能设备实地勘测和大数据分析提炼出影响因素,构造预测模型,通过机器学习,对模型加以训练和测试,最终获得合适的模型参数。使用这种方法,需要收集大量数据,比较繁琐,但是构造出的预测模型使用范围广,精确度高。
表1 节水潜力预测方法对比
机器学习方法越来越多地被应用于节水潜力预测中,传统机器学习模型的构建过程中最重要的环节之一是特征设计,特征选取是否准确将直接关系到学习模型的好坏。但是传统的机器学习方法中重要的特征设计环节一般由人工完成。现实中,节水潜力预测是一个复杂的非线性问题,难以通过人工经验实现准确有效的特征选取,人工设计的特征往往受经验的不确定性影响,不具备普适性。并且,基于传统机器学习方法的节水潜力预测算法大多都是浅层结构,如支持向量机(SVM)可以认为是带有一个隐含层的结构,而线性回归和逻辑回归等根本不包含隐含层。当某一用水主体所处的环境十分复杂,需要考虑非常多因素时,这种浅层结构的机器学习算法学习到的规律有限,对复杂函数的表达能力有限,从而致使算法泛化能力不够强,预测效果不够理想。例如,在前文介绍的基于Elman神经网络的节水潜力预测[43-44],由于其网络结构仅为3层,在针对复杂非线性问题时预测能力会受到限制。为突破这一制约,有必要引入具有特征自学习属性的深度学习技术构造模型,将简单的神经网络替换为深度学习理论中的多层网络结构,通过多隐层的堆叠学习数据之间的深层次非线性关系,实现对实际预测中复杂因素的更好控制,分层传递、逐步抽象,最终清晰表达原始数据的本质,从而获得更精确的预测结果。利用深度学习模型进行节水潜力预测的主要过程如图1所示。
图1 基于深度学习的节水潜力预测流程
节水潜力预测的研究历经几十年,已经累积大量数据,但预测过程中数据的获取、整理和分析途径却大多限于小规模数据和人工分析,需要引入大数据技术实现海量数据高效分析,使预测模型具有更强的决策力、洞察力和流程优化能力,获得更加精准的预测结果。如彭致功等[13]利用遥感蒸发量(ET)数据开展节水潜力的研究,提出基于遥感(RS)数据和地理信息系统(GIS)方法估算区域作物节水潜力。在ET定额计算理论基础的研究过程中,发现遥感数据精度有待提高,不得不选用同期作物需水量对计算得到的作物ET定额加以修订;此外,研究范围内一种典型作物的像元数就已经达到上万数量级,如果直接使用全部像元数拟合水分生产函数,数据量过多、离散度高,因此需使用分类均值法将ET定额相近的像元进行组合、求均值后,再进行函数拟合。该种情况下,若引入遥感大数据技术对模型进行优化,如结合基于GPU集群的遥感大数据处理系统,虽然数据处理仍以像素集为主要单位,但却可以通过光学影像辐射校正、空中三角测量等技术实现遥感数据的预处理,如果与深度学习结合实现深层次数据挖掘和处理,就能够以多来源、多介质、多频段、多分辨率的海量遥感数据集为直接研究对象,短时间内实现更精确的预测分析。
实际上,在节水潜力预测的过程中,我们依据的数据往往不限于遥感数据,节水数据资源涉及水务管理的各个方面,内部结构复杂,包括节水综合库、数据仓库、元数据库等数据。此外,还包括大量来自互联网的数据。因此,节水大数据存在涉及范围广,时间跨度长,时序数据多维性、影响因素多等特征,导致数据冗杂,数据处理和信息挖掘困难,进而为基于大数据的节水潜力预测带来挑战。因此在对数据进行分析应用之前必须对数据进行清理,保证数据的准确性与有效性。另外,由于与节水相关的经济社会大数据应用面非常广,用户对数据的理解参差不齐,再加上数据类型多样,若数据未经规范化语义描述直接用于提供服务,将难以满足用户的需求。因此,基于大数据的节水潜力预测首先要解决数据的清洗问题,进而实现异构数据的不同粒度、不同层面的协同统一表示。数据清洗流程包括数据预处理、数据分析、数据清洗规则制定、清洗稽查,最终经过清洗分析不断完善知识库。其次,考虑到节水潜力预测面临的是多种类型、多种来源、不同时间和不同特征的节水大数据,因此还需要解决天、空、地全方位立体节水大数据的融合同化问题,并结合大数据挖掘技术,挖掘数据中的关联关系。
传统意义上,节水潜力预测所依托的数据包括由监控系统、各类传感器获得的水务基础信息数据、空间数据和共享数据,这类数据获取时延大、分辨率低、不确定性高。因此应考虑引入水利新闻、媒体报告、媒体社会监控数据等互联网多源数据,通过边界条件进行大数据初步分类,降低数据量级;通过自动文本聚合、摘要和排序进行数据清洗、关键词提取,以提高节水潜力预测系统的预测能力和应急能力。结合互联网+背景,应将互联网多源数据获取、大数据处理和基于深度学习的预测技术结合,形成数据获取、处理、预测的闭环。同时,面向公众关心的节水热点问题,研究节水水务社会化服务数据的收集、处理、预测、发布“一体化”模式。
通过互联网实现多源数据获取后,还需构建如图2所示的应用架构,实现底层数据监测和节水潜力预测模型的无缝集成,应用架构由下到上分为数据存储层、服务层、业务应用层和交互层。最底层:数据存储层,依据数据来源分为:水务基础信息数据库,主要存储水利相关部门的监测数据;空间数据库,存储地理、农作物等潜在影响节水潜力的信息;共享数据库,实现不同平台间的数据交换与共享功能;互联网数据库,是指水利新闻、媒体报告、媒体社会监控数据等互联网数据。本层实现数据的共享和专题数据的管理,与水务信息资源库对接。第二层:服务层,提供GIS组件、报表服务、数据交换等功能。第三层:业务应用层,首先通过大数据处理子系统进行大数据分类,降低数量级;通过自动文本聚合、摘要和排序进行数据清洗、关键词提取。然后将处理过的数据输入节水潜力预测子系统,利用相关的预测模型,例如基于深度学习的预测模型,进行预测性计算并输出结果。第四层:交互层,可对接电脑、平板和手机客户端,实现节水数据的实时发布,提供统一、友好的展示页面,同时具有通知公告、政策法规等辅助信息发布功能。
虽然目前节水潜力预测领域,深度学习、大数据等新技术的应用仍然处于起步阶段,但随着经济和科技发展,基于新型机器学习技术的节水潜力预测技术将不断完善发展,为节水潜力预测提供可靠的基础数据和技术保障。未来有望通过大数据和深度学习技术实时收集各环节用水参数,精确分析各环节主要影响参数,因地制宜建立符合各类用水主体的节水潜力计算模型,较准确地提前预知某些参数变更后的节水量、节水率,挖掘各类用水主体的节水环节的巨大潜力,实现精细化节水潜力预测。同时,加快完善基于互联网的节水潜力预测应用,实现节水水务社会化服务数据的收集、处理、预测、发布“一体化”模式,将使各部门数据实时共享、预测数据实时更新,人民群众可以通过各类客户端实时了解节水数据并进行评价、反馈,加强对节水政策和措施的认知,提高节水意识。