城市需水量预测方法与模型综述

2019-02-07 05:32董云程周明杜坤卢慢黄乐烽杨佳莉
软件导刊 2019年12期
关键词:时间序列

董云程 周明 杜坤 卢慢 黄乐烽 杨佳莉

摘要:通过需水量预测能实现城市供水系统最优控制,以达成供需平衡和节约能耗目的。分析2010-2019年部分有关城市需水量预测相关文献,对现有城市需水量预测方法与模型进行综述,提出目前需水量预测存在的问题及建议,为城市需水量预测后续研究提供基础与借鉴。

关键词:需水量预测;时间序列;供水系统决策

DOI:10.11907/rjdk.192178

文献标识码:A 中图分类号:TP306

文章编号:1672-7800(2019)012-0001-05

0引言

城市需水量预测能为供水单位运行和决策提供科学依据,城市供水单位需掌握今天和明天的需水量数据,从而恰到好处地运行供水系统以满足客户用水需求。吕谋等研究表明,对供水系统调度运行费用采用时用水量预测结果进行优化,以电费为评价指标,将此方法与常规经验调度方式相比较,能够节约3%~5%的能源开支。近年来,大力推进的城市化进程和高速发展的社会经济,均导致了城市用水量大幅度增加,因此供水单位的当务之急便是扩大城市供水系统规模以满足客户用水需求。根据2018年《中国统计年鉴》(见表1),全国供水总量呈上升趋势。

现有预测方法与模型能为需水量预测提供较大帮助,但其应用在供水单位的需水量预估也存在诸多问题,例如:现有数据的准确性、影响需水量预测的众多变量、所涉及的预测范围以及预测周期的多样性均会影响需水量预测结果可靠性。李颖等对多种预测方法和模型进行了评价和优选,其所提及的模型与方法均有不同的预测性能,尽管能够找到合适的预测方法进行需水量预测,但在全面预测上需作进一步研究;聂红梅等将主成分回归法、逐步回归法、灰色模型以及BP神经网络4个模型在城市需水量方面进行比较,上述模型的局限性可能导致信息缺乏完整性、预测结果不准确。城市供水单位还需要预测未来20-30年的需水量,为开发新的水源或扩大其供水系统规模决策提供可靠数据支持。城市需水量预测方法和模型需要不断完善,寻求高精度的城市需水量预测方法和模型是大势所趋。

本文对2010-2019年需水量预测相关文獻进行综述,可为城市需水量预测研究提供借鉴,为供水系统决策和管理提供相应方法和模型参考。对于研究人员而言,目前他们寻求扩展该领域内最先进的预测技术。为此,本文介绍需水量预测框架,根据供水单位规划水平、预测范围和预测周期对产生需求的用水决策问题进行描述,从而为需水量预测奠定基础;对部分预测方法和模型进行综述、归纳和整理,总结其优势与不足;最后提出目前城市需水量预测中存在的问题,并给出解决此类问题的建议。

1需水量预测框架

1.1需水量预测依据

需水量预测作为其供水单位决策规划的基础,能够为决策规划所涉及的供水系统运行、管理和优化提供先决条件。在规划和运行供水系统时,供水单位的目的是满足客户用水量需求,这意味着在合理压力下,不断向用户提供足够数量的优质水,从而确保供水系统具有良好的可靠性与稳定性。城市需水量预测可分为长期预测、中期预测、短期预测3种时间尺度上的预测。长期预测主要用于规划和设计层面,而中、短期预测在操作和管理方面有用,并有助于自来水公司管理人员在平衡供水需求时,能够更明智地作出有关供水管理方面的决策。刘裕辉等研究表明,城市需水量科学、准确的预测结果能够为城市供需水量平衡决策提供合理依据。以天津市滨海新区2020年需水量预测为例,预测结果均属于合理范围内,并为此区域供水系统发展规划提供了主要依据。本文总结了供水单位规划层次、决策问题与预测属性之间的关系,如表2所示。

1.2需水量预测变量与决定因素

在城市用水中,许多预测变量被认为是影响城市需水量的因素,这些变量从社会经济到天气相关变量的各种衍生变量不等。周晨等将东北地区的水库蓄水总量、人均可支配收入、绿地面积以及工业用水量等作为5个因素并对东北地区需水量进行分析;Shine等分析了奶业生产、库存数量、基础设施设备、管理程序和环境条件等6个因素对奶牛场用电量和用水量的影响。众多需水量决定因素(外生变量)是增加需水量预测复杂性的主要特征。

1.3预测误差度量

将预测结果与观测结果进行比较最终得出预测精度,然而预测误差可作为一种衡量预测精度高低的方式,因此为了保证预测结果具有较高的预测精度,预测误差选择尤为重要。例如:平均绝对误差(Mean Absolute Deviationma,MAD)将所有预测误差取绝对值后计算的平均误差;均方误差(Mean Square Error,MSE)利用平方将误差的正负号消除后所计算出的平均误差;平均百分比误差(Mean Percent-age Error,MPE)和平均绝对百分比误差(Mean Absolute Per-centage Error,MAPE)二者能作为反映误差大小的相对值,一定程度上消除时间序列数据水平和计量单位影响。其预测误差的选择取决于预测者的最终预测目标与对所采用预测方法的熟悉程度。

2需水量预测方法与模型综述

现有需水量预测方法有传统预测(回归分析、时间序列分析、指数平滑等方法)和新型预测(人工神经网络、混沌理论、机器学习、复合模型等方法),传统和新型预测方法皆为需水量预测领域提供了较大帮助。本文对2010-2019年期间出版的需水量预测文献中所提及的传统和新型需水量预测方法及模型进行分析、归纳、整理和综述,并分析城市需水量预测方法和模型发展及研究趋势,为未来寻求新的研究突破提供借鉴。

2.1传统预测方法

需水量预测是一个非常活跃的研究领域,早期主要使用传统预测方法进行需水量预测工作。传统预测方法的先驱是统计学理论,主要包括回归分析法、指数平滑法、趋势外推法、移动平均法等。对于城市供水系统而言,其具有较强的周期性和随机性,因此,使用传统预测方法进行城市需水量预测时,为了取得理想效果,应根据序列性质进行合理假设。本文对应用较为广泛、预测效果良好的回归分析法和整合移动平均自回归模型进行综述。

2.1.1回归分析法

将回归分析应用于城市需水量预测,通过寻找需水量与影响需水量因素之间的因果关系,从而建立回归模型进行预测。根据这些关系,可以采用线性回归、逻辑回归和多项式回归等多种方法,其中一元回归分析只涉及单个变量,多元分析则涉及多个变量。回归分析可根据回归方程的表达形式分为线性回归和非线性回归,非线性回归可以通过变量变换,将非线性回归变为线性回归,而利用线性回归方法时,其回归系数值需要运用最小二乘法原理求出,从而得到预测模型。

Yasar等对土耳其亚达纳城建立了供水量与其它众多因素(平均水费、总人口数、大气温度、气压、降雨量等)的多元非线性回归模型,并通过多步预测,最终得出最符合该城的需水量预测模型。

金东梅等基于多元线性回归模型对长春市2020年需水量进行预测,同时采用2013-2016年需水量数据检验模型适用性。结果表明,该模型拟合情况良好,能为长春市2020年水资源发展规划提供数据支撑。

李孝朋等在矿井涌水量预测中采用了多元回归分析法,结果表明,预测的相对误差在允许误差范围内,并且此方法使用简便,有利于相关煤矿工作人员根据当地实际情况对矿井的防治水进行分析。

Polebitski等利用3种回归模型基于12个月的需水量预测,解释了美国普吉特海峡地区、西雅图和华盛顿等区域内住宅需水量与其供水基础设施扩建、水资源管理等决定性因素之间的关系。

本方法计算方便简洁,若在供水系统没有发生重大变化且数据波动较小的年用水量预测上采用本方法则会取得良好效果。因而,在使用回归分析法时,对自变量的选择以及历史数据的准确性皆有较高要求,若在影响因素复杂且数据波动较大的城市需水量预测上采用此方法则达不到良好预测效果,例如城市时需水量预测。影响需水量因素的选取、原始数据的准确性以及选用模型的适用性都对该方法起着决定性作用,在选用此方法时应当着重注意上述3方面問题。

2.1.2整合移动平均自回归模型

整合移动平均自回归(ARIMA,即Autoregressive Inte-grated Moving Average)是自回归和滑动平均模型的综合。此模型由Box & Jenkins于70年代初提出,ARIMA模型起源于自回归模型(AutoRegressive,AR、移动平均模型(Mov-ing average,MA)以及自回归滑动平均模型(Auto Regres-sion Moving Average)。模型通常表示为ARIMA(p,d,q)和包括自回归(AR)、整合(I)及移动平均(MA)分别记为自回归项p,移动平均项q,和差分次数d。其中心思想是运用数学模型近似描述一个随机数列(此序列为时间序列),ARIMA模型的应用步骤主要包括模型识别、参数估计、诊断检查和预测。

张吉英等基于ARIMA模型对沈阳市月降水量进行分析,根据沈阳市2005-2016年降雨量特征,建立了ARI-MA(1,1,1)预测模型,通过对模型的诊断和验证,对2017年1-12月份沈阳市降雨量进行预测。尽管沈阳市月降水量年内及年际变化较大,但结果表明,该模型可以准确地对沈阳市降雨量进行预测分析。

Paulo等采用双季节性ARIMA模型对某地区进行为期一天的需水量预测。仅利用历史需水量数据作为解释变量,并将和声搜索法应用于ARIMA模型的参数估计(和声搜索优化算法是基于音乐理论过程搜索完美和声的方法)。结果表明,通过实测的居民水表读数与ARI-MA模型生成的时间序列进行比较,吻合程度较好,因此验证了该方法的有效性,为未来一天的需水量预测提供了高精度模型。

赵凌等通过建立ARIMA的乘积季节模型,用于对成都市2010年全年月需水量进行预测,用2006-2010年2月供水量数据作为基础数据,并对最后的残差进行分析。结果表明,该模型具有良好的拟合效果,能够提取有效信息以及更好地预测需水量。

若在时间序列为线性非平稳时间序列,且时间序列内没有数据丢失的情况下,使用ARIMA模型拟合时间序列进行预测,能取得较好的结果。ARIMA模型原理简单,具有预测结果精度相对较高并兼具收敛快和鲁棒性强等优点,但是ARIMA是基于线性数据的模型,如果在非线性数据上进行序列分析,则会导致模型在非线性序列上的预测精度降低,得不到理想的预测效果。因此,该模型较宜使用在时需水量、日需水量、月需水量和季度需水量预测方面,一般不用于年需水量预测(大部分年需水量数据具有较强的非线性特点)。

2.2新型预测方法

传统预测方法的不足之处是易受众多因素影响,对历史数据的准确性要求较高,大多数模型是基于全局角度而建立的,结构相对简单容易导致最终预测精度偏低。为了提高预测精度,一些新的方法应运而生,目的在于寻找可靠的预测方法。新型预测方法包括机器学习、人工智能、混沌理论、专家系统等。据目前研究状况,用于我国城市需水量预测最多的新型预测方法是灰色预测模型、人工神经网络、机器学习以及其它组合模型等方法,本文着重对最常用的人工神经网络以及组合模型进行综述。

2.2.1人工神经网络

人工神经网络(Artificial Neural Networks,ANN)是基于模拟人类神经系统结构进行学习和处理问题的非线性系统。该模型由若干个神经元节点以及连接它们的权值构成,能够实现输入变量到输出变量的非线性映射。神经元按层排列,每层之间的神经元通过称为权重的链接连接在一起,通过对这些连接的调整,从而达到信息处理的目的。据近年来研究发现,运用于需水量预测的人工神经网络模型屡见不鲜,其中最常见的有误差反向传播前向神经网络(BP神经网络),以及径向基(RBF神经网络)、广义回归神经网络(GRNN)等。

Zhou等运用ANN模型模拟每周需水量的峰值需求,这些需求水平可以根据气候变量(如气温、体积和降雨)和以前的需水量制定。研究表明,该模型具有良好的拟合效果和较理想的预测精度。

Bennett等采用3种传统神经网络:两种前馈、反向传播网络和径向基函数网络,建立住宅用水用途需求预测模型。最后得出,人工神经网络建模方法是建立住宅用水量最终利用预测模型的一种可行方法。

舒媛媛等将延安市1990-2010年需水量数据作为基础数据,在基于主成分分析的BP神经网络上对延安市2015年需水量进行预测。结果表明,预测值与实际值吻合度较高,该模型能够适应需水量预测较强的非线性特点。

郭冠呈等预测常州市某供水管网DMAl5min的需水量时采用双向长短时记忆循环神经网络模型。结果显示,该模型在传统预测的基础上提高了预测精度并改善了稳定性,若在需水量波动较大的区域进行需水量预测,可以优先考虑此模型。

人工神经网络具有较强的记忆能力、非线性映射能力以及很强的学习能力等优势,但也存在一定缺陷,例如训练时间长、局部极小、网络结构难以确定等。据目前研究,由于大部分需水量时间序列具有时序性和非线性等特点,因此使用人工神经网络进行需水量预测能够得到较高的预测精度。

2.2.2组合模型

根据近年来研究发现,用于需水量预测的单一预测模型存在局限性,每个单一预测模型皆有优势与不足,与每个单一预测模型相适应的需水量预测要求也不尽相同,为了在需水量预测上达到更好效果,有关研究人员提出了组合模型。组合预测模型的基本思想是利用每个模型的特性在数据中捕获不同的信息,再将不同的信息组合起来建立一种新的预测模型。理论研究和实践都表明,将不同方法结合为一种方法能够有效改善预测精度。

蒋白懿等运用一种灰色遗传神经网络的组合模型预测A市s区2014年年需水量。结果表明,组合模型相比单一模型精度提高了0.84个百分点,误差也有所降低,该组合模型是一种有效的年需水量預测方式。

Brentan等运用混合回归模型对城市时需水量进行预测,该模型建立在离线支持向量回归模型的基础上,构成预测基础和在线自适应傅立叶级数预测偏差。研究表明,该模型的联机功能有助于供水系统运作和管理,以节省能源和成本。

展金岩等运用组合模型进行某区域需水量预测,在此过程中,将组合模型对各预测模型进行整合优化。最终得出,组合模型在需水量预测方面有着较好的预测精度和拟合度,较单一模型更全面科学,在区域需水量和水情灾害评估上得到了广泛运用。

据目前研究看,组合模型在一定程度上均表现出较单一模型更好的预测能力,尤其在解决复杂需水量预测问题上,组合模型有举足轻重的作用。单一预测模型很难充分利用时间序列上所呈现出来的信息,组合模型能够很好地解决此问题,但在运用组合模型进行需水量预测时,也要考虑到时间序列特性、模型相适应程度、模型操作性能等因素,这样才能更好地发挥组合模型的积极作用。

2.2.3预测方法与总结

综上所述,对各类城市需水量预测方法和模型进行分类总结,结果如表3所示。

3需水量预测存在的问题及建议

据目前研究看,大量成熟的城市需水量预测模型得以运用,但部分需水量模型存在一定的局限性。神经网络等用于长期预测难以取得良好的预测效果,但在短期预测上效果理想。因此,如果供水单位要作出反映需水量短期预测的决策,则需要更多地关注神经网络等方法。近年来,新形势下的预测方法和模型对现有大部分成熟的需水量预测方法和模型作出了进一步优化,例如:深度学习方法逐渐应用于需水量预测。牟天蔚等提出一种基于深度学习框架的小波深度信念网络(SW-DBN)时间序列模型对城市日需水量进行预测,该模型比BP神经网络更适应大样本预测,在一定程度上提高了城市日用水量预测精度;张薇薇等基于长短时神经网络对某地区需水量进行预测,对小时级别的预测具有很好预测精度,对众多需水量影响因素能够有效处理。基于深度学习以及长短时神经网络等方法皆是当前研究热点,未来需水量预测领域将会对更多的预测方法和模型进行研究,以满足需水量预测的高精度要求。

4结语

可靠的城市需水量预测能够使得供水系统在满足市民用水需求的同时,最大程度地降低运行能耗,节约运行成本。在实际城市需水量预测中要考虑到预测方法和模型适应性、历史数据特征以及相关影响因素。本文基于2010-2019年需水量预测相关文献,对现有部分常用需水量方法与模型进行了综述,可为未来提出更加完善的需水量预测方法和模型提供借鉴。

猜你喜欢
时间序列
基于分布式架构的时间序列局部相似检测算法
基于嵌入式向量和循环神经网络的用户行为预测方法
基于时间序列分析南京市二手房的定价模型