王 培,许仕荣,唐国强,胡 毅(.新疆油田公司供水公司,新疆 克拉玛依 834000;.湖南大学 土木工程学院,湖南 长沙 4008)
基于集对分析原理的城市需水量预测模型及其应用
王 培1,许仕荣2,唐国强1,胡 毅1
(1.新疆油田公司供水公司,新疆 克拉玛依 834000;2.湖南大学 土木工程学院,湖南 长沙 410082)
城市需水量预测对合理分配水资源起着重要作用,但城市需水量本身的影响因素众多,其预测是典型的不确定性问题。集对分析是处理不确定问题的新方法,它通过联系度展示了研究对象间关系的详细结构,对处理不确定性问题十分有效。采用集对分析相似预测法,结合集对分析同异反模式中的“择近原则”和相似分析法中相似的历史原因产生相似结果的原则,在预测过程中将需水量时间序列作为需水量的影响因子,利用一定时长的历史数据来建立基于集对分析原理的相似预测法模型。通过对克拉玛依市三坪地区需水量的预测发现,集对分析相似预测法不但计算简单,而且精度优于传统的ARIMA模型。
集对分析原理;相似预测法;不确定性问题;预测
新疆克拉玛依地处我国西北,属于干旱地区,水资源本身较为短缺,加上近年来城市化进程的加快,这一问题更为突出。因此,科学预测城市需水量,将对克拉玛依市的供水设施建设和原水调度的优化起着重要作用。城市需水量变化要受到诸多因素的影响,存在着诸多的不确定性因素。由于传统的ARIMA模型在预测城市需水量特别是对相关影响因子进行分析时,存在着引入的自变量是否适当可靠,各因子间是否因密切相关而导致难以分离各个变量等问题[1]。为了消除城市需水量预测中由不确定性带来的影响,不少学者尝试用新的方法来进行城市需水量的预测。马文敏等[2]等将灰色系统理论应用在了对银川市的城市需水量预测中;刘勇健等[3]提出基于遗传—神经网络的城市需水量预测方法。然而,这些方法原理都比较复杂,当需要对模型中的参数进行修改时,对非专业人士来说存在着一定的困难。在处理不确定性信息方法中,集对分析方法不但原理简单,而且相比传统方法更具有优越性[4]。
本文尝试利用基于集对分析原理的相似预测法对城市日需水量进行预测。首先根据新疆克拉玛依三坪地区的日需水量历史数据建立预测模型,利用该模型进行预测,通过预测值和实际值的对比来检验预测模型的可行性,同时与传统的ARIMA模型进行对比,以分析和检验其预测精度。
2.1 集对分析原理
在水文水资源系统中,“集对”概念可定义为在不确定性系统中有一定联系的两个集合组成的对子。在水文水资源系统中集对一般表示为H(A,B),表达A和B构成的一个对子[5]。在需水量预测中,我们可以将连续几天的需水量放在一起组成一个集合,根据日期的不同,可以有多个这样的集合,任意两个集合放在一起都可以看成一个集对。
集对分析法(SPA)是一种处理不确定性问题的系统分析方法,其中心思想是先对不确定性系统的两个有关联的集合构造成集对,再对集对的特性做同一性、差异性、对立性分析,然后建立集对的同异反联系度。SPA的基础是集对,关键是联系数[6],计算公式为:
(1)
式中,N为集S合特性的总项数;S为同一性的个数;P为对立性的个数;F为差异性的个数;i为差异度系数,在(-1,1)区间取值,有时仅起差异标记作用[5];j为对立度系数,一般j=-1,有时仅起对立标记作用[5]。
定义a=S/N为同一度、b=F/N为差异度、c=P/N为对立度(实际上是该属性的同、异和反三方面的模糊关系)[5],则式(1)可改写为:
μ(A-B)=a+bi+cj
(2)
式中,a+b+c=1,且a、b和c均为非负实数,分别表示就某种属性而言具有相同性质、差异性质和相反性质的程度。其中,a和cj是相对确定性的项,bi是相对不确定性的项,可统一描述随机性、模糊性、灰色性、未确知性、中介(反映客观事物相互过渡的各离散状态)等不确定性信息[5,6]。式(2)是最常用的三元联系数。将式(2)中的bi根据A或B的子集、不确定性的类型(如随机性、模糊性)等进一步拓展可得k元联系数:
μA-B=a+b1i1+b2i2+…+bk-2ik-2+cj
(3)
其中,a+b1+b2+…+bk-2+c=1。
集对分析法就是在一定的问题背景下,对所讨论的集对特性展开同异反分析,并进行度量、刻划,得到集对的同异反联系数表达式,利用联系数及其运算深入展开有关系统的演化、突变、识别、模拟、预测、评价、决策、控制等问题的研究[7]。
2.2 相似预测法
相似预测法是按照相似原因产生相似结果的原则,从历史样本集中找出与现在最相似的一个或几个样本作为预测结果的一种非参数预测方法[8]。用相似方法预测城市需水量需要解决一个关键问题,即如何定量描述需水量历史样本之间的相似性。样本之间在某些分量上常常反映出确定的相同或相反特性,而在另外的一些分量上又往往反映出不确定的差异特性。可见,上述相关性和相似性都是既含有确定性因素又含有不确定性因素的一类确定性与不确定性相耦合的复杂系统。
集对分析为相似预测法在预测城市需水量预测中的运用所遇到的两个关键问题提供了一种新的解决途径。基于集对分析原理的相似预测法,就是通过集对分析原理去寻找各个城市需水量集合的同异反关系,计算联系数,将联系数作为相似性的度量,用多个最相似的历史样本水资源加权平均值作为当前城市需水量的预测值,建立基于集对分析的水资源相似预测模型,从而对城市需水量进行预测[9]。
3.1 建模预处理
建模预处理主要包括数据整理、选择集合和构建集对三个步骤:①数据整理。整理出某地区一段时间内的日需水量数据。②选择集合。设有日需水量时间系列xi(i=1,2,…,n),xi依赖前m个相邻历史的数据xi-1,xi-2,…,xi-m+1,xi-m;集体集合Bi=(xi,xi+1,…,xi+m-1)(i=1,2,…,n-m),xm+i为后续值。这里将集合Bi的元素当作自变量,即有m个自变量和m个影响因子;xm+i作为因变量,即我们需要预测的数值。预测的后续值xn+1,可构建集合Bn+1=(xn-m+1,xn-m+2…xn-1,xn)。③构建集对。可将所要预测的需水量xn+1的主要影响因子集Bn+1与历史样本需水量的主要影响因子集Bi建立集对H(Bn+1,Bi)。
3.2 集合的分级量化
将影响因子集合Bi中的各个元素等级进行符号化处理,对落入一级标准范围内的记为符号“1”,落入二级标准范围内的记为符号“2”,对落入K级标准范围内的记作符号“K”,以此类推。
3.3 建立联系度表达式,计算联系数
构建当前预测值xn+1的影响因子集合Bn+1与历史样本xi的影响因子集合Bi的同异反联系度,对i、j取值后计算联系数[5]。
3.4 选取最相似历史样本预测
合理确定最相似的历史样本数目K值,将多个最相似的历史样本需水量的加权平均值作为当前需水量的预测值,也可对相似的历史样本取一定的权重再进行加权评价[9,10]。
我们收集了新疆克拉玛依市三坪地区2013年12月—2014年11月的一年需水量数据,用以预测2014年的12月的日需水量,并与实测值进行比较。
表1 各影响因子的均值和离差
表2 量化结果和联系数计算
表3 联系数最大时相关集合
为了整体评价模型的精度,分别采用本模型和传统的时间序列法ARIMA模型[11,12](q=0、d=1、q=2)预测一周的日需水量数据,并计算各预测结果的平均绝对误差(MAE)和平均相对误差(MAPE),结果见表4、表5。从表4、表5可以看出,集对分析相似预测法作为一种新的预测方法是可行的,且预测精度比传统的ARIMA模型高。
表4 集对分析相似分析法预测精度评价结果
表5 时间序列法ARIMA模型预测精度评价结果
本文利用新疆克拉玛依市三坪地区的日需水量历史数据进行建模并验证分析,证实了基于集对分析原理的相似预测法在城市需水量预测中的可行性。与传统的时间序列法ARIMA模型相比,基于集对分析原理的相似预测法不但原理简单,而且具有更高的精度。此外,集对分析相似预测法的关键点在于联系数的计算,而联系数的计算相对较简单。集对分析相似预测法中所涉及的参数m、i、j之类都不是固定的,而是可以根据实际情况取不同的值,因此集对分析相似预测法对不同的情况都有较好的适应性。但集对分析相似预测法中参数的确定存在一定的主观性,且参数的不同取值会对预测结果产生一定程度的影响。如何更加准确地确定这些参数,是集对分析相似分析法需要改进的地方,以便为城市需水量预测提供一个更有效的方法。
[1]席洋,程水源,郭秀锐,等.灰色预测模型在城市需水量预测中的应用[J].环保科技,2007,13(1)∶25-34.
[2]马文敏,唐莲.灰色系统理论在城市需水量预测中的应用[J].西北水资源与水工程,2001,12(1)∶14-16.
[3]刘勇健,沈军.基于遗传一神经网络的城市需水量预测方法研究[J].水资源与水工程学,2004,15(4)∶21-25.
[4]和蕊,原晨阳,杨思波,等.集对分析聚类方法预测法在城市生活需水量中的应用[J].水利科技与经济,2010,16(12)∶1324-1327.
[5]王文圣,李跃清,金菊良,等.水文水资源集对分析[M].北京:科学出版社,2010.
[6]王文圣,李跃清.水文水资源集对分析[J].南水北调与水利科技,2011,9(2)∶27-32.
[7]陈光怡,秦帅,葛松,等.基于SPA-TFN-SS耦合的隧道瓦斯突出分析模型[J].土木工程学报,2011,44(S2)∶240-243.
[8]严华生,谢应齐,曹杰.非线性统计预报方法及其应用[M].昆明:云南科技出版社,1998.
[9]金菊良,魏一鸣,王文圣.基于集对分析的水资源相似预测模型[J].水力发电学报,2009,28(1)∶72-77.
[10]汪明武,金菊良,周玉良.集对分析耦合方法与应用[M].北京:科学出版社,2014.
[11]吴今培,孙德山.现代数据分析[M].北京:机械工业出版社,2006.
[12]冯国生,吕振通,胡博.SPSS统计分析与应用[M].北京:机械工业出版社,2011.
ModelforForecastofUrbanWaterDemandedBasedonSetPairAnalysisandItsApplication
WANG Pei1,XU Shi-rong2,TANG Guo-qiang1,HU Yi1
(1.Water Supply Company of Xinjiang Oilfield Company,Karamay 834000,China;2.College of Civil Engineering,Hunan University,Changsha 410082,China)
The forecast of urban water demanded was very important when water resources needed to be distributed reasonably.There were many factors which could affect the results when we predicted the urban water demanded.It was a classical uncertainty problem,and at the same time,Set Pair Analysis was a new method to solve the uncertainty problems.It could express the detailed structure between studied variables with the connection degree So Set Pair Analysis was always effective when we tried to work out the uncertainty problems.Using the Similar Prediction Method based on Set Pair Analysis to forecast the urban water demanded,with the principle of “picking up the nearest one”in Set Pair Analysis and “similar reasons leading to similar results”in the Similar Prediction Method.This paper treated the time series as the factors and built the model based on the Similar Prediction Method and Set Pair Analysis with a number of data which was recorded for some time.At the same time,this paper used the data of water demanded in Sanping,Karamay of Xinjiang to test the model based on the Similar Prediction Method and Set Pair Analysis,which showed the method was simple and had a higher accuracy compared with the traditional ARIMA model.
Set Pair Analysis;similar prediction method;uncertainty problems;forecast
10.3969/j.issn.1005-8141.2017.04.005
TU991.31
A
1005-8141(2017)04-0408-03
2017-02-10;
2017-03-21
王培(1973-),男,新疆维吾尔自治区克拉玛依人,硕士研究生,工程师,主要从事科技管理、信息管理等工作。
许仕荣(1965-),男,湖南省永州人,教授,研究方向为给排水管网系统及其优化与饮用水安全保障技术。