梁楠楠,陈黎黎
宿州学院信息工程学院,安徽宿州,234000
基于属性理论的降雨预测研究
梁楠楠,陈黎黎
宿州学院信息工程学院,安徽宿州,234000
为了提高降雨预报精度,及时预警,提出了一种基于属性理论的降雨预测算法。该算法充分利用了属性理论方法的特点,根据属性理论中定性映射算法,通过对其降雨量时间序列进行相似性查找,查询到轨迹与样本区间最为相似的序列,最后再结合属性理论坐标模型算法进行判断。以安庆市气象台站的逐日降雨数据为例进行,结果表明,预测结果与实际情况基本相符,因此可运用此算法对降雨数据进行稳定预测。
时间序列;属性理论;降雨预测
近年来,干旱、洪涝、泥石流等自然灾害的频繁发生,不仅威胁着人们的生命安全,而且还给经济带来巨大损失。在这些自然灾害中,降雨是引发各类自然灾害的重要因素[1-2]。因此,如何提高降雨量的预测精度,保证精确预报、及时预警成为当前研究的重点和关键问题。同时,降雨量精确预测也有利于水资源的管理和调度。
自20世纪90年代以来,各种数据分析技术的发展使得气象统计预报取得突破性进展。特别是统计学方法[3],例如时间序列分析法、相关典型分析法、回归分析法、聚类分析等方法。在对降雨数据进行深入研究后,人们发现除台风等特殊天气变化的影响外,降雨量数据序列的波动极大地受到历史降雨数据因素的影响[4]。根据四季节气变化,在历史降雨量数据中进行相似性比较,发现降雨量的时间序列呈规律性变化,可以采用相似性查询方法,查询到降雨量时间序列模型的相似区间数据,从而进行预测。目前,时间序列预测法[5-6]的相似查询技术中,欧几里德距离法是使用范围最广的一种相似性度量方法,它较为简单、易用,但在时间轴上伸缩和水平移动的效果较差;动态时间弯曲虽然提高了相似查询的精度,解决了欧氏距离法的缺陷,但计算难度高,时间效率也较为低下。
针对这一问题,本文对时间序列进行相似性搜索,运用属性理论中的定性映射和转化程度函数方法作为相似性度量的依据。首先,根据预测序列模型从历史时间序列中找出N(N≥0)个相似的匹配模式,再对相似查找结果进行取舍,然后采用属性坐标分析法,据属性变权的加权和模型求出最满意解,即最优相似模型。
1.1 变权
设X=(x1,x2,…,xm)为一组决策指标值,加权和法如下式所示:
(1)
1.2 模型的构建
(2)
由训练得到的b({xh(z)})∈ST∩X,让T访问区间[T0,100m],得到局部最优解集合{b({xh(z)})|T∈[T0,100m]},记作L(b({xh(z)}))。由于决策者对事物的思维变化一般不会发生跳跃式变化,L(b({xh(z)}))曲线是一条连续光滑的曲线,权向量(w1(T),w2(T),…,wm(T))每个具体属性也是光滑的曲线。
在以上模型最优解的构建中,关于使用单纯形ST∩X物理重心的求解过程的方法被称为属性理论的坐标构造方法[9-10]。
2.1 算法概述
如果把降雨数据[11-12]描述为一组动态数列Xi(i=0,1,2,…,n),其中,Xi=F(t),t表示为时间,由X0,X1,…,Xi可推导出Xi+1。时间序列预测算法主要是运用统计学等方法,例如采用自回归滑动平均模型处理降雨量时间数据时,此数据不满足ARMA模型必须为平稳性序列。故本文采用转化程度函数法对某降雨量时间序列模式进行相似性搜索,找出与该降雨量序列最相似的历史模式序列,再利用属性坐标分析法中的变权加权和模型对相似序列作出相应的决策,找出最优解。
2.2 算法详解
要预测Tx+1天的降雨量,所提出的算法步骤如下:
(1)将降雨量时间序列分解为n个大小相同的区间,实验选取每个时间区间长度为20,区间长度可以根据当时具体状况进行改变。
明考夫斯基举例(Minkowsky distance):
(3)
当q=1时,为常用的绝对值距离(Absolute distance):
(4)
当q=2时,为欧氏距离(Euclidean distance):
(5)
马氏(MahalanbiS distance):
当(X,G)两个m维向量是正态分布的,且具有相同的协方差矩阵S时,其马氏距离为:
(6)
(3)假设Xi(i=0,1,2,…,n)与G相似度较高,可以采用多属性坐标分析和学习决策模型中的基于属性坐标的变权加权和模型决策方法。降雨影响因素产生的数值因子在一定程度上会影响降雨量曲线的变化,而这些数值因子也是气象专家预测降雨量的重要依据。
本文的预报对象是安徽省一些台站的逐日降雨量,将其中影响系数较大的物理量(气温、日照、风速、气压、湿度)资料全部用来构造预报因子[13-14],构建属性坐标的变权加权模型,以描述降雨量的变化。
首先,对选取城市(安徽省安庆市)各个物理量的属性值进行预处理,经过数据无量纲化处理后得到如下格式数据:
000220.0,1∶0.00000,2∶0.34191,…,5∶0.41667#
000208.0,1∶0.07053,2∶0.23897,…,5∶0.20833#
000228.0,1∶0.45340,2∶0.21140,…,5∶0.30556#
000208.0,1∶0.01763,2∶0.27206,…,5∶0.06944#
000219.0,1∶0.53652,2∶0.23346,…,5∶0.20833#
000244.0,1∶0.00168,2∶0.06066,…,5∶0.34722#
2.3 基于属性论的降雨预测算法
下面给出在降雨量历史时间序列中的基于定性映射方法的模糊匹配算法的主要框架(伪代码):
Match(Fs)
{a=0.9;//初始相似阀值
FloatD[20]={PT3-19,PT3-18,…,PT3-1,PT3};
FloatD′[20]={Pstart,Pstart+1,…Pstart+19};
Fori=1ton{//如果历史时间数据窗口与Fs的相似度>α,则这个范例被选为候选范例,放入链表中
//在计算Sim()时,采用高斯型转化程度函数与平均相度的计算方法
Start++
}
Float factor[]={temperaturelast,humiditylast,airpressurelast, airpressurelast}
将预测样本D代入拉格朗日插值公式得W=(w1(T),w2(T),…,w6(T))
For j=1 to list_length(){
IfJjismax
ThengettheDj
选取安庆市气象台站的逐日降雨量数据,利用MATLAB软件进行编程,把本文所提出的基于属性论的降雨预测算法与支持向量机方法进行比较,结果如图1、图2所示。
在图1和图2中,用细红线代表实际降雨走势情况,粗黑线代表降雨量的预测走势情况。由上述对比试验可以看出,在相同条件和相同预报因子的情况下,使用属性论方法比使用支持向量机方法的拟合性更好。由于支持向量机方法对预报因子要求较为严格,故实验选取维数较少的情况下进行预测,在同样情况下与支持向量机方法预测作比较,发现此时属性论方法受影响因子的影响力度要小于支持向量机方法,因此有更好的预测能力。
图1 支持向量机方法安庆气象台站降雨量预测
图2 属性论方法安庆气象台站降雨量预测
同时,图2实际走势曲线和预测走势曲线也验证了此算法的有效性,预测结果基本符合现状。
本文提出一种基于属性理论的气象预测算法,该算法采用属性理论中定性映射方法,通过对降雨量时间序列进行相似性查找,查询到轨迹与样本区间最为相似的序列,最后再结合属性理论坐标模型算法进行判断。由于降雨数据的时效性较强,所以对相关预报因子筛选有待进一步优化。
[1]王妍.中长期降雨预测方法研究[D].合肥:合肥工业大学土木与水利工程学院,2003:1-7
[2]陈德辉,薛纪善.数值天气预报业务模式现状与展望[J].气象学报,2004,62(5):623-633
[3]魏凤英.我国短期气候预测的物理基础及其预测思路[J].应用气象学报,2011,22(1):1-11
[4]窦浩阳,邓航,孙小明,等.基于均生函数:最优子集回归预测模型的青藏高原气温和降水短期预测[J].北京大学学报:自然科学版,2010,46(4):643-648
[5]杨瑞科,李磊,仲普,等.我国典型地区动态降雨衰减时间序列仿真研究[J].电波科学学报,2011,26(5):875-880
[6]李相虎,张奇,邵敏.基于TRMM数据的鄱阳湖流域降雨时空分布特征及其精度评价[J].地理科学进展,2012,31(9):1164-1170
[7]李德清,李洪兴.变权决策中变权效果分析与状态变权向量的确定[J].控制与决策,2004,19(11):1241-1245
[8]李春好,孙永河,贾艳辉,等.变权层次分析法[J].系统工程理论与实践,2010,30(4):723-731
[9]吴志雄,屠梅曾,冯嘉礼.基于属性坐标的变权加权和模型[J].上海交通大学学报,2006,40(9):1610-1612
[10]冯嘉礼,董占球.基于属性抽取和整合的感觉神经检测模型[J].计算机研究与发展,1997,34(7):481-486
[11]JR Fan,Y Chen,D Yan,et al.Characteristics of rainfall erosivity based on tropical rainfall measuring mission data in Tibet,China[J].Journal of Mountain Science,2013,10(10):1008-1017
[12]王洪,冯嘉礼.基于属性论方法的股市预测算法[J].复旦学报:自然科学版,2004,43(5):941-943
[13]R Lee,J Liu.JADE Weather MAN:A weather forecasting system using intelligent multiagent-based fuzzy neuro network[J].IEEE Transaction On Systems,Man and Cybernetics Part-C:Applications And Reviews,2004,34(3):369-377
[14]徐向舟,刘大庆,张红武,等.室内人工模拟降雨试验研究[J].北京林业大学学报,2006,28(5):52-58
(责任编辑:汪材印)
2016-08-16
国家大学生创新创业训练项目“p2p技术下家庭智能网关及远程控制系统”(201510379030)。
梁楠楠(1988-),女,安徽宿州人,硕士,助教,主要研究方向:物联网、云计算。
10.3969/j.issn.1673-2006.2016.11.026
TP391.9
A
1673-2006(2016)11-0097-04