廖娟 阮运飞
摘要:以农业灾害中常见的水灾为例,文章提出一种基于斜率过滤分段的时间序列匹配方法,定义了水深序列和应用于农业灾害的相似度量模型。根据过滤算法,确定出农业灾害等级,从以往水灾数据库中调出应急方法,达到辅助决策的目的,为农业灾害的辅助及防治提供了很好的技术支持。
关键词:过滤分段;时间序列匹配;辅助决策
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2014)12-2871-02
A kind of Natural Disasters in Agriculture Aided Decision System Based on Time Series
LIAO Juan, RUAN Yun-fei
(KaiLi University, KaiLi 556011, China)
Abstract: In the agricultural disasters common floods, for example, the article puts forward a kind of time series matching method based on slope filtering section, defines the sequence and the depth of the water used in agriculture disasters similarity measurement model. Based on filter algorithm to determine the level of agricultural disaster, emergency method, from previous flood database, in an achieve the purpose of aid decision making, for the auxiliary of agricultural disasters and prevention provides a good technical support.
Key words: filtering section; time series matching; aid decision making
时间序列数据在社会中有着非常广的使用[1],生活中、商业上、科学上等等各个领域几乎都涉及到时间序列数据。而农业中的水灾是农业灾害中比较重要也是常见的一种自然灾害[2],该灾害涉及到雨水的多少、风的大小等都会造成一定的农业经济损失。结合雨水中的一些特点,利用时间序列匹配的方法,给农民提前传授一定的预防知识,是非常有必要而且有意义[3]。
1 算法的相关定义
定义1:水深序列:把洪水或者大雨等事件的空间、地域描述等属性忽略,根据洪水发生的时间,按照时间将该事项连接起来。从而,一个水深序列就可以用[S=S(t)|t=0,1,2,…,n]来表示。
定义2:水深序列长度:水深序列 [S]的长度即为水深时间序列元素的个数,该序列的任意一个元素,表示的是水深时间序列在某一个时刻的最高水位值。[S[i]]表示水深序列[S]中的第[i]个元素,[S(t)]表示水深序列[S]在[t]时刻的最高水位值。
定义3:相似度量模型定义:假设[Q]和[C]是和是两个不同的水深时间序列,那么这两个序列的相似性定义为这两个序列相对应的元素的相似性来确定。
他们的度量模型定义:
[Measure(Q,C)=i=1max{|Q|,|C|}δ(Q[i],C[i])]
其中,若[|Q|=|C|],则两序列的长度相等。
2 算法描述
基于斜率过滤分段的水深序列相似匹配算法(SHM_SF):
步骤1:首先对搜集到的数据进行预处理,经过筛选、按照时间顺序,把不符合规定是数据剔除掉。同时,将对应的水深信息放在预处理文件中。
步骤2:把经过预处理的数据构造成水深序列,即按照时间顺序把各个地方的水深数据编号,依次放入数组中,形成一组水深序列SSS。
步骤3:水深数据的处理,把监测到的水深数据依次按照步骤1进行预处理,根据时间顺序放入数组中形成时间序列数据。
步骤4:把得来的水深数据经过步骤3形成水深时间序列,同农业灾害数据库中的水深时间序列进行过滤分段基于斜率的相似匹配比较,如果相似则放入到指定的经过一级过滤的数据库中,再利用定义3的相似度量模型,确定好阈值,如果得出的相似度小于该阈值,则筛选出改条水深时间序列,从而人为它是要找的相似的那条序列。
步骤5:水深辅助决策,依据步骤4得出的相似序列,在水深灾害数据库中找到相似匹配的灾害等级,农业相关部门根据结果,找到往年是如何给农民提出相对应的意见,再针对该次水灾发生的时间长短,给出指导性的意见。流程图如下图所示:
该算法在使用了基于斜率的分段相似匹配之后,利用定义3进行的两序列之间的匹配需各序列对应元素一一匹配。
3 实验设计与分析
3.1 灾情等级评价
根据上述算法可以得出动态水位分布,评定灾害等级,综合灾害等级得到该次灾害的信息。灾情等级分为非常严重、严重、中级、初级、没影响等,每一级别都有相应的应对信息。
3.2 应用实例及结果分析
农业灾害的辅助决策,该文主要针对水自然灾害,该方法是通过在已有的农业水灾害数据库中按照步骤3本水深数据处理为水深时间序列事件,每次农业水灾害都有与之对应的处理方法,该文就是利用分段的时间序列相似匹配方法把目前已有的水深数据处理为水深时间序列数据,与数据库中的时间数据序列进行匹配,得出最符合要求的时间序列,从而根据当年发生该次灾害时处理的方法,得出该次灾害应如何处理。例如下面图2这个例子,是1960年7月发生的通过本文的方法,得到最相似的是1961年10的严重潮灾。那么,根据该次潮灾发生时,当时农业部门处理的方法,就可以很快得出应急方案,减少损失。
该算法的[l]值选取非常关键,因为该值选取过大或过小,对算法的影响比较大。该值如果过大,则分段的数目就会减少,从而导致会多过滤掉时间序列,把本来相似的序列给过滤掉。反之,如果该值过小,那么过滤掉的效果就不明显,起不到筛选的作用。经过多次实验,[l]值为7时,效果是最佳的, 既没有过滤掉相似的序列,也有效的剔除掉了一部分序列。
从该实验可得知,该算法在l=7时相似匹配程度较高,准确性较好,在为农民提供有利的灾害信息时,比较及时和准确。
4 结束语
在农业自然灾害方面,水灾是比较常见的灾害。而风暴潮灾害也是其中的一种,文章针对农业水灾害中碰到的一些问题,采用数学分析的方法,提出了基于过滤分段的算法,对于更好的指导农民的农业作业有着一定的帮助。
参考文献:
[1] 张鹏,张锦文,王喜年.天津沿海风暴潮实时监测预报系统[J].海洋预报,2002(19):16-22.
[2] 国宏伟,刘燕驰,梁合兰,武森.多变量时间序列的模糊决策树挖掘[J].计算机应用研究,2009(1).
[3] 吴绍春,吴耿锋,王炜,蔚赵春.寻找地震相关地区的时间序列相似性匹配算法[J].软件学报,2006,17:185-192.endprint
摘要:以农业灾害中常见的水灾为例,文章提出一种基于斜率过滤分段的时间序列匹配方法,定义了水深序列和应用于农业灾害的相似度量模型。根据过滤算法,确定出农业灾害等级,从以往水灾数据库中调出应急方法,达到辅助决策的目的,为农业灾害的辅助及防治提供了很好的技术支持。
关键词:过滤分段;时间序列匹配;辅助决策
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2014)12-2871-02
A kind of Natural Disasters in Agriculture Aided Decision System Based on Time Series
LIAO Juan, RUAN Yun-fei
(KaiLi University, KaiLi 556011, China)
Abstract: In the agricultural disasters common floods, for example, the article puts forward a kind of time series matching method based on slope filtering section, defines the sequence and the depth of the water used in agriculture disasters similarity measurement model. Based on filter algorithm to determine the level of agricultural disaster, emergency method, from previous flood database, in an achieve the purpose of aid decision making, for the auxiliary of agricultural disasters and prevention provides a good technical support.
Key words: filtering section; time series matching; aid decision making
时间序列数据在社会中有着非常广的使用[1],生活中、商业上、科学上等等各个领域几乎都涉及到时间序列数据。而农业中的水灾是农业灾害中比较重要也是常见的一种自然灾害[2],该灾害涉及到雨水的多少、风的大小等都会造成一定的农业经济损失。结合雨水中的一些特点,利用时间序列匹配的方法,给农民提前传授一定的预防知识,是非常有必要而且有意义[3]。
1 算法的相关定义
定义1:水深序列:把洪水或者大雨等事件的空间、地域描述等属性忽略,根据洪水发生的时间,按照时间将该事项连接起来。从而,一个水深序列就可以用[S=S(t)|t=0,1,2,…,n]来表示。
定义2:水深序列长度:水深序列 [S]的长度即为水深时间序列元素的个数,该序列的任意一个元素,表示的是水深时间序列在某一个时刻的最高水位值。[S[i]]表示水深序列[S]中的第[i]个元素,[S(t)]表示水深序列[S]在[t]时刻的最高水位值。
定义3:相似度量模型定义:假设[Q]和[C]是和是两个不同的水深时间序列,那么这两个序列的相似性定义为这两个序列相对应的元素的相似性来确定。
他们的度量模型定义:
[Measure(Q,C)=i=1max{|Q|,|C|}δ(Q[i],C[i])]
其中,若[|Q|=|C|],则两序列的长度相等。
2 算法描述
基于斜率过滤分段的水深序列相似匹配算法(SHM_SF):
步骤1:首先对搜集到的数据进行预处理,经过筛选、按照时间顺序,把不符合规定是数据剔除掉。同时,将对应的水深信息放在预处理文件中。
步骤2:把经过预处理的数据构造成水深序列,即按照时间顺序把各个地方的水深数据编号,依次放入数组中,形成一组水深序列SSS。
步骤3:水深数据的处理,把监测到的水深数据依次按照步骤1进行预处理,根据时间顺序放入数组中形成时间序列数据。
步骤4:把得来的水深数据经过步骤3形成水深时间序列,同农业灾害数据库中的水深时间序列进行过滤分段基于斜率的相似匹配比较,如果相似则放入到指定的经过一级过滤的数据库中,再利用定义3的相似度量模型,确定好阈值,如果得出的相似度小于该阈值,则筛选出改条水深时间序列,从而人为它是要找的相似的那条序列。
步骤5:水深辅助决策,依据步骤4得出的相似序列,在水深灾害数据库中找到相似匹配的灾害等级,农业相关部门根据结果,找到往年是如何给农民提出相对应的意见,再针对该次水灾发生的时间长短,给出指导性的意见。流程图如下图所示:
该算法在使用了基于斜率的分段相似匹配之后,利用定义3进行的两序列之间的匹配需各序列对应元素一一匹配。
3 实验设计与分析
3.1 灾情等级评价
根据上述算法可以得出动态水位分布,评定灾害等级,综合灾害等级得到该次灾害的信息。灾情等级分为非常严重、严重、中级、初级、没影响等,每一级别都有相应的应对信息。
3.2 应用实例及结果分析
农业灾害的辅助决策,该文主要针对水自然灾害,该方法是通过在已有的农业水灾害数据库中按照步骤3本水深数据处理为水深时间序列事件,每次农业水灾害都有与之对应的处理方法,该文就是利用分段的时间序列相似匹配方法把目前已有的水深数据处理为水深时间序列数据,与数据库中的时间数据序列进行匹配,得出最符合要求的时间序列,从而根据当年发生该次灾害时处理的方法,得出该次灾害应如何处理。例如下面图2这个例子,是1960年7月发生的通过本文的方法,得到最相似的是1961年10的严重潮灾。那么,根据该次潮灾发生时,当时农业部门处理的方法,就可以很快得出应急方案,减少损失。
该算法的[l]值选取非常关键,因为该值选取过大或过小,对算法的影响比较大。该值如果过大,则分段的数目就会减少,从而导致会多过滤掉时间序列,把本来相似的序列给过滤掉。反之,如果该值过小,那么过滤掉的效果就不明显,起不到筛选的作用。经过多次实验,[l]值为7时,效果是最佳的, 既没有过滤掉相似的序列,也有效的剔除掉了一部分序列。
从该实验可得知,该算法在l=7时相似匹配程度较高,准确性较好,在为农民提供有利的灾害信息时,比较及时和准确。
4 结束语
在农业自然灾害方面,水灾是比较常见的灾害。而风暴潮灾害也是其中的一种,文章针对农业水灾害中碰到的一些问题,采用数学分析的方法,提出了基于过滤分段的算法,对于更好的指导农民的农业作业有着一定的帮助。
参考文献:
[1] 张鹏,张锦文,王喜年.天津沿海风暴潮实时监测预报系统[J].海洋预报,2002(19):16-22.
[2] 国宏伟,刘燕驰,梁合兰,武森.多变量时间序列的模糊决策树挖掘[J].计算机应用研究,2009(1).
[3] 吴绍春,吴耿锋,王炜,蔚赵春.寻找地震相关地区的时间序列相似性匹配算法[J].软件学报,2006,17:185-192.endprint
摘要:以农业灾害中常见的水灾为例,文章提出一种基于斜率过滤分段的时间序列匹配方法,定义了水深序列和应用于农业灾害的相似度量模型。根据过滤算法,确定出农业灾害等级,从以往水灾数据库中调出应急方法,达到辅助决策的目的,为农业灾害的辅助及防治提供了很好的技术支持。
关键词:过滤分段;时间序列匹配;辅助决策
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2014)12-2871-02
A kind of Natural Disasters in Agriculture Aided Decision System Based on Time Series
LIAO Juan, RUAN Yun-fei
(KaiLi University, KaiLi 556011, China)
Abstract: In the agricultural disasters common floods, for example, the article puts forward a kind of time series matching method based on slope filtering section, defines the sequence and the depth of the water used in agriculture disasters similarity measurement model. Based on filter algorithm to determine the level of agricultural disaster, emergency method, from previous flood database, in an achieve the purpose of aid decision making, for the auxiliary of agricultural disasters and prevention provides a good technical support.
Key words: filtering section; time series matching; aid decision making
时间序列数据在社会中有着非常广的使用[1],生活中、商业上、科学上等等各个领域几乎都涉及到时间序列数据。而农业中的水灾是农业灾害中比较重要也是常见的一种自然灾害[2],该灾害涉及到雨水的多少、风的大小等都会造成一定的农业经济损失。结合雨水中的一些特点,利用时间序列匹配的方法,给农民提前传授一定的预防知识,是非常有必要而且有意义[3]。
1 算法的相关定义
定义1:水深序列:把洪水或者大雨等事件的空间、地域描述等属性忽略,根据洪水发生的时间,按照时间将该事项连接起来。从而,一个水深序列就可以用[S=S(t)|t=0,1,2,…,n]来表示。
定义2:水深序列长度:水深序列 [S]的长度即为水深时间序列元素的个数,该序列的任意一个元素,表示的是水深时间序列在某一个时刻的最高水位值。[S[i]]表示水深序列[S]中的第[i]个元素,[S(t)]表示水深序列[S]在[t]时刻的最高水位值。
定义3:相似度量模型定义:假设[Q]和[C]是和是两个不同的水深时间序列,那么这两个序列的相似性定义为这两个序列相对应的元素的相似性来确定。
他们的度量模型定义:
[Measure(Q,C)=i=1max{|Q|,|C|}δ(Q[i],C[i])]
其中,若[|Q|=|C|],则两序列的长度相等。
2 算法描述
基于斜率过滤分段的水深序列相似匹配算法(SHM_SF):
步骤1:首先对搜集到的数据进行预处理,经过筛选、按照时间顺序,把不符合规定是数据剔除掉。同时,将对应的水深信息放在预处理文件中。
步骤2:把经过预处理的数据构造成水深序列,即按照时间顺序把各个地方的水深数据编号,依次放入数组中,形成一组水深序列SSS。
步骤3:水深数据的处理,把监测到的水深数据依次按照步骤1进行预处理,根据时间顺序放入数组中形成时间序列数据。
步骤4:把得来的水深数据经过步骤3形成水深时间序列,同农业灾害数据库中的水深时间序列进行过滤分段基于斜率的相似匹配比较,如果相似则放入到指定的经过一级过滤的数据库中,再利用定义3的相似度量模型,确定好阈值,如果得出的相似度小于该阈值,则筛选出改条水深时间序列,从而人为它是要找的相似的那条序列。
步骤5:水深辅助决策,依据步骤4得出的相似序列,在水深灾害数据库中找到相似匹配的灾害等级,农业相关部门根据结果,找到往年是如何给农民提出相对应的意见,再针对该次水灾发生的时间长短,给出指导性的意见。流程图如下图所示:
该算法在使用了基于斜率的分段相似匹配之后,利用定义3进行的两序列之间的匹配需各序列对应元素一一匹配。
3 实验设计与分析
3.1 灾情等级评价
根据上述算法可以得出动态水位分布,评定灾害等级,综合灾害等级得到该次灾害的信息。灾情等级分为非常严重、严重、中级、初级、没影响等,每一级别都有相应的应对信息。
3.2 应用实例及结果分析
农业灾害的辅助决策,该文主要针对水自然灾害,该方法是通过在已有的农业水灾害数据库中按照步骤3本水深数据处理为水深时间序列事件,每次农业水灾害都有与之对应的处理方法,该文就是利用分段的时间序列相似匹配方法把目前已有的水深数据处理为水深时间序列数据,与数据库中的时间数据序列进行匹配,得出最符合要求的时间序列,从而根据当年发生该次灾害时处理的方法,得出该次灾害应如何处理。例如下面图2这个例子,是1960年7月发生的通过本文的方法,得到最相似的是1961年10的严重潮灾。那么,根据该次潮灾发生时,当时农业部门处理的方法,就可以很快得出应急方案,减少损失。
该算法的[l]值选取非常关键,因为该值选取过大或过小,对算法的影响比较大。该值如果过大,则分段的数目就会减少,从而导致会多过滤掉时间序列,把本来相似的序列给过滤掉。反之,如果该值过小,那么过滤掉的效果就不明显,起不到筛选的作用。经过多次实验,[l]值为7时,效果是最佳的, 既没有过滤掉相似的序列,也有效的剔除掉了一部分序列。
从该实验可得知,该算法在l=7时相似匹配程度较高,准确性较好,在为农民提供有利的灾害信息时,比较及时和准确。
4 结束语
在农业自然灾害方面,水灾是比较常见的灾害。而风暴潮灾害也是其中的一种,文章针对农业水灾害中碰到的一些问题,采用数学分析的方法,提出了基于过滤分段的算法,对于更好的指导农民的农业作业有着一定的帮助。
参考文献:
[1] 张鹏,张锦文,王喜年.天津沿海风暴潮实时监测预报系统[J].海洋预报,2002(19):16-22.
[2] 国宏伟,刘燕驰,梁合兰,武森.多变量时间序列的模糊决策树挖掘[J].计算机应用研究,2009(1).
[3] 吴绍春,吴耿锋,王炜,蔚赵春.寻找地震相关地区的时间序列相似性匹配算法[J].软件学报,2006,17:185-192.endprint