王洋洋,孙 伟*,古丽米拉·克孜尔别克
(1.新疆农业大学 计算机与信息工程学院,新疆 乌鲁木齐 830052)
时空数据模型研究进展
王洋洋1,孙 伟1*,古丽米拉·克孜尔别克1
(1.新疆农业大学 计算机与信息工程学院,新疆 乌鲁木齐 830052)
对已有的时空数据模型进行了分析,介绍了有关学者对构建模型的见解和贡献;阐述了具有代表性的时空数据模型的原理和特点,指出不同阶段时空数据模型的研究成果和不足之处以及当前时空数据挖掘面临的难题。
时空数据模型;研究成果;发展趋势
也逐渐形成了海量的时空大数据[1]。时空数据具有增长速度快、数据量大、来源多样、结构各异等特点,高效管理问题突出。时空数据模型是其中的一个关键技术;涉及许多学科,需要运用计算机、遥感、全球定位系统和地理信息系统等技术来分析时空数据;可应用在国防、工业、社交网络、医疗、交通、救灾、气象等领域。与此同时,在物联网环境下,大量传感器的应用,遥感集市云平台的建立使得时空数据模型成为GIS研究中的一个重要方向[2]。数据挖掘技术的突破和海量时空数据的生产,为空间理论的验证提供了一个新的视角[3]。
陈新保[4]等从时态GIS的核心内容出发,阐述了时空数据模型间的关系和本质区别,为模型的扩展和新模型的研究提供了理论依据和参考,并就几类具有代表性的模型进行了介绍;分析了侧重状态描述的时空数据模型、侧重过程描述和因果分析的时空数据模型和侧重时空对象及其关系描述的时空数据模型。刘大有[5]等对时空数据挖掘的研究现状和面临的主要问题进行了分析,对时空模式发现、时空聚类、时空异常检测、时空预测和分类等方面进行了详细说明,结合近年来数据挖掘领域的研究进展讨论了各种研究方法的优缺点。赵彬彬[6]等阐述了从数据挖掘到空间数据挖掘,再到时空数据挖掘的发展历程,找出空间数据和传统知识发现的异同,并讨论了未来时空数据挖掘的研究热点。在众多数据模型中较为特殊的模型要数海洋时空过程数据模型[7],海洋现象时刻发生变化,与陆地的瞬时变化相比存在明显的差异。
时空数据挖掘工作都还处于起步阶段,且许多研究工作都是针对特定领域,缺乏广泛性[8]。在理论研究方面不仅受到空间数据挖掘和时态数据挖掘研究的影响,还受到时空数据表示和存取方式的限制[9]。一些文献中提到的更新方式都是同步更新,若在更新过程中出现错误,将无法进行回溯和修改[10]。
随着大数据的到来,数据量急速膨胀,导致了人们对数据处理的困难,数据挖掘应运而生。除了数据挖掘的共性,空间数据挖掘还有自身特性,不仅包含位置和属性数据,还包含实体间的空间关系[11]。不同时期提出的数据模型在解决的科学问题方面都存在差异,表1给出了不同时空数据模型的研究成果和不足之处。由表1可知,不同阶段发展起来的数据模型均能解决特定问题,但缺乏更完善的体系。
2.1 时间快照图像序列模型
时间快照图像序列模型是较为经典的时空数据模型之一[12],通过使用经过空间配准后的栅格图像来表示真实世界在某个时刻的状态。在数据库中只记录当前的数据状态,数据更新时,新数据会替换旧数据,可将时间片段存储起来,根据用户需要对指定时间的片段进行回放。因数据未发生变化时也会进行存储,故当数据量较大时,系统的处理效率会急剧下降。该模型还只是一种理论上的模型,开发价值不是很大。
2.2 时空复合模型
在与矢量基态修正模型相似的时空复合模型中[13],时空复合式把空间分割成具有相同时空过程的最大公共时空单元,较容易实现时空拓扑分析[14]。该模型保留了沿时间的空间拓扑关系,所有更新的特征都被加入到当前的数据集中,新的拓扑关系也会伴随生成。但随着时间的延续,时空数据库中的数据会逐渐增多,影响时空复合模型的查询效率。
表1 时空数据模型对比分析
2.3 面向对象的时空数据模型
在静态对象模型的基础上扩展时态信息表达[15],其核心思想是把所考察的系统看成一个对象,提取它们之间的共性和相互作用方式并进行规范化,使得逻辑过程的建模变得简单且容易实现[16]。该模型能够较好地表达数据的时间、空间和语义属性信息,反映要素对象之间的多层次关联关系[17],有助于探索事物动态变化的内在规律[18]。面向对象的数据库也将是未来数据库的发展方向[19]。
2.4 时空立方体模型
1970年Hagerstrand提出了时空立方体模型,由两 个空间维和一个时间维组成三维立方体[20],给定一 个时间位置值,即可从三维立方体中获得相应的截面[14]。时空立方体单元是以规则的空间网格为底,相应的时间段为高组成的方形柱体,是数据存储的基本单元[21]。当时空立方体单元中存储的物理表或逻辑表超出数据存储的上限时,数据的管理效率将会大幅下降,同时在时空立方体表达方面也较难实现。
2.5 基态修正模型
当状态变化相对缓慢,为了降低数据冗余量,存储时只记录变化部分,可选择基态修正模型,又称为底层叠加模型[22]。每变化一次的快照可通过叠加每次变化内容获得,每个对象只需存储一次,记录很小的数据量。虽然解决了数据冗余问题,但也增加了时空操作的复杂性[23]。该模型设使用最为频繁的状态为基态,每当有状态变换时,将前一状态相对于最新状态的变化部分存入历史库。存储入库的内容会被变更数据不断修正[24]。该模型处理矢量数据的效率较低,但处理栅格数据较为合适。
2.6 快照增量时空模型
要素在其生命周期中,可发生多次空间几何变化和属性变化,空间几何拥有正负号特性。每一时刻的快照信息为前一快照信息加上增量信息,表现为空间几何标识符的集合。时空索引的节点包括空间几何集和时间区间,其中空间几何集共有3类,通过出现的集合和消亡的集合来表示增量。该索引机制将时间和空间作为同等重要的维,能对时间段和时间点进行快速查询,兼顾了时间和空间的查询效率[25]。
2.7 时空ER模型
ER模型常用于设计高性能的事务型处理系统,主要是围绕数据和数据之间的关系构建而成。在传统的ER模型上引入新的符号结构来支持时空信息,将现实世界中的空间、时间、属性信息相互关联,可为时空数据的建模提供便利条件,并对数据库的设计提供有效的方法[26]。在用户使用该终端时,为了理解查询的结果,必须要先了解数据库如此庞大的ER模型,这一点对用户而言不易实现[27]。
2.8 基于事件的时空数据模型及其扩展
按时间顺序把事件组成一个链,新发生的事件会依次加到整个事件的尾部。以时间顺序来组织发生在特定地理位置上的变化。扩展后的模型主要适用于高级时态查询,具有3个重要功能:解决对象标识问题,使更新机制更加灵活;被扩展的时间对象能够清晰地反映时空模型中事件与状态变化之间的因果关系;为了提高在事件、空间、属性的查询速率,在空间和属性信息中可加入它们的事件对象标识,时间与空间信息是分离的[28]。
2.9 基于图论的时空数据模型
尹章才[29]等基于图论的时空数据模型研究显式地表达与存储时空实体与时空拓扑关系,避免了用快照序列进行数据的存储与表达。图论是一种研究具体事物间关系的抽象代数,实现历史数据与当前数据的分离,能够描述在空间与时间上不连续变化的时空实体。数据结构简易也有益于用户对时间和空间数据的查询与管理。
2.10 GSM数据模型
张恒才[30]等提出了GSM数据模型,实现了截取、扩展、投影和多维投影4种基础操作,弥补了移动对象数据库系统中地理空间及社交网络数据管理的不足。该模型与PostgreSQL相比,稳定性较高,在执行效率方面,GSM模型操作符也要高于PostgreSQL实现方式,能够有效防止关系数据库中表链接造成的移动对象管理与查询效率不高的问题。
通过对当前典型时空数据模型的归纳分析发现,理论研究模型与实际应用还存在很大差距。典型表现就是理论研究的模型较多,而开发实现的应用原型较少;大部分数据模型只能表达某一时刻地理实体状态的变化,却不能描述与表达连续发生变化的地理实体,在森林火灾和台风预警方面欠缺时效性。因此,理论研究要与应用开发紧密结合才能取得更大的发展空间;通过结合已有数据模型,使其互补产生新的扩展模型;在解决实际问题的同时也要兼顾数据冗余等问题。
[1] 王劲峰,葛咏,李连发,等.地理学时空数据分析方法[J].地理学报,2014(9)∶1 326-1 345
[2] 龚健雅,李小龙,吴华意.实时GIS时空数据模型[J].测绘学报,2014(3)∶226-232
[3] 王小兵,孙久运.地理信息系统综述[J].地理空间信息, 2012,10(1)∶25-28
[4] 陈新保,朱建军,陈建群.时空数据模型综述[J].地理科学进展,2009(1)∶9-17
[5] 刘大有,陈慧灵,齐红,等.时空数据挖掘研究进展[J].计算机研究与发展,2013(2)∶225-239
[6] 赵彬彬,李光强,邓敏.时空数据挖掘综述[J].测绘科学, 2010(2)∶62-65
[7] 薛存金,董庆.海洋时空过程数据模型及其原型系统构建研究[J].海洋通报,2012(6)∶667-674
[8] 王卫民,叶秋菊,贺文丽,等.基于GIS的气象时空数据挖掘和融合技术[J].电子科技,2014(2)∶130-133
[9] 陈捷,唐世渭,杨冬青,等.面向移动环境的时空数据挖掘研究现状与展望[J].计算机工程与应用,2002(16)∶1-3
[10] 杨思吉.森林资源时空数据异步更新和回溯算法的研究[D].北京∶北京林业大学,2014
[11] 李德仁,王树良,李德毅.空间数据挖掘理论与应用[M].第二版.北京∶科学出版社,2013
[12] 姜晓轶,周云轩.从空间到时间∶时空数据模型研究[J].吉林大学学报(地球科学版),2006(3)∶480-485
[13] 樊雅婷,杨建宇,朱德海.地籍管理中时空数据模型研究[J].测绘科学,2009(5)∶139-141
[14] 张保钢,王润生.时空复合数据库模型及实现∶以规划道路中线为例[J].测绘通报,2006(2)∶18-22
[15] 薛存金,谢炯.时空数据模型的研究现状与展望[J].地理与地理信息科学,2010(1)∶1-6
[16] 佘江峰,冯学智,都金康.时空数据模型的研究进展评述[J].南京大学学报(自然科学版),2005(3)∶259-267
[17] 刘玉婷,李景文,傅玮佳,等.基于Geodatabase的版本-对象时空数据组织方法[J].地理空间信息,2012,10(4)∶63-65
[18] 陈新保, LI Songnian,李黎,等.基于对象-事件-过程的时空数据模型及其应用[J].地理与地理信息科学,2013(3)∶10-16
[19] 沈敬伟,周廷刚,温永宁,等.基于面向对象数据库的空间数据管理[J].西南大学学报(自然科学版),2013(4)∶132-137
[20] 吴正升,胡艳,何志新.时空数据模型研究进展及其发展方向[J].测绘与空间地理信息,2009(6)∶15-17
[21] 胡继华,程智锋,詹承志,等.车辆监控数据仓库中时空立方体数据模型的设计与实现[J].武汉大学学报(信息科学版),2013(1)∶78-81
[22] 李婷,徐柱,卢彩霞,等.交通路况基态修正模型及其效率分析[J].地球信息科学学报,2012(6)∶712-718
[23] 齐庆超,曾永年,吴桂平,等.一种多基态修正时空数据模型改进的方法[J].测绘科学,2008(4)∶178-180
[24] 胡彦波,吴华瑞,朱华吉.农村土地调查时空数据模型构建及应用[J].江苏农业科学,2014(9)∶387-391
[25] 尹章才,李霖.基于快照-增量的时空索引机制研究[J].测绘学报,2005(3)∶257-261
[26] 任家东,高伟,任东英.时空ER模型的设计[J].计算机工程,2003(12)∶77-79
[27] 唐九阳,陆昌辉,邓苏,等.ER模型与多维模型互相转换的研究[J].计算机工程,2003(1)∶109-111
[28] 郑扣根,余青怡,潘云鹤.基于事件对象的时空数据模型的扩展与实现[J].计算机工程与应用,2001(3)∶45-47
[29] 尹章才,李霖,艾自兴.基于图论的时空数据模型研究[J].测绘学报,2003(2)∶168-172
[30] 张恒才,陆锋,陈洁.移动对象时空轨迹及社交关系一体化数据模型[J].武汉大学学报(信息科学版),2014(6)∶711-718
P208
B
1672-4623(2016)09-0029-03
10.3969/j.issn.1672-4623.2016.09.009目前对时空数据分析理论方法的研究日益增多,
王洋洋,硕士研究生,研究方向为时空数据挖掘,嵌入式。
2015-11-16。
项目来源:2014年库尔勒科技合作资助项目(KRLKJHZXM);新疆维吾尔自治区研究生科研创新资助项目(XJGRI2015087)。(*为通讯作者,博士)