时间段条件下的时空信息查询方法研究

2018-01-04 10:59刘建东戚利娜
电脑知识与技术 2018年28期
关键词:本体时空

刘建东 戚利娜

摘要:提高时空信息的查询效率可有效提高时空信息的价值。已有的时空查询方法在构造本体时只构造了时间本体,忽略了时间区间本体的构造,因此导致该方法在查询某段时间的时空信息时效率有待提高,该文在该方法的基础上,增加时间区间本体的构造过程,通过对比可知该文方法在一定程度上减少查询次数,从而提高查询效率。

关键词: 本体;查询;时空

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2018)28-0006-02

1 引言

时空信息是结合时间属性、空间属性的数据,主要用于记录地理等实体的位置属性随着时间变化的动态轨迹,为方便研究其变化规律提供数据基础。目前存储时空数据的主要以时空数据库存储为主,但是该类数据库虽然保存有大量的时空信息,却由于存储结构等原因不利于时空信息的查询,至少为时空查询需耗费较大的精力。比如,时空信息查询涉及时间、空间等属性,作为用户不仅需要懂得基本的数据库查询语言,而且对于多维度查询也需有一定了解,这在一定程度上降低了时空信息的价值。因此,有必要改善时空信息查询不便的情况。

2 相关研究

目前,有较多学者对提高时空信息查询效率进行了研究,大致可以分成以下几类:第一类是基于地理信息系统(即GIS)进行查询,但是这类方法要求用户掌握基本的有关GIS的概念和知识,可能致使该类方法无法得到普及;第二类是基于数据或者基于元数据进行查询,但该方法的存在与第一类类似的缺点[1];第三类即基于空间的知识查询[2],一方面该方法具有语义相关性,查询具有较高的智能,但是另一方面该类方法实现较为困难,也就是说实施难度较高[3];第四类是基于本体的时空信息查询[3],这类方法只需要用户输入非形式化的查询语言即可实现时空信息的查询,但是该类方法对于适合某个时间点的时空信息查询,而对于某个时间段的时空信息查询效率不太高。本文在第四类时空信息查询方法的基础上进行加工以达到能支持时空段的时空信息查询的目的。

3 基于本体的时空信息查询方法

本节将引用吴孟泉提出的本体驱动的时空数据查询方法[3],以便说明该方法对于时间段时空信息查询的不便之处。

时空信息查询的方法的基本步骤是首先通过国家颁布的规范文件,构造与用户查询相关的语义本体,如用户查询农业时空信息,该方法参考相关的文件,构造农业时空信息本体;构造的本体结合保存有大量时空信息的时空数据库进行改造,从而利用时空数据库的实际数据丰富构造的本体属性以及相关实例;通过语法解析用户输入的查询语句,识别出关键的类、属性、实例;利用本体的语义相关性对用户输入的类进行扩展,查到符合用户输入条件的属性和实例保存到预先设计好的结构化表中,最终以结构表中的数据为基础,以分解后的查询语句为条件,查询时空信息。该方法即利用了本体的语义相关性,又具有结构化数据查询的高效性。但是该方法适合某个时间点的时空查询,对于时间段查询的效率有待改进。以文献[3]中提出的案例为例进行说明。

在案例中,用户需要查询曲靖市在2005年种植烟草型号为k236的地塊[3]。根据之前提到的步骤,首先构造了农业时空信息本体与种植本体,再利用该市的时空数据库丰富了本体内容,从已经构造的本体利用语义相关搜索符合2005年、k236等相符的类、属性和实例后存入结构表中,关键的结构表如表1、表2、表3所示:

以案例中的查询为例,该方法最终首先通过根据“曲靖市”查询到所在区域X,然后根据种植年份以及种植类型查询到区域a,将两个区域取交集即可得到查询结果R。具体如图1所示:

然而如果用户不是以“2005年”为时间查询条件,而是以“2005年-2012年”为时间段查询,那么根据前面的步骤可知,最终用户要想查询到符合要求的区域,必须分别以2005年、2006年、2007年...2012年为条件查询8次,得到八个每年符合种植类型的小区域,最终还要将这八个小区域与曲靖市的地理空间取交集从而得到结果。具体如图2所示:

4 支持时间段查询的时空信息查询方法

从以上的讨论可知,文献[3]的时空信息查询方法对于时间段的查询条件需要分解多次,执行多次交集运算,因此效率有待提高,为改善上述不足,本节在文献[3]提出的构造的农业信息本体基础上,对时间本体增加时间区间本体,以开始时间和结束时间来表示,具体如图3所示:

由于对时间本体进行了改造,因此对于保存在最终结构表中的数据中应该会包含开始时间和结束时间的两个字段,具体如表4所示:

由表4可知,种植地块会根据种植类型保存开始时间和结束时间。因此如果还是以“2005年-2012年”为时间查询条件,则可先通过“曲靖市”查询该市的空间,然后分别以开始时间和结束时间、种植类型查询符合条件的区域,最终取交集得到结果,形式化的查询语句如下:

Bound_1 =Select 空间区域 where 名字=“曲靖市”;

Bound_2 = Select 空间 where 种植类型=“K236” and 开始时间<=2005 and 结束时间>=2012;

Result= Select 空间 where Intersection(Bound_1,Bound_2)=1。

由查询条件可知,该时间段的查询也只查询三次,远远低于之前的方法的查询次数。

参考文献:

[1] 杜云艳,周成虎.海岸带及近海科学数据集成与共享研究[M].北京:海洋出版社,2005.

[2] 王敬贵,苏奋振.基于Ontology的空间知识查询方法及其应用[J].地理信息科学,2004,6(4):93-98.

[3] 吴孟泉,崔伟宏.本体驱动的时空数据查询方法研究[J].计算机工程与应用,2009,45(11):154-157.

[4] 刘大有,胡鹤.时空推理研究进展[J].软件学报,2004,15(8):1141-1149.

[5] 李霖,王红.基于形式化本体的基础地理信息分类[J].武汉大学学报:信息科学版,2006,31(6).

[6] 虞为,曹加恒,陈俊鹏.基于地理空间语义网的异构地理信息查询[J].计算机工程与应用,2006,42(30):6-9.

【通联编辑:代影】

猜你喜欢
本体时空
Abstracts and Key Words
跨越时空找自己
对姜夔自度曲音乐本体的现代解读
镜中的时空穿梭
玩一次时空大“穿越”
基于本体的机械产品工艺知识表示
《我应该感到自豪才对》的本体性教学内容及启示
跨时空,再相逢
专题