基于本体的地理空间信息语义表达研究

2019-10-08 07:45闫李月左小清葛小三
软件 2019年1期
关键词:空间信息本体语义

闫李月 左小清 葛小三

摘  要: 为了研究地理空间信息语义层次上的统一描述,文章在对地理空间信息特征分析的基础上,基于本体论的语义构建思想,选取五元组GeO=的本体组织基础结构,其中C表示概念集合或者类(各种实体和现象)、R表示关系集合(属性和空间关系等)、F表示函数(计算概念间某些特定关系的函数)、M表示公理(针对概念或关系的约束条件)、I表示实例(对象);以旅游出行计划为例,对概念、关系、函数、公理、实例五种要素的进一步定义,提出并构建了针对旅游出行领域的应用本体;借助OWL语言本体建模创建本体类,实现了针对出行计划的地理空间信息语义表达,为地理信息服务的发现与组合提供支撑。

关键词: 地理空间信息;语义;本体;出行计划;应用本体

中图分类号: TP391    文献标识码: A    DOI:10.3969/j.issn.1003-6970.2019.01.024

【Abstract】: In order to study the unified description of the semantic level of geospatial information, based on the analysis of geospatial information characteristics, based on the semantic construction idea of ontology, the quintuple GeO= is selected. Ontology organization infrastructure, where C represents a concept set or class (various entities and phenomena), R represents a relation set (attributes and spatial relationships, etc.), F represents a function (a function that computes certain relationships between concepts), and M represents axioms (for the constraints of concepts or relationships), I represents the instance (object); taking the travel plan as an example, further definition of the five elements of concepts, relationships, functions, axioms, and examples, proposes and constructs a field for tourism travel. Application ontology; the ontology class is created by OWL language ontology modeling, and the semantic expression of geospatial information for travel planning is realized, which provides support for the discovery and combination of geographic information services.

【Key words】: Geospatial information; Semantics; Ontology; Travel planning; Application ontology

0  引言

當前地理信息系统技术的发展要求,内容上不仅要有地理数据和地理信息,还要能更人性化表达地理知识,和人们的生活认知相符合,促进GIS的

大众化和社会化;地理信息服务的数量在急剧增加,向网络化方向发展;在信息交流方面,要求充分利用信息网络中复杂多源的地理信息资源,从数据格式转换与信息共享,发展到更智能化的、基于语义的互操作,满足不同用户的需求[28]。从这些需求和

发展趋势可以看出,地理信息系统正在向着地理信息资源的智能化、网络化发展,地理空间技术和语义网技术的发展推进了基于语义Web Service的地理信息服务和共享[1,11]。地理空间技术和语义网技术的发展推进了基于语义网服务的地理信息服务和共享。其中,语义目前是地理信息服务研究的一个关键问题,让计算机识别地理信息所含的语义成为了研究的焦点[2]。

美国乔治梅森大学LAITS研究中心的DiLiping等[15-17]研究了地理信息服务链中自动服务发现和服务组合的方法,提出了使用“地理树”和“地理对象”的概念表达服务链和特定地理信息服务,并建立地理信息服务领域本体,形成地理信息服务的语义描述,实现智能搜索与组合。Lutz使用本体来描述地理信息服务的语义描述,在此基础上,深入研究了基于本体论与规则的地理信息服务发现与组合研究[4]。在国内,景东升等[2]对基于本体的地理空间信息语义表达和服务进行了研究,分析了从现实世界到地理元素的抽象过程的九个层次,提出了语义支持的地理空间查询框架与流程,依据当时的网络服务和语义网服务,结合基于特征的空间数据模型等,提出了包含语义信息的地理空间信息系统概念架构。郑亮、李德仁[9]进行了空间服务语义模式的地理信息服务发现的研究,完整的构建出了地理信息服务语义描述的层次模型。张瑞[14]研究了基于情景演算的交通信息服务动态组合发布方法,创造性的构建了本题库和情境库,还有支持语义分析和推理的模型库。同时,李德仁、柳来星[10]进行了上下文感知的智慧城市空间信息服务组合的研究,拓展了OWL-S本体,重点研究上下文相关类,结合智能规划和语义增强等技术,实现了“智慧旅游”案例。

总结发现,地理信息组合服务面临的现有挑战重点是空间资源的发现和检索。当前已有的描述地理空间信息数据的标准、注册地理信息服务的OGC目录服务,都面临一个缺陷:语义的发现与表达。信息及服务概念层次的知识标注,即表示数据语义的形式化和明确的描述模式,是构建地理信息服务语义发现和组合支撑环境的基础[5]。地理空间语义网的出现为基于语义的地理信息服务的研究一大进展,提供了一套框架、方法与应用模型。伴随着语义网技术的不断研究,语义结合的信息服务已经在生活、娱乐、军事等领域扩大应用。但国内针对地理空间信息的语义发现与表达技术的研究并不多,对语义的挖掘仍有局限。本文在已有的语义和地理空间信息发现与表达的研究成果基础上,对基于本体的地理空间信息语义表达进行进一步的研究。

1  地理空间信息语义特征分析

1.1  地理空间信息特性

地理信息系统是一种具体的空间信息系统,研究的基本问题是如何理解和理解地理空间,如何查询和分析环境信息,为用户提供地理信息的支持和服务。地理空间信息是与地理空间位置有关的信息,其载体为空间数据。由地理学和地理信息系统的本质决定了地理空间信息表现形式的复杂性,其空间数据也往往是异构的、需要经过重新组织的。地理空间信息具有空间定位性和多维结构性,特征是时序和动态变化等[11]。

地理空间信息当下所具有的特性和特征决定了地理数据多种多样的表达方式,地理信息系统的研究对象的大范围和多类别的特点也决定了地理空间信息的语义复杂性。对于同一个客观存在的地理信息表达,在现实世界里它的几何特征相同,但属性上却可能对应有大不相同的语义信息,像地貌、土壤、地理位置、气候、海拔高度等自然特点,还有经济社会信息,像行政区划、人口等。简单来说,地理空间信息的传统表现形式通常为地名或空间坐标,但是这两类常见的地理空间信息会由于区域、文化等语境的不同而代表内容各异。随着人类对地理信息研究的不断深入和地理空间信息解决方案的不断完善,地理空间信息的表达逐渐多元化。比如“焦作”这一地理信息,可以直接按照人们习惯例如:“焦作”、“山阳”、“怀州”、“JiaoZuo”等名称来表达,也可以使用计算机图形例如:“矢量地圖”、“影像地图”或者“栅格地图”等来表达;还可以用一些间接形式例如:“行政区划代码”、“电话区号”、“邮政编码”等来表述;甚至可以用人文现象以代表,如“中国太极拳发源地”、“云台山风景区所在地”“司马懿、韩愈故里”等。

地理信息属于信息资源中重要的一部分,所含的信息量具大,同时具有空间属性整合的特点。随着3S等技术的兴起,计算机和网络上提供的空间数据增长迅速,形式不再仅是元数据,更多的是卫星图象、航摄影像、普通地图和专题地图等,数据的海量性与其表现形式的多样性导致了空间信息的搜索也越来越复杂。地理空间信息的表现形式的多样性导致了对地理信息准确描述的困难性、地理空间关系提取与搜索的复杂性,由此推进了地理空间信息的语义研究。

1.2  地理空间信息与事件语义学

事件的语义性是指事件是一个语义单位,其介于词和句子之间,比词组意义完整,通过事件语义分析与计算,可以透彻研究其所在句子的意义,进而研究所在篇章意义[13,23]。在事件语义学中,动词表示的是事件的集合,其分类是由事件的性质所决定的,但动词分类同时决定了不同事件结构的性质。因此事件可以分为对应的四种:状态事件、活动事件、达成事件、完成事件。Bach等将状态同事件合并,共称为事态,只有后三类,为计算机语义学领域所接受。事件语义的决定要素是事件谓词的意义,如事件“小明计划在焦作旅游”和“2017年的端午节三天假期,在河南理工大学读大三的男生小明计划在焦作及其周边的著名景点放松旅游”,虽然后者比前者多了几个语义成分,但两个事件的事件谓词都是“旅游”,并且在两个事件中事件谓词的语义相同,在不考虑语境的情况下,它们为同一个事件。

《基于认知与计算的事件语义学研究》中提到,语义角色可以大致分为主事(theme)、接收者(recipient)、时间(time)、原因(cause)、方式(manner)、目的(purpose)等,这是本文在后边进行地理信息本体的构建的思路来源。事件语义角色的层次结构如图2-1所示。及物动词的施事跟受事或结果相对应,致事跟结果相对应,主事跟系事相对应,因而可以由施事预测受事和结果,致事预测结果,主事预测系事。施事、致事和主事被当作原型施事的典型小类,而受事、与事、结果和系事被当作是原型受事的典型小类。空间在地理学和天文学中指的是地球表面的一部分,分为绝对空间和相对空间两个概念,绝对空间是指其自身的特征,其他一切外在事物是无关紧要的,无处不在,永不改变;相对空间是可以在绝对空间中移动的结构,或是通过其与物体的相对位置可以感知的绝对空间的度量,通常作为不可移动的空间,包括大气、地表、地下的空间,都是根据和地球的相互关系决定。基于相对空间的考虑,空间类事件语义角色除地点外,还包括能标示事件方向特性的源点和终点两个事件语义角色,其中源点是指事件所表示的动作行为开始的地点,而终点是指事件表示的动作行为的结束地点。事件语义角色层次结构如图1。

我们将地理空间信息资源和事件语义学内容结合起来,剖析地理事件的空间语义特征,表示出完整的包含语义信息的地理行为,表达出一个具有完整意义的事件,特点是具有地理属性。例如,在河南理工大学读大三的小明提出问题:“清明节在焦作去哪里玩比较好”。其中,“清明节”是时间语义成分,等价于“踏青节”或“4月4日-6日”;“焦作”是空间语义成分,包含焦作市和焦作市周边一定范围内的目标地点,源点是焦作市,终点是“去玩”的目标地点;“哪里”即指代目标地点;“玩”是一个动作,在本句中的语义等价于“旅游”、“出行”等;“比较好”的约束性不强,可以为“可达”、“合适”、“最佳”不同层级。整句话等同于“查找4月4日-6日焦作出发可旅行的地点或项目”,这就是一个具有地理属性的完整意义的事件,是基于本体的语义分析方法的基础。

2  基于本体的地理空间信息語义分析方法

2.1  基于本体的语义分析

本体(Ontology)最早是哲学领域的概念,被用来阐明事物的本质。Studer给出了本体的完整计算机概念,同时是迄今为止为学术界普遍承认的定义:“本体是共享概念模型的明确的形式化说明”。在这个定义中,“共享(share)”是指本体是领域内共同接受的概念集,体现的是共同承认的认识,面向的是集团而不是单个人;“概念模型(conceptua lization)”是指通过对客观世界中某些概念进行抽象得到的模型;“明确(explicit)”是说所使用的概念和对这些概念的限定条件的定义是明确的;“形式化(formal)”即计算机可读的,能被计算机识别和处理。对于特定一个领域而言,本体表达其一套术语,实体,对象,类,属性和关系,提供限制这些术语解释的正式定义和公理。本体其实可以看做为传统软件中的面向对象提供的对象模式,和其延伸出来的类的定义。

语义分析方法主要包括基于句法规则的语义分析方法、基于相似度计算的语义分析方法、本体构建语义分析和本体推理语义分析等。其中,本体构建语义分析方法是将领域本体的构建过程看作语义分析过程,对领域本体的概念、属性、公理关系进行定义,从而实现语义信息的形式化表达,而本体构建的重要内容是确定领域本体的逻辑结构[22]。目前本体结构的定义并没有统一的规范,由于研究对象的不同,学者提出的本体结构相互之间差异比较明显,如崔巍[24]提出了由图节点、边、规则集组成的三元组本体集合,景东升[2]提出了由概念、关系、函数、公理、实例5部分组成的地理本体结构体系,还有谭永滨等[25]、易茹兰[26]、黄茂军[27]等则分别提出四元组、七元组本体逻辑结构。

3  旅游出行计划本体构建

地理空间信息本体中,地理概念是地理信息语

义共享的基础,本体间相对独立,不会因为实际语境的不同而造成结构上的改变,且其对现实世界现象及关系进行形式化定义,可以通过对一套行业标准进行概念化产生。而地理信息应用本体则与具体的应用语境紧密相连,反映的是特定任务,例如“城镇道路建设规划”或“地震灾区救援”等某一个任务内公共拥有的知识,是应用语境内普遍承认的概念集,能让几个地理应用或产品同用。特定领域应用本体继承了地理空间信息本体中的概念,再根据地理元素的应用特征扩展出具体的属性。特定领域应用本体的构建可以简单概括为6个步骤:(1)确定地理空间信息具体的应用领域和范围;(2)已有模型的利用;(3)对应用领域内相关概念的识别和标注;(4)确定描述概念的属性;(5)确定概念间的关系和层次;(6)确定应用于地理概念和地理关系之上的约束条件。

3.1  旅游出行本体的定义

3.2  旅游出行本体的表达

基于以上对旅游出行本体概念、关系、函数、公理、实例的分析,可以构建旅游出行本体。依据形式化本体结构,使用本体描述语言OWL对其中的概念、关系、函数进行描述。对本体进行构建操作时,可以用一些编辑工具或者集成工具等等,使用较多的是斯坦福大学的Protégé软件系统。Protégé是一种可视化的构建本体的工具,是一个可扩展的建立OWL本体的集成环境,可用于语义网中本体的构建。Protégé为创建并可视化、应用各种描述形式的本体,创造了丰富的知识模型的框架和程序,是当前构建本体的首选工具。

文章用Protégé创建“Travel Plan”项目,增加并命名“scenic spot”类,建立相应属性并与类关联,然后构造实例并与相应属性关联,如图4所示。

4  结论

随着人类获取地理信息数据能力的不断提升,计算机和网络上提供的地理空间数据增长迅速,数据的表现形式越来越复杂,形成了海量的地理大数据集合。但是由于地理空间信息大数据集合的多源

性和异构性等原因,至今尚未有令人满意的地理空间数据组合服务可视化表达工具,因此对特定领域地理空间信息组合的语义可视化表达研究有着非常重要的意义。为此,本文借助空间语义事件与本体的知识,基于五元组的地理空间信息本体组织结构,通过特定应用领域的扩展,形成了特殊的六元组旅游出行本体结构,为旅游出行计划知识的组织提供了一种规范框架体系。

文章的研究为针对特定应用领域的地理空间信息语义表达研究提供了一种思路,下一步可在基于本体的地理空间信息数据组织模型基础上,深入对语义相似度计算方法、地理信息服务的组合形式、地理信息服务链的触发等方面的研究,以期为现代地理信息服务的智能化提供理论和方法支撑。

参考文献

陈美伊. 基于GIS 的旅游景区虚拟实现技术的研究[J]. 软件, 2015, 36(10): 30-32.

景东升. 基于本体的地理空间信息语义表达和服务研究[D]. 中国科学院研究生院(遥感应用研究所), 2005.

李世祥. 基于语义的地理信息服务发现与组合的关键技术研究[D]. 武汉大学, 2010.

冯卫东, 孙显, 王宏琦. 基于空间语义模型的高分辨率遥感图像目标检测方法[J]. 电子与信息学报, 2013(10): 2518-2523.

梁汝鹏, 李宏伟, 李文娟, 等. 空间语义学与地理信息语义服务研究进展[J]. 测绘科学, 2013.

刘茂福, 胡慧君. 基于认知与计算的事件语义学研究. [M]. 北京: 科学出版社, 2013

张东. 基于语义相似度的地理信息检索技术研究[D]. 山东农业大学, 2011.

陈科. 语义支持的空间信息服务组合关键技术研究[D]. 解放军信息工程大学, 2012.

郑亮, 李德仁. 空间服务语义模式的地理信息服务发现[J]. 测绘科学, 2011, v. 36;No. 170(2): 130-132.

李德仁, 柳来星. 上下文感知的智慧城市空间信息服务组合[J]. 武汉大学学报(信息科学版), 2016, v. 41(7): 4-11.

梁秋实, 桑新柱, 邢树军. 利用多视点自由立体显示系统实时显示GIS 信息[J]. 软件, 2016, 37(01): 44-47.

汤大权, 唐九阳, 肖卫东. 地理信息本体开发方法及应用[J]. 地理空间信息, 2008.

张力生, 年欢, 宋辉, 等. 领域模型中关联语义的描述逻辑表示与应用[J]. 软件, 2015, 36(6): 66-74.

张瑞. 基于情境演算的交通信息服务动态组合发布[D]. 长安大学, 2016.

Di Liping. Geo Brain-A Web services based geospatial knowledge building system[C]. Proceedings of NASA Earth Science Technology Conference, 2004.

Di  Liping. A framework for developing Web-service-based intelligent geospatial knowledge  systems[J]. Journal of Geographic Information Sciences, 2005, 11(1): 24-28.

Aijun Chen, Liping Di, Yaxing Wei, et. al. Use of Grid Computing for Modeling Virtual Geospatial Products[J]. International Journal of Geographic Information Science, 2009, 23(5): 581-604.

Chen Jia, Wu Yue. Rules-based Object-relational Databases Ontology Construction[J]. Journal of Systems Engineering and Electronics, 2009, 20(1): 211-215.

Davide Buscaldi, Paolo Rosso, Emilio Sanchis. A Word Net-Based Indexing Technique for Geographical Information Retrieval[A]. Evaluation of Multilingual and Multi-modal Information Retrieval, Berlin: Springer, 2007: 954-957.

Yuan An, John Mylopoulos, Alex Borgida. Building Semantic Mappings from Databases to Ontologies[C]. In: Proceedings of the Twenty-First National Conference on Artificial Intelligence (AAAI-06), Boston, MA, July 16-20, 2006.

Christophe Claramunt, Serhei Levashkin Michela, Bertolotto. GeoSpatial Semantics[M]. Springer, 2011: 5-23.

李婷, 付雁, 季民, 等. 基于本體论的海洋流场语义分析与表达研究[J]. 地球信息科学学报, 2018, 20(10): 1373-1380.

张晓明, 尹鸿峰. 基于卷积神经网络和语义信息的场景分类[J]. 软件, 2018, 39(01): 29-34.

崔巍. 用本体实现地理信息系统语义集成和互操作[D]. 武汉: 武汉大学, 2004.

谭永滨, 朱海红, 李霖, 等. 数字城市框架下地理信息服务语义分析[J]. 地理与地理信息科学, 2012, 28(2): 5-8, 19.

易茹兰. 基于地理本体的地理信息语义表达与查询方法研究[D]. 长沙: 中南大学, 2009.

黄茂军. 地理本体的形式化表达机制及其在地图服务中的应用研究[D]. 武汉: 武汉大学, 2005.

梁子鑫. 探讨新时代背景下新兴技术在人工智能中的应用[J]. 软件, 2018, 39(7): 166-169.

猜你喜欢
空间信息本体语义
Abstracts and Key Words
结合多层特征及空间信息蒸馏的医学影像分割
对姜夔自度曲音乐本体的现代解读
语言与语义
《地理空间信息》协办单位
“上”与“下”语义的不对称性及其认知阐释
《我应该感到自豪才对》的本体性教学内容及启示
认知范畴模糊与语义模糊
关于地理空间信息标准体系
基于网格的广义地理空间信息服务