刘华尧,文思
(1.广西有色勘察设计研究院,广西南宁 530031;2.桂林理工大学艺术学院,广西桂林 541000)
空间数据库的研究一直是地理信息科学(GIS)领域的研究热点。随着信息技术的飞速发展,GIS的应用范围已经涉及人类生活的各个层面。然而,不同领域、不同部门在应用GIS系统时往往按照各自需求,采用相互独立的空间数据格式和建模方法,时空数据的组织有很大的差异,信息孤岛由此产生。
对道路而言,交通管理部门需要详细了解其路面结构、通行能力、行车方式、交通设施等与交通运输密切相关的信息;而城建部门则关注道路宽度、面积等与城市建设密切相关的信息。这两个部门对道路的概念化有很大的差异。不同部门对空间数据库的设计需要数据更加具有针对性,以适应不同行业领域的专业要求,然而空间数据的共享和互操作又要求空间数据库更加大众化,能够适应各种平台和环境[1]。这样的矛盾随着地理信息科学的发展,这种矛盾在可持续发展要求多学科多部门的协作中显得越来越突出。本体论思想的引入为解决这一问题提供了新的思路。
本体(Ontology)原本是哲学概念,最早来源于亚里士多德对事物存在本质的研究。它的含义是客观存在的一个系统本质的抽象解释和说明[2~3],从哲学意义上看,本体论关注的是“存在”,即世界在本质上有什么样的东西存在,或者世界存在哪些类别的实体,是描述领域范围内公认的知识和概念集。
本体论在计算机科学领域的发展与人工智能和信息技术的起步和发展密不可分。首先是McCarthy受学者Quine的启发,认识到哲学本体论与人工智能的逻辑构建活动之间的重叠,并于1980年提出:以逻辑概念为基础的智能系统必须“列出所有存在的事物,并构建一个本体描述我们的世界”[4]。以此为基础信息学的本体概念目前被广泛接受的定义是1995年由Gruber提出的:本体是一个领域中共享的概念化模型的形式化和显式的说明规范[5]。这种抽象的描述方法目前已经成为计算机科学的一种重要方法,尤其是在地理信息科学领域有重要应用。为了更好地将本体理论应用到地理空间的研究中首先要对地理空间的内涵进行抽象和描述。
空间是实体存在的前提和基础,空间和实体既有独立性又是统一的整体。并且由于空间和空间内实体的交互作用。这种空间的描述和理解的过程离不开语义的参与,由于不同空间体系中对同一实体的拓扑描述不尽相同就会存在语义异构,系统间难以兼容或无法发共享。而基于本体建立起来的逻辑关系知识库,是目前一般计算机甚至云计算机能够普遍接受和共享的。本体间的基本逻辑关系主要包括4种:
(1)“part-of”表达概念之间部分与整体的关系即{a1,a2,a3…,an}∈Rk;
(2)“kind-of”表达概念之间的继承关系,类似于父类与子类之间的关系即:{Rk1,Rk2,…,Rkn}⊂R;
(3)“instance-of”表达概念的实例与概念之间关系,类似于面向对象中的类与对象之间的关系即Rki∩Rkj=Ø或Rki∩Rkj≠Ø;
(4)“attribute-of”表达某个概念是另外一个概念的属性即Rki∈M。
基于本体的空间认知是将空间抽象为关系集的描述。它主要以概念网络层次的形式来表达实体间的关系,不同层级的概念是本体的基本组成元素。由此我们将本体视为由5个基本的建模元语组成[6~7],表示为:O={C,R,F,A,I}五元组结构具有深远的影响,具体含义为:
C代表概念(Concepts)或类(Classes),概念的范围很广,可以指描述、操作或生产活动等。从本体的语义层面上看,概念描述的是一系列对象的集合,包括概念名、与其他概念之间的关系等,在道路实体的抽象过程中,主要将其分为单纯道路类和交通设施类。
R表示概念之间的相互关系(Relations),用n维笛卡儿积的子集形式进行描述,表达为R:C1×C2×…× Cn。关系包括子、父类关系以及部分、整体关系等。关系是通过对象元组集合的形式进行表达,通常为二元组集合。对于道路实体而言,就表达了其包含的各种概念之间的关系集。
F表示函数(Functions),是概念间特殊的关系表达,表示公式中n-1个元素可以唯一决定第n个元素。形式化的定义为F:C1×C2×…×Cn-1→Cn。比如支线与干线的汇聚关系,一条支线最终汇聚一条干线。
A表示公理(Axioms),是永真性断言,包括对概念和关系的约束。
I空间集(Space set)是空间对象的空间属性,它包括基本点对象、线对象、面对象等。在地理本体研究中,需要同时关注空间对象的空间几何特征及空间关系描述。采用地理本体描述空间对象的空间特征的方法,对点、线、面进行抽象和定义可分为5个类:Point类、Line类、Polygon类、Compound类、Attribute类。具体抽象过程如图1所示。
图1 空间对象具体抽象过程
点(Point)类:由点的唯一标识符和(x,y,z)三维坐标进行定义。
线(Line)类:由一系列点的有序对组成,至少有两个结点,折线通过记录关键点的序列进行描述,若定位的直线仅有两个点,则为直线段,若有多条折线则为曲线,记录起点、中间的关键点、止点的有序序列,若起、止点重合,则构成环。使用函数表示为f(x,y)或者
面(Polygon)类:由外环的内区域与内环的外边界围成的中间范围。使用函数表示为f(x,y,z)
复合(Compound)类:由点线面等基本几何对象类组合而成。Compound可使用复合函数f[g(x),z]、分段函数进行表示。
非空间属性(Attribute)类:表示出几何属性以外的其他所有属性。
时空数据应是无缝化的有机整体,而空间属性和非空间属性的改变或持续都是基于时间发展的,时间的发展又通过空间属性和非空间属性的改变和持续来表现。不同空间实体相对独立的改变在时间轴上具有绝对的同步性。为了实现相对独立属性在时空内的无缝关联,基于本体的思想我们引入时间本体的概念。
时间本体是从空间内对象的一切属性发展的角度出发,把空间对象属性的改变与更替就可以抽象为一个对象在某一瞬间由于空间和属性的变化而死亡或新的对象产生。
空间对象的存在状态是在一定的时间下,空间实体客观存在的形式,是空间实体相对稳定的一个过程,一个空间对象在其生命周期里有不同的状态。空间实体状态的改变是人类认识、改造地理实体的反映,因而空间对象的产生和变更是一个瞬间状态,产生和变更采用时刻的方式表示[8]。其变化主要分为3种类型:
空间信息不变,属性信息的突然变化;属性信息不变,空间信息的突然变化;空间几何信息和属性信息的同时突然变化。
无论是持续还是变化,空间对象的死亡与产生是一个相对状态,死亡对象的空间特性与产生对象的特性是相关的平且在时间上是一致的,这样就保证了地理空间的无缝性。空间实体的发展和时间一致性如图2所示:
图2 空间对象时态的关系示意图
道路系统作为城市构架的重要组成部分,在交通、规划、旅游等行业应用中占据举足轻重的作用。但在构建道路模型数据库时,受比例尺、用途、区域特征等各种主客观因素的影响。人们对究竟应选用何种准则对路网要素进行认知、抽象、表达约束等问题未达成一致的认识,使得目前存在着多重抽象表达模式,造成路网要素多尺度表达实体和关系难以量化。本文拟从本体的角度出发,阐述道路抽象和组织。
道路本体是地理本体的子类,描述包括道路实体及实体间的关系。其中,对道路实体的描述包括空间属性和非空间属性。基于本体的空间认知过程是把空间实体的相关属性封装为整体,将概念、空间属性和非空间属性进行一体化的组织和表达,既实现了语义共享遵循了人类认识现实世界的思维过程,又使用数学方法定义了道路对象、对象所在空间以及对象直接复杂的逻辑关系(如图3所示)。
图3 道路本体的认知过程
道路对象的本体描述可以视为是道路实体、现象、特征等以及对他们的描述的总和,在离散的三维空间中,可以将道路对象的本体描述成一个一维数组[9]。
其中,R表示任意路段{R,a1,a2,…,an}表示该路段的道路对象、特征等的集合。
假设α是关于空间变量ai的离散空间,β是该空间的一个路段,我们就可以把自变量β及其在α上的空间参变量变量ai视为一个ai关于R的函数f(R,ai)。f(R,ai)就是一个道路实体,是具有完整道路要素的最小逻辑单元。
对道路的本体描述可以定义成一个五元组Ot= {CP,EP,F,S,L}。其中CP表示道路本体的概念集,控制本体描述的客观性;EP是概念集及它们之间联系的精确定义;F是实例声明集,它确保了Ot的实例是精确地数学描述;S是CP、EP的定义集,它保证了本体中反映的知识是其使用者共同认可的;L是图层要素主要反映了道路实体之间的拓扑关系和属性关联。Ot的定义是在实体之间建立了明确的逻辑关系和语义联系。由此道路实体在本体空间数据模型的描述即为一个三元组E={Ot,f(R,ai),L},模型的构成如图4所示。
图4 基于本体的道路实体数据概念
该模型以实体为单位对道路的地理信息进行组织,把客观世界作为整体看待,在保证了传统模型便于理解和易于实现等优点的基础上,增加了道路实体之间的逻辑关系和语义联系,进一步扩展了传统模型的。通过对道路对象的本体化描述,实现了道路对象的结构化,数学化、封装化,描述了道路对象之间的空间和逻辑关系。
时空数据模型的建立必须符合人的认知规律,图5所示,基于本体的GIS时空数据模型是将空间对象的变化划分为对象的属性改变(Ⅰ、Ⅱ),对象的合并与分解(Ⅲ、Ⅳ),对象的继承(Ⅴ、Ⅵ)3种基本类型。图中以道路的交通信息为例既描述了变化的类型,表达了空间对象属性信息不变而空间几何信息的突然变化、空间几何信息和属性信息突然变化的两种死亡类型,空间对象空间几何信息不变而属性信息突然变化的死亡类型。
基于本体的GIS时空数据模型非常直观地表达了道路对象的变化过程,是地理现象随时间变化的原始表达,且能够很好地恢复历史上某一时刻的所有信息。在整个历程中,只存储变化的空间对象,没有变化的空间对象只需存储一次。因此,每变化一次,只需记录很小的数据量。
图5 道路实体的特征变化
道路实体是一个个彼此相互连接的对象,而且辐射范围广泛,涉及内容众多。合理的拆分道路的各种要素是实现科学组织和管理道路信息的重要保证。
基于本体的概念将城市道路实体拆分,首先将道路实体拆分、抽象,进而得到单纯道路和交通设施两个子类,子类中根据不同的功能进行实例化。依据基于本体的地理空间数据模型建模方法,城市道路实体抽象为3个层次如图6所示。
图6 道路的抽象层次
基于本体的地理空间数据模型将城市道路本体按照模型的要求存储在Oracle Spatial对象—关系数据库中,每个道路实体占用一条记录,图形信息存放在SDO _GEOMETRY类型的字段中,数据库表之间通过对象标识建立联系。
抽象得到的道路实体的概念及相互关系采用本体模型进行组织,用W3C公布的本体描述语言OWL进行描述,最后存储到Oracle XML/OWL中。
数据库表主要包括道路表、交通设施表如图7所示,每个表中都包含了由本体概念决定的定量定性的道路属性和设施的属性,不同的箭头代表了不同的函数映射关系,是对道路本体各种属性和联系的定义。每个表表示一个图层L,不同道路对象使用相同的属性或者相同的映射关系就是它们在图层L上的联系。道路表不存储对象的位置信息,只存储组合对象信息和简单对象的地址信息。道路的几何信息和属性信息的改变的关联通过时间序列关系连接,保证了属性几何信息和非几何信息的同时更新和记录。
基于本体的地理空间数据模型从人类的思维角度出发,研究地理世界中语义和逻辑关系的描述与表达,将现实世界中的地理现象用空间本体及本体间关系来描述。在信息管理方面,模型以本体的方式存储空间实体,该方法具有实体管理、修改方便、查询检索、空间分析容易等优点。更重要的是它能够方便的构造用户需要的任何复杂空间实体。该模型的存储方法实现了空间实体的图形信息和属性信息的一体化管理,突出了语义信息的管理,可以解决不同系统间易造成语义理解误差甚至错误的问题。对现有数据模型进行了扩充,为智慧城市地理信息的表达、存储和共享等操作提供了借鉴。
[1] Rodaric B.The design of GSC field Log:ontology-based software for computer aided geologicalmapping[J].Computers&Geosciences,2004,30(1):5~20.
[2] 赵波,陶跃华.本体论及本体论在计算机科学技术中的应用[J].云南师范大学学报·自然科学版,2002,22 (6):5~7.
[3] 邓志鸿,唐世渭,张铭等.Ontology研究综述[J].北京大学学报·自然科学版,2002(5):730~738.
[4] JMcCarthy.Circumscription-A form of non-monotonic reasoning[J].Artificial intelligence,1980,5(13):27~39.
[5] Mennis JL,Peuquet D J.A conceptual framework for incorporating cognitive principles into geo-graphical database representation[J].geographical information science,2000,14 (6):501~520.
[6] 李景.本体理论及在农业文献检索系统中的应用研究一以花卉学本体建模为例[D].北京:中国科学院,2004.
[7] 王洪伟.基于本体的元数据模型的建立研究[D].上海:上海交通大学,2004.
[8] 李景文,傅玮佳,叶良松等.基于对象的GIS时空数据模型设计方法[J].地理与地理信息科学,2010,26(6):11~14.
[9] Goodchild F.Geographic datamodeling[J].Computer and Geo-sciences,1992,18(4):401~408.