贾佳
(河南测绘职业学院,河南 郑州450000)
由于地理数据需要从多个维度进行数据的分析与处理,数据结构复杂,逻辑关系难以明晰,因此在时空数据挖掘时较为困难。超图模型在数据挖掘中主要用于进行高维数据聚类问题的解决,其理论较为严谨,且具有灵活的结构体系,因此,基于超图模型而总结出超图时空数据挖掘法并将之应用于地理信息的数据挖掘可使地理数据信息分析与处理更加高效与精准。
以超图结构为根本而建立起来的模型就是超图模型。其以图论为基础,将集合论融入其中共同组成了超图理论。其是将属性特征一致的对象归纳为一个集合,在集合当中再将具有更高层次共性的集合再次归类,进而使集合中呈现出层次化的结构。这些集合之间会形成二元关系,一个集合可与其他集合进行映射,同时也被其他集合映射,这种多对多的映射方式就是集合之间关系的重要体现。
类与对象是超图模型的基本构成元素,类与对象各自的属性也是其重要的结构之一,同时不同类的链接以及不同对象的链接也是重要的结构组成内容。超图模型有多种结构属性:可以是单一数值也可以是多维数值,某个特定程序或法则也是其属性之一,此时主要是对某个对象或类所进行的合法操作进行准确描述,这与对某个对象进行的描述具有一致性。同时可以运用超图进行描述的某个结构也是其结构属性之一,此时可实现对较为复杂的对象进行描述。基于此,如果所要研究的是较为复杂的对象,那么就可运用结构与其子结构共同进行对象组成的描述,也可对不同对象之间的关系进行分析。在链接以及超链接模式下,超图模型可以对不同的类或不同的对象之间的层次关系进行表达,也可描述其非层次的关系,具有一定的灵活性。具体可描述的内容有分类、概括,也可对聚合以及多层次联系进行阐述,此外,还可描述复合类以及分割等关系。
地理现象可由时间特征、属性特征和空间特征共同表现。二十世纪七十年代,外国专首次提出超图数据模型,利用该结构模型可以对现实中的实体物质进行描述,在地理信息系统领域当中应用超图数据模型尚属首次。地理时空数据之间的关系有多种表现方式,既有空间、时态以及时空等单一的关系,也可将这些单一的关系进行组成而形成属性或时间属性关系,此外还有空间时间以及空间属性关系。时空数据挖掘正是以这些不同种类的关系为基础而进行的。在时空数据挖掘时要对这些关系进行分析与考量,否则其与得出的规则分析可能不准确或得到不正确的知识内容,得到的知识内容也可能不具有实用性。在地理信息系统当中,地理、经济乃至人文等多个不同的地理要素在空间分布方面都各不相同,时间过程也存在较大差异,进而可以实现物质世界层次等级的描述,也可对不同物质之间的关系进行相应的体现,并反映出其具体的网络结构特征。由简至繁、从无到有、自低向高是世界变化的规律,地理信息关体也具有层次化的特点,同时也具有非层次化的特征。正是由于地理信息关系的复杂性,将超图模型应用于地理信息数据的挖掘可以展现出良好的数据挖掘效果。
关系- 对象型的地理数据库(Geodatabase)属于新型的空间数据模型,其是在面向对象技术的基础上而实现对现实空间世界的抽象化,将之组成数据模型,该模型是多个不同对象类的集合,同时,可在此数据库中进行面向对象的空间实体的有效存储,这些对象类都具有各自的属性,同时行为清晰,规则明确,并且不同对象类之间还会相互关联与影响。该数据库在对空间对象的坐标进行存储时,是以长二进制型数据进行存储的,且保存于某一字段当中,随后又将该字段的属性存储其中,实现了空间与属性两种不同数据的组成,使二者共存于一个数据库当中,此种存储方式较为简便,极大的降低了空间数据存储的复杂程度,进而使空间数据的查询粒度得以进一步明确,可以更好的进行空间对象所具备的时空数据的有效表达,也使其组织形式更加清晰。
关系数据库中存储了多种方法,如概念泛化,此外还有归纳学习法,这些方法可发现于时间知识拓展过程中。关系型时空数据库由两个部分组成,一是空间部分,其属于二维空间,属于空间数据结构的组成部分之一。二是非空间部分,其数据属性为时间,其主要存储于关系数据库当中。空间与非空间数据库采用ID 链接而建立关联。采用概念泛化技术可以实现对空间及非空间数据的有效泛化,在对空间数据进行泛化时,非空间数据也需一同进行泛化,无法单独对其中之一进行泛化。
关系- 对象型地理信息数据库中所存储的空间与属性数据都位于关系数据库当中,且存储位置相同,进而形成了地理空间数据库。在时间知识提取过程中,可采用概念泛化方法实现空间与非空间数据的有效融合,使之形成整体,进而作为时空数据挖掘实现的根本。时空数据泛化开始前,首先要将关系-对象型数据库中所存储的相应要素反映到超图之上,要求被反映的必须为带权的超图,同时也要将各要素之间的关系在超图上体现出来。在超图当中,某一要素或某一对象可以点的形式体现出来,其与超图模型的对象属性一一对应。同时要素及对象类也可以类的形式体现于超图模型之上,并且其与超图模型中所存储的类的属性相对应。此外,要素数据的集合也可以超类的形式映射于超图模型之上。关系类以及规则既可以类的形式映射于超图模型,也可映射为不同对象间具有赋值的链接,还可以映射为具有一定限制或操作要求的链接。在关系- 对象型数据库中可以实现对时间或空间等单一属性的泛化,也可对专题之中的任一属性进行泛化。这种单一的属性可以是超图中某一对象的特征,也可以其为依据进行对象类别的划分,进而运用链接进行数据结构当中各项数据的有效分离与提取。链接的类型可以替代要素或要素类所组成的链接,同时要素层次结构可对其进行替代并实现有效处理。也就是说,在超图链接的作用下可以实现时间及空间等各个要素、属性以及各个要素类的有效传递。在此之中,如果所传递的类或对象是以具有赋值的弧的形式存在,也可将赋值向端点进行传送,进而使弧段的赋值转化为所传递端点的值,进而构建出含有类的结构。关系类或规则可以类或对象的形式映射成为超图模型中具有赋值的链接,有时所映射的链接具有一定的限制条件,因此,以超图模型为基础进行时空泛化时要受到一定条件的限制。然而首次进行某一特定属性的泛化时,未必可以一次就实现预期的概念泛化,也有可能出现泛化值的数量比预设的泛化数值更多的情况。因此,有时需要将这一泛化结果映射到超图模型当中,进而通过再次泛化而使之与预期的概念层次相一致。有时甚至需要进行多次有条件的泛化,才可以将之转化为预期的泛化关系,进而使之形成逻辑公式。
在国际领域当中时空数据挖掘技术得到了高度重视,然而由于其研究并不深入,与当下社会的应用需求还有一定差距。在时空数据挖掘研究当中,时空信息及数据模型是其研究的核心内容,然而在地理学领域已掌握了一定规模的地理信息数据,因此以此为依据建立地理信息数据模型,可以实现时空数据挖掘的进一步研究与验证。在空间数据库系统当中超图模型具有一定的作用,同时也可应用于地理信息系统当中,其必然也会在时间数据挖掘领域发挥出极为重要的功能价值。