(河海大学商学院,211100)
基于本体的防汛信息系统设计
祝 源
(河海大学商学院,211100)
近年来,伴随着水利信息化的不断推进,系统开发者和系统用户之间沟通困难的问题开始涌现,严重阻碍了系统开发的进程。本文回顾了国外本体研究的进展,分析了国内基于本体的信息系统开发的实践,通过使用本体能力问题帮助系统开发者获取用户需求,并研究了本体在数据库中的存储设计。
本体;信息系统;防汛
防汛工作往往由防汛指挥部牵头,各个地方水利局或者水利站协同工作,这就牵涉到各地方防汛工作小组对于一些问题的共同理解。一方面,系统开发人员由于不是防汛专业人员,短时间内难以理解防汛业务使用的专用术语;另一方面,防汛人员由于对系统开发的过程、技术手段等缺乏了解,而且用户可能并不确切知道自己的需求是什么,并将需求确切的表达出来,不知道该提供哪些资料帮助系统开发者了解系统需求。本体就是通过形式化地定义领域概念,使得不同的人能够对这些概念和问题实现共享认识。现有的防汛信息系统在系统规划之初就没有考虑到这一问题,他们往往针对各个地区所特有的问题,各个地方水利单位自身的情况而进行单独的需求分析,造成需求的重复获取,不能有效地利用以往的开发经验。因此通过构建一个防汛知识本体,生成能力问题库,为未来的防汛信息系统的开发提供需求参考。
为了提高员工操作环境的安全性和提升企业在全球市场的竞争力,企业使用人工智能模拟(human simulation)对员工的工作环境进行仿真。然而,环境模型构建的需要大量的时间与精力投入,Seonhwa对基于本体的建模方法进行了验证,节省了企业的建模成本。
当前的本体构建主要存在2种途径:从基于数据库的本体构建和自顶向下或自底向上的概念体系构建方法。Ra将两者进行了结合,提出了一种混合构建方法(MOBM):首先基于数据库构建本体核心,再通过概念体系法进行补充实现本体的构建,帮助企业更有效的进行知识表示。本体开发前期需要大量的准备工作,包括长时间的数据准备和结果解释,昂贵的专家咨询和共识建立过程。针对这一问题,d’Aquin提出对数据挖掘和本体工程的相互作用进行研究,实现一种半自动获取数据资源的方式,进而实现知识获取。
Adigun使用FOX方法构建了动态环境下的自适应协作构建了本体,实现了动态环境的知识共享。Nagata基于顶层本体Goi-Taikei,使用半自动方法构建了日本维基百科本体,产生了良好的分类系统。为了更好地回答用户的提问,本体在信息检索领域得到广泛使用,然而随着新概念以及概念关系不断出现,有限的本体库需要得到相应的更新。Mustapha提出了一个基于案例推理的本体学习框架,帮助本体库进行更新。
尽管本体可以用于组织和系统之间的沟通,支持通用软件系统的开发,但是使用本体进行知识建模的应用却很少,原因在于每次开发的本体都是服务于某个特定的应用,不会考虑到本体的分享和再利用。各个研发团队拥有自己的一套原则,他们遵循自己的一组开发原则开发本体,由于缺乏一个统一的本体开发的原则和开发方法,各开发团队之间的无法进行有效的知识共享,已经开发出的本体不能被其他的本体开发项目重用。针对这一现状,不同的研究者开始着手研究本体开发的方法论。另一方面Pinto等研究了本体融合的问题。一个学科是否成熟的标识在于是否存在广泛接受的方法论,当前不同的研究小组使用各自的方法和流程开发本体,从这个角度讲本体工程还处于发展阶段。
当前,本体是由少部分专家或者研究人员开发,这和远远多于开发者的使用者形成对比,数量上的巨大差异产生一些问题:首先,本体使用者不能控制本体的发展;其次,本体使用者不能完全掌握一个概念的内涵。这些都是因为本体的开发和使用是分开的。
近年来随着信息系统在各个行业的应用越来越广,考虑到本体在信息组织和信息表示等方面的强大优势,人们开始尝试将本体和信息系统的开发进行结合。将信息系统和本体作为关键词进行组合,对CNKI数据库进行检索,近7年来国内基于本体的信息系统构建与研究如表1所示,按照研究人员、年代、信息系统进行组织:
表1 基于本体的信息系统
基于本体的信息系统研究前提是所应用的领域信息化程度较高,不仅有信息化的标准,信息系统的发展也达到一定的阶段,因此基于本体的信息系统研究应该是立足于成熟的信息系统开发之上的。虽然不同行业的信息系统随着领域知识的变化而存在差异,但是将本体引入信息系统的开发存在以下几个目的:
(1)建模工具:由于本体具有的共享特性使得同一个应用领域内,不同的业务人员在开发系统时可以共享本体概念模型;基于本体的系统建立之后,各个子系统可以共享这个本体,实现数据和信息的共享。另一方面,由于本体对领域内概念的定义、概念之间的关系有明确的形式化的定义,遇到新的现象、实例都可以纳入已有的本体知识结构中,极大方便了未来系统的升级和扩展。
(2)互操作性:大大小小的“信息孤岛”阻碍了系统之间的互操作性,通过共享统一的本体模型,不同的系统之间的互操作性将会大大增强,从系统层面加强了企业各个部门的协作;另一方面,使用本体帮助各个部门理解彼此系统的结构,提供一个沟通的平台。
(3)数据集成:基于本体的信息系统大多具有分布范围广的特点,并且已经建成的各地信息系统较为成熟,推倒重新设计系统代价太大,因此通过本体进行数据集成,从而实现对信息资源统一管理的目的。本体不仅是用于业内人员的协作,也用于企业对外信息的发布。
针对防汛知识的无序组织现象,本文初步研究了工情知识和雨水情知识,构建相应的知识本体。借鉴了METHONTOLOGY和TOVE,设计了防汛知识本体构建流程,如图1所示:
图1 本体构建流程
3.1防汛本体构建目标和范围确定
防汛知识往往和水利知识组织在一起,作为水利知识的一个分支而存在。当然防汛知识主要以专业书籍、行业文件、省市的水利网站、防汛工作手册等形式存在。构建防汛知识的本体需要尽可能多地收集防汛资料,搭建一个领域核心知识体系,确定本体的相关领域范围,从而使防汛领域本体的构建有明确的路线。
3.2防汛核心概念提取与分析
水利领域相关的概念非常多,但我们在描述核心知识体系时不需要将所有概念一一列举,而是筛选出和防汛密切相关的概念,作为防汛本体中的核心概念。
3.3顶层本体构建
防汛知识本体构建过程中的选词、概念之间的属性关系确定及最终本体逻辑体系的形成都需要征询防汛领域专家的意见。在本体初步逻辑体系形成过程中,邀请领域的专家一直协同工作。在属性关系确定环节,邀请参与防汛工作的一线人员和水利专家参与讨论,对制定的属性关系进行评判,如果同意则进行下一步骤,不同意则针对主要的不足之处重新进行选词,对于专家之间的不同意见进行沟通和协商,形成最后的统一意见,最终形成本体逻辑体系。
本体的存储主要分为两种途径:文件存储和数据库存储。数据库存储主要分为XML数据库和关系数据库。基于文件的本体存储随着本体规模的不断扩大,后期维护成本越来越高,查询效率也会降低;相比较基于文件的存储方式,基于数据库的本体存储查询效率高,并且有许多数据库产品如Oracle、MYSQL、SQLSERVER等可供选择。由于关系数据库技术已经成熟,许多数据库产品也已经投入商用,并且现有的防汛信息系统大多使用关系数据库进行数据的管理,使用关系数据库可以直接以知识查询模块的方式加入现有系统,因此本文选择关系数据库存储防汛本体。
OWL本体之所较其他本体语言有更强的语义描述能力在于它有更多的描述概念与概念之间关系的机制。OWL本体元素主要包括概念、属性和实例等,属性分为对象属性和数据属性,通过对OWL语言和关系模式的比较分析,分别设计fClass、fInstance、fProperty三个表来存放本体中的概念、属性和实例。OWL本体中概念之间的关系是通过对属性的定义域和值域的设置来完成的,分别设计表定义域表fDomian和值域表fRange来存放本体中的属性,其中Class为外键,与表fClass相联系。概念之间有子类父类的关系,有等同关系,有不相交关系,分别设计表fSubClass 、fEquivalentClass、 fDisjointClass,都通过外键Class与fClass表相连。例如要想知道分洪区属于防汛体系中的上层概念,可以在fSubClass表中检索分洪区,得到它对应的上次概念是蓄滞洪区;另一方面,字段superclass的值为蓄滞洪区的所有记录的class都是蓄滞洪区的子概念,可以得到蓄洪区、滞洪区等概念。本体存储模式如下图所示:
图2 本体的关系存储模式
由上图可见,本体各个概念之间的关系在关系数据库通过外键相联系,本体如果发生变化只需要对各个关系表的记录进行增加或删减,而不需要修改数据模式,缩小了本体维护的代价。系统开发人员也可以依据上图进行查询语句的设计,开发基于本体的防汛知识系统。
传统的信息系统的建模,概念的使用相对分散,各个地区,各个部门都有各自的系统建设标准,容易形成信息孤岛。由于系统开发人员对防汛知识缺乏系统了解,系统需求获取受到很大的限制。防汛本体的构建为专业系统开发人员和防汛工作人员架起了一座沟通的桥梁,开发的信息系统更能满足防汛人员的需求;另一方面,基于本体的信息系统构建方法将本体建模引入到信息系统的建模过程中,为信息系统的建模提供了理论依据。本文在回顾国内外本体研究的基础上对基于本体的信息系统开发过程中的需求获取和本体的存储进行了研究,下一步将进行系统的实施。
[1] Jeong S,Wegner D,Noh S.Validation of an ontologybased approach for enhancing human simulation in general assembly environments[J].Proceedings of the WCE,2010,3.
[2] Ra,Minyoung,et al."The Mixed Ontology Building Methodology Using Database Information." Proceedings of the International MultiConference of Engineers and Computer Scientists.Vol.1. 2012.
[3] d’Aquin,M.,G.Kronberger,and M.Suárez-Figueroa. "Combining data mining and ontology engineering to enrich ontologies and linked data." Workshop: Knowledge Discovery and Data Mining Meets Linked Open Data-Know@ LOD at Extended Semantic Web Conference,ESWC. 2012.
[4] Adigun,Adepeju A.,and Michael O.Kolawole. "Building Ontology for Adaptive Collaboration in a Dynamic Environment." International Journal of Computer Science 9 (2012).
[5] Malik,Sanjay Kumar,Nupur Prakash,and S.A.M. Rizvi."Developing an university ontology in education domain using protégé for semantic web." International Journal of Engineering Science and Technology 2.9 (2010):4673-4681.
[6] Jonquet,Clement,Mark A.Musen,and Nigam H.Shah. "Building a biomedical ontology recommender web service."Journal of biomedical semantics 1.suppl. 1 (2010):1.
[7] Nagata,Masaaki,Yumi Shibaki,and Kazuhide Yamamoto. "Using Goi-Taikei as an Upper Ontology to Build a Large-Scale Japanese Ontology from Wikipedia." 23rd International Conference on Computational Linguistics.2010.
Design of flood control information system based on Ontology
Zhu Yuan
(Business school of Hohai university,211100)
Currently,there is communication problems between the users and the system developers,which seriously hold back the development of flood systems.This paper analyzed the research and application of ontology,designed the management information system based on Ontology.Using competency questions to help system developer to acquire the users’needs,This paper make an attempt to store the Ontology in database systems.
ontology;information system;flood control