语义级互操作的关键技术研究*

2016-08-10 03:33晋芳华钱兴华
舰船电子工程 2016年7期
关键词:信息共享

晋芳华 刘 鹏 钱兴华

(中国舰船研究院 北京 100192)



语义级互操作的关键技术研究*

晋芳华刘鹏钱兴华

(中国舰船研究院北京100192)

摘要语义级互操作是促进系统间数据互操作,提升系统信息共享程度的重要方法与途径。针对异构信息系统语义级互操作涉及的本体异构等核心问题,提出基于NIEM的语义级互操作解决框架及实现流程,并分析关键技术。

关键词语义级互操作; NIEM; 信息共享

Class NumberTP391

1引言

诸如数字化图书馆、智能交通、智能电网、智能医疗、智慧城市、军事信息系统等广域分布、组成异构的复杂系统集成运行涉及海量信息交互、共享。互操作是实现异构系统信息交互和共享的关键技术。异构信息系统之间实现信息交互的基础做法是采用协议转换,即数据源协议数据包转换为目标协议数据包。实际中由于语言复杂性、管理维护水平和业务发展变更等因素,异构系统间的信息语义难以被完全统一定义,难以直接利用固定的映射模式来完成数据的转换,大量的机器与机器之间的信息交互无法自动完成,需要人工参与(即人与机器的交互),严重影响系统工作效率。为实现异构系统之间消息高效交换和信息共享,需要在语义层面开展研究。

学者们从语义级互操作概念、信息源语义表达、语义异构分类以及语义互操作框架等角度展开研究。文献[1~2]重点从互操作概念角度出发进行研究。文献[1]梳理了不同组织对互操作概念内涵的定义,并总结出互操作的共性理解:一是互操作发生在两个或多个需要进行信息交互的实体或系统之间,二是实体或系统之间能够交换信息,三是实体或系统能够使用所交换信息;文献[2]提出概念互操作等级模型(levels of conceptual interoperability model,LCIM),以分层的形式给出互操作每层做出定义,并指出语义互操作不仅可以在系统间交换数据本身,也包括数据的语境,并借助公共数据参考模型,使被交换的数据具有清晰、无歧义的语义;文献[3~4]重点从信息源的语义表达角度进行研究,文献[3]通过对比分析XML、RDF、OWL等描述语言,指出OWL在表述语义概念、属性和关系上比其他语言有优势,文献[4]指出元数据是结构化的编码数据,它是描述数据的数据,是揭示信息资源的基础,文献[5]指出本体是对共享概念的形式化的明确说明,以面向对象的思想,建立信息源中抽象概念的关系和约束。文献[6~8]重点从语义异构分类进行研究,文献[6]以知识组织体系角度,将异构概括为句法异构、术语异构和概念异构,并介绍几种知识组织体系互操作方法;文献[7]将异构信息源之间分成了三个层次的语义异构,即模式异构、上下文异构和个体异构,并重点给出了消除上下文异构和个体异构的解决方法。文献[5]将本体的异构分成了概念和语言两层异构,并对每层异构做细粒度划分,指出本体的集成核心问题就是解决概念和语言两层的异构。文献[8]重点从语义互操作框架角度进行研究,分析了作战仿真系统与指控系统在架构、信息交换模型、通信协议以及数据库上的异构性;设计了由接入层、资源层、语义交互层、服务层和应用层等构成的语义互操作技术参考框架,文献[9]在分析了主题图(Topic Map)技术解决数字图书馆语义互操作的可行性的基础上,在分析了数字图书馆特性的基础上,设计实现了基于XTM语义互操作原型系统,该原型系统包括资源层、元数据层、主题层和应用层等四层。文献[10]运用元模型互操作框架(Metamodel Framework for Interoperability, MFI)和本体技术,建立了一种支持语义互操作的Web服务注册管理模型的体系架构,运用MFI中的本体演化规则保证了本体在演化前后的一致性,从而保证基于本体的不同Web 服务注册库的互操作性。

综上,在信息源中查找并使用有效数据涉及的一个关键问题是必须知道信息源的语义。为实现应用系统和信息源语义的解耦合,促进信息共享,需要将信息源的语义通过本体显示表示。但是不同信息源之间的本体存在异构,如何有效地解决本体之间的异构,使得异构信息源实现信息集成与信息共享,是语义级互操作的核心问题。框架性的研究多聚焦于具体应用,对框架移植性与复用性等因素考虑不足。本文从语义形式化、语义异构消除和功能扩展等角度分析语义互操作的关键点,在考虑灵活性和可扩展性的基础上,提出基于NIEM(National Information Exchange Model)的语义级互操作通用解决框架和实现流程,并分析其关键技术。

2语义级互操作分析

2.1互操作

互操作是指两个或两个以上系统间能够相互交换信息,并使用交换信息的能力[11]。从复杂系统的设计和开发提供指导角度,通过划分描述系统、组件或服务间传递信息和知识的能力,概念互操作等级模型(levels of conceptual interoperability model,LCIM)将互操作分成了六层结构[12],具体如表1所示。

表1 LCIM等级描述

在信息共享与信息集成中,语义级互操作属于第三级互操作,在整个互操作等级模型起到承上启下的作用。语法级互操作只能依靠应用程序的逻辑来表现的语义,表现出程序耦合度高,开发慢,利用率低等问题。而语义级互操作针对语法级互操作的问题,通过将信息系统中的语义显示化,依靠公共数据参考模型,实现信息系统在交换数据本身的基础上,也交换了数据的语境,从而解决了异构信息系统语义歧义的问题。

2.2语义级互操作关键点分析

当前系统多面临数据和信息量飞速增长的局面,受自然语言的复杂性多义性、系统管理维护水平以及业务需求发展变更等因素影响,仅靠语法级层面的互操作难以应对“语义歧义”、“信息利用率低”等问题,所以语义级互操作成为问题关键解决办法。

由于行业领域、用户习惯、技术路线等因素,不同系统发展建设过程中难以遵循统一的标准,不同信息源会建立各自的语义形式化模型,在跨系统集成实现信息共享时便面临语义互操作问题。语义级互操作的核心问题便成为在不同信息源建立起的语义形式化模型基础上进行形式化模型的集成。独立开发的语义形式化模型可能采用不同概念表达模型和语言,形式化程度各不相同,不同领域知识可能重复或交叠,存在多种不一致。为了解决这种不一致问题,就产生了语义异构分类以及语义异构消除等研究,通用的语义异构消除策略是,建立公共的数据参考模型作为异构信息源的语义形式化模型的中间模型,完成异构信息源形式化模型的转换,从而避免了异构信息源P2P模式的冗余转换,将语义异构消除问题的解决方案复杂度从N2级转到N级。虽然从整体上语义互操作已经有了完整的解决方案与框架,但是引入的公共参考数据模型增加了该模型管理、可扩展性以及重用性等问题的考虑。同时随着信息处理自动化和智能化需求不断提高,充分利用交换信息,达到提高交换信息的利用率以及交换信息冲突自动检测等扩展功能成为必须考虑的问题。

通过以上分析,可以将语义互操作的关键点梳理为:语义形式化、语义异构消除和功能扩展等三个关键点。

1) 语义形式化

语义形式化是语义互操作的基础。语义的形式化分两个层面:语义形式化语言、语义形式化方式。语义形式化的主要方式包括元数据和本体,元数据是结构化的编码数据,用于描述有关信息实体的特征,从而标识、发现、评估和管理这些被描述的实体,它是描述数据的数据,是揭示信息资源的基础[13]。本体是对共享概念的形式化的明确说明。这里共享概念指多个主体所感兴趣的某特定领域的抽象,形式化是指可以被机器处理,明确地说明指概念、属性、关系、函数、约束、公理都有明确的定义[14]。分析发现,元数据和本体都在语义形式化上起到一定作用,但是元数据更偏向于抽象信息资源,本体则侧重于建立概念和术语之间的关系和约束,所以充分利用元数据和本体的优势建立基于元数据的本体模型是信息源语义形式化最好的选择。

语义形式化语言包括XML Schema、RDF、OWL等,XML Schema定义了文档标记的语法规则,并以层次结构的形式规定了所有以其为标准的文档,包括数据对象的数据属性的类型、嵌套层次、取值范围及约束条件等,完全能够实现LCIM描述的语法级互操作并能够实现部分语义级互操作甚至更高的语用级互操作;RDF建立了以主语、谓语和宾语为元素的“三元组”数据模型,可以把一些非常简单的元数据说明组合在一起,使得文档能够被解析,实现异构系统的信息交换,RDF在LCIM所描述的互操作能力上与XML相似[15];OWL(本体描述语言)在RDF的基础上通过添加大量的基于描述逻辑的语义原语来描述和构建本体。OWL采用面向对象的方式来描述领域知识,即通过类和属性来描述对象,并以公理的形式来描述这些类和属性的特征和关系[3]。由于其使用了描述逻辑的语义原语,使得它可以实现LCIM的语义级互操作,可以部分实现语用级互操作,所以OWL是最能满足语义形式化的语言。

2) 语义异构消除

语义异构消除是语义互操作的核心。语义异构消除需要做两方面的工作:语义异构分类、公共数据参考模型构建。信息源主要包括概念层和语言层两层语义异构,概念层异构又可以根据建模时的差异和概念具体化使得差异进行更细粒度的划分;而语言层的异构同样可以根据语法差异和表达能力的差异,进行细粒度划分[14]。公共数据参考模型的构建的通用作法是依据各信息源的本体建立上层本体(领域通用本体),通过建立各信息源本体与上层本体建立关联,从而消除各类语义异构,达到异构信息源之间信息语义共享的目的。

3) 功能扩展

功能扩展是语义互操作的扩展。功能扩展的主要工作是提高交换信息的利用率,达到信息增量与检测信息语义冲突的作用。信息源之间交换的数据,不光数据本身,还包括数据的语境。将数据的语境映射到领域本体上,通过定义领域语义规则,实现交换的数据依据领域语义规则和领域本体的语义推理,达到检测交换数据之间的冲突和信息增量的目的。

3基于NIEM的语义级互操作技术参考框架

针对语义级互操作的关键点,将语义级互操作框架分四层,自下而上分别是语义表达层、互操作层、功能扩展层和应用层,如图1所示。

3.1语义表达层

语义表达层是语义互操作框架的基础,对应语义互操作关键点的语义形式化,用于实现信息源语义的显示化表述。元数据是基础,用于描述信息资源在特定情形下的微观结构。元数据经过抽象,对资源语义化标注,不仅有利于资源的发现,也是实现互操作和有效利用资源的基础。知识本体是在元数据对信息资源封装的基础之上,通过描述不同元数据方案在语法和语义上的差异以及信息资源之间的复杂关系来完成信息源的语义形式化表达,从而为分散信息资源的整合与管理提供模型与方法[16]。

图1 基于NIME的语义级互操作技术参考框架

3.2互操作层

互操作层是语义互操作框架的核心,对应语义互操作关键点的语义异构消除,用于解决各信息源间的语义异构问题。互操作的基础是信息系统的知识组织体系的互操作[6]。在分析信息系统间知识组织体系异构的基础上,建立关于知识组织体系的公共参考数据模型。公共参考数据模型具有层次之分,主要与数据抽象粒度相关。NIEM数据模型包括三个部分核心数据模型、领域数据模型和领域数据词典三个部分,其中核心数据模型(National Information Exchange Model)通过把各个业务领域普遍应用的时间(When)、地点(Where)、人物(Who)、事件(What)等,通过语义和语法进行统一,然后由各个业务领域在此基础上进行扩展,并以开放性、扩展性的语言来表示,形成信息系统相互理解和认识的“五线谱”[17],领域数据模型在核心数据模型的基础上匹配、扩展、演化,形成与领域相关的概念、术语以及它们的关联与约束,领域数据词典指领域数据模型中可被引用的概念与术语。基于NIEM的领域数据词典,利用NIEM核心数据模型具有的高抽象、高扩展等特点,通过匹配与扩展等手段,构建出与应用相关的联合本体,分别建立信息源本体与联合本体的映射,实现信息源之间的语义转换,解决了公共参考模型的管理与模型组件的扩展、重用等问题。

3.3功能扩展层

功能扩展层处于互操作层与应用中间,是语义互操作框架的扩展,用于提高交换信息的利用率,达到信息增量与检测信息语义冲突的作用,并对互操作层进行服务封装,形成服务接口,为应用程服务。功能扩展层以本体和语义推理为基础,实现信息查询、语义交换、语义推理、冲突检测和信息增量等功能。

3.4应用层

应用层是指各种具有信息系统协同工作的领域,主要包括数字图书馆系统、数字化变电站系统等传统基础设施的信息共享与集成以及物联网、分布式仿真系统的信息共享和军事电子信息系统集成等。

图2 基于NIEM语义级互操作流程图

4语义级互操作实现流程分析

综上所述,语义互操作的实现需要:1)信息源本体构建,信息源语义的形式化的明确说明;2)公共数据参考模型(联合本体)构建,基于NIEM数据模型的联合本体构建是实现语义互操作的核心;3)语义映射,建立信息源本体与联合本体之间的映射关系,完成信息源之间语义异构消除的目的;4)语义推理,扩展语义互操作功能,实现交换信息的信息增量与冲突检测。

依据语义级互操作技术参考框架和关键点分析将实现流程划分为构建信息源本体库、构建联合本体、建立联合本体和信息源本体的映射关系、语义推理和应用五个部分。并将每个部分的关键步骤列出,如图2所示。

5语义级互操作关键技术点分析

语义互操作参考技术框架和实现流程的实现依赖以下关键技术。

5.1基于元数据的信息源本体构建技术

基于元数据的本体构建技术是指选定具体领域,对其资源进行总结、抽象出领域本体,从资源中提炼知识的过程。该技术的作用是信息源的语义形式化,对应语义互操作框架的语义表达层。本文参照了Mike Uschold&King的“骨架”法构建本体[18],该方法的主要步骤如图3所示。

图3 本体构建步骤

1) 定本体应用的目的和范围:限制研究的范围,依据研究的领域或任务,建立对应的领域本体或者过程本体。

2) 本体分析:由领域专家参与,来确定领域内概念或术语的约束以及它们之间的关系。

3) 本体表示:使用语义模型来表示本体。

4) 本体评价:以清晰性、一致性、完善性、可扩展性等作为本体的评价标准。

5) 本体的建立:使用本体评价标准对所建本体进行评价检验,符合要求的以文件的形式存放,否则转2)。

5.2基于NIEM的联合本体构建

基于NIEM的联合本体构建是指以NIEM数据模型为基础,建立关于领域的通用本体模型。该技术的作用是建立公共数据参考模型,对应语义互操作的互操作层。基于NIME的联合本体构建过程是,明确信息交换内容,通过引用NIEM数据模型对交换需求进行描述,建立联合本体的过程。建模过程主要经历需求分析、建模与映射等三个过程[17]。

1) 需求分析是构建本体的基础,信息共享业务需求分析主要内容是:明确信息交换背景、了解信息交换的主要内容、明确信息交换的策略要求等。

2) 联合本体建立是业务领域专家在信息交换业务需求分析的基础上运用本体构建技术对信息交换需求的直观描述,是信息交换需求的直接体现。

3) 信息交换业务模型映射是指建立信息交换业务模型与NIEM数据模型的映射关系,即联合本体中的类映射到NIEM数据模型中的类型。在映射过程中存在完全匹配、部分匹配或者完全不匹配三种情况,通过对NIEM领域数据词典的匹配、扩展与演化等手段达到联合本体与NIEM数据模型建立映射关系的目的。

5.3异构本体映射技术

异构本体技术是指建立信息源本体与联合本体之间的概念与术语之间的关联,实现以联合本体为源本体到目标本体的中间本体的异构本体转换技术。该技术的作用消除信息源本体与联合本体的异构,对应语义互操作框架的互操作层次。该映射变换采用以通用本体作为中间转换本体的方式,实现信息源之间知识的共享与集成,与直接根据异构本体之间映射关系进行映射转换相比,使用通用本体降低了耦合度,具有更高的柔性和可扩展性[19],如图4所示。

图4 基于联合本体的映射变换模型

5.4基于本体的语义推理技术

语义推理技术是指借助本体进行推理从根本上把隐含在显示定义和声明中的知识通过一种机制提取出来。该技术的作用是实现交换数据的信息利用率最大化,同时检验交换信息的语义冲突。语义推理技术应用在信息源语义互操作的基础上,通过建立基于本体的语义互操作来实现冲突检测、信息增量等服务。基于语义关系,定义本体推理规则,在公共领域本体的基础上引入规则表示,制定规则库,通过推理引擎依据一定的推理算法从显示表述中推出隐含结论[20],如图5所示。

图5 基于规则的推理结构

6结语

本文通过分析语义互操作的语义形式化、语义异构消除和功能扩展等三个关键点,应用NIEM数据模型,给出基于NIEM的语义互操作框架与实现流程,为解决语义互操作中语义不一致和信息利用率低等问题,给出实现语义互操作四个关键技术。

参 考 文 献

[1] Tolk A. Interoperability and Composability[C]//Sokolowski J A, Banks C M. Modeling and SimulationFundamentals: Theoretical Underpinnings and PracticalDomains. New York, NY, USA: John Wiley, 2010:403-433.

[2] Wenguang WANG,Andreas TOLK+,Weiping WANG. The Levels of Conceptual Interoperability Model:Applying Systems Engineering Principles to M&S[C]//Proceedings of the 2009 Spring Simulation,2009:210-218.

[3] 李新,何治成,许中.基于本体的IEC61850和IEC61970语义模型的映射研究[J].电器与能效管理技术,2010(21):57-61.

[4] Zeng M L, Chan L M. Metadata interoperability and standardizationA study ofmethodology p art I achieving interoperability atthe schema level [EB/OL]. http://www.dlib.org/dlib/june06 /chan/06chan.html.

[5] WACHE H, V GELE T, V ISSER U, et al. Ontologybased in tegration of information: a survey of existing approaches[C]//Proc of theIJCAI2001 Work shop on Ontologies and Information Sharing. NewYork: IEEE Press,2001:108-118.

[6] 宋文.知识组织体系语义互操作研究[J].图书馆论坛,2012,32(6):117-121.

[7] 周建芳,徐海银,卢正鼎.信息集成中语义异构问题研究[J].计算机应用研究,2008,25(8):2349-2351.

[8] 徐享忠,汤再江,谭亚新.作战仿真与指控系统语义互操作技术参考框架研究[J].系统仿真学报,2015,27(8):1735-1739.

[9] 陈卓群,王平,王忠义.基于XTM的数字图书馆语义互操作研究[J].情报科学,2011,29(3):462-468.

[10] 曾诚,何克清,李兵等.Web服务注册管理模型中的语义互操作性研究[J].武汉大学学报(理学版),2009,55(2):206-210.

[11] Saikou Y. Diallo, Heber Herencia-Zapana, Jose J. Padilla, Andreas Tolk. Understanding Inter-operability[J]. Society for Computer Simulation International,2011:110-118.

[12] 胡丰华,邱晓刚,黄柯棣等.军事分析仿真语义互操作研究[J].系统仿真学报,2012,24(12):2468-2472.

[13] 毕强,朱亚玲.元数据标准及其互操作研究[J].信息系统,2007,30(5):666-670.

[14] 王真星,但唐仁,叶长青等.本体集成的研究[J].计算机工程,2007,33(2):4-5.

[15] 程变爱.试论资源描述框架(RDF)——一种极具生命力的元数据携带工具[J].现代图书情报技术,2000,16(6):62-64.

[16] 周武,金远平.构建XML本体信息研究[J].微机发展,2003,13(10):61-64.

[17] 戴剑伟.跨领域信息交换方法与技术[M].北京:电子工业出版社,2014:20-80.

[18] Uschold& King. Overview of methodologies for buildingontologies[EB/OL].http://www.lsi.upc.edu/~bejar/aia/aia-web/4-fernandez.pdf,2010-05-18.

[19] 叶范波,唐任仲,王正肖等.基于通用本体的本体映射变换技术[J].浙江大学学报(工学版),2009,43(12):2274-2280.

[20] 吴彦伟.智能查询中的本体推理机制及其应用研究[D].西安:西安电子科技大学,2014:21-43.

收稿日期:2016年1月9日,修回日期:2016年2月12日

作者简介:晋芳华,男,硕士研究生,研究方向:舰船电子工程技术。刘鹏,男,硕士生导师,研究方向:系统顶层设计。钱兴华,女,博士生导师,研究方向:系统总体设计。

中图分类号TP391

DOI:10.3969/j.issn.1672-9730.2016.07.024

Key Technologies of Semantic Interoperation Technologies

JIN FanghuaLIU PengQIAN Xinghua

(China Ship Research and Development Academy, Beijing100192)

AbstractSemantic interoperation is an important method to promote data interoperation between systems and improve the level of information sharing. Considering main problems faced by semantic interoperation of heterogeneous systems, a semantic interoperation framework based on national information exchange model is presented in this article, key technologies are also analyzed.

Key Wordssemantic interoperation, NIEM, information sharing

猜你喜欢
信息共享
横向动态联盟的信息共享效应研究
基于WebGIS的合肥中小企业信息共享平台的研究
基于供应链的制造业服务化客户逆向服务研究
上市公司内部审计运行管理
中国铁水联运信息系统物理框架设计
利用微信做好班级管理工作的实践研究
探索“互联网+”思想在传统货运业的应用
对我国商业银行财务信息共享模式的探究