基于RDF/XML公共元数据的数据交换模型

2014-01-24 02:35李满玲
湖南科技学院学报 2014年5期
关键词:异构文档模块

李满玲 吴 坚

(1.湖南汽车工程职业学院 电子信息系,湖南 株洲 412001;2.上海农村商业银行 村镇银行管理部湖南分部,湖南 长沙 410000)

基于RDF/XML公共元数据的数据交换模型

李满玲1吴 坚2

(1.湖南汽车工程职业学院 电子信息系,湖南 株洲 412001;2.上海农村商业银行 村镇银行管理部湖南分部,湖南 长沙 410000)

基于现有税务部门中各应用系统间的彼此孤立性,提出构建松耦合高容错RDF/XML数据交换模型,采用基于规则的元数据表示方法,对于数据交换的标准采用元数据管理的方法建立数据交换模型,以达到在各个应用系统之间进行异构的数据交换,实现信息共享。最后,通过实例证明了该模型的可行性和有效性。

RDF/XML;公共元数据;数据交换

0 引 言

随着计算机技术的不断发展,信息资源逐渐呈现出需求性、动态性、共享性、时效性和分布性等特性,能够重复使用,且不同信息在不同用户中体现不同价值[1]。同时还具有多领域、半结构化或无结构化、非规范化等特点[2]。而各应用系统由于彼此间缺乏关联,数据得不到共享,长期的发展形成了许多的“信息孤岛”[3]。为了便于用户对数据的查询、订阅与发布,就需要建立一种公共元数据,统一不同的数据形式,这样不同的应用系统之间才可以进行准确的信息共享和交换。RDF/XML模式是一种采用RDF和XML相结合的方式编写元数据的方式[4-5]。使用RDF/XML模式来描述元数据的优势主要体现在以下几点:第一,元数据的描述采用RDF/XML格式,可以将各种资源进行统一识别和规范,从而真正实现重用和共享资源库,解决了资源库的建设中存在标准不一,数据格式多样,结构复杂等问题。第二,元数据不仅可以描述各应用系统中的数据资源,还可以描述它们与标准数据格式之间的映射规则,从而使数据在交换的过程中进行语义操作时有据可查。第三,可以建立领域内相关知识的本体,分析订阅者的查询请求,实现基于本体的语义理解,提供智能交换。综合以上分析,本文试图提出一种基于RDF/XML公共元数据的数据交换模型用来实现税务部门的应用系统之间的数据交换。

1 RDF/XML公共元数据模式简介

公共元数据模式包括语法、语义和关联三部分组成。其中语法是指如何使用元数据描述和表达;语义是指元数据表达的含义;关联是指元数据元素间的相互关系[3]。

XML模式是指利用XML语言规范作为元数据描述方式。XML模式继承了XML的简易性、可扩展性和平台无关性等优势,更具可读性和灵活性。该模式还提供了一种描述结构数据的格式,简化了网络中数据交换和表示,使得代码、数据和表示分离,并成为数据交换的标准格式。

RDF是资源描述框架,符合W3C标准,它采用XML语言作为通用语法结构体系,用于交换和处理元数据的创建、使用和交换,甚至还可以进行简单地RDF模式嵌套[4]。RDF定义了一个独立于任何特定的语法结构的数据模型,该数据模型是一个三元组的集合,即资源—属性—值,可用来描述Web上的各种资源。RDF具有可操作性、可扩展性、蕴涵性、可交换性、易统一性等优势。

2 基于RDF/XML公共元数据的数据交换模型

该数据交换模型的中间数据采用RDF/XML文件格式来描述数据的数据文档和结构文档,它作为一个国际使用标准,具有丰富的表现形式和简单的语法格式,使用非常方便,且数据更具可读性[6]。该数据交换模型由数据采集模块、数据交换模块、数据推送模块等三个模块组成。该数据交换模型框架图如图1所示。

图1.基于RDF/XML公共元数据的数据交换模型框架图

(1)数据采集模块。数据采集的过程就是形成数据文档和结构文档以及原始层数据的过程。数据采集需要设计采集模式,其原则是减少数据之间的耦合,提高系统的扩展性。数据采集模块包括模式采集、模式转换和文档提交等功能,模式采集即抽取各种源数据库中的数据的结构信息,包括字段、类型、约束条件等,形成原始层结构文档,模式转换是抽取源数据库中数据形成数据文档的过程,将各种异构数据库的模式转换成标准模式即RDF/XML模式,最后文档提交是将数据文档和结构文档保存为RDF/XML文件。

(2)数据交换模块。数据交换模块将源数据与目标数据连接起来,通过分析对比原始层数据文档、结构文档和目标数据层的数据文档、结构文档,编写数据转换规则配置文档。数据交换以RDF/XML文档作为中间媒介,将源数据中的各种异构的数据转换成RDF/XML格式的标准数据。RDF/XML文档不仅作为数据交换的媒介,也是标准数据存储的格式。通过数据交换模块产生的标准数据具有统一的标准,相比于目标数据已经消除了数据的异构。因此数据交换模块是整个数据交换模型的核心。

(3)数据推送模块。通过数据映射形成了目标层的数据文档,数据推送模块则负责将目标层的数据推送到目标数据库中,完成数据交换的整体过程。

数据交换的工作流程主要分为三个步骤:首先,确定源数据与目标数据,利用数据采集模块对源数据进行数据采集抽取源数据的数据结构、数据约束条件以及数据,编写出原始层的数据文档和结构文档,同时为了将源数据能正确的转换成目标数据,必须分析目标数据的数据结构,编写转换层结构文档。其次,对比原始层结构文档和转换层的结构文档,编制数据以及数据类型的映射关系,形成数据交换时需要的转换规则配置文档。数据交换模块根据转换规则配置文档和转换层结构文档将源数据转换成标准数据之后,并根据映射关系将转换层的标准数据转换成目标层的目标数据。最后,由数据推送模块将数据推送到目标数据库中,完成整个数据交换的过程。

3 RDF/XML模式应用实例

3.1 RDF/XML数据文档

下面详细介绍用RDF/XML文档格式来描述的关系表的数据和结构。关系数据库的表描述如表1所示。

表1.关系数据库表

利用RDF/XML格式描述的数据文档的结构如下所示:

3.2 RDF/XML结构文档

本实例用rdfs:Class元素中rdf:ID属性来表示关系表的名字,用field元素定义表中的每一个字段,用标准属性名label, domain,range,length分别表示属性名、数据域、数据类型、数据长度的语义类型。其结构如下所示:

3.3 RDF/XML转换规则配置文档

一个RDF/XML转换规则配置文档可以实现两个异构数据之间一个关系表的转换。其结构如下所示:

4 结束语

本文提出了一种基于RDF/XML公共元数据的数据交换模型,给出了该数据交换模型的框架图,详细分析了其工作流程以及各功能模块的实现过程,还给出了该数据交换模型的应用实例,为税务部门中各应用系统间实现数据共享提供了可行的方案。后续工作中,我们将建立基于该数据交换模型的数据交换平台,并应用于实际的税务工作中。

[1]朱夏.异构系统间数据交换模型的设计与实现[J].东南大学学报,2006,(12):223-235.

[2]Zeithaml VA.Consumer perceptions of price quality and value[J].Logistics Technology,2008,(3):7-9.

[3]赵永辉.信息网络异构数据交换技术研究与实现[M].陕西:西北工业大学出版社,2007.

[4]王亮.基于XML异构数据库数据转换技术的研究[J].信息安全与技术,2012,(8):77-79.

[5]赵莉,杜思锋.数据交换平台中异构数据转换技术的研究[J].电子设计工程,2011,19(5):91-93.

[6]Ramin K.XBRL as a new language for business and intangibles reporting[J].PRISMWP4,2002,(9):2-4.

Data Exchange Model Based on RDF/XMLPublic Metadata

LI Man-ling1,WU-jian2

(1.Department of industrial design,Hunan automotive engineering career college,ZhuZhou 412001,China; 2.Village bank management department of shanghai rural commercial bank of hunan branch,ChangSha 410000,China)

The existing tax departments between application systems are isolated from each other based on the proposed construction of loose coupling,high fault tolerance of RDF/XML data exchange model,representation of rule based on the metadata, the data exchange standard by using the method of metadata management to establish the data exchange model of heterogeneous data exchange,between each application system to achieve,to realize the information sharing.Finally,the practical application shows the feasibility and effectiveness of this model.

RDF/XML;Public Metadata;Data Exchange

TP311

A

1673-2219(2014)05-0115-04

2014-01-03

李满玲(1978-),女,湖南省永州人,讲师,硕士,主要研究方向为中间件技术、软件工程和信息管理。

(责任编校:刘志壮)

猜你喜欢
异构文档模块
28通道收发处理模块设计
“选修3—3”模块的复习备考
浅谈Matlab与Word文档的应用接口
试论同课异构之“同”与“异”
有人一声不吭向你扔了个文档
异构醇醚在超浓缩洗衣液中的应用探索
基于RI码计算的Word复制文档鉴别
overlay SDN实现异构兼容的关键技术
LTE异构网技术与组网研究
Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat