基于XML中间件的数据存储交换技术研究

2016-01-04 04:01林虹虹
科技创新导报 2015年28期
关键词:存储中间件

林虹虹

摘 要:该文从数据集成入手,先介绍XML数据源的简单、动态可扩展、多用户兼容、开放高效的特点,再利用微软ADO.NET中的XML相关类的方法和属性,结合实例来详述以XML中间件对异构数据源的进行存取的过程,尤其是在单独访问、修改或侧除异构数据数据集的技术上。为了实现XML中间件、映射交换以及数据的实时存储上,可以使用第三方工具以及微软ADO.NET,从而保证在网络数据交换中以XML作为标准的格式,继而便于集成异构数据源数据的集成,为了数据异构交换提供了新的思路。

关键词:XML 数据集 存储 中间件

中图分类号:TP311.52 文献标识码:A 文章编号:1674-098X(2015)10(a)-0065-02

The Research of the Data Storage Technology Based on the XML Middleware

Lin Honghong

(Engineering occupation technical college of Guangdong, Guangzhou Guangdong,510520,China)

Abstract:This paper start to analysis from data integration, first introduced the simple XML data source, dynamically scalable,multi-user compatible, open and efficient features,and then use the methods and properties of Microsoft ADO.NET XML related classes,described in more detail with examples to XML process middleware access heterogeneous data sources,especially in individual access,modify,or in addition to the technical side of heterogeneous data sets.By using Microsoft ADO.NET and other third-party tools to achieve XML middleware way to achieve storage and mapping of data exchange,so as to achieve the standard XML as the format for data exchange on the Internet,you can easily achieve the integration of heterogeneous data source,heterogeneous data exchange to provide a new way of thinking.

Key Words:XML;Dataset;Storage;Middleware

异构数据集成的实现方法主要分为两种:基于中间件和基于模式,其中基于中间件是完成数据集成中异构数据源集成的主流。根据现阶段的研究发展情况,主要分为如下几种:通用数据访问结构(Universal Data Access Architecture)、ODBC方法、XML中间件集成法、分布式中间组件。

数据间异构是科技技术发展的需要。随着互联网络及物联网的推广,数据资源共享成为一个迫切的问题。同时,大数据和云计算的快速发展,使得企业经营管理理念转向以信息技术模式为主的经营模式。因此在异构数据集成的研究以及异构数据理解研究中异构数据以及数据的集成变成了最重要的基础性概念。所以必须深入研究数据集成问题,从而研发出新技术。

1 XML 技术及特征

XML是一种界定文本数据的简单而标准的方法。XML支持各种应用程序,与SGML兼容,可以直接应用于互联网,并且XML文档易于创建,规则简单,结构清晰,便于阅读,明确的标识含义。

XML的特征与数据库相似,能表示半结构化数据,一般来说,整个XML可以被看成是一个数据库系统。DTD或者Schemas即是数据库模式设计,XQL即是数据库查询语言,SAX或DOM即是数据库处理工具。因此XML同数据库比较缺乏数据库的重要机制。例如索引机构以及触发器和有效的存储组织、多用户处理机制等。

XML数据源有多种,根据具体实际应用,主要分为下面3种:(1)来源于其他各种应用数据,如邮件、目录清单、商务报告等。(2)关系型数据库。(3)XML纯文本文档;扩展纯文本文档的关系型数据库一般是用于动态应用的开发,便于数据库统一管理数据,继而便于服务器应用端对数据库中数据动态存取。

2 以XML文档为基础的数据存储技术

W3C推荐标准是DOM,其文档多为对象模型。文章主要论述以ADO.NET的Framework为基础,实现XML中间件存储交换设计。

.NET framework的System.XML名称空间提供了大量的类,用来存储和处理XML文档,其中就有:(1)存储、构造XML文档类;(2)读写、解析文档类。而System.XML名称空间里读写、解析文档类主要包括;XMLvalidatingreader、 XMLreader、XMLnodereader(读类)和XMLwriter(写类)等几个基本大类。

而存储、构造文档类为XMLNode,该类主要包括插入、删除和替换节点等方法,以及常用的3个子类:XMLdocument、XMLdocumentfragment、和XMLdatadocument,下面分别介绍读、写及存储技术XML相关语法。

那么以XMLtextreader基类通过XML文档文件名或者它的URL处理其XML文档数据,在创建新对象的构造函数中指明XML文件位置,语句为:Dim mybook as new XMLtextreader(server。mappath(“books。XML”)),一旦读取完毕,则可以调用其read方法,nodetype,name、value等属性读出books.xml信息。

输出(write)则是指根据XML文件规则,通过应用程序的读写文件命名将数据逐行反映到XML文件中。如books.xml中的一行数据,它有title,price等字段;不管采用哪利一方法,XML文件必须满足Well-Formed要求。而在ADO.NET中输出的XML类主要以XMLwriter为基类,该类主要包括:XMLtextwriter类和XMLnodewriter两个子类,子类则包括了writenode,writestring和writeendelement等方法和writestate,XMLlang等属性。

存储(save)和处理XML文档主要以XMLdocument类实现。该类包括:load,loadXml和save等重要存储方法,仍以books.xml为例,利用loadXml方法,从一个页面XML文档读取数据并调用save方法将数据保存在books.xml文件中。

3 以XML文挡为基础的数据转换

如何从数据库提取数据是数据交换重点重点内容,在以XML文档为基础的数据交换中,最为关键的便是XML文件转换问题。所以在功能上数据映射工具应当进行文件转换,提取模式信息以及映射建模和模版的生成。另外依照目标模式以及源信息,以映射建模为基础形成模板文件,即映射模板文件,从而完成源交换文件同目标交换文件之间的转换。

文档结构和数据库结构之间建立映射就是为了在数据库和XML文档之间转换数据,该映射主要分为两类:模型驱动和模板驱动。

3.1 以模型驱动为基础的的映射

基于模型驱动的映射是指用具体的模型把数据从XML文档传送到数据库(或把数据从数据库传送到XML文档)。XML文档是由DTD或XML Schemas描述的。所以在XML和数据库之间进行数据转化的时候,需要考虑两个过程:一个是从数据库模式中产生DTD,另一个是根据DTD生成数据库模式。

(1)以数据库模式为基础进行DTD的构件首先应当以表为单位进行元素的创建;其次进行子元素或者属性的创建,即以表中的每一列为单位,并且子元素、属性仅有PCDATA内容;最后则是进行表元素的子元素创建,这一子元素的创建以表中主键/外键关系为基础。

(2)DTD生成数据库模式的首先需要新建一个关系模式,该模式从DTD中生成,以此为基础进行关系数据库的建立;针对每一个元素,都要产生主键列以及一个表;若元素中存在混合内容,则应当建立新的独立表,进行PCDATA的存储,并将父表同父表主键关联到一起;而在建模中需要将每一元素的单一属性值都声称相对应的单一列,若能够选择子元素类型,则该列应当允许为NULL;若子元素多次出现或者该属性具有多个值,那么则需要新建独立表格对这些值进行储存,同时关联父表、父主键;对每一个包含元素或者混合内容的子元素来说,通过父表主键把父元素和子元素联接起来。

3.2 以模板驱动为基础的映射

以模板驱动为基础的映射方式有两种。

(1)进行映射模板的新建。这就需要进行文件的指定,即目标模式信息文件以及源模式信息文件的确定。继而对其进行解析,即使用Schema分析器分析,从而获得信息文件的属性结构。依照顾客需要,对转换节点映射规则进行变更和确定,且该规则描述需要使用XSLT语言,并予以保存,便于后期修改、使用。

(2)打开现有映射模板文件。将现有映射模板文件进行制定,继而有XSLT调用专用分析器,即Schema分析器对文件、数据进行解析,而映射模板信息则通过专有映射分析设备进行解析,从而获得树形结构。客户依照实际需求对映射模板文件进行修改,完成修改后,保存最终映射机构,从而形成新的模板文件。

映射模板文件的生成方式主要有以上两种,每一种都可以进行源Schema结构XML文档至目标Schema结构XML文档的转换,以此完成源数据→目标数据的转换,即源数据库信息→目标数据库信息的转换。

4 结语

XML作为一种可扩展的、与平台无关的通用数据格式,具有开放、简单的优势,正发挥着越来越重要的作用,因此如何利用XML中间件进行数据存储交换就成了人们研究的重点,该文通过利用微软ADO.NET及其他第三方工具实现XML中间件的方式,实现数据的存储.和映射交换,从而将XML作为Internet上数据交换的格式标准,实现集成异构数据源数据,为了数据异构交换提供了新的思路。

参考文献

[1] 梁利娇,吴国平.一种基于XML的异构数据源集成方案[J].现代计算机,2004(3):27-29,63.

[2] 萨师煊,王珊.数据库系统概论[M].3版.北京:高等教育出版社,2001.

[3] Young Michael J.XML学习指南[M].北京:机械工业出版社,2001.

[4] 丁跃潮,叶文来,陈杰.XML实用教程[M].北京:机械工业出版社,2006.

[5] 贺晓萍.基于XML的数据库存取技术[J].湖南理工学院学报:自然科学版,2007,20(1):3.

[6] 靳强勇,李冠宁,张俊.异构数据集成技术的发展和现状[J].计算机工程与应用,2002(11):1-112.

猜你喜欢
存储中间件
RFID中间件技术及其应用研究
基于VanConnect中间件的设计与开发
档案管理中电子文件的存储探究
条形码技术在涂装生产中的应用
云计算与虚拟化
中间件在高速公路领域的应用
一种支持智能环境构建的中间件