基于XML技术的数字图书馆资源共享平台构建

2013-05-08 09:40贾凤旭
图书馆学刊 2013年9期
关键词:资源共享文档服务器

贾凤旭

(鞍山师范学院图书馆,辽宁 鞍山 114005)

网络技术的发展推动了文献资源的数字化建设,由此,作为数字图书馆服务门户的数字资源共享平台系统的建设也成为必然。XML作为描述数据语言及其所具备的数据互操作等众多优点,以其作为基础技术构建的数字图书馆资源共享平台,成为数字资源和用户密切联系的纽带,既方便读者利用数字资源,又提高了数字图书馆的知识服务能力。

1 XML特点

XML(eXtensibleMarkupLanguage)是 W3C工作组制定的可扩展置标语言。XML是定义语义标记的规则,通过标记将文档分成多个部件并加以标识。XML和HTML虽然同是SGML应用子集,但XML可依据不同应用而自定义标签,以开放的自我描述方法来定义数据结构,进而描述数据内容和数据之间的关系。具体讲,XML有以下几方面特点。

1.1 容易扩展

XML采用嵌套文本标签的方式来表示数据,标签的文本和结构均可以自由扩展,使用者可以按需创建并使用新的标记,其区别于一些二进制文件对字段结构长度的诸多限制,极容易扩展,因此,其技术在广泛的开发平台都有支持,几乎所有的常用编程语言都支持XML,从而让其成为理想的信息交换工具。

1.2 灵活分离性

HTML虽是Web显示数据的专用语言,但其显示的网页样式信息与内容信息混杂在一起。而XML采用文档数据和显示指令分离的机制,有利于对大量XML文档的维护,有利于应用程序处理XML文档,直接分析、处理数据内容。而且多个XML文档可共用一个样式文件,便于管理。

1.3 自由的文档标签

XML文档中的标签在不违反其语法的前提下可以根据需要自由设定,但要注意考虑所用词汇的合理性,以及标签相互的嵌套层次逻辑性。

1.4 规范约束的描述语汇

为了有利于XML传播和共享信息,需协定共同遵守行业标准,使用规范的语汇。

1.5 来源不同的数据之间的交换

XML的跨平台特征,决定了它可以实现不同数据源之间的数据交换,提供一个公共交换平台。XML格式数据不需任何转换和其本身的简明性,为数据交换的发展提供广阔的前景。

2 XML技术内容

2.1 XML文件构成

XML文件结构可以分为实体结构和逻辑结构。实体结构是构成XML文件的实际资料;逻辑结构是XML元素排列图,即元素的排列顺序。XML文件的逻辑结构包括3部分:文件首,用来指定该文件的指令;主体部分,由一个或多个元素组成,形式为可以包含字符数据的层次结构树;文件尾,包括注释、处理命令及主体后面的空白。

XML文件的实体结构用下面实例作进一步说明:

XML文档

----- ①

----- ②

----- ③

< 图书 A=”1”B=”2”C=”3”/> ----- ④

<选择 =”A”/>

----- ⑤

其构成部分及解释如下:

①XML声明:XML版本号和文本编码方式。

②处理指令:给XML应用程序阅读的特殊标记。

③元素:;分别是两对元素。

④属性:与元素相关联的部分,如“图书”元素有3个“A”、“B”、“C”属性,其属性值分别为“1”、“2”、“3”。

⑤文本:两个标签之间的字符,如“这个选择是正确的!”是“结论”这个元素的文本。

⑥空白:文本中出现的换行,半角空格或制表符。

2.2 XML与数据共享

XML是记述Web相关数据的最基本语言;XML既采用供阅读的文件形式,又采用供程序使用的数据形态,具有记述文件和数据的两面性,使非表格形式的数据结构非常清晰地显示出来,在关联数据方面发挥出它独特的优势。

第一,分布在不同地域的数据,XML的远程功能,借助HTTP协议,解决了这类数据的共享问题。

第二,结构和语言不同的数据,XML的DOM和XQL工具,XML对半结构化数据的通用表示以及XML查询语言,实现了对该类数据的互操作。

第三,不同系统间属性表示和语义差异的数据,XML通过源和目标大纲属性来匹配描述性的元数据,把这类数据转换成同一性而实现互操作。

第四,不同规范的数据,XML通过把这些数据根据需要重新组织成不同结构的数据表来实现操作。

第五,签定数据,XML清晰明确地描述属性表示和语义方面的优势,可以避免数据使用端程序的识别错误。

基于XML在数据方面的优势,采用其建立接口数据标准,有利于数字资源平台的开发,实现不同平台间的数据交换和协同工作,通过XML模式发布,可以自动实现对数据的验证和约束,使数字资源数据由抽象的标准变成具体的操作。

3 数字资源共享平台的构建

3.1 基于XML的共享平台的构想

数字图书馆的资源目标是构建一个逻辑上统一、物理上分散的资源共享体系,以资源元数据为核心基础,统一管理分散的资源数据,具体构想如图1。

图1

数字资源共享平台主要从用户需求出发来考虑构建,包括“数据信息检索、发现和数据访问”,用户通过资源共享服务平台网站检索数据信息、发现并访问使用,主要是通过各节点系统的元数据搜索引擎来实现检索功能。具体实现步骤是:资源共享平台传递的检索请求信息通过数据描述层节点,

经数据控制层的调用处理,通过XML查询命令从各资源库中生成检索结果并回复给服务器,最后回应到客户端浏览器。用户确认后可根据共享资源元数据定位信息(URL)下载资源,实现对数据的访问。管理员通过元数据管理系统,实现对数字资源元数据的更新、添加、编辑、修改,并对资源数据库进行维护。

3.2 数字资源共享平台系统功能模块设计

表1

数字资源共享平台系统是异构数字资源数据库整合推介平台,能便捷、系统地为用户提供知识服务。主要设计了两大功能模块:①服务模块:资源信息推介、信息检索、信息下载。②管理维护模块:数据资源整理和加工、数据存储、数据资源安全、用户管理及事务管理。数字资源共享平台按层次理论分析如表1所示。

4 数字资源共享平台的数据交换技术

目前XML应用于互联网上数据交互操作主要形式为“Web服务”,是指客户端和服务器通过网络利用XML信息进行沟通,是数据信息的“请求→处理→应答”过程。

图2

Web服务的客户端以XML形式并基于HTTP协议,用GET或POST方法在HTTP报文中发送请求到Web服务器,Web服务器解析XML请求报文并执行相关操作,从数据库查询处理并返回XML应答报文给Web服务器,Web服务器将应答报文解析为相应的信息,并把结果显示到客户端电脑页面,以便客户端等待做下一步指令处理工作。

这样基于XML技术的数据处理流程,后台加载XML文档避免了类似HTML网页向服务器提交表单,用户需等待表单处理完毕才能进行下一步操作的情况,提高了数据服务的效率。

随着XML的普及应用和相关工具软件的层出不穷,XML在各行各业的应用也愈加广泛。在数字图书馆资源建设方面,用XML记述数字资源的内容和元数据,已成为现今的主流。数字图书馆的资源主要包括做为元数据的目录和信息资源的全文数据,用XML记述的全文数据,可以通过程序对它们进行各种操作。XML对内容记述与显示分离的特性,方便将XML源数据进行不同形式的转换,实现多角度的检索,从而满足不同读者需求,因此,XML技术成为数字图书馆建设和服务的基础。

集成XML众多优越性构建的数字图书馆资源共享平台,以其方便、快捷、人性化的服务,把数字图书馆资源展现在用户面前,以知识服务为基础指针的资源管理、组织和服务体系,不断推动数字图书馆作为信息、知识的社会核心地位的发展。

[1]石塚英弘,李颖.未来网络的基磐技术——XML的理论与应用[M].北京:华艺出版社,2002.

[2] 李广健.数字时代的图书馆网络信息系统[M].北京:北京图书馆出版社,2006.

[3] 左伟明.即用即查XML数据标记语言参考手册[M].北京:人民邮电出版社,2007.

[4] 雷燕.高校图书馆Web站点信息服务比较研究[J].大学图书馆学报,1999(2):28-30.

猜你喜欢
资源共享文档服务器
浅谈Matlab与Word文档的应用接口
交通运输数据资源共享交换体系探究与实现
有人一声不吭向你扔了个文档
福建省交通运输信息资源共享平台
通信控制服务器(CCS)维护终端的设计与实现
PowerTCP Server Tool
卫康与九天绿资源共享
Word文档 高效分合有高招
得形忘意的服务器标准
计算机网络安全服务器入侵与防御