解 凌 钱 进
浅谈WebService技术在标准文献信息系统中的应用
解 凌 钱 进
本文首先分析现有的标准文献信息系统建设中不足,并指出了产生这些不足之处的根本原因。然后介绍XML和WebService这些新技术及其在标准文献信息系统建设中应用。文章的最后介绍了现有的利用XML和WebService技术实现的标准文献信息系统的应用,并提出了今后研究的方向。
标准文献信息系统 XML WebService
近年来,随着社会各界对标准文献需求范围的不断增加,以及需求频率的不断提升,各地方标准化机构希望能够对外提供更便捷、更有效的标准文献信息服务。同时,随着信息技术,特别是网络技术的高速发展和普及,一些地方标准化机构纷纷斥资建立起了规模不一的标准文献信息服务系统,在Internet上对外提供标准文献信息,以满足用户对标准的需求。
通过建设标准文献信息服务系统可以满足用户对标准的需求,但是随之也产生了一些不足之处。第一,前期投入巨大。由于标准文献信息资源很庞大,内容也很丰富,因此标准文献信息系统建设的前期投入相当大,建设周期一般也比较长,对需要投入的软硬件设备的要求也比较高,很多中小地方的标准化机构没有能力获取完整的标准文献资源,也没有能力自行开发如此规模的信息系统,造成他们无法通过信息化手段对外提供标准信息服务。第二,后续更新很难跟上。随着社会不断的进步与发展,各类标准也在不断更新,标准文献资源的信息量也不断扩大。如果无法及时获取到最新资源,那就无法向社会提供标准文献信息服务。第三,资源重复建设。因为资源形式、站点风格等多方面的因素,每一个标准文献信息服务网站在一定程度上都重复其他站点的资源建设,这种资源的重复建设不能不说也是一个弊端。
探究这些不足之处的原因,最根本的在于传统的Web应用开发模式本身存在弊端。标准文献信息资源很庞大,包括了国内外数十个品种的题录信息以及相关的电子全文信息,而且标准文献信息系统的功能也比较丰富,包括题录检索、在线购买、电子全文在线阅读与打印等。为了存储大量的文献资源,就必须配备大容量的存储设备,并根据存储情况不断调整。另外,为了能够实现标准文献信息系统的功能,还必须配置相应的数据库软件(如Oracle、SQLServer等)和 WebServer软件(如Weblogic、Websphere、IIS 等),同时还要配置相应数量和性能的服务器。以上这些软硬件设备的费用以及开发相应系统的费用对于一些中小地方的标准化服务机构来说是一个不菲的数目。而且对于这些机构来说,由于系统的复杂性较高,系统的日常维护也是一项非常艰巨的工作。另外,传统的Web应用各自采用的数据库软件和WebServer软件的不同,使得各个系统之间无法进行资源共享和功能互补,致使资源重复建设。
新技术的产生总会给很多应用带来新的启发和思路,这一点在标准文献信息系统中也不例外。那么现在到底有什么新的技术会对标准文献信息系统产生重大的影响呢?答案是XML和Web Service。
2.1.1 XML的定义
XML是eXtensibleMarkupLanguage(可扩展标记语言)的缩写,中文称之为可扩展的置标语言,它是SGML(StandardGenericMarkupLanguage)的一个子集。WorldWideWebConsortium(W3C)的XML工作组于1998年2月完成了XML规范1.0版本的定义。
XML很容易让人误解为是HTML的扩展,其实不然,它虽然同HTML一样是标记语言,但是它却有着与HTML完全不同的机制,它比HTML的应用范围要广阔得多。HTML可以很好地表现一个内容,但却极度缺乏对内容的表达能力。而这正是XML所擅长的地方。XML将内容与表现形式分开,既可以很好地描述一个内容,又可以借助于样式单来格式化显示内容。比如下面的一个关于人员档案的例子,用HTML写为:
在这里,用户通过浏览可以知道这个人的各个信息,而计算机却根本无法知道标记<p>、<h1>所表示的内容是什么。如果用XML,那么就可能如下所写:
在这里,通过标记<姓名>、<地址>等就可以立即明白其表示的内容。
2.1.2.XML的优点
通过上面的例子可以看出,XML标记可以清晰地指明其表示的内容,这使得精确的搜索成为可能。这是XML第一个优点,其次在它的基础上,自动化的UserAgent或者说智能的Web应用不再是奢望。比如想通过一个站点,自动定购一张在时间、价钱、机型都理想的机票,在XML结构下就非常容易。
XML是以文本的方式存在的,所以任何操作系统、任何数据库构成的平台,只要装了XML解析器,都可以很简单地访问XML数据。借用劳虎在《无废话XML》中所说“XML是非常理想的网际语言,它方便了各式各样网络器具间的信息交流”,如图1所示。
图1 XML是非常理想的网际语言,方便各式各样网络设备间的信息交流
XML已经在很多领域如电子商务、数学符号描述、语音、矢量图形、化学标记等都建立了专门的XML语言。
2.1.3 XML与标准文献信息系统
标准文献信息系统所暴露出的大部分弊病,最重要的原因就是没有统一的资源描述方式。对于这一点,正是XML最大的优势所在。所以XML在标准文献信息系统中最基本的就是用来描述各类资源。举个例子来说明,比如在标准文献信息系统中定义的一条标准文献题录数据,用XML就可以表示为:
在用XML对各种资源进行描述之后,就可以利用XML的特性来开发和建设更智能化、综合化的Web应用和标准文献信息系统。比如下面的例子,A是一个提供标准文献信息的网站,都以XML方式进行描述。用户B想在网站A上查找有关计算机网络的国内标准,就可以通过“<标准信息>.<中文名称>=计算机网络 and<标准信息>.<文献类型>=国内标准”来进行非常精确的搜索了。
2.2.1 WebService的定义
WebService是一个很新的名词,中文称之为“Web服务”。WebService是一个Web上的组件编程模型,在这个模型中,各个应用都以服务(组件)的形式在Web上发布,然后远程的应用程序可以通过一个统一的访问方式(HTTP+SOAP)来调用这个服务,将其集成到本地的应用程序中。Web Service也是一个分布式计算模型,但是它打破了COBRA、DCOM及RMI的客户与服务紧耦合的限制,比它们中的任何一种都更具优势。
2.2.2 WebService的优点
WebService的优点或者说优势有很多,下面就是最为重要的几个。
· 首先就是它的松耦合性。也就是说,客户或服务任何一方执行机制的改变都不会影响应用程序的正常运行。
· 互操作性。任何Web服务都可以与其他Web服务进行交互。
· 集成性和简单性。这里有两点,第一可以使用任何语言(如 C、C++、VB、VC、JAVA,甚至COBOL)来编写Web服务,开发者无需更改他们的开发环境就可生产和使用 Web服务。第二,已有的组件(如 COM、JavaBean)很容易被包装成Web服务。
· 普遍性。Web服务使用HTTP和XML进行通信。因此,任何支持这些技术的设备都可以拥有和访问 Web服务。不久,它们将在电话、汽车甚至汽水贩卖机中出现。汽水供应不足吗?没问题,无线联网的汽水贩卖机可以与本地供应商的 Web服务联系,订购更多您喜爱的饮料。
· 行业支持。所有主要的供应商都支持SOAP和周边Web服务技术。例如,微软的 .NET平台就基于Web服务,因此用VisualBasic编写的组件很容易作为Web服务部署,并由使用IBMVisualAge编写的Web服务使用,反之亦然。
2.2.3 WebService与标准文献信息系统
如果用WebService来构建标准文献信息系统,会有什么样的结果呢?我们先来看一个例子。图2一共有四个网站,其中站点STD是标准文献信息系统的入口站点,站点A、B、C都提供远程标准信息服务。一个用户登录到STD,然后发送一个查询标准的基本要求(步骤①),如标准中文名称=计算机网络、文献类型=国内标准等。STD根据用户的要求自动到各个站点(站点A、B、C)上搜索符合要求的标准(步骤②、③),并通过汇总(步骤④)将最符合要求的标准信息返回给用户(步骤⑤)。
图2 多站点间的数据通讯
标准文献题录检索可以通过WebService的形式在Internet上发布,那么类似的,标准文献电子全文阅览室、标准有效性查证等所有的标准文献资源都可以以 WebService的形式在 Internet上发布,供其他的 Web应用程序(本地或远程)进行调用。
新技术往往带来很多新的应用,但这不是主要的。更为重要的是,新技术所带来的一种概念,一个新型的开发模式。XML和WebService及其他一些技术(如CSCW)的产生和发展正是给标准文献信息系统的建设开辟了一个新的思路和更广阔的发展空间。
针对以往标准文献信息系统建设中出现的问题,我们提出通过运用基于XML与SOAP(Simple ObjectAccessProtocol,简单对象访问协议)协议的WebService技术,利用数据库、Internet等各种设备环境,运用各种技术手段,结合地方标准化服务机构的实际需求,实现了标准文献题录数据库与标准文献动态信息的远程调用,标准文献远程有效性查证以及电子阅览室,以实现标准文献信息的异地实时共享查询,满足各地方标准化机构进一步充分、及时地向用户提供标准文献信息服务的需求,提升各地方的标准信息服务水平;同时,进一步提高上海市标准化研究院馆藏标准文献利用率。
系统的架构如图3所示:
首先,在上海市标准化研究院的标准信息服务平台中搭建一系列的数据交互接口,并将其部署在Web服务平台中。然后,第三方终端网站通过调用这一系列的接口,就可对外提供标准文献信息服务。与传统的开发模式相比,第三方终端只需配备PC服务器即可,节省了前期投入,而且也易于维护,节省了人力物力。
3.2.1 常州市技术标准信息平台(http://www.cztss.org)
常州市技术标准信息平台是常州地区唯一面向社会提供标准化在线服务的专业网站,向国民经济管理部门、企业与消费者提供国内外标准信息/文本传递,是常州标准化服务的权威网站。该平台通过调用上海市标准化研究院标准信息服务平台的标准文献检索接口,实现了异构网站的无缝对接,并在其网站上对外提供标准文献题录检索、标准文献电子阅览室以及远程标准有效性查证功能。网站收录有完备的国际标准、国外先进标准、中国国家标准、行业标准等四十多万条数据。网站全面覆盖了标准化咨询、标准化应用、标准化培训等服务,能够满足各行各业对标准化的各种类型的服务需求。
3.2.2 上海研发公共服务平台(http://www.sgst.cn)
上海研发公共服务平台是运用信息、网络等现代技术构建的开放的科技基础设施和公共服务体系,由科学数据共享、科技文献服务、仪器设施共用、资源条件保障、试验基地协作、专业技术服务、行业检测服务、技术转移服务、创业孵化服务和管理决策支持十大系统组成。其中的科技文献服务就包含标准文献服务系统,该系统通过远程调用上海市标准化研究院标准文献信息服务平台的一系列接口,在线提供标准文献题录检索、全文阅读、购买、咨询及有效性查证等一站式服务的服务系统,通过系统,研发平台用户可以在线浏览存放于上海市标准化研究院标准文献信息服务平台上的60余万条信息,系统提供标准号、检索词、中国标准分类号、国际标准分类号、标准品种、采用标准等多种检索途径,帮助用户寻找所需求的标准。
3.3 尚需进一步研究的问题
3.3.1 进一步完善网络和系统基础设施(如:网络带宽扩容以及网络、服务器等设备增配等)
目前,该系统已投入使用。随着今后使用面的不断推广,用户数会逐渐增加,这样势必会对现有的硬件设备(服务器)、软件设备(数据库系统、Web Server)以及网络设备带来增加负荷。因此,建议今后能够对现有的软硬件设备以及网络设备进行扩充,以满足更多的用户对标准文献的需求。
3.3.2 进一步推广分布式标准信息服务的应用领域
目前,标准化服务机构与一些大中型企业对标准文献服务的需求越来越迫切,但由于受到一些条件的限制,他们无法去开发一套完整的标准文献信息服务系统。因此,建议在标准化服务机构与一些大中型企业中推广该应用,以满足他们对标准文献信息服务的需求。
3.3.3 不断开拓分布式标准信息的服务功能,进一步完善分布式标准信息服务系统的性能
目前,该系统对外提供了标准文献动态信息、标准文献题录检索、标准有效性查证以及标注文献电子阅览室功能。随着标准文献对外服务模式的不断完善与扩充,可以不断拓展分布式标准信息服务系统的功能;同时,建议进一步完善分布式标准信息服务系统的性能,以满足今后不断增加的对外服务。
[1]劳虎.无废话XML[EB/OL].[1999].http://wenku.baidu.com/view/26c2ff 610blc59eef8c7b4f4.html.
[2]柴晓路.架构WebService[EB/OL].[2001].http://www.cn.ibm.com/developerWorks.
[3]GrahamGlass.Web服务创新[EB/OL].[2000].http://www.cn.ibm.com/developerWorks.
[4]Microsoft.XML、Web服务和.NET框架[EB/OL].[2001].http://www.aspcool.com.
上海市标准化研究院)