我国数字图书馆标准建设问题浅探

2010-03-23 06:31蒋晓艳
图书馆学刊 2010年5期
关键词:标准规范数字化数字

蒋晓艳

(辽宁省委党校图书馆,辽宁 沈阳 110004)

数字图书馆(Digital Lib rary)是当今一个国家信息基础水平的重要标志,也是21世纪世界图书馆发展的方向。从上个世纪末起,世界各国就掀起了数字图书馆建设的热潮。2001年我国政府投资11.2亿人民币用于国家数字图书馆建设,我国各地、各类型图书馆也纷纷把建设数字图书馆作为当务之急。数字图书馆的建设不同于单个传统图书馆,它不仅是一个高科技项目,更是一个跨地区、跨部门、跨行业乃至跨国界的大文化工程,它在理论与实践中存在着许多迫切需要解决的问题,标准建设更是重中之重。

1 数字图书馆标准建设的必要性

1.1 实现信息资源共建共享

历史上各个图书馆特色资源的独享性和服务范围的针对性,决定了数字图书馆的建设需要由众多图书馆以及各信息提供机构共同来完成。由于缺乏统一的标准来规范,各馆都从自身目的和现实条件出发,自主开发数字化信息资源,导致各馆建设的数字资源在用户检索界面、检索语言和管理系统等方面存在较大差异,而且大量的数据库及电子出版物结构本身也不兼容,各系统之间难以相互应用,互操作性差。例如,在CERNET(中国教育和科研计算机网)中我们可以发现不少单位所建的信息资源不仅标引项设置不一致,而且缺少检索其资源的帮助信息,甚至在不同的链接点使用不同的名称等等。可以说,数字图书馆信息资源建设与利用过程中存在的不能共享的问题,绝大多数是因为没有建立和执行统一的标准造成的。资源共享需要资源共建,但共建并不是泛泛地你建一个,我建一个,而应该是按照统一的标准和规范,分主题、分学科、分阶段地进行。只有在统一的标准之下对电子信息、多媒体信息以及印刷型载体数字化信息进行规范的组织和加工,使之有序化,才能将各单位所独享的信息资源按统一的格式组织起来,实现网络连接,完成信息资源的有效交流和传递,资源共享的梦想才能最终得以实现。

1.2 避免重复建设

国外数字图书馆发展的模式是首先进行图书馆网络建设,然后再进行网上资源的共建共享,而我国正相反,各馆都先忙于进行馆藏数字化建设,然后才想到联网。由于没有全国性的宏观规划和布局,也没有相应的统一标准,各馆已经建立的数字化资源难以相互沟通和相互应用,使得没有数字化资源的图书馆也不得不进行自己的数字化资源建设,从而造成了严重的重复建设。据有关统计资料显示,2001年我国数字资源建设的重复率高达90%以上。只有建立统一的标准,才可以协调各个单位的资源建设,使大到一个国家,小到一个图书馆或个人,只要符合统一的标准,所建设的数字资源就可以非常方便地实现共享,从而避免重复建设。同时,制定和执行统一的标准还有助于数字图书馆相关软件的开发,使得数字图书馆能够在拥有统一的数字资源基础上,进一步开展信息挖掘、知识查询、智能处理等工作,否则会在数据的转换上花费大量的时间和经费。

1.3 保护我国的数字图书馆事业

数字图书馆是我国信息产业的重要组成部分。目前,国际上对信息产业,包括对数字图书馆的保护已不能再采取贸易壁垒的方式,而只能通过制定本国的行业、技术等标准和规范来实现。美国的几大IT业巨头IBM、MICROSOFT等公司在新技术产品研发时所采取的一个重要策略,就是围绕所涉及的标准开展大量的宣传和研究,并竭力使其为其他公司和国家所接受,这实际上也是另一种意义上的侵略。而法国、德国、英国等西欧发达国家为保护自己国家和企业的利益,在充分利用现有技术供给的同时,纷纷制定本国技术标准以形成强有力的非贸易壁垒。我国的数字图书馆事业只有制定自己的相关标准,才能形成有力的屏障,保护其自主发展。因此,标准建设是我国数字图书馆工程建设应对竞争和挑战的需要。我们不能将研究重点只放在技术、资源数字化以及服务模式上,更应当关注数字图书馆建设中不可或缺的标准与规范问题。

2 国内外数字图书馆标准建设的现状

国外数字图书馆建设非常重视标准的选择和应用。20世纪90年代以来,随着信息技术等高新技术应用速度的加快,一些网络化、数字化资源组织在国际标准化方面取得了长足的进展。ISO、国际图书馆标准化国际组织、W3C(万维网联盟World Wide Web Consortium) 和 IETF(Internet Engineering Task Force)等都采取设立专家工作组、全程开放、吸收多方意见和建议等方式,积极推进标准规范的完善与推广工作。美国国家标准学会(ANSI)下设全国信息技术标准委员会,从事有关元数据的命名、标识、定义、分类和注册等工作。欧盟在信息与传播技术标准化方面也做了很大努力,1998年创建的标准化组织——信息社会标准化系统(Information Society Standardization System,ISSS)负责提供全面的标准化服务及产品,提高用户的标准化意识。随着数字图书馆的进一步发展,更为广泛和系统的标准规范体系正逐步被确立。如英国分布式国家电子资源项目(DNER)标准体系、美国RLG/CMI数字化指南、美国国家信息标准局(NISO)的图书馆系统标准指南以及新西兰国家图书馆元数据标准框架等,都对数字资源的管理、传播、利用和保存进行了系统规范。

目前我国数字图书馆标准建设也取得了较大进展。科技部《我国数字图书馆标准规范发展战略》项目按照数字资源的生命周期建立了关于数字化加工、资源描述、资源组织、资源互操作和资源服务等方面的标准规范;我国高等教育文献保障系统也编制了一系列《中国高等教育数字图书馆技术标准与规范》,但总体上来说我国数字图书馆标准规范建设还处于研究成果的宣传与推广阶段。2007年以来,《数字图书馆标准与规范建设》项目组委托中国科学院国家科学图书馆在全国范围内展开了“全国数字图书馆标准规范建设宣传与推广”培训活动,宣传推广数字图书馆的各类技术标准。但同时我国在数字图书馆支撑技术方面的标准规范,如信息传递标准、网络互连协议、服务标准和数据保存与安全标准等研究较少,现有的几种标准大多限于对资源的描述和著录,并且基本是对国际上比较通用的DC(Dublin Core,都柏林核心元数据集)研究和应用的结果。它们主要有:

①《中文核心元数据集》。由国家图书馆根据OAIS(开放式档案信息系统ISO标准)模型标准制定,其目标是为海内外中文数字资源的创建、存储、服务和交换提供一个统一的可供参考的中文元数据方案。它适应不同层次对元数据的制作要求,考虑了与其他元数据方案的可交换性,对中文元数据的总体框架结构、核心元数据集、基本扩展集、细分规则作了规定。其核心元数据涵盖了DC的所有基本元数据元素,集成了其他一些元数据项目的优点,形成了一套结构化的元数据解决方案。

②《数字式中文全文文献通用格式》。这是文化部制定的行业标准。它在通用置标语言以及其他国际标准的基础上设计了中文文献的数据格式,以DC为基本框架,共有16个数据项目,可以对文本、图像、音频、视频、计算机程序以及网址资源进行编目和数字化处理,并规定了中文数字化文献的文本著录格式,具有高度的兼容性和通用性。可以说是中文的“都柏林核心元数据”。

③上海图书馆数字图书馆元数据方案。以IBM DL2.4为开发平台,该系统的元数据方案采用以DC为核心集、多种元数据并存的方法,根据基于XML/PDF的资源描述体系将各类数据封装在一起,统一了元数据的描述方法,保证了原始素材内容管理中元数据的完整性,提高了元数据之间以及与其他资源对象数据之间的互操作性,同时也提供了一个统一的内容管理体系。

④《中文文献元数据标准框架》。北京大学数字图书馆研究所研制,以各类具有鲜明中文特征的金石拓片和敦煌古卷、善本、舆图等“中文文献”为资源实体对象的元数据标准。现已成为北京大学数字图书馆后续一系列元数据标准制定工作的规范性文件。北京大学古籍数字图书馆拓片元数据标准就是在此基础上制定的。

⑤机读目录MARC。它是传统的元数据代表。作为国内图书馆实现计算机自动化管理的规范格式,在图书馆中使用最广,是图书馆描述、存储、交换、处理以及检索信息的基础,经过不断发展已被图书馆用来描述和存取电子信息资源。从信息技术角度来看,MARC本身是一个详细的元数据规范,但不适合网络的特点。

从以上可以看出,中文元数据方案中相关数据项的数量相差较大,国家图书馆联合其他单位建立的“中文核心元数据规范”使用了近80个数据项,而清华大学使用的元数据项有16个,且以DC为主要依据。由于不同单位在中文元数据建设方面未达成共识,没有采取联合、协作、共享的策略,故此中文元数据的标准化和规范化还难以实现。同时,由于DC以描述性数据为主,不足以全面揭示电子文献的内容,而MARC虽对数据的描述十分详尽,但过于复杂,因此要想实现MARC与元数据格式之间的互操作和完全对应仍存在困难。

3 数字图书馆标准建设应注意的问题

3.1 由政府统一规划、组织和推行

数字图书馆工程不仅是高科技项目,也是跨部门、跨行业的大文化工程。同时数字图书馆的资源囊括了所有学科,而且还包括了文字、表格、图像、音频的数字化表达和无缝链接,组织极其复杂。因此数字图书馆标准与规范的制定涉及到计算机与通信技术、信息检索查询、文本编码、知识产权保护、电子读物、开放系统互连协议等诸多方面。它不是一个孤立的标准,而是一个标准体系,更需要多个标准之间的联系、协调与衔接,必须由政府出面来统一规划、组织和推行。

3.2 建设兼容性的标准,以解决异构系统间的互操作问题

正如我们所看到的,目前我国已经有很多社会团体在不同程度上进行了数字图书馆的建设或者电子资源的积累,这些都是未来数字图书馆的资源基础。我国数字图书馆建设由于各单位、各地区的发展很不平衡,资金、技术、人员素质、信息储量等条件差别很大,导致它们的开发目的、技术基础、运行手段都各不相同,这就造成了不同系统提供信息服务的底层应用、操作平台、通信协议等各不相同的情况。但作为面向整个社会提供信息基础设施服务的数字图书馆建设,不能也不应该把这些信息基础设施抹去重建,而必须充分利用这些现有的信息资源,以免造成人力物力的巨大浪费。这样一来异构平台的兼容、现有系统的集成、网络复杂系统的支持等问题就摆在了我们面前。因此,我国数字图书馆标准建设必须要充分考虑到我国现有的情况,要在已有的信息基础设施之上建设通用的、兼容性强的标准,实现更高层次信息服务协议的统一,从而解决异构系统间的互操作问题。

3.3 要注意与国际标准接轨,使我国数字图书馆建设与全球数字图书馆建设基本同步

在数字图书馆标准制定过程中,应参考国外所制定的标准,优先采用国际标准(ISO),其次采用国际同类项目使用的工业标准和事实标准。对于已经可用的成熟标准规范,在数字资源的组织、存储、加工、发布、检索、存取等方面,要充分加以吸收和利用,使之在数字图书馆环境中可以得到很好的实现。同时,由于这些标准基本上都是英文版本,所以在使用过程中,要结合中文环境的特殊性,实施本地化工作,在吸收利用的基础上研究并制定符合中文环境的标准规范。对于目前没有的标准规范,应根据数字图书馆建设的具体实践,本着与国际接轨的原则,通过周密细致的调研,制定出具有自主知识产权的技术规范,供我国数字图书馆建设使用。同时,在适当时机,可以向国家或国际标准化组织申请,将其形成国家或国际标准。对于需要继续研究和开发的标准规范,则应根据标准规范的动态发展变化和逐渐完善的特点,注意采用最新版本,及时更改或增加内容。

[1] 潘薇,喻杰.数字图书馆相关技术领域标准规范综述.世界标准化与质量管理,2008(6).

[2] 陈定权,张俭恭.数字资源建设及相关标准.图书情报工作,2002(6).

[3] 黄星亮.都柏林核心元数据及其在我国数字图书馆建设中的应用.津图学刊,2002(3).

[4] 郝晓蔚,沈玉兰.我国数字图书馆标准建设现状综述.科技情报开发与经济,2007(18).蒋晓艳 女,馆员,从事典藏工作。

猜你喜欢
标准规范数字化数字
家纺业亟待数字化赋能
高中数学“一对一”数字化学习实践探索
高中数学“一对一”数字化学习实践探索
工业锅炉标准规范数据库管理系统实现
答数字
数字化制胜
数字看G20
韩国拟修订食品容器和包装标准规范
成双成对
央行发布两项征信行业标准规范征信机构信息安全