陈红星 张淑芳 (湖南省怀化学院图书馆 湖南 怀化 418008)
随着互联网技术的飞速发展,特别是Web2.0技术的发展和应用,越来越多的人们不必再借助传统媒介而是通过互联网直接表达自己的观点和言论,基于人类互联网活动而产生的网络原生数字资源也因此应运而生。这些网络原生数字资源既包括大量非正式出版的个性化网络原生数字信息(如博客资源、网络论坛资源、网络原创视频资源、播客资源、网络原创音乐或小说、政府网站的服务信息、企业的广告与产品展示信息以及招聘信息等),也包括许多正式网络出版物(如网络原生电子期刊、通过超文本链接技术组织大量专题报道的电子报纸、大量具有学术价值的开放存取期刊等)。 网络原生数字资源作为近年来国内外图书馆界、情报界和其他信息工作领域的一个新概念,人们对其含义有不同的理解,还没有达成共识。含义理解的不一致不利于网络原生数字资源的理论研究和实践发展,因此本文试图对网络原生数字资源的概念、特征、类型进行较为深入的探讨。
免去对传统信息和传统信息资源的探讨,网络原生数字资源的产生可以追溯至数字信息资源的产生。数字信息资源是伴随着电子计算机的诞生而出现的,最早形式的数字资源是书目数据库。20世纪60年代后期,电子计算机技术、信息存储技术、数字通信技术和分组交换网的发展,使信息的远距离传输和交换成为可能。20世纪60年代末至70年代初,随着互联网络的诞生,网络数字资源也应运而生。进入20世纪90年代,基于网络开发的数字资源及其检索系统有了突飞猛进的发展,网络数字资源具有更新速度快、时效性强、可以免费获得、费用比较低廉等优势,不仅成为数字信息资源的主体,而且在整个信息资源体系中开始占据主导地位。进入21世纪,以博客、Wiki为代表的Web2.0技术的兴起,使人们直接通过互联网即可表达自己的观点和言论,网络原生数字资源逐渐出现。网络原生数字资源主要包括:电子邮件(E-mail)资源、电子布告板(BBS)资源、网络论坛(Forum)资源、留言板(Message Board)资源、博客(Blog)资源、维基百科(Wikipedia)资源、播客资源、网络原创音乐或小说、百度贴吧资源等;网络原生电子期刊、网络原生电子报纸;政府网站上的服务信息;企业的广告信息、产品展示信息、招聘信息;学校网站上的教学信息等。网络原生数字资源的产生过程如图1所示。可以说,网络原生数字资源是信息技术、计算机技术、互联网技术发展的必然产物,是网络数字资源发展的高级阶段(见图2)。
综观目前国内外有关网络原生数字资源的研究,多集中在博客、网络论坛、BBS等个别的网络原生数字资源开发和数据挖掘、保存上,系统研究网络原生数字资源的成果很少。究竟何为网络原生数字资源,目前还没有统一的认识和定义。
在国外,原生数字资源被称为“Born Digital”,美国著名的新词汇搜索网站Word Spy把原生数字资源定义为“仅仅以数字形式产生和存在的一种信息资源”[1];联合国教科文组织( United Nations Educational, Scientific and Cultural Organization,简称UNESCO ) 把原生数字资源定义为“除了数字形式再没有其他载体形式的信息资源”[2]。国外的定义特别强调“数字形式”是原生数字资源的唯一形式,这既强调了原生数字资源的数字原创性,也指明了原生数字资源在存续期间的数字形式是其唯一形式。
在国内,李宝强、孙建军从数字资源产生的技术手段出发,把原生数字资源定义为“直接由文字处理软件、CAD、数字摄像设备等数字信息系统产生的数字资源”[3];常娥、袁曦临从原生态的角度出发,把网络原生数字资源定义为“网上最初始的信息资源,指那些利用计算机和网络创造、生成、存储及传播的数字资源,并且没有经费支持,没有固定的组织、机构或者商业公司加以管理,由网络用户自发创作的、原汁原味的信息资源”[4]。国内对原生数字资源的定义强调了原生数字资源的数字原创性,但没有明确指出数字形式是其唯一的表现形式。
因此,国外的网络原生数字资源定义的外延要比国内的小得多。国内定义的网络原生数字资源既包括了国外定义的网络原生数字资源,又包括了大量具有数字原创性并在其传播、利用、保存过程中出现了其他非数字形式的信息资源,如预印本、以传统形式出版的网络小说等。
在互联网信息技术迅速发展及信息资源的生产、传递、获取、存储发生根本性变化的今天,网络原生数字资源具有区别于其他网络数字资源的独特内涵。因而网络原生数字资源的定义要反映出其在新的互联网信息环境中的特征和内容以及有别于转化型网络数字资源的特质。因此,笔者认为可以这样定义网络原生数字资源:所谓网络原生数字资源,是指直接在互联网活动中产生的或仅仅发布于互联网并仅以数字形式传播交流、保存利用的网络信息资源。
该定义包括两个方面的内涵:
(1)直接产生于互联网活动中或仅发布于互联网 直接产生于互联网活动是指网络原生数字资源具有网络“原生态”性,是网民在互联网活动中的即兴原创,并直接发布。网络原生数字资源的另外一种情况是,原创数字资源并不直接产生于网络活动,而是作者在其他数字设备(单机电脑、数码相机等)上已经创作完并存储在数字生产设备中,没有以其他形式发表而是仅仅发布在互联网中的原创数字资源。这里的发布不仅包括公开发表,也包括将资源保存在不对外公开的互联网私人空间,如一些加密的网络信息资源也是网络原生数字资源。
(2)仅以数字形式产生、发布、传播交流并保存 网络原生数字资源从产生、发布、传播交流到最后的长期保存都只能以数字载体形式存在。例如,目前原创于互联网的网络小说中,许多点击率高的网络小说最后都再以传统形式出版,可以说,网络小说在以传统形式出版之前,它是网络原生数字资源;而以传统形式出版后,就不再是网络原生数字资源。可见,网络原生数字资源是一个单向动态的概念,即网络原生数字资源会因为其从数字形式变为传统载体形式而转化为非原生网络数字资源,而不会因为其从传统载体形式变为数字载体形式而成为网络原生数字资源(见图3)。
网络原生数字资源是网络信息资源发展到高级阶段的必然产物,是网络信息资源的重要组成部分,因此具有网络信息资源的共同属性,即链接性、多样性、无序性、动态性、开放性、网络共享性、时效性、不安全性等。同时,网络原生数字资源作为高级阶段的网络信息资源又具有与其他网络信息资源相区别的独特特征,主要表现为网络原创性、数字形式唯一性和极易灭失性等。
网络原创性不仅指信息内容是作者首创,具有新颖性和独特性,而且指整个信息生产的过程是基于互联网环境的,即在互联网活动中产生的内容新颖、具有独特个性的数字信息资源。一方面,网络原创性表现为数字资源直接产生于互联网活动中,具有网络原生态性。直接产生于互联网活动是指原生数字信息直接在互联网的网页或即时通讯工具上创作、生产,在其发布之前没有任何的复制品,这样其网络原创性非常明显,能够体现生产者创作、修改的整个过程。但是同样由于其生产、发布、流通、保存都在互联网中,并且没有复制品,非常容易被改动和丢失,改动丢失后无法找回原数字信息。另一方面,许多网络原生数字资源的生产者鉴于网络的不稳定性和不安全性,不是直接在互联网的网页中生产数字信息,而是把欲发表的数字信息在单机或其他数字设备上进行编辑和存储,再向互联网上传、发布,并且互联网是其唯一的发表空间。这样发表在互联网上的数字资源也具有网络原创性,但由于其发布的数字资源往往多是最终产品,所以不能很好地体现网络原生数字信息生产者在数字资源创作过程中的完整信息。不过,因为其拥有数字复制品,因此,与直接生产于网页或即时通讯工具的网络原生数字资源相比具有较高的稳定性和安全性。
信息是客观存在的物质,数字是一种离散的表示信息内容的符号。数字形式唯一性是指网络原生数字信息自始至终只能以数字形式存在,即网络原生数字资源的产生、发布、传播交流直至保存都只能以数字的形式存在,一旦该信息出现了其他载体形式(如传统的纸本形式),不管其是否具有网络原创性,都不能再称之为网络原生数字资源。例如,现在流行的原创网络小说开始时都是网络原生数字资源,一旦以传统的纸质形式出版发行,其传播交流、保存利用模式就不再只是在网络数字环境下,这时就不能再称其为网络原生数字资源,这是由网络原生数字资源数字形式唯一性决定的。因此,数字形式唯一性是网络原生数字资源区别于转化型非原生网络数字资源的重要特征(见图3)。
极易灭失性是由网络原生数字资源的数字唯一性决定的。网络原生数字资源因为只有数字化的存在形式,相对于其他网络数字资源而言,稳定性较差。转化型的非原生网络数字资源由于互联网的更新、变动、删除,丢失的只是互联网环境下的数字形式,传统形式的信息内容仍然存在,因此信息并没有灭失;而网络原生数字资源由于只存在数字形式,如果没有对其进行长期保存,将可能面临彻底消亡的危机,这种灭失对人类文明的保存和发展是巨大的损失。网络原生数字资源的极易灭失性是进行网络原生数字资源长期保存的重要原因之一。
与其他非原生网络数字资源相比,网络原生数字资源更加具有开放性。例如,目前的开放存取( Open Access,简称OA )就是基于网络原生数字资源的一种数字出版模式。另外,网络原生数字资源具有更强的时效性,特别是基于即时通讯工具产生的网络原生数字资源,用户可以看到信息资源生产者动态的生产过程,如QQ聊天资源、聊天室资源等。
网络原生数字资源的范围非常广泛,形式多种多样,内容纷繁复杂,依据不同的标准,可以划分为不同的类型。
依据网络原生数字资源的应用形式,可划分为万维网信息资源、电子邮件信息资源、FTP信息资源等。
(1)万维网 是World Wide Web(缩写为WWW)的中文名称。万维网信息资源是互联网中最普遍存在的一种信息资源形式,即Web资源。
(2)电子邮件(Electronic mail,简称E-mail) 是一种用计算机网络提供信息交换的通信方式,是互联网应用最广的服务之一。用户通过E-mail,可以用非常低廉的价格、以非常快速的方式与世界上任何一个角落的网络用户联系,获取大量的网络原生数字资源,并实现轻松的信息搜索。
(3)FTP(File Transfer Protocol,文件传输协议) 是互联网上用来传送文件的协议,是为了能够在互联网上互相传送文件而制定的文件传送标准。基于这种应用,目前互联网上大量的FTP服务器存储着大量的网络原生数字资源。
从网络原生数字资源的组织形式上看,可划分为自组织形式的网络原生数字资源,以网站、信息门户组织的网络原生数字资源,以数据库组织的网络原生数字资源,以数字图书馆组织的网络原生数字资源等。
(1)自组织形式的网络原生数字资源包括搜索引擎中的网络原生数字资源、博客资源、Wiki资源、电子邮件资源、播客资源、BBS资源等。这些资源是基于互联网络自组织技术形成的网络原生数字资源。
(2)网站、信息门户致力于将特定学科领域的信息资源、工具与服务集成到一个整体中,为用户提供一个方便的信息检索和服务入口[5]。网站、信息门户按照一定的资源选择和评价标准、规范的资源描述和知识组织体系,对具有一定学术价值的网络原生数字资源进行搜集、选择、描述和组织,并提供给用户检索、利用专门性网络原生数字资源信息组织形式。
(3)数据库是将相关数据以一定的组织方式存储在一起的集合,是数字信息资源最早的形式,也是数字信息资源的主要构成部分。主要的原生数字资源数据库应包括网络书目数据库、网络原生机构知识库等。
(4)数字图书馆领域的组织问题更多的集中在对异构网络原生数字资源系统的整合上,它的目标是整合现有资源系统的检索资源,形成统一的检索界面并将其呈现给最终用户。
按照网络原生数字资源的可获得性,网络原生数字资源可划分为开放存取网络原生数字资源和非开放存取网络原生数字资源。
(1)开放存取(OA)资源是指某种信息资源在互联网公共领域里可以被免费获取,允许任何用户阅读、下载、拷贝、传递、打印、检索、超级链接,并为之建立索引或其他任何合法用途。用户在使用该文献时不受财力、法律或技术的限制,而只需在存取时保持文献的完整性[6]。开放存取网络原生数字资源主要有:原生OA期刊(Open Access Journal,简称OAJ)和原生OA仓储[7]。
(2)非开放存取网络原生数字资源主要指付费使用的网络原生数字资源和限制使用的网络原生数字资源。
按照搜索引擎是否能够收集到,可分为浅层网络原生数字资源和深层网络原生数字资源。
(1)传统的搜索引擎能够抓取到的网页称为浅层网络,存在于浅层网络的原生数字资源称为浅层网络原生数字资源。
(2)搜索引擎抓取不到的网页称为深层网络,同理,存在于深层网络的原生数字资源称为深层网络原生数字资源。
从资源提供者来看,可分为商业化的网络原生数字资源和非商业化的网络原生数字资源。
(1)商业化的网络原生数字资源包括数据库商、出版商和其他机构以商业化方式提供的各种网络原生数字资源。
(2)非商业化的网络原生数字资源主要指免费的网络原生数字资源,这些网络原生数字资源大多都是免费的。
按载体类型可分为文本网络原生数字资源、音频网络原生数字资源和视频网络原生数字资源。
(1)文本网络原生数字资源主要指存在于网页的网络小说、博客文章等。
(2)音频网络原生数字资源主要包括网络原创的MP3、WMA等格式的网络音乐,个性手机铃声等。
(3)视频网络原生数字资源主要包括播客视频、拍客视频、网络原创电影等。
按出版形式可分为正式出版网络原生数字资源和非正式出版网络原生数字资源。
(1)正式出版的网络原生数字资源是指通过正式的网络出版渠道发布的网络原生数字资源,如包含多媒体及其他动态信息并具备超链接功能等优势的网络原生电子期刊;动态的、多媒体的、可及时更新并通过超文本链接技术组织大量专题报道的电子报纸[8];大量具有学术价值的完全开放存取期刊等。
(2)非正式出版的网络原生数字资源,如个人博客资源、播客资源、BBS资源,政府网站上的服务信息,企业的广告信息、产品展示信息、招聘信息,学校网站上的教学信息等。
[1]Word Spy. Born-Digital[EB/OL]. [2009-07-03]. http://www.wordspy.com/words/born-digital.asp.
[2]UNESCO. On the Preservation of the Digital Heritage [EB/OL].[2009-07-03]. http://www.cdnl.info/ 2003/07unesco.pdf.
[3]李宝强,孙建军. 试论数字信息资源配置模式[J]. 情报资料工作,2007(2):44-48.
[4]常 娥, 袁曦临. 网络原生数字资源管理问题探析[J]. 图书馆建设,2009(5): 27-30.
[5]蔡 箐. 学科信息门户及其优化途径[J]. 中国图书馆学报,2008(4):45-50.
[6]Charles W. Bailey J. What Is Open Access?[EB/OL]. [2009-07-02].http://www.digital-scholarship.org/cwb/WhatIsOA.pdf.
[7]李 武. 开放存取出版的两种主要实现途径[J]. 大学图书馆学报,2005(4):58-63.
[8]肖希明. 数字信息资源建设与服务[M]. 武汉:武汉大学出版社,2008:5.