●王知津,王丽娜,胡玲玲(南开大学 商学院信息资源管理系,天津 300071)
随着我国互联网络的日益成熟和发展,网络学术资源也得以快速增长,因其时效性强,有助于了解国内外学术动态而备受我国学者的青睐,最明显的表现就是学术期刊中网络引文数量明显增多。然而,网络资源的不稳定性却成为其作为学术期刊参考文献的瓶颈,按照文后提供的URLs追溯引文时,“找不到网页”“禁止访问”等现象很普遍。如何改变这一现状,是学术界关注的一个重要问题。
随着我国网络的迅速发展,网络资源数量剧增。据中国互联网信息中心的调查显示:截至2009年12月31日,中国网民规模达到3.84亿人,普及率达到28.9%;网民规模较2008年底增长8600万人,年增长率为28.9%。[1]随着计算机网络技术的发展与应用普及,Web2.0时代的到来,开放获取运动的开展,网络出版开始红火,网络信息资源将越来越多地成为人们科研参考的来源。
的定义一般是:为撰写或编辑论著而引用的有关图书资料。网络文献以其时效性、丰富性、简便性等受到越来越多的学者青睐。由此可见,将参考文献仅仅局限于印刷型文献已经难以适应学术研究的需求和发展,网络参考文献的提法应运而生。
所谓网络参考文献,是指学术论文后面所附的、其来源出处是因特网资源的参考文献,实际上就是用作学术论文参考文献的网络资源,著录内容中含有网址是其突出特征。网络参考文献是参考文献的一种,是社会信息化的必然产物。
网络参考文献具有一般参考文献的功能,并逐步发展成为有价值的学术期刊不可分割的重要组成部分。评价一篇论文的质量如何,其学术研究是否具有新颖性和创造性,与文后所列参考文献的质量和数量是分不开的。
网络参考文献的功能包括:① 可以为学术论文中的新观点提供依据。② 可以反映学科之间的交叉渗透关系。通过对网络参考文献的考察,可以发现与作者学科联系较紧密的另一个学科,从而可以借鉴另一学科的理论与方法,发展综合性学科,特别有助于目前尚未确立本学科理论体系的新学科,建立适合自己的学科理论体系。③ 通过研究网络参考文献的可获得性,可以发现信息传播交流的规律和评价网络信息资源的质量,有利于刺激网络信息资源的建设,以及建立网络信息资源的质量评价体系。
网络参考文献的可追溯性,即文后网络参考文献提供的网址可以打开,并且所进入网页的内容与网络参考文献中所著录的责任者、题名、出版时间等内容相符,或者已更新的网址链接自动或手动地转移至新网址后,网页上含有与网络参考文献中所著录的责任者、题名、出版时间等相符的内容。如果网络参考文献提供的网址不能直接获取,但在其一级域名通过该网页上的“搜索”功能或目录超链接对引用内容进一步查找到文献也可算作可追溯。
网络迅速扩张带来信息污染、信息混杂,真假难辨,因此,研究人员在选择利用网络参考文献时往往陷入两难境地:一方面,网络文献的时效性、新颖性无疑是吸引研究人员的一大优势;另一方面,网络文献的易变性、不确定性和不可靠性又成为研究人员利用网络文献的最大障碍,这直接影响到研究人员的参考利用。试想,如果网络参考文献无法获取,网络参考文献就发挥不出原有的价值。所以,网络参考文献可追溯性研究具有重大意义。目前我国在这方面也有所研究,但与国外一些发达国家相比还有一段距离。
网络参考文献的可追溯性与许多因素有关,下面分别从论文发表时间、参考文献的语种、网络信息资源的类型、来源网站4个方面加以考察。
Germain调查了31种随机选择的学术期刊论文的64条URL引文的可获取性,在3年的时间里,URL引文的可获取性百分比每年下降11%左右。[2]而在3年后,几乎50%的URL引文无法获取。网络参考文献的可追溯性与论文发表时间大致成负相关,即论文发表时间越久,文后的网络参考文献的可追溯率越低。
考察我国学术期刊上的网络参考文献可以发现,所参考的网络信息资源以英文居多。从表面看,语言反映的是语种问题,而在深层次上,反映了国家网络信息资源的丰富性、新颖性及管理水平。使用英语的国家主要有美国、英国、加拿大、澳大利亚,这些国家科技比较发达,尤其是美国,网络技术比较成熟,网上信息资源的管理和建设也比较好,可追溯率较高。很自然地,研究人员在撰写自己的学术创新成果时,通常优先选择这些网络信息资源作为自己观点的佐证,或者作为参考,从而使得英文网络信息资源的引用占了很大的比例。表1可以在一定程度上反映网络参考文献的可追溯性与语种的关系。
表1 网络参考文献的可追溯性与语种的关系[3]
由表1可知,在被调查的学术论文的网络参考文献中,80%来自英文网站上的网络信息,而引用国内网络信息资源还不到10%。该结果表明,与上述发达国家相比,我国网络信息资源建设存在着明显的差距。中文网络信息资源在数量上明显落后于美英等国家,而且网络信息资源的稳定性、持久性也有待于进一步改善。
按照互联网所提供的服务来划分,可作为参考文献的网络信息资源主要包括:WWW信息资源、FTP信息资源、Gopher信息资源等。WWW将位于全世界互联网上不同网址的相关数据信息有机地编织在一起,通过浏览器提供一个友好的查询界面,用户仅需要提出查询要求即可;FTP信息资源可被用来在两台位于互联网上的计算机之间传输文件,它是一种实时的联机服务,用户可免费从网上获取别人的资源,达到信息共享的目的。Gopher信息资源是基于菜单驱动的互联网信息查询工具,在菜单指引下,用户通过选取自己感兴趣的信息资源,对互联网上远程联机信息系统进行实时访问。
由以上定义可以发现,WWW服务方式发展比较成熟,信息资源比较丰富,稳定性好,因此,这种网络信息资源作为网络参考文献其可追溯性好,引用者也多,在网络参考文献中占主导地位。而FTP和Gopher等其他方式,由于针对特定用户服务,且其服务的时间有所限制,提供的资源类型也有局限,故而研究人员以此方式获得的信息有限,利用这些网络信息资源的不多,从而使用这些网络信息资源作为参考文献的可追溯性也较差。[3]
网络资源都有一个自己的网址(URLs),通过这个网址可以找到对应的信息,这就如同一把钥匙打开一个抽屉,得到物件一样。更为奇妙的是,我们可以从网址的域名看出它是哪一种性质的资源。以情报学期刊为例,其引用的网络信息资源将近一半是从全球4.39%域名的.edu、.org、.gov上获取的,这主要是因为这些网站资源的稳定性与持久性,但政府网站资源可追溯率不高。而达到36.39%的.com与占全球高达43.22%的.net站点的资源,在网络参考文献中所占比例却很低。[4]这主要是因为这些机构并不是网络文献的保存单位。可见,研究人员在利用选择网络参考文献时,不仅要从权威性出发,也要考虑其可追溯性。
网络参考文献和一般网络信息资源一样,检索方便,类型丰富,传递快捷,但也保留了网络信息资源的不确定性和不规范性的缺点,使得历时较久的信息被移动而难以查找,甚至被删除而不能获得,导致网络信息资源作为参考文献的不可追溯性。
我国在信息化方面起步相对发达国家较晚,虽然取得了令人瞩目的成就,但也存在着许多问题,这影响了作为参考文献的网络信息资源的可追溯性,具体体现在以下几个方面:
(1)网络信息资源的利用
在利用态度方面,有人对2002年度国内5种大学学报上采用网络资源作为参考文献的论文情况进行调查,结果表明,采用网络资源作为参考文献的文章只占论文总量比例的0.93%—5.83%之间。[5]作为参考文献,网络信息资源保留了一般网络信息资源的稳定性差等缺陷,许多作者在引用网络信息资源时都有所担忧,这就使得我国的网络信息资源的利用不足,影响到我国网络信息资源的成熟和发展。试想,如果不存在网络信息资源的引用,网络参考文献的可追溯性又从何谈起?
在著录格式方面,在使用网络参考文献时,对其著录格式的要求不是很严格,导致含有错误著录格式的网络参考文献的论文发表。所发布的网络信息应当包含责任者、题名、发布时间、更新时间等项目内容。黄明对2002年10期国内外期刊中的267篇网络参考文献的著录情况统计发现,仅著录网址的有55篇,占20.6%,不完整著录的百分比为48.3%,几乎达到半数;而完全著录的只有40篇,占15%,其中有21篇是属于美国的《The LibraryQuarterly》。[6]
表2表示网络参考文献著录不完整或错误时,利用现有的正确的著录项查找文献时,其追溯率:
表2 网络参考文献可追溯性与著录格式的关系[7]
从表2可知,依靠某些著录项的组合而不是完整的著录来查找文献,其追溯率相对要低。如果格式错误,就会造成著录中某些项的错误或丢失,依靠这些缺失或错误的信息查找文献时,必然会影响可追溯性。
(2)网络参考文献的数量和质量
信息的特点决定了满足人们信息需求不只是在信息的数量和规模,而是信息的品种和类型。网络的开放性,一方面,刺激大量冗余信息的膨胀,甚至许多虚假、劣质信息得以泛滥,一旦学者引用此类信息,可追溯性就难以得到保证。另一方面,使得非法拷贝、抄袭个人和组织的研究成果的现象无法控制,作者的知识产权受到侵犯,使得研究人员对网络信息表示怀疑。虽然开放存取运动在我国已经出现,而且我国在硬性保证学术成果对公众开放方面也已有所作为,然而,在自愿公开方面还存在不足,这进一步加深了我国学术性网络信息资源数量和质量的不足,必将直接影响网络资源作为参考文献的可追溯性。
(3)网络信息资源的保存
网络文献不如纸质文献持久、稳定,其保存难度也相对更大。许多作者对网络信息资源用作参考文献持怀疑态度的一个重要原因,就是网络信息资源的长久保存问题。实现网络信息资源的有效保存,无疑能够大大提高网络参考文献的可追溯率。关于网络参考文献的持久性、稳定性,有人对网上资料用作参考文献的重现性进行了调查:仅从“著录析出部分+出处部分”和“著录析出部分+出处部分+引用日期”两种形式的文献中随机抽查了10条,析出部分即析出责任者、析出题名,结果发现仅有4条能重现原文。[6]由于网站的更新和维护,资源的定期更新和删除十分正常,这就导致了死链接,无效URLs等,使原始信息无法重现。
如果建立起网络信息资源的评价标准,就可以杜绝不符合要求的低质网络文献作为参考文献,使网络参考文献更可靠,可追溯率也会提高。为此可以参考Grassian和Zwemer所提出的6项评估准则[8]:
(1)权威性和正确性。① 看看网页上的信息是由谁放上去的;② 网页作者的身份背景、资历,以及在此学科方面的权威性如何;③ 是否有提供一种查证渠道,可以验证网页上所提供的信息。
(2)观点立场和客观性。① 网页的作者所提供的信息是事实,还是个人之意见,亦或是揣测之词;② 提供论点或意见是以中立者的角度来叙述或是以主观者的角度在评论,注意是否具有相当的客观性;③ 网页内容的观点和立场是否与常理相违背,亦或是谬论。
(3) 时效和范围。① 网页内容是否有时时更新或定期更新,并且有没有把更新日期标示出来;②注意网页信息是不是最新的,或是已过时;③ 网页内容是否完整涵盖了主要的范围,与主题相关的资料是断章取义,还是搜集完备。
有效的网络信息资源整合可以减少信息污染,有利于从分散无序的信息资源中快速查找和获取所需信息。这直接影响到作为参考文献的网络信息资源的利用,从而提高其可追溯性。目前,我国应当针对国情开展信息资源整合的理论和实践的研究。整合所涉及的技术很多,主要有Z39.50协议、都柏林核心元素集等。Z39.50是分布式虚拟联合数据库检索体系,其目的是实现网上多个数据库检索、规范查询格式、简化检索过程、实现异构系统和不同图书馆系统之间的通信;都柏林核心元素集能较好地解决网络资源的发现、控制和管理问题。[9]面对日益膨胀无序的网络信息,我国应当将网络信息资源整合提上日程,制定网络信息资源整合的相关标准,探讨相关技术,以便快捷准确地检索到网络信息。
网络参考文献的著录格式应当包括:① 作者。如果作者是不可用的,引用网页标题。② 出版日期。可用的最后一次更新;如果没有出版日期,使用未检出(没有出版日期可用)。③ 网页标题。引用一个特定网站的文章,给出文章的标题和较大的网站的名称。④ 网址。“统一资源定位器”是文档的网址。[10]
有人认为,减少参考文献著录格式错误要从三个方面入手,这三个方面同样适用于网络参考文献:①在作者终稿时或向作者约稿时,应把网络参考文献的著录要求作为单独一项提出,说明网络参考文献的作用和意义,引起作者注意。② 审稿专家对网络参考文献进行检查,格式是否正确,是否可连通,可追溯。③ 审稿结束后,编辑可提醒作者修改网络参考文献著录中的错误。[11]
美国APA组织建议的做法是在文章撰写时、投稿时、最后确定发表稿件时,或者验证证据时,作者要定期测试网络参考文献的URLs。如果所引用的文件已被移动,就要采用新的、正确的URLs;如果所引用的文件已不存在,就应该用另外的资源代替或者完全把它从文章中删除。
目前,我国在网络信息资源的保存方面还应在以下方面予以加强:① 应使保存信息的主题更加多元化,加强动态网页信息的采集。② 重视合作。网络信息资源的保存不是哪一个机构可以独立承担的,要扩大合作范围,建立以国家图书馆或档案馆为领导的、其他信息保存机构参与的全国范围的分布式网络信息资源保存体系。该体系要解决的重要问题在于统筹规划,避免重复性的劳动。③ 继续重视国际交流与合作,包括技术框架的借鉴与交流,以及积极参与国际范围的网络信息资源保存系统的建设。
有助于网络信息资源保存的其他观点包括,把非数据库型网络信息资源下载到本地保存、整序;使用网络蜘蛛和信息抽取器,依靠网络蜘蛛下载网页,保存在本地硬盘,利用信息抽取器对搜集回来的网页抽取标引信息,保存在本地数据库中向用户提供服务。[12]
[参考文献]
[1]CNNIC.第25次中国互联网络发展状况统计报告[EB/OL].[2010-01-15].http://www.cnnic.cn/html/Dir/2010/01/15/5767.htm.
[2] Germain,CarolAnne.URLs:uniform resource locatorsorunreliableresource locations[J].College&Research Libraries.2000,61 (4):359-365.
[3]吴志强.我国学术论文中的网络参考文献可追溯性考察分析 [J].情报学报,2006,25(1):80-86.
[4]胡德华,孙振球.网络参考文献的可接受性、选择性和可获取性研究[J].情报学报,2006,25(2):179-183.
[5]苏雪梅.论网络资源成为学术论文的参考文献[J].四川师范大学学报,2003,30(6):137-140.
[6]黄明.网上资料作文后参考文献的著录问题[J].图书馆论坛,2003,23(5):40-42.
[7]冯英华,等.网络文献资料引用状况的调查与分析[J].新世纪图书馆,2008(1):64-68.
[8]中国科学院国家科学图书馆.查找网络资源[EB/OL].[2010-04-20].http://www.las.ac.cn/subpage/subframe_detail.jsp?SubFrameID=1010.
[9]彭凤兰,朱长菊.论网络信息资源的整合研究[J].高校图书馆工作,2009,29(130):21-23.
[10] Patrick Hartsfield.APAstyle-How toDocumentinformation[EB/OL].[2010-01-19].http://www.lib.wsc.ma.edu/apastyle.htm.
[11]高雪莲,等.医学论文参考文献的核查方法及网络查阅技巧 [J].中国科技期刊研究,2009,20(1):173-175.
[12]贾晓斌.网络信息资源采集与本地化转换[J].图书情报工作,2003(11):55-59.