于 洋
(河南科技学院图书馆 河南 新乡 453000)
国内三大中文数字期刊库的比较分析
于洋
(河南科技学院图书馆河南 新乡453000)
选取中国知网、维普以及万方三大数字出版集团的中文学术期刊数据库作为调查对象, 分别从其收录期刊的整体重复率、更新延迟情况、检索时的易操作性和界面友好等几个角度对三大期刊数据库进行比较和分析,以为高校图书馆在数字资源建设方面提供一定的参考。
中国知网; 重庆维普;万方数据库;中文数字期刊库
中国数字期刊于20 世纪90年代开始出版发行,期间几家大型的数字出版集团显露头角并逐渐占领大部分市场,它们分别是中国知网(以下简称CNKI)、重庆维普(以下简称VIP)和万方数据库。
本次研究选取了CNKI、VIP以及万方三大数字出版集团中的中文学术期刊数据库作为调查对象, 分别从其收录期刊的整体重复率、收录期刊的更新延迟情况、检索时的易操作性和界面友好等几个角度对三大期刊数据库进行比较和分析。本次研究期望能从整体的角度反映中文数字学术期刊的出版发行现状,以为高校图书馆在数字资源建设方面提供一定的参考。
三大期刊库的源数据均是来自各数据服务商,
截至时间到2014年。其中,CNKI所出版的《中国学术期刊网络出版总库》样本的期刊数量7 842种。VIP出版的《中文科技期刊数据库》样本期刊数量9 569种。万方的《中国学术期刊数据库》集中了多种科技、人文和社会科学期刊的全文内容,样本期刊有7 676种。本研究目的旨在了解各期刊库中所有数据的整体重复率,而不仅仅是选取其中某一学科进行对比,因此样本数量较大,误差是不可避免的。为了了解三大数字期刊库收录期刊的整体重复情况,分析时采取两两比较的方式,即分别将两个期刊库中的数据通过逐条对比得出重复的数量,然后再计算出重复量占两个库的百分率[1]。
通过逐条对比,发现CNKI与VIP的重复期刊数量是6 541种,占CNKI总数量的83.41%,占VIP总数量的68.36%。CNKI与万方的重复期刊是6 048种,占CNKI的77.12%,占万方的78.79%。
表1 三大期刊库收录期刊的整体重复率
VIP与万方的期刊重复数量最高,达到6 773种,占VIP的70.78%,占万方的88.24%。也就是说,三大期刊库两两对比的重复期刊数量都超过了6 000种,重复数量是相当高的,均超过各期刊库的70%以上。其中,万方库的重复率是最高的,与CNKI的重复率有78.79%,与VIP的重复率更高,为88.24%。可见重复建设现象非常严重,应该给予相当的重视。另外,VIP的重复率分别是68.36%(CNKI与VIP)和70.78%(VIP与万方),重复率是相对较低的,分析其原因可能是由于VIP数据库中期刊总量是最多的,分母就是最大的,因此,重复率的数值相对比其他要小。
本次研究统计了三大期刊库收录中文核心期刊的情况,中文核心期刊目录是参照北大中文核心期刊目录(2011年版),核心数量是1 983种[2]。通过对比发现目前三大期刊库的核心期刊覆盖率均达到90%以上。
表2 三大期刊库的中文核心期刊收录情况
数字期刊库中的期刊如果能同步更新,无疑是对科研工作者最有益的帮助。研究通过随机选取30种期刊进行调查分析。为了使样本能够兼顾一般性和重点性,参照三大期刊库的学科分类,此次调研选择工业技术、经济管理和农业科学3个类别,每类挑选10种期刊作为研究对象。其中每个类别中前五种为核心刊,后五种为一般刊物。进行调查分析的时间集中在2014年12月。因此,截止到调研时间,样本期刊发行的最新的季刊应该是第4期,双月刊是第6期,单月刊是12期,半月刊是24期。
通过表3可以看到样本期刊在三大期刊库中均存在明显的延迟现象,其中只有CNKI中的2种期刊和万方中的1种期刊基本实现了同步更新。另外,截止到调查日期,样本期刊在VIP期刊库中的缺期现象比较普遍,但是通过研究分析,只是当年的期刊存在缺期的现象。在万方期刊库中,一些样本期刊存在长时间滞后的现象,如《水电能源科学》最后更新日期是2012年8月。类似的还有《现代图书情报技术》更新至2009年9月,《中国食用菌》更新到2012年3月,《饲料与畜牧》更新到2008年12月。
2.2绝对延迟时间
绝对延迟时间是指调查采样时期刊库中收录的某本期刊最近一期的发行时间滞后于该刊最新一期发行的时间[3]。首先,从各期刊库中收录期刊的绝对延迟情况进行调查,绝对延迟时间下文用TD表示。另外,考虑到上文观察到在万方库中有4本期刊存在长时间滞后的问题,为了使数据具有对比意义,在下面的分析中不考虑它们。
2.1更新情况
表3 随机选取的期刊更新情况
注:(Q:季刊,D:双月刊,S:单月刊,H:半月刊)
表4 随机选取期刊的绝对延迟情况
通过调查三类学科的延迟时间,在CNKI中,TD=47;在VIP中,TD=99;在万方中,TD=108。在CNKI、VIP和万方期刊库中的样本期刊分别平均滞后了1.8期、3.3期和3.6期。总的来说,CNKI的期刊更新速度远远优于VIP和万方,究其原因,应当考虑到样本情况的复杂性,比如有些期刊是半月刊,一旦缺期就会对分母影响比较大,比如万方库中收录的图书情报工作属于半月刊,更新到了第5期,就滞后了19期。
2.3相对延迟时间
表5显示了三大期刊库两两之间的相对延迟情况,其中CNKI期刊库相对VIP在期刊更新速度上领先了53期,VIP相对万方领先了8期,万方相对CNKI的期刊更新速度滞后了61期。
表5 随机选取期刊的相对延迟情况
3.1检索界面接入方式
VIP推出的平台即维普期刊资源整合服务平台,通过在同一个界面切换菜单的方式可以检索文献或者查找期刊。万方新改版的万方数据知识服务平台操作更加方便,实现了一站式检索的功能,可通过切换检索框上方的期刊类型进行检索。当切换为期刊类型时,输入框后面会有检索论文和检索刊名两种选择按键,输入信息后只需点击对应按键即可。相对来说,CNKI的期刊检索体验就繁琐一些,在主页检索框上切换到期刊类型后,可以检索到文献内容;如果需要查找某本期刊,需要点击页面右上角的期刊导航打开新的界面,反之亦然。总的来讲,VIP和万方都推出了专门的平台,无论是检索某篇文献还是查找某种期刊,其相对应的检索输入框是很容易找到的,CNKI则是在不同的页面实现的,给用户带来了一些不便。
3.2期刊导航
CNKI的期刊导航做得是最细致的,可以按照大学科类别、刊期、出版地、刊源、核心刊等多种形式进行查找。并且每种类别及子类的后面均备注了期刊的数量[4]。VIP实现了按照学科、核心刊、地区分布和国内外数据库进行导航的功能,并且在小类的后面标注了相应的期刊数量[5]。万方的期刊导航界面目前实现了学科、地区和首字母导航。并在首界面展示了最近更新的期刊图片和最新上网期刊列表。但是如果要了解每类期刊的数量,需要通过点击具体的类别打开新的界面才能找到相关数据[6]。综上,三大期刊库的期刊导航都可以实现最基本的首字母、学科和地区的导航功能,值得一提的是CNKI的导航界面制作的更细腻,功能实现的更全面。
表6 三大期刊库的检索途径
3.3检索方式及检索途径
CNKI期刊检索界面提供的检索方式比较多,有基本、专业、高级、作者发文、科研基金、句子和来源期刊检索。VIP的期刊检索界面提供了基本、专业和高级检索。除此之外,CNKI和VIP在主界面可以选择期刊的来源和限定年限,VIP还可以限定学科类别。CNKI和VIP均可以很方便地实现二级检索。而万方主界面只实现了按关键词或者篇名的基本检索功能。如果需要使用其他检索途径需打开高级检索页面,这样操作起来显得比较麻烦。另外,高级检索界面无法实现二级检索,这也是一个不足之处。下面详细列出了各自的具体检索途径。从表6的检索途径可以看出三大期刊库均提供了多种形式的检索途径,其中,各期刊库独有的检索方式有:CNKI可按照ISSN和CN号检索以及全文检索;VIP实现了第一作者、作者简介、栏目信息和任意字段的检索;万方可以实现按照DOI和日期的方式进行检索[4-6]。
表7 三大期刊库的检索结果显示
3.4检索结果显示
从检索结果的显示界面来看,目前三大期刊库的显示都是比较详细的,序号、题名、作者、期刊、摘要这些关键信息均可以看到,万方库还单独提供了关键词信息。其中,如果需要看到CNKI的摘要信息,需要通过点击检索结果上方的切换按键,稍显繁琐。另外,万方库在文献处标识了来源刊的情况和被引用情况,CNKI还标明了下载次数。三大期刊库在结果页面均提供了下载和在线阅读的功能。CNKI和万方的检索结果页面均可以找到相关信息的推荐服务。在检索结果进行列表展示时,三大期刊库均可以实现任意页码跳转,CNKI更是可以设置每页显示的记录数(10,20和50条),而VIP只能实现每页显示20条的记录,万方每页只能显示10条的记录。在检索结果分组浏览方面,实现方式最多的还是CNKI,可以做到按照学科、时间、基金等方式浏览。万方也具备按照学科、时间、机构、出版状态和期刊方式的分组浏览功能。但是VIP基本不具备此功能[4-6]。
本文对这三家出版的学术期刊库内容进行了整体的重复度调查,通过两两比较我们发现重复率是非常高的,均高于70%。关于学术期刊数据库更新延迟的情况, 本文分别从绝对延迟以及相对延迟的角度进行观察。结果表明三大期刊库都存在绝对延迟的现象, 其收录的期刊最新期数基本上都滞后于期刊最新发行的期数。检索的易用性方面,三大期刊库均在主页提供了检索入口,都提供了期刊导航功能。万方更是实现了一站式检索的便利。CNKI的期刊导航分类项目更丰富,但是期刊文献检索和期刊导航之间需要切换到不同的页面。检索功能的比较从两方面进行,首先,三大期刊库都可以实现基本、专业和高级检索,但是万方不提供二级检索。关于检索途径, 各数据库都已经将常用的几种检索方式(如题名、作者、关键词等)纳入其中,并在此基础上提供了一些各自特有的检索方式。三大期刊库的检索结果页面也都非常详细,页面显示形式可以说是正趋于统一,但是小细节上又具有特色。总的来讲,页面制作的最精良的是CNKI,分类导航和浏览等方面做得较丰富的也是CNKI。而VIP定位于咨询数据库, 因此其期刊数据库的数量最多,结果显示也相对较简单。万方是一个以科技信息为主的平台, 其目标是为广大科研工作者提供最优的检索服务。
本次研究也存在些许不足:(1)研究的样本数量繁杂庞大,在对照整体重复数量时,各数据库的期刊名称有出入,有些还在使用曾用名。这些必然影响整体的准确性。(2)在调查期刊延迟现象时,样本数量较少,只能在一定程度上反映一些问题。(3)在比较操作性和检索功能时,指标较为凌乱, 没有形成一个整体的评价体系。以上这些不足,均需要在以后的研究中不断改进。
[1]温芳芳.试论中文电子期刊数据库资源重复建设问题[J].新世纪图书馆,2008,(2):69-71.
[2]谷景亮,赵芳,曹先平.3大中文期刊数据库收录期刊重复情况探究[J].医学信息学杂志,2011,32(8):26-28.
[3]谭捷,张李义,饶丽君.中文学术期刊数据库的比较研究[J].图书情报知识,2010,(4):4-13.
[4]中国知网.期刊导航[EB/OL].[2015-03-08].http://epub.cnki.net/kns/oldnavi/n_Navi.aspx?NaviID=1&DataSource=CJFD.
[5]维普.期刊文献检索[EB/OL].[2016-01-08].http://lib.cqvip.com/.
[6]万方.期刊[EB/OL].[2016-01-08].http://c.wanfangdata.com.cn/Periodical.aspx.
G250.76
A
2016-01-31责任编辑:孙炜)