自动化和计算机技术类核心期刊的OA现状、特点和传播效果分析

2014-04-14 02:28■蒋
中国科技期刊研究 2014年9期
关键词:全文次数论文

■蒋 静

上海市地方税务局税收科学研究所,上海市陆家浜路1056号 200011,E-mail:assignmentj@126.com

0 引言

期刊因其出版的规范性、对学术质量控制的严格性及其提供内容的实时性,成为科研人员获取信息的第一来源。随着OA运动的发展,通过网络免费开放的OA期刊日益增多,不仅涌现出大量创刊即以OA方式出版的期刊,传统期刊也在逐步开放其内容,以借助网络优势增强传播效果、扩大学术影响力。国内原生的OA期刊数量少且分散,国际开放期刊目录DOAJ目前收录中国出版的OA期刊仅51种。而传统期刊开放内容的比重在日益增长,如中国科协期刊2013年已有1/3左右的期刊实现了开放获取(364/1056)[1]。

对期刊学术影响力和学术质量的测度,传统上以引用研究为基础。随着期刊越来越多地借助网络平台进行传播,从其下载情况可以即时反映出读者利用情况。读者下载获取文献内容之后,或仅仅为了了解相关信息,或应用于实际工作,或在信息吸收的基础上转化产生新的学术成果,第三种使用以引用的方式反映出来。下载与引用都是测度信息传播效果的重要指标,从理论上来说,先有下载后有引用,引用是由下载的一部分转化而来的。

就期刊下载与引用的相关性方面的考察,对传统学术期刊研究中,普遍发现下载与引用存在正相关关系。如刘筱梅统计了15种英文化学类期刊2003-2005年间在数据库中的总下载量,及其在中国科学引文数据库中的引用次数,发现二者呈较强的相关关系[2]。庞景安选择了《中国科技期刊引证报告》和《中国学术期刊网络计量测试报告》共有的1471种期刊为研究对象,发现这些期刊的总被引次数与总下载次数存在相关关系[3]。

在对OA期刊论文的研究中,就下载量与被引次数之间相关性的发现结果不一。牛昱昕等对《中国科技论文在线》上的论文进行了统计分析,发现单篇论文的下载次数(CNKI与中国科技论文在线网站二者的下载次数之和)与被引次数之间的相关性不显著,当从整体上考察被引次数与平均下载次数,发现二者则呈正相关趋势[4]。方红玲统计分析了《中国科技期刊研究》2007-2011年的论文,发现各年网站下载量均高于CNKI下载量,而CNKI下载量与被引次数的相关度高于网站下载量与被引次数的相关性,其中部分年度网站下载量与被引次数未呈现相关关系[5]。

对于OA期刊及论文传播效果的研究,国外很多学者集中于探讨OA论文与非OA论文相比是否存在引用上的优势,以证明OA出版方式在促进学术信息传播上更具优势。例如Michael Norris等针对生物学、应用数学、社会学、经济学四个领域的OA与非OA论文进行了研究,发现OA论文具有明显的引用优势,但不同学科领域OA论文的引用优势存在差异—社会学OA论文的引用优势最为明显,而生物学 OA论文的引用优势表现最弱[6]。Davis Philip M等人以美国生理学会出版的11种期刊为研究对象,发现在出版半年之后,OA论文的下载量高于非OA论文,而出版一年之后,OA论文未呈现出明显的引用优势(OA论文的被引率为59%,非OA论文为63%)[7]。

国内原创的OA期刊相对较少,而传统期刊转型而来的OA期刊多。这部分OA期刊的发展现状及其传播效果如何,国内有针对性的研究还比较少。本文首先以自动化和计算机技术学科(以下简写为中图分类号TP)为例,调查学科内核心期刊实现开放获取的现状,并对比分析通过网站开放与通过商业数据库发布两种传播方式的特点,最后分析这些OA期刊网站的使用和传播效果:以下载量考察不同OA期刊的即时传播效果,并比较不同期刊网站下载量与引用次数的相关性,同时以商业数据库下载量与引用次数的相关性进行对比考察。

1 调查范围和方法

选取《北大中文核心期刊目录(2011年)》收录的31种TP类期刊为调查对象,调查时间为2014年6月(于8月底更新)。利用搜索引擎Google和Bing分别对这31种期刊进行搜索,查询其有无独立网站,有则进入其网站,考察其内容开放情况。

对于调查发现已实现OA的期刊,为了考察其使用和传播效果,分别从期刊网站和CNKI数据库分别获取下载量数据进行比较分析,并考察两种下载量与引用之间的相关关系。

首先是获取合适的即时下载数据。选择15种提供下载量统计的OA期刊网站为调查对象,选取每种期刊的2014年第1-2期进行数据采样,以反映期刊网站最新的使用情况。采集时间为2014年8月28日。

其次是获取合适的引用数据。根据相关研究,下载和引用至少有2年的时间差,即2008年发表论文的被引情况在2010年及之后才可反映出来[8]。同时,各个学科的文献均有一定的时效性,计算机科学的时效性尤强,若干年以前的文献可能由于使用价值较低而较少被下载并引用。研究发现,计算机科学期刊的引用峰值在第5年[9],即2008年发表的论文在2013年达到引用的高峰,其后被引用次数呈下降趋势。权衡以上因素,为了获得较为稳定的引用数据,本文选取2008年发表的文献为考察对象。21种开放全文的期刊中,开放了2008年的全文内容,并且提供下载量数据的有12种期刊,以其在2008年第1-2期发表的论文进行相关分析。数据采集时间为2014年8月29日。

2 TP类核心期刊的OA现状

2.1 总体开放情况

期刊网站具有多种功能,最基本的是作为一个在线稿件管理系统,为作者、编辑和专家评审处理稿件之用,而对更广范围的读者来说,期刊网站能够提供内容才是其价值所在。31种TP类核心期刊中,有22种不同程度实现了全文开放(占比71%),另有2种开放了摘要信息,及4种仅开放目录信息。其余3种期刊中,有1种无独立网址,1种有网址但访问异常,1种虽有网址但尚无目录、摘要或全文等任何与期刊内容有关的信息。以往有针对测绘类、农学类期刊开放情况的调查,其全文开放的比例分别为26%及37%[10-11],笔者同时间也针对28种法律类核心期刊的开放情况进行了调查,发现仅有3种期刊实现了全文开放(11%)。比较之下,TP类核心期刊71%的开放比例处于较高的水平,因而更具开发利用的价值。详见表1。

2.2 开放的实时性

计算机、自动化是发展很快的学科,通过内容的实时开放,可使读者及时获取并转化利用这些成果,加快整个学术信息交流的进程,实现信息传播效用的最大化。调查发现,有1种期刊较印刷本提前开放,有16种期刊与印刷本同步开放,有1种较印刷本滞后1期,2种滞后2期,1种开放部分过刊,1种仅开放1期。总体来说,TP类核心OA期刊开放的实时性较好。是否同步开放以“当期目录”是否提供全文作为主要判断依据,并与数据库收录情况进行比较作综合判断。

2.3 回溯开放的情况

读者不仅要了解最新的研究进展,也需要追溯过去的研究历史和发展过程,因此过刊也具有重要的利用价值。调查发现,有5种期刊回溯至创刊年,分别为:《软件学报》、《自动化学报》、《中国图象图形学报》、《国土资源遥感》、《信息与控制》,此5种期刊同时也实现了与印刷本同步实时的开放。发现《信息与控制》、《计算机科学》、《传感技术学报》部分过刊内容空缺,这部分内容可能正在回溯过程中。

表1 TP类核心期刊OA情况

其余17种未回溯至创刊年的期刊中,均至少开放最近2年的内容,其中最长的回溯了近34年以来的内容(《机器人》)。猜测若干期刊亦在回溯过程中,未来可能实现全部内容的开放。

2.4 访问限制

调查发现,有19种期刊没有任何访问限制,允许直接浏览或下载全文,而有1种期刊需注册为会员登录后方可访问全文,有2种期刊需输入验证码访问全文。从网站管理的角度看,设置访问限制可能是为了阻止机器人自动访问、采集数据之考虑,但也给正常访问的读者增加了获取信息的障碍。

2.5 浏览和检索功能

清晰合理的网站导航和检索功能可以帮助读者快速准确地获取信息。调查发现,多数期刊均有清晰的访问路径,可通过“过刊浏览”、“全文检索”等标识到达全文浏览和下载页面。《计算机研究与发展》没有发现明确的访问路径,其“当期目录”(2014年7月)的url地址包含“vol=2014&issue=7”,由此猜测而得到2005以来各期的全文访问路径。有21种期刊提供检索功能,具体因其使用的软件系统不同而有所差异。

3 TP类核心期刊OA传播方式的特点:与商业数据库相比较

3.1 覆盖率和实时性

商业数据库将各学科各种层次的期刊聚合在一起,提供一站式的检索服务,自1990年代出现以来,成为图书情报机构用来提供信息服务的重要工具。以CNKI和维普为例,考察其对于TP类核心期刊的收录情况。详见表2。

比较对TP类核心期刊品种的覆盖率,CNKI收录了全部31种,维普收录了30种,而OA期刊为22种。考察对过刊的收录情况,两种商业期刊回溯的年份比较久远,其中维普多回溯至1989年,CNKI回溯至创刊年的情况较多。OA期刊网站目前有5种回溯至创刊年。因而商业数据库对于品种的覆盖率和对于过刊的回溯情况优于OA期刊网站。

考察发布信息的实时性,以22种OA期刊作为考察对象,发现CNKI提前或实时发布的期刊有12种,其余有10种滞后1-3期。维普发布的期刊均有不同程度的滞后,1种未收,11种滞后2-4期不等(其中2种有缺期现象),10种滞后7-32期、自2012年以来的内容未见更新。因而就计算机核心期刊的情况,CNKI数据库优于维普数据库,而不及OA期刊网站。

表2 TP类OA核心期刊被商业数据库收录的情况

3.2 访问的便利性和使用情况

使用商业数据库的前提是,提供信息服务的图书情报机构需购买这些数据库,并视其签订协议的不同,或提供数据库的馆内访问、或提供网络远程访问,其中后一种方式给读者提供较大的便利。与商业数据库相比较,OA期刊网站提供了一种免费、直接的传播方式,读者不必经过图书馆等中介者,可以直接访问期刊网站获取内容。

3.3 聚合检索功能

商业数据库与OA期刊网站相比,最明显的优势在于可提供一站式检索,允许读者跨期刊通过主题、作者等检索获取相关文献。而OA期刊由于版权政策的限制,目前难以建立全文内容的聚合平台。不同于国外OA期刊较多遵循CC协议的情况,我国传统期刊转换而来的OA期刊,除了在期刊网站开放全文,允许读者在线阅读或下载阅读之外,绝大多数并没有任何版权政策上的改变,即期刊论文的版权仍属于期刊所有,期刊内容的再传播受到限制,因此读者仍需访问期刊网站获取内容,期刊内检索功能的实现因期刊网站的建设情况而异。

通用搜索引擎可在跨越不同的OA期刊进行建设,但仅可索引以网页形式发布的题名、作者等题录信息和摘要,并不能针对OA期刊网站发布的pdf文件建立全文索引,因而检索效果受到一定限制。

4 传播效果分析

4.1 网站下载量

OA期刊网站的使用数据可以直接反映OA网站的传播效果。一部分OA期刊网站提供摘要点击量和全文下载量。为了考察读者对全文内容的获取情况,同时与商业数据库的下载量做横向比较,这里选择“全文下载量”考察OA网站的使用情况。统计结果见表3。

表3 期刊网站下载量与CNKI下载量

由表3可见,大部分OA期刊的读者使用情况已经远超出商业数据库。14种期刊中,有12种期刊的网站下载量超过其CNKI下载量,其中半数期刊的网站下载量远超出其CNKI下载量,5种期刊的网站下载量略高于CNKI下载量;2种期刊的网站下载量低于CNKI下载量。期刊的网站下载量与其CNKI下载量之间中度相关(r=0.5423,p=0.0451<0.05)。

OA期刊网站之间的使用情况差异明显。读者对期刊网站的使用情况涉及多种因素,不仅与期刊的学术质量和影响力、期刊所覆盖的读者群大小等有密切关系,与其OA内容的网络知名度和网络可见性也有直接关系。期刊转换为OA期刊的时间有先后,网站建设情况不一,因而影响其被读者知晓的情况,及被搜索引擎收录的情况,从而影响其被读者使用的情况。网站建设起步早且影响因子较高的《软件学报》、《自动化学报》、《控制理论与应用》,其下载量排名也较高:从网站简介和网站备案号推断,三种期刊分别创建于2001、2005和2008年,属于TP类OA期刊中创建较早的;三种期刊的影响因子在31种TP核心期刊中的排位分别是1、3、8(影响因子参照表1)。

对于较新内容的网站下载量可以反映网站的即时使用情况,随着期刊学术质量的提高、网络显示度的提高并及时发布全文内容,以下载量反映出来的读者使用情况应当随之有所提升。

4.2 下载与引用的相关性

根据获取的数据,分别以文章和期刊为单位考察了两种下载量与引用次数的相关关系。统计结果见表4-5。

4.2.1 以文章为单位进行考察

表4反映了以文章为单位考察每种期刊的下载与引用的相关关系。就网站下载量与引用的相关性来看,《软件学报》的网站下载量与引用呈高度线性相关(r≥0.8,p<0.05),《机器人》等2 种期刊的网站下载量与引用为中度相关(0.5≤r<0.8,p<0.05),《计算机工程与科学》的网站下载量与引用呈低度线性相关(0.3≤r<0.5,p<0.05),其余7 种期刊的网站下载量与引用不相关(|r|<0.3)。比较之下,11种期刊的CNKI下载量与引用均呈现线性相关关系,其中6种为高度相关,5种为中度相关。

表4 下载与引用之间的相关性——以文章为单位

如前所述,OA期刊网站的网络知名度和网络可见性对于读者使用率有直接影响,从而影响下载之后的引用行为。

另外,期刊网站开放该期内容的时间对期刊论文的下载和引用有直接影响,自2008年或更早时间同步开放全文的期刊,其下载量与引用更有可能呈现相关关系。

以《软件学报》为例[12],其自从2003年开始在网站同步实时开放期刊全文,之后网站点击量急剧上升,从而带动期刊的总被引频次和影响因子指标得到迅速提升。可以推测,至2008年,该刊网站已经形成了一个庞大稳定的用户群,从而对基于学术研究目的的内容获取(转化为引用行为)产生了积极的影响。而相比之下,网站创建时间晚并且对2008年全文内容的开放时间可能距离论文出版时间滞后较长时间的期刊,其网站下载的起点必会不同程度晚于CNKI,因而造成以文章考察的网站下载量与引用的不相关。

除此之外,部分期刊网站可能存在系统平台故障造成的异常下载,以及主办方及作者本人在网站上产生的非基于信息利用目的的下载,因而造成下载与引用背离的现象。相比之下,CNKI的下载量则相对统一准确,其下载与引用呈现出更高的相关性。

4.2.2 以期刊为单位进行考察

由表5可知,从整体上看,OA期刊网站下载量与引用次数、CNKI下载量与引用次数均呈中度相关关系(0.5≤r<0.8,p<0.05)。这表明,从整体上看,无论网站下载还是CNKI下载,都与引用有着密切关系。

表5 下载与引用之间的相关性——以期刊为单位

以上统计结果与牛昱昕等人的发现有相似之处,即单篇OA论文的网站下载与引用相关性不明显,而以平均数从整体上考察的下载与引用则明显相关。作者认为高下载不必然导致高被引,例如论文可能仅仅因为显示度高而获得大量下载,如果其内在质量不高,则引用转化率也会很低;而从长期、整体上看,高被引必然代表之前存在着高下载,二者存在相关趋势[4]。

就本文以文章为单位及期刊为单位的统计结果看,CNKI下载与引用均表现出相关性,OA期刊网站的总下载量与引用存在相关性,而以文章为单位具体考察每种期刊的网站下载与引用的相关关系时,部分相关、部分不相关。如4.2.1所述,期刊网站在网络知名度和网络显示度上的不足、全文开放时间上的滞后性,以及基于非文献利用目的的引用,可能是造成部分期刊网站下载与引用背离的原因。以期刊网站总下载量进行考察时,网站下载则与引用存在相关的趋势。

此处以历史文献计算的网站下载量与CNKI下载量呈现高度相关关系(r≥0.8,p<0.05),4.1 以较新文献计算的网站下载量与CNKI下载量中度相关(0.5≤r<0.8,p<0.05)。这里认为,两种下载量相比,新文献的下载量是一个即时的也是相对不稳定的数据,网站下载量与CNKI下载量随时间推移均会发生较大的变化,历史文献的下载量则是相对稳定的数据。

5 结语

本文通过调查分析和定量研究的方法,对自动化和计算机技术类下核心期刊的全文开放情况、网站开放的特点及传播效果进行了分析,得到一些有益的发现:

(1)截止目前,TP类核心期刊有71%实现了不同程度的全文开放,开放的实时性较好,绝大多数期刊的全文内容至少回溯至2012年的内容(20/22),大部分期刊没有设置访问限制(19/22),并且可以实现检索功能(21/22)。

(2)TP类核心期刊网站实时开放的比例高于商业数据库CNKI和维普,网站访问比较便利,但对于过刊回溯情况及检索功能尚不及商业数据库。

(3)从传播效果来看,绝大多数OA期刊网站的下载量已高于或远远高于商业数据库,成为科研人员获取信息的重要来源。以文章为单位考察每种期刊下载量与引用的相关性,发现CNKI下载量与引用均呈现高度或中度相关性,有部分OA期刊网站的网站下载与引用呈相关关系(4/11),部分不相关(7/11);以期刊为单位考察下载量与引用的相关性,两种下载量与引用次数均呈相关关系,证明网站下载与CNKI下载均与引用有密切关系。对于部分期刊的网站下载量与引用不相关的现象,各期刊网站在网络知名度和网络可见性上的不足、全文内容开放的滞后性、以及部分网站可能存在的异常下载可能是造成这种背离的一部分原因。

1 程维红,任胜利,沈锡宾等.中国科协科技期刊数字出版及传播力建设.中国科技期刊研究,2014,25(3):340-345

2 刘筱敏,张建勇.数字资源获取对科学研究的影响—电子期刊全文下载与引用分析.大学图书馆学报,2009,27(1):60-63

3 庞景安.中文科技期刊下载计量指标与引用计量指标的比较研究.情报理论与实践,2006,29(1):44-48

4 牛昱昕,宗乾进,袁勤俭.开放存取论文下载与引用情况计量研究.中国图书馆学报,2012,(7):119-127

5 方红玲.OA网站与商业网站论文高下载量对比分析及其与被引频次的相关性研究.中国科技期刊研究.2013,24(5):866-869

6 Norris M,Oppenheim C,Rowland F.The citation advantage of open-access articles.Journal of the American Society for Information Science and Technology,2008,59(12):1963-1972

7 Davis P M,Lewenstein B V,Simon D H,et al.Open access publishing,article downloads,and citations:randomised controlled trial.BMJ,2008,337

8 丁佐奇,郑晓南,吴晓明.科技论文被引频次与下载频次的相关性分析.中国科技期刊研究,2010,21(4):467-470

9 党兰学.科技期刊论文被学位论文引用的文献计量分析.中国科技期刊研究,2013,24(2):291-294

10 蒋红艳.我国测绘类期刊OA现状调查与分析.测绘通报,2013,(1):110-114

11 张凤丽.农学类核心期刊开放存取现状.安徽农业科学,2012,40(22):11500,11513

12 方梅,李桂云.全文上网对《软件学报》发行量及其主要计量指标的影响.中国科技期刊研究,2007,18(2):275-277

猜你喜欢
全文次数论文
2020年,我国汽车召回次数同比减少10.8%,召回数量同比增长3.9%
俄罗斯是全球阅兵次数最多的国家吗?
基于切削次数的FANUC刀具寿命管理
青年再造
发现“西方中医”
反腐
来信
探索性作战仿真实验重复次数控制研究
下期论文摘要预登
下期论文摘要预登