刘宇 卫军朝 杨柳
摘要 期刊评价是图书馆学和其他学科共同关心的研究议题,相关研究的文献量巨大。为厘清有关英文期刊研究文献的主要脉络,通过收集Web of Science数据库中1940—2015年间2826篇期刊评价研究的相关文献,利用Citespace软件作为数据分析工具,揭示了国外期刊评价研究的研究主体和知识基础,发现国外期刊评价的重要文献可以细分为7大类别。
关键词 期刊评价 知识图谱 学术评价 期刊质量
分类号 G255
DOI 10.16603/j.issn1002—1027.2016.01.004
1引言
根据学者或研究机构在不同级别期刊上发表文章的数量来衡量其科研绩效,已成为国内外学术界普遍采用的一种评价方式。因此,期刊评价遂成为学术界利益相关者普遍关注的研究议题。
目前,国内外有大量文献讨论期刊评价、核心期刊、引文分析等相关问题,但是对期刊评价这一主题的研究主体、知识脉络、主流范式进行系统梳理的文献尚不多见。李云霞于2008年利用CNKI数据库对1979—2008年之间的261篇期刊评价研究文献进行计量分析。同年,刘新燕和武夷山利用CNKI数据库对1983—2007年之间的671篇期刊评价研究文献进行计量分析。姜春林于2011年利用CSSCI数据库对1998—2009年间303篇国内期刊评价研究进行了梳理,侯素芳和汤建民于2014年也是基于CSSCI数据对1998—2011年间458篇国内期刊评价研究进行综述。除了上述计量研究成果外,曾建勋和宋培元于2007年对我国科技期刊评价工作进行了定性的历史回顾,别立谦和何峻于2012年对我国近30年核心期刊研究实践进行了定性的历史综述。这些文献都是针对国内期刊评价展开的梳理。2010年,陈燕和李锐使用1998—2009年间的SSCI和CSSCI分别获取421篇外文文献和385篇中文文献,使用计量方法对国内外科技期刊评价研究的文献进行了比较研究。
目前这些计量研究的检索策略主要是以“期刊评价”作为检索词,在“主题”或者“关键词”字段进行检索。这种检索策略会发生大量的漏检,最为严重的后果就是遗漏大部分研究“核心期刊”的相关文献。在陈燕和李锐的研究中,作者使用学科类别“Information Science & Library Science”对检索结果进行了精炼,无疑遗漏了大量其他学科研究期刊评价的相关文献。笔者主要针对国外期刊评价研究的英文文献进行梳理,在时间上突破了陈燕等人的范围限制,以Web of Science数据库1940—2015年之间的数据为来源,时间跨度达76年,以期对国外期刊评价研究有一个较为整体、全面的认识和把握。
2数据与研究方法
由于国外期刊评价的相关文献过多,为避免重要的文献湮没于海量文献之中,本研究使用“Web ofScience TM核心合集”作为数据源。在南京大学图书馆购买的Web of Science数据库(以下简称“WOS”)数据库中,用检索式“标题=((journal orjournals)and(rank* or assess* or evaluat* orstratif*or select* or citation or citing or cited 0rquality))”进行检索,时间范围为1900—2015年,返回检索结果3303条记录,检索时间为2015年7月16日。通过对检索结果的精炼、清洗,选择文献类型为“article,editorial material,letter,proceedingpaper,review”五种类型,最终得到2826条文献记录。检索结果中发表时间最早的来源文献是AustinM.Patterson发表于1940年的一篇文献。
1940年以来国外期刊评价研究的文献增长趋势符合普赖斯提出的科学文献量指数增长的普遍规律,拟合优度R2为0.9213(图1)。从20世纪70年代中期到90年代中期,实际发文量都超过了理论值;1998年之后,实际发文量和理论值之间的差距越来越大,期刊评价研究进入成熟期;但是每年发文的绝对值仍然在持续增长,自2007年开始发文量突破百篇,2011年达到历史最高的193篇文献。
本研究使用的研究方法是知识图谱。知识图谱是以文献计量学、图论、社会网络分析、计算机技术为基础形成的一种将分析单位进行可视化的量化研究方法,被广泛应用到从海量的文献中分析学科结构、描述科研合作、发现学科研究热点和前沿、挖掘学科知识基础、研究知识的扩展与传播等问题。在具体分析方法上,本文主要使用共现分析来明确国外期刊评价的研究主体,使用共被引分析研究期刊评价的知识基础。共被引也译为同被引(Co-Cita-tion),是1973年由Henry Small和Irena Mar-shakova-Shaikevich同时提出的。共被引方法提出之后,已被广泛地应用到学科结构和知识基础的发现研究中。
使用的数据分析工具是Citespace3.9.R9。Citespace是德雷塞尔大学(Drexel University)陈超美教授采用Java语言开发的一款信息可视化工具,该工具的设计集成了文献计量学、社会网络分析、科学社会学等多学科思想,用于挖掘某一知识领域的知识基础和研究前沿的演进轨迹。在Citespace生成的知识图谱中,每一个节点用一个年轮表示,年轮以时间切片划分为依据,年轮的厚度与相应时间切片中节点出现频次成正比;节点之间的连线表示节点之间共现,连线的粗细与共现的频次成正比,连线的颜色与首次共现的切片颜色一致;中介中心度高的节点的年轮外圈用紫色标示。在社会网络分析中,中介中心度衡量的是社会行动者“控制”他人行动的能力。在引文网络中,它可以衡量某一节点对其他节点的影响力。
3期刊评价研究的研究主体
3.1学科分布分析
图2显示了WOS中期刊评价研究文献的学科分布。在Citespace中节点选择Category,每个时间切片选择Top50的点,节点标签的参数设置为(40、3、12)。如图所示,图书情报学是所有学科中关注期刊评价问题最多、持续时间最长的学科。计算机科学、商学和经济学、普通和内科医学、医学、工程、心理学、管理学、教育、护理等学科也非常关注期刊评价研究。
从这些学科分布来看,我们发现一个较为显著的特征:基础性学科并没有在期刊评价上投入很多精力,如数学、化学、物理学、哲学、文学、历史学等,而具有较强应用性质的学科均比较关注期刊评价问题。产生这种现象的原因主要有二个方面:一是与各个学科主要依赖的交流平台有关。基础性学科更加偏向于著书立说,强调知识的累积性和确定性;而应用性学科偏向于社会实践,社会实践的不断改变使得应用性学科的研究成果具有很强的时效性。罗素说:“科学正像哲学一样,也要在变化的现象之中寻找某种永恒性的基础。”人类对永恒和确定性的追求是知识产生的社会心理基础,从这一点上说,基础科学更为接近人类追求知识的原始动机,不大关注与实践紧密联系的暂时性的研究问题。二是和学科内部的研究范式有关。基础性学科内部的一致性程度较高,研究范式相对单一,学科内部对什么是好的研究成果、好的传播平台具有高度一致的认同感;应用性学科研究范式多元化,学科的知识生产会根据研究问题的不同产生较大的差异,相对来说对什么是好的研究成果、好的传播平台无法形成有效的一致共识,因此才会根据各自研究范式的核心价值对期刊从不同角度进行评价,产生大量研究文献。图书情报机构是科技文献的主要消费机构,因此图书情报学也是给予期刊评价最多关注的学科。这主要是因为图书情报学不仅要关注本学科的期刊,同样也要关注其他各个学科的期刊,期刊评价的成果会对图书情报机构的期刊采购和文献收藏工作带来巨大影响。
在图2中,计算机科学、商业与经济学等节点拥有紫色年轮,表明这些节点的中介中心度较高,在整个网络中处于重要的中心位置。若以1961年美国美国科学信息研究所(Institute for Scientific Infor-mation)创办出版的科学引文数据库(Science Cita-tion Index)作为分界点,图书情报学、计算机科学、心理学、社会科学、社会科学—其他主题是最早关注期刊评价这一研究主题的5个学科。图书情报学总计发表文献764篇,和其他四个学科的发文总量(791篇)相当。但是,图书情报学在网络中的中介中心度仅有0.1,远落后于其他四个学科。这表明图书情报学在期刊评价研究中虽然体量巨大,但是学术影响力相对较弱,其研究成果需要借助其他学科传播才能被普遍接受。环境研究(ENVIRON-MENTAL STUDIES)等学科体量虽小,但是影响力较大,中介中心度高达0.22。
3.2研究机构分析
在Citespace中节点选择Institution,每个时间切片选择Top50的点,节点标签的参数设置为(8、7、90),得到期刊评价研究的机构图谱(图3)。由于整个图谱的网络密度只有0.0011,尚未形成规模性的网络结构。图中的节点INST SCI INFORMAT和INST SCI INFORMAT ION均为美国科学信息研究所,通过图谱我们可以了解,西班牙格拉纳达大学(Univ Granada)、荷兰阿姆斯特丹大学(UnivAmsterdam)、美国科学信息研究所(INST SCI IN-FORMAT)、美国伊利诺伊大学(Univ Illinois)等机构在期刊评价领域非常活跃。发文量在8篇以上的高产机构共有35所,其中美国有14所,加拿大和西班牙各有4所,英国和中国(包括台湾)各3所,荷兰2所,澳大利亚、克罗地亚、马来西亚和伊朗各1所。这些高产机构基本上都在2000年左右开始涉足期刊评价;很早就开始进行期刊评价研究的机构,如美国科学信息研究所、纽约西奈山医学院(CUNY MTSINAI SCH MED)、尼古拉斯州立大学(NI-CHOLLS STATE UNIV)这三所机构在2000之后基本就淡出期刊评价研究领域。在图谱中这3个节点的年轮基本上都是绿色,意味着进入2000之后这三所机构在期刊评价领域产出极少。
中国大陆有两家机构进入了高产机构:中国科学技术信息研究所(Inst Sci & Tech Informat Chi-na),哈尔滨工业大学(Harbin Inst Technol)。中国大陆进行期刊评价研究的主体是图书情报学界,中国科学技术信息研究所在国内期刊评价领域的贡献广为人知,而哈尔滨工业大学在国内期刊评价领域并未取得相同的学术声望。
3.3作者分析
在Citespace中节点选择Author,每个时间切片选择Top40的点,节点标签的参数设置为(4、14、200),得到期刊评价研究的机构图谱(图4)。整个图谱的网络密度只有0.0024,尚未形成规模性的网络结构。
如图所示,节点年轮的冷暖色调变化反映了期刊评价研究的核心作者活跃时段的不同,依据颜色的变化可以将期刊评价研究领域的主要作者分为三代学人,以1970和2000年作为色调冷暖的分界线。第一代研究者的节点以蓝色为主,主要有L.丁.Martin和J.B.Adams、J.C.Merrill和D.M.Gillnlor、R.P.Kinght和A.Delahaye为代表。第二代研究者的节点以绿色为主,最具代表性的就是SCI的创始人E。Garfield,此外还有J.Vlachy、A。N。Bran-don和D.R.Hill、T.Braun团队。第三代研究者的节点以黄色或红色为主,突出的代表有L.Leydesdorff、C.J.Miguel、P.Jacso、A.Serenko等人,此外形成了5个重要的研究团队:M.Wright团队、R。M。Rauber团队、A.N.Zainab团队、N.Pandis团队、G.E.Hunt团队。此外还有一些非常活跃的两两合作者和突出的个人研究者,比如台湾淡江大学的蔡明月(M.Y.Tsay)。
4期刊评价研究的知识基础
在Citespace中,筛选阈值(C、CC、CCV)前、中、后三段都选择(2、1、15;4、2、20;6、2、20),时间切片以10年为一段,节点标签参数设置为(50、3、30),选择图谱的显示方式是Timeline,得到期刊评价研究的高被引期刊图谱(图5)。图谱包括85个节点,78条连线,聚类稳定性的模块化参数Modularity Q为0.8185,表明文献共被引网络具有较好的类内一致性、类间差异性,聚类结构较高。
由图可知,文献共被引网络聚成7类。下面以每一类中中介中心度较高的文献为主对各类的研究内容和核心观点进行解读。
表2列出聚类0#Scholars的主要文献节点,这些文献主要是对经济学与管理学领域内的期刊进行评价。1984年,S.J.Liebowitz等将引文分为来自经济学期刊的引用和非经济学期刊的引用,并使用来自经济学期刊的引用次数来评价经济学期刊的影响力,从而排除了其他学科的引用造成的噪声干扰;同时发现期刊历史、期刊发文量、期刊印张多少对期刊总被引次数有显著影响。1988年,M.J.Stahl等发现管理学期刊可以分为学术导向和实践导向两大类,由此生成2个管理学核心期刊清单,依据在这两个期刊上的发文量,对美国商学院的管理学系的科研实力进行评价。1999年,A.Tahai等统计了17种管理学重要期刊在1993—1994年间参考文献中的期刊论文,发现参考文献中出版年限较久的期刊论文主要来自相关的社会科学(如心理学、社会学等),而较新的期刊论文来自管理期刊自身;作者以参考文献出版年限分布的众数(4年)为节点,以4年内的被引次数作为评价管理学期刊的依据,研究发现Strategic Management Journal是被引次数最多的期刊,心理学期刊的被引次数有明显的下降;这证实了管理学的知识结构主要有2个重要部门组成:一是支撑管理学研究的社会科学基础理论,一是管理学自身最近正在不断发展的知识模块。1999年,Michael Jay Polonsky用有多少家澳大利亚大学图书馆收藏作为依据,评价市场营销期刊,研究发现Sloan Management Review和Journal ofMarketing Research两份期刊的收藏率最高,依据收藏率的期刊排序和依据专家感知质量的期刊排序(Perceptual Ranking)有很大差异L19J。
表3列出聚类1#Information Science类的主要文献节点,这些文献主要出自情报学学者之手,主要内容是针对影响因子的评价功能展开讨论。1963年,E.Garfield等首次提出利用影响因子遴选引文索引的来源期刊,从而避免来源期刊大量集中于历史悠久或发文量大的期刊。之后,情报学界对影响因子的评价功能和内在缺陷展开了大量的研究。2002年,R.Rousseau指出影响因子无法测量期刊质量,因为“质量”是一个多维度的概念;相对来说,观察期刊影响因子在一个时间段内的变化趋势在评价期刊质量时更有价值。2002年,W.Glanzel指出尽管影响因子存在一定的缺陷,但是没有其他的期刊评价指标可以代替影响因子,主要原因是其他指标都无法像影响因子一样持续稳定地更新,这是其他计量指标无法得到学界接受的最大障碍。2008年,L.Leydesdorff指出不同学科之间的期刊影响因子不具有可比性,数学期刊的影响因子均值是0.559,遗传学期刊的影响因子均值是3.633;不同类型期刊的影响因子也差异巨大,如评论类期刊(刊名中有Review)的影响因子均值是4.0081,而通讯类期刊(刊名中有Letter)影响因子均值为1.7981;由于作者和研究机构都会同时从事不同主体的研究,使得科研主体的研究领域具有多元性,因此不能使用影响因子来评价一个学者或机构的科研水平。2009年,D.A.Pendlebury系统回顾了文献计量学的发展历程和影响因子的优缺点后指出,“期刊质量”是科研政策的制定者和基金会关心的核心概念,尽管被引用可以表示某一文献的内容被使用、被接受、内容重要或有影响力,但是被引用不能直接反映文献的质量;影响因子虽然可以用来评价期刊,但是引文数据只是同行评议的补充手段。2012年,H.Moed等详细比较的两个新的期刊评价指标SJR、SNIP和影响因子之间的差异,最终指出以引文数据为基础的计量指标是期刊评价的适当而有效的工具。
表4列出聚类2#Validity类的主要文献节点,这些文献主要出自ISI的创始人E.Garfield,主要围绕如何有效选择来源期刊建立引文索引展开。1927年,P.L.K.Gross等对Journal of the A-merican Chemical Society 1926年卷的所有参考文献进行统计,发现3633篇参考文献源自247种期刊,被引5次以上的期刊仅有49种;并以1916-1925年10年间被引次数对期刊进行排序,得出为了保障化学专业教育和科研,高校图书馆最值得收藏的22种期刊。这是现存可考的最早使用引文分析方法对期刊进行评价的文献,虽然该文的中心度为0,但却是期刊评价和引文分析的奠基性著述,被引高达41次。正是在这些早期的引文分析研究成果和谢泼德索引(Shepard's Citation)共同启发下,Garfield于1955年提出了创建科学引文索引的构想。建立引文索引的第一步,就是如何选择来源期刊。1963年,Garfield发现如果按照Gross的方法仅仅以被引次数选择来源期刊,发文量大的期刊会具有很大的优势,因为发文量大的期刊容易获得更多的被引;为了避免这一情况,Garfield等正式提出用期刊影响因子(Journal Impact Factor)这一个概念,用被引次数除以发文量以消除载文量大的期刊的先天优势。1971,Garfield著文指出被引次数比发文量更适宜于科研评价,进一步强调引文索引来源期刊的选择更强调刊物的被引次数,而不是发文量。正是基于强调期刊被引次数的理念,ISI在选择SCI来源期刊时不断调整选刊的标准和方法,至1972年SCI来源期刊已经扩展到2400种。1972年,Garfield对被引论文被引次数的时间分布进行研究后发现,一篇论文发表2年后有最多的被引,于是在算法上对影响因子进行了修正,将总被引次数除以总发文量的时间窗口修正为2年。现在学术界广为人知的影响因子正式确立。这一改进使得来源期刊的选择不仅不再偏向于那些发文量大的期刊,同时也不再偏向于那些历史悠久的期刊。因为,历史悠久的期刊容易累积更多的被引次数,而影响因子强调的是期刊最近2年的载文的平均被引用次数。1976年,Garfield对英国和美国的SSCI用户进行调查,检验SSCI在社会科学文献检索的效用。调查中有用户指出SSCI的来源期刊偏向英文期刊,Garfield辩解认为考虑到英语的通用性和国际性,一个国际化的学者会努力在国际期刊上发表论文,而这些国际期刊通常都是英文期刊,因此这种偏向是合理的。
表5列出聚类3井Research Assessment类的主要文献节点。传统引文分析将每一次引用都等同视之,这一直被很多学者认为是引文评价的缺陷之一。这一类簇文献研究的主要内容就是弥补这一重要缺陷,赋予不同引用以不同的权重,在此基础上对引文分析法进行修正。该领域的奠基性成果是G.Pinski和F。Narin于1976年提出,该算法首先建立期刊互引矩阵,以每个期刊被引频次除以期刊的施引频次确定不同期刊在引文网络中的重要度,以期刊的重要度为施引权重;同时,利用加权后的被引次数、期刊文章的篇均被引率、期刊的总被引率,将这三个指标综合测量被引期刊的影响力。J.Bollen等将PageRank算法应用到期刊评价领域,其中以期刊之间的引用代替网页之间的链接,并进行标准化处理,即两个期刊之间的被引频次除以该期刊和所有期刊之间的被引频次得到期刊的引用权重,并将其与ISI的影响因子排名进行对比,综合两种算法提出了Y指数(IF乘以PangeRank指数),实验表明Y指数能更好地进行期刊排名。C.Bergstrom提出用特征因子来进行期刊评价,利用每一期刊引用另一期刊的引用矩阵,在引文网络中迭代计算每个期刊的重要性,若期刊被高影响的期刊引用越多,则其影响力也越大。这类期刊评价研究,都是从计算施引期刊的重要度对引用赋权出发,以此为基础进行期刊评价。然而,也有学者质疑这一逻辑的合理性。John Hudson等认为,引用行为就像消费者为一件商品付款一样,一件商品的价格不应该因为购买它的人不同而产生差异;同理,任何一次引用也应该被等同视之。
表6列出聚类3#Invariant Method类的主要文献节点,该类文献的主要内容是围绕引文索引和引文分析是否具有学术评价的合法性展开。尽管Garfield强调设计引文索引的主要目的是为了弥补主题索引的不足并完善文献检索;他同时也明确指出在评价一份科研工作的重要性及其对其他文献或科学思想在一定时段内的影响时,引文索引明显是一种有用的工具;因此,用被引次数评价一位科学家的历史作用比仅仅考量该科学家发表了多少篇文献更有价值。在1972年那篇广为人知的论文中,Garfield明确指出引文分析最重要的应用领域可能会是科技政策和科研评价。实际上,引用行为本身就意涵施引者的评价和判断,因此评价功能对于引文索引和引文分析来说具有内生性。Garfield之所以在SCI的创始阶段对其评价功能采取一种欲盖弥彰的表达,是出于一种营销策略。Garfiled担心引文评价挑战了公认的同行评议制度,而SCI的生产者不可能具备众多学科的同行评议资格。因此,在SCI创立之初只能强调其检索功能,否则会影响学术界对SCI的接受和使用程度。在学术界日益接受SCI之后,1970年代美国政府开始采用引文评价进行科学基金的分配,此时引文索引的评价功能逐渐凸显,成为科研管理的利器。这时Garfield也开始明确表示被引率或影响因子的变化很可能反映的是期刊质量的变化,引文索引为客观评价期刊的绩效(Performance)开了一个好头。然而,伴随着引文索引评价功能的凸显,不同领域的学者对引文索引的态度逐渐出现分化:一派认为引文索引只能用来检索文献,不具有任何评价功能;一派认为引文索引具有科研评价的功能。反对派中旗帜性的人物就是P.O.Seglen。早在1989年,Seglen就旗帜鲜明地反对引文评价。1997年,Seglen除了逐条列出引文评价的种种弊端,还发现如果将某一时段的期刊论文按照被引次数排序,把所有论文平均分为高被引和低被引两组,高被引组的总被引次数是低被引组的10倍之多。因此,期刊的影响因子无法代表某篇论文的质量或水平,因此以一位学者在高影响因子期刊上的发文数量评价其科研水平和实力是不合理的。与其针锋相对,S.Saha通过对113名内科医生和151名临床医学研究人员的调查发现,专家对9种普通医学期刊的感知质量和影响因子评价的结果高度相关。面对这种巨大的分歧,情报学界的计量专家应对措施正如聚类#工所显示,一面在呼吁谨慎使用计量指标进行学术评价,强调期刊质量的复杂性;一面不断地对计量指标进行修正,完善计量指标的评价功能。
表7列出聚类5#H-Type Indices类的主要文献节点。从科研管理者的角度出发,有限的研究资源最好分配给那些既有较高的研究水平同时也能保持高产出量的研究者,也就是说以资源配置为根本目的的科研评价具有两个基本的维度:产能评价(Productivity)和效能评价(Quality)。如果科研管理者认同引文索引的评价功能,那么长期以来以被引次数或影响因子为代表的计量指标,仅仅能对效能进行评价,而无法有效涵盖产能。2005年,J.E.Hirsch提出h指数,当且仅当一个科学家有h篇被引次数至少为h的论文,同时剩余论文的被引次数都小于h时,该科学家的成就分值为h。2006年,T.Braun将这一思想应用于对期刊的评价之中。h指数的一个重要缺陷就是区分度问题,即一个科学家可能有若干篇被引次数相同的论文恰恰处于分界点时,h指数就不宜取值。2006年L.Egghe提出将论文按照被引次数高低进行排序,并且将排序的序号进行平方,当序号的平方等于序号之前所有论文的累积被引次数时,这个序号就定义为g指数。g指数在一定程度上增强了h指数的区分度。由于h指数的计算思路同时覆盖了效能和产能两个维度,而且计算简单,使其成为继影响因子之后接受程度最高、最为成功的计量指标。在学界掀起了一股研究h指数的热潮,大量对h指数进行改进的研究成果不断涌现。在h指数大热之时,Garfield也对期刊影响因子发展历史进行回顾,同时回应了2项对影响因子评价功能的指责:一是从业人员多的学科,期刊的影响因子高;Garfield认为在从业人员多的学科,容易产生超高被引论文,但是对期刊的影响因子没有显著影响,因为可供被引的论文数目也同样很多。二是影响因子不能直接评价学者个人的研究水平;Garfield认为新近发表的论文暂时还无法累积被引次数,只能用影响因子来预估论文的被引次数,而且期刊影响因子能够反映刊物质量,因此期刊影响因子可以用来对学者研究论文的水平进行评价。
表8列出聚类6#类的主要文献节点,这一类文献的主要内容是从宏观视角考察引文索引和期刊评价在科学交流系统的功用。1965年,普赖斯利用1961年的SCI数据分析了参考文献的频次分布和时间分布特征,发现高被引的论文一般都是新近发表的论文,通过引用关系这些新近发表的论文之间形成紧密联系,构成了研究前沿(ResearchFront)。该文开启了科研人员以引文索引为工具从宏观上探索科学文献之间引用规律的先河,为文献老化规律研究、研究前沿发现等问题奠定了基础。1976年,Garfield对1974年SCI的数据进行统计分析,进一步验证之前发现的三个引文分布特征:一是历史悠久的期刊总被引次数一般较高,但是其影响因子不一定就高;二是评论类期刊的影响因子普遍高于普通期刊;三是不同学科的期刊影响因子不具有可比性。1979年,Garfield出版CitationIndexing:Itsrheory and Application in Science,Technology,and Humanities一书,对引文索引的设计思想和发展历史进行了详细陈述,并明确指出引文索引在文献检索、科学管理、科学史研究、期刊评价、科学家个人的评价方面的应用价值。
5结语
期刊评价是一个延续了近百年的研究议题,相关文献卷帙浩繁。正是通过对期刊评价研究的关注和知识贡献,图书情报学的知识体系从为信息机构服务,延伸到为整个社会和学界的知识传播和科研管理服务,基于文献计量学的期刊评价成为图书情报学从学术界的边缘走向中心的突破口。虽然学界对当下量化学术评价体制诟病不断,但是根本原因是科研体制导致的科研管理部门对工具的使用不当。作为工具生产者的图书情报学,研究的主要焦点是完善工具。作为一个应用性的研究主题,以图书情报学界为主体的期刊评价研究重视评价方法和评价指标,忽视理论构建。因此,对很多社会性的、认识论上的问题缺乏深入的理论探讨,难以形成共识。期刊评价研究属于学术评价研究的中观层面。从目前的发展方向来看,期刊评价研究在评价对象、评价方法、评价理论构建上都具有一定的拓展空间。在评价对象上,一是从中观的期刊评价转向微观的论文评价,比如最近几年兴起的对“睡美人”论文的研究;二是从中观评价拓展到宏观评价,即通过期刊评价研究的成果为机构评价奠定基础,最为典型的是大学评价研究的兴盛。在评价方法上,替代计量学的出现使得评价数据源更为丰富。在评价理论的构建上,研究学术评价活动的社会机制、评价行为的心理机制将会是未来的重要热点,比如在宏观上研究评价制度的构建运作,在微观上研究引用心理和引用动机等。