徐志玮(中山大学图书馆 广东 广州 510275)
《美国信息科学和技术学会杂志》(Journal of the American Society for Information Science and Technology,简称JASIST)在科学引文数据库Web of Science中的学科分类为“Information Science and Library Science” (信息科学和图书馆科学),代表了图书情报学方面的最前沿研究,是该领域最重要的期刊之一。笔者通过Web of Science对JASIST上发表的论文(2005-2009年)及引文数据进行统计分析,得到高频引用的核心期刊和重要会议论文集,并且通过JASIST所属的Elservier电子数据库网站,得到每篇论文的标引词,对标引词进一步分析,得到图书情报学领域近年来的研究热点。
在Web of Science界面,选择:出版物名称=“Journal of the American Society for Information Science and Technology”,出版年=“2005-2009”,文献类型=“article”,得到816篇论文。以Excel格式保存全部字段的内容,其中“CR”字段为引文数据。笔者根据HTML(HyperText Markup Language,超文本标记语言)的表格语句,把CR字段中的引文单独提出,共得到引文数据32207条。把Excel数据导入Microsoft Access,利用Count语句得到引文文献频次表和年代分布频次表。另外,对每篇论文在Web of Science中的标引词进行收集、整理和分析,得到近5年该期刊的热点标引词。
816篇论文共引用了32207条文献,最高引文数282条,最低引文数0条,平均每篇论文引用了39条。对这些引文数据按照种类进行合并,得到11403条记录,即有11403种文献被引用了32207次。笔者发现,引文数据的种类比较庞杂,尤其是引用频次为1的文献种类高达8597种,占全部种类的75%。笔者认为这是因为:①论文引用了大量会议论文,造成标示的不统一;②论文的研究范围不仅仅涉及到计算机科学和图书情报学,还有众多其他学科的内容,包括自然科学、医学、人文、社会科学等方面,而这些文献在本期刊论文中的引用率比较低,因此,造成大量文献的引用频次低。由此可以看出,该领域研究的范围非常广,只要与信息有关的内容,都能成为研究对象。另外,Web of Science的CR字段没有提供清晰的文献类型,引文数据无法非常准确地统计出文献类型(期刊、会议资料、图书、网站资源等)所占的比例。但是经过人工统一后,可以得到有关该领域的核心期刊表,其中引用频次最高的20种期刊如表1所示。
表1 JASIST论文引用频次最高的20种期刊(2005-2009年)
上述20种期刊可以为研究图书情报学的学者提供帮助。笔者根据中山大学图书馆的订购情况发现,这些期刊的保障率比较高,将近五分之四的期刊均有订购。其中,4种期刊来自Elsevier全文期刊数据库,3种期刊来自LISA 全文数据库,2种期刊来自ACM数据库,5种期刊分别来自SpringerLink、Emerald、JohnWiley、PNAS和IEEE/IEL电子数据库,综合性权威期刊《Nature》和《Science》的引用率也比较高,中山大学图书馆也有购买,而另外的4种期刊没有订购。笔者还发现,引文数据中有大量国际会议论文,引用率最高的会议论文包括美国信息科学和技术学会会议(Proceedings of the American Society for Information Science and Technology,简称PASIST)论文和美国计算机协会(ACM)的国际年会会议论文及系列丛书Lect. Notes Computer Science。中山大学图书馆订购了PASIST的2002-2008年的会议数据与ACM的国际会议论文集,Lect. Notes Computer Science没有订购。
另外,从国家/地区分布看出(每位作者所属的国家/地区都被统计一次),美国占据了差不多一半的论文,总共有375篇论文(占45.96%)的作者是美国作者,其次英国70篇(占8.58%)、中国(除台湾地区外)57篇(占6.99%)、加拿大49篇(占6.00%)、荷兰48篇(占5.88%)、比利时29篇(占3.55%)、新加坡29篇(占3.55%)、西班牙29篇(占3.55%)、中国台湾地区29篇(占3.55%)、其他国家252篇(占30.88%)①。可见,美国在信息技术和图书馆科学领域占据绝对优势。中国(除台湾地区外)的57篇论文中,香港的大学占据主要地位(共有30篇论文),国内包括中国科学院国家图书馆(3篇)、北京大学(3篇)、河南师范大学(3篇)、浙江大学(3篇)、武汉大学(2篇)、清华大学(2篇)等。
从机构分布可以看出(每位作者所属的机构都被统计一次),美国、英国、荷兰、芬兰、新加坡的大学占据了前10位,具体见表2所示。
表2 JASIST论文的机构分布排行榜(2005-2009年)
对816篇论文的32207条引文数据进行整理,删除不正确的数据,得到31897条记录,对其进行年代分布频次统计,得到图1和表3。
图1 JASIST论文的引文数据年代频次图(2005-2009年)
表3 JASIST引文文献的年代频次表(2005-2009年)
从表3和图1可以看出,文献从发表时间的第二年开始被广泛引用,发表后的第三、第四年是最高被引时间,随后引用率逐渐减少,引用5年内发表的文献占引文数据的39.83%,引用6年内发表的文献占引文数据的46.66%,这个数据与普赖斯在1971年所作的统计结果有所差别[1]:在被调查的1年内所发表文献的全部参考文献中有一半文献是在近5年内发表的。引用10年内发表的文献占引文数据的66.48%;引用20年以内发表的文献占引文数据的86.12%,其中引用11-15年的文献占12.58%。另外,引文文献中最早的时间是728年前的数据,笔者发现是论文引用了728年前出版的词典中的内容。由此也能看出,该领域不仅研究范围广,而且研究年代也非常久远。
笔者对816篇论文的标引词进行收集和整理,得到3869个标引词,把相同标引词合并后得到842条记录,其中频次最高的30种标引词如表4所示。另外, Web of Science也提供JASIST在2005-2009年被引频次最高的10篇论文(如下页表5所示),从中可以大概看出近5年国际图书情报学领域的研究热点。
从标引词的排序可以看出:(1)“引文分析”依然是最为学者所关注的热点。2005-2009年的标引词频次分别为7、11、16、26和26,大部分引文分析的研究对象是期刊,其他包括对网络、数据库、作者等对象的研究,也有论文专门对具体的学科进行的引文分析,比如化学、社会科学等。(2)“影响因子”是受关注的第二热点。笔者发现,这些论文的研究内容同引文分析有着非常密切的关系,许多标引词同时出现Citation Analysis(引文分析)和Impact Factor(影响因子)。尤其是通过期刊、学者等对象的引文分析来研究这些对象的h指数,是热点之一。(3)研究用户搜寻行为也是关注的重点之一。从表4可以看出,与用户搜寻有关的标引词有end user searching(终端用户搜寻)、online searching(联机检索)、search behavior(搜寻行为)、information retrieval(信息检索)、information seeking(信息搜索)、retrieval effectiveness(检索效率)等,基本上是对网络用户的搜寻行为进行研究,目的是提高检索质量。(4)网络信息搜索工具的研究是热门之一。从表5看出,针对Google Scholar、Scopus、Web of Science、AltaVista的比较研究论文成为被引频次最高的论文之一。(5)值得注意的是,与“社会网络”有关的论文呈现上升趋势。标引词“social networking”(社会网络),2005-2009年的标引词频次分别为1、5、7、4和10,其中美国的相关研究已经取得了显著成绩,而且开始重视在图书馆的实践应用。
表4 JASIST论文中的30个最热门的标引词(2005-2009年)
表5 JASIST被引频次最高的10篇论文(2005-2009年)
图书情报科学领域的研究范围非常大、程度非常深,美国在该领域的研究远远超过其他国家,处于绝对领先地位。中国国内的相关研究还不能令人满意,国际影响力不够。为了提高国内的研究水平,国内研究人员可以参考表1列出的20种核心期刊。另外,要密切关注美国信息科学和技术学会和美国计算机协会的国际年会。从标引词频次的统计分析可以看到目前该领域的研究热点,这对我们有启发作用。
注释:
①SCI按作者统计时,每位合作者各算1次,所以此处论文篇数之和大于816篇。
[1] 邱均平.信息计量学[M].武汉: 武汉大学出版社,2007(1):73.