田质兵 (南京邮电大学图书馆 江苏 南京 210003)
随着开放存取运动在全球范围内的广泛发展,学术出版、交流朝着多样化的方向发展,除传统的学术期刊之外,开放存取期刊、机构知识库、学科知识库等都成为了重要的学术信息源,且与传统学术期刊相比,这些信息源基本都免费开放。
Google 是全球知名的搜索引擎公司,2004年,该公司推出了Google Scholar(Beta版)(以下简称GS),为用户搜索互联网中的免费学术信息资源提供了一条新的途径。GS以“Stand on the shoulders of giants”(站在巨人的肩膀上)作为宗旨,为所有互联网用户提供学术信息搜索。该学术搜索引擎不仅可以搜索普通网页中的学术论文,还可以搜索同行评议论文、学位论文、图书、预印本、文摘、技术报告等多种文献,文献来源包括学术出版物、专业学会网站、预印本库、机构知识库,内容从医学、物理学到经济学、计算机科学等,横跨众多学术领域[1]。
GS的推出迅速受到了各方的关注,尤其是信息管理领域,众多学者从不同角度对GS展开了研究。为了解几年来GS研究的整体状况,笔者选择信息管理领域最权威的文摘数据库LISA(Library and Information Science Abstracts,图书馆学和情报学文摘)为文献源,采用文献计量学的方法对搜集到的信息进行计量分析。LISA收录了自1969年以来的全球60多个国家20多种语言的550多种期刊的摘要,并且每两个星期更新一次[2]。因此,通过LISA可以较全面、快捷地了解到信息管理领域中GS的研究总貌。
2009年12月25日,笔者通过检索式“KW =google scholar OR TI =(google AND scholar)”在LISA中进行检索,共得到文献203篇,手工剔除相关性较低的文献,最后得到文献189篇。
通过对一个主题的研究论文在时间上分布的分析,可以在一定程度上反映该领域学术研究的理论水平和发展速度。2004年至今的189篇文献的发表时间见图1。
图1 2004-2009 年GS研究文献量及发表时间分布
从图1可以看出:①GS的推出迅速引起了信息管理领域学者的广泛关注,Google公司于2004年11月推出GS,2005年LISA中就有48篇文献与此主题紧密相关就充分说明这一点,而2005年的文献量是6年来的最高峰。分析其原因,这应该与GS定位于学术搜索,直指图书馆信息检索与服务的核心功能有关。GS的推出让图书馆第一时间感受到了竞争的压力,因此广泛关注也不足为奇。最早的文献是来自于Ralph L S于2004年发表在North Carolina Libraries的“Two New Search Engines: MSN Search/Beta and Google Scholar ”(两个新的搜索引擎:MSN搜索和Google Scholar),该文分析了GS和MSN Search两个搜索引擎的收录范围及检索性能,并讨论了这两个搜索引擎的定位及服务对象[3]。②2006年至今的文献量基本保持稳定,说明界内学者对GS还在持续关注,但是随着对GS认识的加深,界内学者当初的压力及危机感有所缓解,因此文献量相对于2005年来说,略有下降。
根据文献的集中分散规律,某一研究领域的大部分文献相对集中在少数期刊上,而剩余的文献则依次分散在其他大量的相关期刊上。因此,分析论文的来源期刊是了解本领域文献的空间分布特点和掌握本领域核心期刊的最有效方法,同时也有助于人们集中注意力,了解掌握该领域的主要研究成果[4]。
据统计,189篇论文分别发表在86份期刊上,其中有49份期刊仅刊载了1篇相关文献,占总数的56.98%,这说明了GS确实引起了广泛的关注,同时也在某种程度上表明GS并未受到众多期刊的持续关注。有15份期刊发表了2篇与此相关的论文,发表3篇、4篇和5篇论文的分别有7份、6份和3份期刊。此外,有6份期刊发表6篇及以上的相关论文。在此,笔者将这6份期刊作为GS研究领域的核心期刊(见表1)。
表1 GS研究的核心期刊
从表1 可以看出,英国和美国的期刊表现出色,排在首位的是英国期刊,而6份期刊中有4份是美国期刊,因此可以说英美两国是GS研究的主要阵地。6份期刊中, Online Information Review、 Journal of the American Society for Information Science and Technology和Online均被SSCI(Social Sciences Citation Index,社会科学引文索引)收录,2008年在JCR(Journal Citation Reports,期刊引用报告)中的影响因子分别达到1.103、1.954和0.352,在SSCI收录的信息与图书馆学的61份期刊中,分别排在第25、12和49位[5]。该主题的研究受到高质量期刊的青睐,从期刊的层面上说明了GS研究具备了较好的学术水平。
LISA数据库收录了60多个国家的期刊,包括多种语言。因此,可对论文发表的语言进行分析,以了解相关学者使用语言的特点,并以此管窥GS研究的地域特征。
表2 GS研究论文语种分布
从表2可以看出:①英语毫无争议地位列第一,是大多数作者采用的第一语言,189篇中有164篇用英文写成,占总数的86.77%。不过应当注意的是,其中很多文献是非英语国家的作者用英语撰写并发表在英文期刊上的。②其他语言中包括了欧洲国家的丹麦语、德语、荷兰语、法语、意大利语、波兰语和西班牙语,说明欧洲是除美国之外的GS研究的主要阵地。③语种当中比较意外地出现了波斯语,再一次说明GS在全球范围内引起了广泛的关注。④东亚语系中只有日语文章,说明该地区整体水平不高,尤其是中国,虽然近几年GS已经成为我国图书情报界研究的热点之一,但没有中文文献被LISA收录,这固然与LISA的来源期刊有关,但也从一个侧面说明国内研究水平有待提高。
对论文作者进行分析有利于了解GS研究的现有状况和发展趋势。检索得到的189篇文献中,除去7篇文献无作者,共涉及到229名作者(包括合作者)。其中,191位作者只被LISA收录1篇文章,占总数的83.41%,发表2篇论文的作者数为32(见表3)。
表3 GS研究作者人数表
从表3可以看出,在GS研究的6年历程当中,还是出现了核心作者,在这里,笔者将发表3篇及3篇以上的作者认为是GS研究的核心作者(见下页表4)。
从表4可以看出:①6位核心作者中,2位来自美国,2位来自德国,还有一位来自瑞士,一位来自伊朗,这说明这几个国家确实是研究GS的核心国家。②位列首位的是来自美国夏威夷大学的Peter J,该作者主要关注的是GS的性能,包括检索性能及引文分析性能。如分析GS检索性能的优势与不足,文章在GS中的被引频次应用于计算h指数时的优势与不足以及与Web of Science、Scopus等数据库的比较。③让人稍感意外的是,来自伊朗德黑兰大学的Kayvan K发表了3篇关于GS的研究论文,由于众所周知的情况(伊朗战乱),Kayvan K能对GS持续关注,实属不易。该作者关注的焦点是GS的引文分析功能,作者分别比较了GS与Web of Science、Google Web/URL等的引文功能。④Michael L C关注的重点是对Web of Science、Scopus及GS三者的引文功能进行比较分析;Christoph N侧重于对GS的检索性能测评,如文献覆盖情况等;Philipp M与Anne-Kathrin W来自同一个单位,论文也均是合作完成,他们关注的重点同样是GS的检索性能,如文献覆盖及更新情况等。
表4 GS研究的核心作者
对文献主题进行分析有助于我们了解该领域的基本特点及重点内容,掌握研究发展的整体趋势和规律。笔者通过阅读论文题名和摘要并查看部分全文,发现GS研究主要集中在GS的性能评价(检索性能评价和引文性能评价)、GS对图书馆的影响及图书馆的应对策略、GS的应用等领域(见表5)。
GS之所以在信息管理领域受到广泛关注,其中最主要的原因是GS的推出对图书馆的现有业务产生了深远的影响,对图书馆的发展提出了强有力的挑战,因此GS对图书馆的影响以及图书馆的应对策略成为最受关注的核心主题,也就不足为奇了。Bowering M L 和Karen A H于2005年对美国研究图书馆协会(Association of Research Libraries,简称ARL)113所高校成员图书馆网站对待GS的态度进行调查,在调查中提出了“GS是否出现在图书馆网站的主页上”、“GS是否出现在图书馆所列出的数据库列表上”等9个问题。发现已有部分图书馆采取相应的措施与GS进行合作,但总体来说比例较低[6]。2007 年两位作者又对此重新进行了调查,发现比例明显提升,表明图书馆越来越重视与GS的合作。两位作者也强调GS的推出对图书馆既是机遇又是挑战,图书馆唯有跟上时代的脚步并作出相应的变革,方可发展壮大[7]。
表5 GS研究论文主题分析
GS推出的另外一大亮点就是提供引文链接。GS通过自动分析和摘录引文,将引文作为单独的结果加以排列,用户点击条目下方的“Cited by…”即可搜索引用该条目的文献。因此,将常用的引文数据库与GS进行比较成为界内关注的热点。Abhaya V K等比较分析了医学论文在Web of Science、Scopus及GS三者中的被引频次,结果显示,在Scopus及GS中的被引频次大大高于在Web of Science中的被引频次,进一步比较发现,相比于Web of Science,Scopus与GS中的施引文献更多的是非英语文献[8]。Kayvan K和Mike T以ISI 2001年收录的生物学、化学、物理学与计算机科学当中的39份开放存取期刊为样本,分析了其在GS中出现但没有在Web of Science中出现的引文。结论认为,相比于Web of Science,GS的优势在于其覆盖文献更广,因而引文量相对更高,并且GS覆盖了更多的开放存取资源,这也可反映开放存取运动的发展及所产生的学术影响[9]。
GS定位于学术搜索引擎,因此其检索性能或者说搜索性能自然受到学者的关注,有33篇文献与此紧密相关,占总数的17.46%。其中,Peter J认为,相比于传统免费学术信息服务,GS的最大优点在其覆盖范围及内容上,提供了全文或者部分全文的链接,而不仅仅只是目次信息,其覆盖范围包括了许多学术出版和大学出版机构的资源、学术组织及政府组织所拥有的资源以及许多预印本知识库,如arXiv.org、RePEc等。但GS也存在着不足,GS并没有明确说明其覆盖范围,用户并不知道哪些出版机构的资源可以搜索,更不用提具体哪一份期刊或者哪一个网站是否被GS覆盖[10]。 John J M和 Thomas W C将EI Compendex(工程索引)数据库中上世纪50年代至2007年的所有文献在GS中进行检索,以此来考查GS对工程类文献资源的覆盖情况,作者以10年为单位考查GS对文献资源的覆盖情况,发现从上世纪50年代至今,GS的文献覆盖率逐步上升,上世纪90年代起覆盖率能接近90%[11]。
信息管理领域的学者在思考图书馆如何应对GS的挑战的同时,也在思考如何将GS应用于学术评价当中。Bhaskar M利用GS来评价图书馆学与信息学的开放存取期刊的学术影响力。该作者以17份该学科领域的开放存取期刊为样本,用GS来获取其引文数量,并以此计算期刊影响因子、期刊自引及即时指数[12]。Harinarayana N S和Vasantha R N以GS为工具,分析了阮冈纳赞(S.R. Ranganathan)的经典著作《图书馆学五定律》(Five Laws of Library Science)、《冒号分类法》(Colon Classification)及《图书分类法导论》(Prole-gomena to Library Classification)的学术影响力,并分析了3本著作的高频引用作者、机构,引用年代,高频引用期刊等[13]。
GS除了可以在学术评价中应用外,实际上还可以在其他领域中应用。Virginia A B利用GS来查找工程学领域论文的引文之全文可获取性,发现样本中化学工程学(Chemical Engineering)领域论文的引文有25%可通过GS获取原文,机械工程学(Mechanical Engineering)则有15%。作者认为利用GS获取学术原文已经成为现实[14]。Michael N等利用Google、GS、 OAIster和OpenDOAR来查找开放存取的论文。结果表明,GS表现最佳,Google表现其次,而OAIster和OpenDOAR的表现让人失望。最后笔者指出,GS和Google是查找开放存取论文的便捷免费途径[15]。
从上述分析可以看出,目前国外对GS的研究呈现出以应用为导向的特点。相信随着时间的推移,图书馆与GS的共同发展以及如何更好地应用GS这一学术工具将是界内关注的重点。
[1]董文鸳.数字科研时代的引文分析——基于被引频次分析的实证研究[J].大学图书馆学报,2007(2): 36-39,106.
[2]华薇娜.网络学术信息资源检索与利用[M].北京: 国防工业出版社,2002:170-171.
[3]Ralph L S. Two New Search Engines: MSN Search/Beta and Google Scholar [J]. North Carolina Libraries, 2004 (4):235-236.
[4]袁顺波,董文鸳.新世纪图书情报界图像检索研究总况探析——LISA数据库收录文献计量分析[J].图书情报工作,2005 (9):40-43.
[5]JCR社会科学版(2008) [EB/OL]. [2009-12-25] .http://admin-apps.isiknowledge.com/JCR/JCR?SID=3DfD4g1HNGpB9b7i5kL.
[6]Bowering M L, Karen A H. Google Scholar and the Library Web Site: The Early Response by ARL Libraries [J]. College & Research Libraries, 2006 (2): 106-122.
[7]Karen A H, Bowering M L. Google Scholar and Academic Libraries:an Update [J]. New Library World, 2008 (5-6): 211-222.
[8]Abhaya V K, Brittany A, Iffat S, et al. Comparisons of Citations in Web of Science, Scopus and Google Scholar for Articles Published in General Medical Journals [J]. Journal of the American Medical Association, 2009 (10):1092-1096.
[9]Kayvan K, Mike T. Sources of Google Scholar Citations Outside the Science Citation Index: a Comparison Between Four Sciences Disciplines [J]. Scientometrics, 2008 (2):273-294.
[10]Peter J. Google Scholar: the Pros and the Cons [J]. Online Information Review, 2005 (2):208-214.
[11]John J M, Thomas W C. Google Scholar's Coverage of the Engineering Literature: an Empirical Study [J]. The Journal of Academic Librarianship, 2008 (3):196-201.
[12]Bhaskar M. Do Open-Access Journals in Library and Information Science Have Any Scholarly Impact? A Bibliometric Study of Selected Open-Access Journals Using Google Scholar[J]. Journal of the American Society for Information Science and Technology,2009 (3):581-594.
[13]Harinarayana N S, Vasantha R N. Citation Analysis of SRR's Works:a Look Through the Window of Google Scholar [J]. Information Studies, 2009 (3):165-178.
[14]Virginia A B. Using Google Scholar to Search for Online Availability of a Cited Article in Engineering Disciplines [EB/OL].[2009-12-25].http://dialnet.unirioja.es/servlet/articulo?codigo=2 914636&orden=197970&info=link.
[15]Michael N, Charles O, Fytto R. Finding Open Access Articles Using Google, Google Scholar, OAIster and OpenDOAR [J]. Online Information Review, 2008 (6):709-715.