王 婧 华薇娜(南京大学信息管理系)
1955年美国著名情报学家尤金·加菲尔德(Eugene Garfield)在Science上发表论文首次提出将引文索引作为一种新的文献检索与分类工具的理念。加菲尔德博士在1958年创建 Institute for Scientific Information(ISI),并于其后成功出版了《科学引文索引》(SCI,1963)、《社会科学引文索引》(SSCI,1973)、《艺术和人文科学引文索引》(A&HCI,1978),建立起较为完整的“引文索引系统”。随着时代的进步和计算机网络技术的发展,引文索引的研究与应用更加广泛,不仅对传统检索起到重要作用,也为学术评价提供了重要依据。
我国引文索引数据库的研究开始较晚,在借鉴国外成功经验的基础上已取得瞩目成就。目前应用较广泛的有中国科学引文数据库(CSCD)、中文社会科学引文索引(CSSCI)、中国科技论文与引文分析数据库(CSTPC)、中文科技期刊引文数据库(VIP)等。其中,由南京大学中国社会科学研究评价中心开发研制的CSSCI弥补了我国人文社会科学领域研究的空白,并逐渐被国内的专家和学者关注,引起了广泛的讨论。因此,从各方面对国内外文科引文索引数据库进行比较分析就显得十分必要。本文将分别从收录数据和检索功能等方面对国内外的引文数据库CSSCI和SSCI、A&HCI进行比较,希望通过对比找出国内引文数据库存在的一些缺陷,对其进一步发展和完善有所帮助。
收录数据是数据库检索的基础,是保证检索结果的资料来源,将直接影响到用户检索的查全率和查准率。CSSCI与SSCI、A&HCI收录数据的比较如表1所示。
表1 数据库收录数据比较
从表1可以看出:
(1)由于CSSCI着手研制较晚,其收录时间和来源期刊的范围与SSCI、A&HCI还存在较大差距,导致我国数据库的回溯性较差,在一定程度上限制了用户“追溯历史”的要求。
(2)从更新周期来看,CSSCI更新周期长,存在滞后性,会对用户的检索造成影响。
(3)从文献类型看,SSCI、A&HCI划分更细致。但由于中外研究背景存在差异,我国在研制CSSCI时也需考虑本国情况,根据需求进行合理划分。
此外,SSCI、A&HCI基于Web of Science平台集成了SCI-E、SSCI、A&HCI三个独立的引文索引数据库,用户既可以分库检索,也可以在统一的界面进行跨库检索,这样不仅为用户检索提供了更多自主选择,同时对检索某些跨学科的研究领域也提高了检全率。而CSSCI是基于中国社会科学引文索引的网络版,对检索范围存在限制。但是,无论SSCI、A&HCI还是CSSCI,在来源期刊的选择上都有严格的要求,使得它们成为检索各自领域文献的权威数据库。
检索功能是评价一个数据库优劣的重要指标。CSSCI与SSCI、A&HCI的检索功能比较如表2所示。
表2 数据库检索功能比较
从表2可以看出:
(1)关于检索算符。Web of Science平台支持三种布尔逻辑运算符:AND、OR、NOT,遵循布尔逻辑运算规则。支持通配符:*、?、$,进行截词检索。如*可以代表0、1或多个字符,?代表一个字符,$表示0或1个字母。用math*可得到maths,mathematic等,m?n可得到man和men,flavo$r可得到flavor和flavour。支持临近算符Same,用它连接的检索词必须出现在同一句子中,检索词在句子中的顺序是任意的。用Address=(nanjing univ same 210093),可以得到南京大学发表的论文情况,而排除了南京理工大学(nanjing univ sci &technol)等干扰项。支持短语检索。若要精确查找短语,可用“”(引号)括住。如“information science”检索时将会得到包含精确短语information science的记录,但仅适用于主题和标题检索。CSSCI对布尔逻辑检索仅支持OR、AND算符,具有一定局限性,给用户编制检索式带来不便。
(2)关于来源文献的检索字段。两者的检索字段设置各有千秋。Web of Science平台中主题字段包括标题、摘要、作者关键字字段,与国内检索习惯有所区别。而CSSCI从分类的角度,增加了中图类号检索,揭示了文献的内部特征,提高了检准率。例如检索有关“莎士比亚创作的戏剧评论”时,如果在篇名字段输入“莎士比亚”,就可能造成漏检,而从分类角度入手,用中图分类号I561.073(英国戏剧文学评论)进行检索,就可以得到如《一场不幸的婚姻——《奥赛罗》浅析》等篇名中不含“莎士比亚”但符合检索要求的结果。
(3)关于被引文献的检索字段。CSSCI比Web of Science提供了更多检索字段,增加了检索的灵活性。如被引文献细节检索,可对文献题录信息进行检索,输入某人的名字,既可以对作者为某人的文献进行检索,也可以检索篇名(词)中含有某人的文献信息。
(4)关于检索方式。Web of Science除了一般检索与引文检索,还提供了高级检索,便于有经验的用户直接在检索框中制定较为复杂的检索式;同时系统自动将用户的检索式保存到检索历史中,按倒序数字顺序显示在检索历史表中,方便查阅和组配;此外,用户可以对所需的检索结果进行标记,并在标记列表中自由选择输出字段,对输出结果灵活管理。
(5)关于检索结果管理。相比于CSSCI,Web of Science对检索结果的处理更加友好和人性化。在显示检索结果数目和检索式的同时,系统提供了与文献全文的超链接以及按照Latest Date(发表日期降序)、Times Cited(被引次数)、Relevance(相关度)、First Author(第一作者名)、Source Title(来源期刊刊名)、Publication Year(出版年)等进行排序,用户可以根据需要对检索结果排序整理。用户还可以利用结果界面的Refine Search(精确检索)对检索结果进行提炼,途径主要有:学科领域、文献类型、作者、来源文献、出版年、机构、语言、国家/地区。由于检索并不能保证全面,用户还可以通过Web Plus检索互联网上免费的信息资源。对于大量检索结果,用户可以进行500条批量下载并保存为多种格式,便于以后对结果统计和处理。
(6)用实例比较数据库的部分检索功能。
下面以文献计量学为例,分别对CSSCI和SSCI进行检索来说明。
首先用CSSCI检索篇名或关键词中包含文献计量学的文献,将年代限制在2004—2009,得到194篇检索结果。系统自动统计出每年的文献结果数,见表3。
表3 CSSCI来源文献结果统计
用SSCI进行检索,主题=(bibliometric*),入库时间=2004—2009,得到778条检索结果。Web of Science提供了根据作者、会议标题、国家地区、文献类型、机构名称、出版年、来源出版物、学科类别等字段对结果进行分析。例如按作者字段分析,得到结果如图1。
图1 WOS作者分析
论文被收录的多寡与其学术水平相关,可作为评定学术带头人的参考标准之一。同理,从其他角度分析也可以帮助用户更全面深入地了解所检索的领域。例如按年代分析,了解某个领域研究的高峰期及发展趋势;按语种或国家/地区分析,了解论文分布情况,可以根据需要加以限制进行深入检索;按机构名称分析,了解相关领域科研能力较强的机构。
图2 WOS创建引文报告
下面对作者GLANZEL,W进行深入分析。选择该作者前的复选框,点击查看记录,得到该作者发表的29篇关于文献计量学的文章。通过“创建引文分析报告”,得到结果如图2。
图2可以清晰地反映出该作者的29篇文献在每年的发表数和被引数,同时系统按照年代对每篇文章的引文进行统计,用户可以通过标题的超链接查看每篇文章的详细著录。例如我们选择《A bibliometric approach to the role of author self-citations in scientific communication》这篇文章,得到它的全记录页面。通过施引文献列表:39,可以查看全部39篇引用该文章的文献,从而了解该领域之后的研究发展状况。同时可以Create Citation Alert(创建引文跟踪),当有人引用此记录时,系统将向用户指定邮箱发送电子邮件以告知,使用户可以及时了解该文章的最新被引动态。通过参考文献:7,可以查看该文章引用的文献,从而层层向前追溯该领域的研究历史。通过Related Records可以查看与该文章有相同参考文献的文章(按共被引的参考文献数量降序排列),从而了解相关领域的研究状况,对进一步扩大检索范围,更全面地了解该领域的研究状况有较大帮助。此外,通过引证关系图,选择向前引证关系(施引文献)、向后引证关系(被引文献)、引证关系图(施引和被引)可以更直观地看出该记录的引证关系。
以上文提到的作者GLANZEL,W为例,检索其于2004在《SCIENTOMETRICS》发表的“A bibliometric approach to the role of author self-citations in scientific communication”一文的被引情况。在SSCI、A&HCI的“被引参考文献检索”途径中,通过被引作者、被引著作、被引年份的限制,得到符合条件的7条检索结果。再通过浏览标题,选择所需文献前的复选框,单击“完成检索”,就可以得到该篇文章的详细施引文献情况,并可以结合分析功能进行分析,在此不再赘述。
下面使用CSSCI检索南京大学信息管理系苏新宁教授在2004—2009年发表期刊论文的被引用情况。在被引文献检索中,通过对被引作者、文献类型和年代的限制,得到的结果统计后如表4。
表4 CSSCI被引文献检索结果统计
CSSCI虽然按年份统计了该作者发表的期刊论文被引数量和被引次数,但是笔者认为这种分类方法不但没有意义,还存在一些弊病。年份完全可以通过统计得到,但是按年份分类后,同一篇文章其计数结果在被引文献时就不准确了。例如《企业知识管理研究与实践的进展》一文,分别在2004、2005、2006、2009年间被引用了5次、4次、2次、1次,但是将在不同年份被重复计次,因此作者实际被引的篇数小于57篇。
Web of Science强大的分析功能和其从用户角度出发提供的如My EndNote Web、My Citation Alert、My Saved Searches、My Journal List等个性化服务是CSSCI望尘莫及的。但是,CSSCI为专业性不强的初级用户提供了委托查询服务,根据一定的收费标准,由专业检索人员提供较为精准的检索结果。随着移动通讯设备的不断普及和发展,CSSCI还提供了手机查询服务,按照用户需求将查询结果通过手机显示给用户,更加方便快捷。
通过以上从数据库的收录范围和检索功能的比较分析可以看出,国内外引文索引数据库的建设虽然各具特色,但是国内数据库的研究应用与国外较为成熟的体系相比还存在一定差距。CSSCI作为中国的“SSCI”,仍存在较大的发展和改善空间。在数据的收录范围上,要做到“广而精”,不仅有较强的回溯性与及时更新性,也要保证来源期刊的质量;在检索功能方面,要更加重视细节的设置,尽量着眼于用户的需求,提供更为便捷和个性化的服务。此外,从我国数据库宏观发展来看,引文数据库可以与提供全文的数据库建立链接,形成完整的检索体系,提供“一站式”服务。还可以考虑将自然科学和人文社科的专一数据库集成在统一的平台上,提供跨学科检索的准确性和灵活度。加强与国外数据库厂商的合作,在借鉴与吸收国外先进研究成果的同时提高自身水平,推进国内数据库的国际化进程。
1 赵蓉英,等.我国五大数据库引文国内的比较研究[J].情报理论与实践,2008(4)
2 郭丽芳.中外五大引文索引系统比较分析[J].现代图书情报技术,2005(1)
3 华薇娜,等.美国ISI公司网络版引文索引数据库评价[J].情报理论与实践,2001(1)
4马费成.CSSCI与社会科学评价.南京大学学报[J],2000(4)
5 中国社会科学研究评价中心[EB/OL].http://cssci.nju.edu. cn,2009-11-26.