邵嘉亮
摘 要:本文在分析SCI数据库中被引文献信息的表达存在问题的基础上,重点探讨了检索被引文献的正确方法,希望能够对于SCI数据库中被引文献信息能够准确进行检索起到一定抛砖引玉的作用。
关键词:SCI数据库 被引文献 检索 信息表达
中图分类号:G351 文献标识码:A 文章编号:1672-3791(2014)07(a)-0017-01
目前,对于美国费城科学情报研究所的科学引文索引(简称SCI)来说,我国大部分高校都用此来评定个人和团体的学术水平,具体包括科研人员的晋升职称、成果申报、课题申请等,在进行评估和考核科研机构,以及相应的高校科研能力排名中,都需要此数据库提供的有关论著收录或者被引用证明。对于情报检索人员来说,在SCI检索方面的需求正大迅速增长的背景下,能否正确进行该数据库的检索有时候直接影响到科技工作团队的工作成就,这就需要特别认真对待,需要具有比较大的责任。但是,在该数据库中,有时候存在过于简单的被引文献信息的表达的情况,有些数据库记录中的一些重要信息也是如此,甚至还会出现一定的错误信息,这就给准确进行检索带来一定困难[1]。本文主要就SCI数据库中被引文献信息表达相关问题进行探讨和分析,并且在DIALOG联机系统中,提出相关的该数据库进行文献被引信息检索的正确方法。
1 SCI数据库中被引文献信息的表达存在问题分析
根据实际工作中的情况,在SCI数据库中,对于被引文献信息表达中所存在的问题进行总结如下[2]:(1)对于尚未正式出版的文献就已经引用,此时就存在十分简略的表达,比如,带有UN PUB(未出版)或者IN PRFSS(出版中)等字眼。(2)分析文献被引信息的表达形式,往往都有固定的格式,为缩写的作者姓名,文献源名称(缩写),卷号,期号,页码。出版年等,但是,存在的例外情况则会缺少相关的一项或者多项信息。(3)对于为丛书系列或会议文献的专著来说,存在多变的文献源信息表示,比如可以用出版商的名称来表达,或者是会议名称、会议文献、会议录书名,或者是丛书名称、专著题名和系列号等,另外,还存在多种多样的表达的缩写方式。(4)对于多于一人的文献作者来说,往往仅取第一作者的姓名。(5)在作者姓名缩写形式中,往往为作者姓+作者名的首字母,中国作者的双名字缩写一般采用为两个词的首字母,但是,存在错把姓当名和名当姓,或者仅仅取一个首字母的情况。(6)引用者会出现相关的期号、卷号、出版年以及页码等方面的错误,文献被引信息中出现错误已经成为普遍现象,这还包括相应的人为所引起的数据录入的错误。
2 检索被引文献的正确方法探讨
在SCI数据库中,存在十分简略的被引文献信息的表达情况,还有一定的不规范性和易出错等特点,这在上述存在的问题中已經表明。要想对于SCI数据库中的尽量避免出现大量的漏检和误检情况,一定要在充分意识到上述问题的基础上,按照正确的检索方法去进行文献检索工作[3]。比如,通过实际工作可以知道,经常出现几十种的对于同一篇被引文献的表达方法,其中,肯定存在一定的错误表达,根据通常的检索方法,仅仅检索过程中集中于一两种的表达方式,这样就会造成比较严重的漏检情况。为了能够更好地公正评价有关科研人员的学术成就,得到较为准确的检索结果,认真负责的态度对于情报检索人员相当重要,应该对于正确和有效的检索方法进行积极探寻。
2.1 被检索文献的书目特征应该详细了解
其中,主要需要了解的内容包括以下几个方面[4]:(1)文献题名。对于专著的文献来说,题目就是其书名,这样就会在相关的被引信息表达中中出现,或者也存在不出现的情况;对于期刊论文的文献来说,篇名就是题名,在被引信息的表达中一般不会出现,但是,在特定的情况下,则在SCI数据库中会出现一定的例外情况;(2)卷、期、页、年、丛书号等,上述信息往往在被引信息表达中出现,也可能不出现,这也是进行所查的文献的被引信息的相关表达式的判定的重要依据之一,但有时也有错误的时候;(3)在文献源方面,可能存在为会议名称、丛书名称以及刊名,甚至有可能为书商名;(4)在作者姓名方面,应该注意合作完成的文献的情况,在SCI数据库中往往仅提供相关的第一作者的在此数据中的被引信息,对于中国作者来说,则应该格外注意作者名字的缩写形式;(5)在中文文献方面,应该注意书目信息译成英文后的形式问题,因为在SCI数据库中存在不止一种形式的被引信息的表达方式。
2.2 “ecr=”的命令应该充分利用
被引信息的可检索字段在在DIALOG的SCI数据库中,总共有四个:cr(被引参考),cw(被引工作,实指被引文献出处),ca(被引作者),cy(被引文献出版年。在上述四种中,被引信息最完整的就是cr所包含的信息。后三者的字段的信息都可以看作为包含在cr中,它们仅为cr的子字段,这样可以看出,检索cr字段为主则是被引文献的检索的有效方法。
DIALOG的扩展命令则是e(expand)命令,通过此命令,能够根据字典排序方式,针对指定字段的内容进行按照从指定点开始展列,同时,包含有该字段的相应内容在该数据库中的记录数量也能够被很好显示。
2.3 用“scr=”的命令作正式检索思考
在分析上述得到的结果过程中,对于文献的被引用情况进行初步的判定。在对于SCI数据库进行正式检索时,则可以使用“scr=”的命令,另外,相关的记录内容的显示命令则用type命令。
2.4 认真分析核对检索结果
应该认真核对上述步骤所得到的相关结果,对于需要检索的被引文献信息进行进一步地确认和判断,在确有必要的情况下,可以找到原文进行确认,并且仔细检查相应的前面几个步骤,主要就有无遗漏表达进行重点检查;对于上述第二部分中的可能存在的不同类型的引文表达来说,应该充分考虑,比如,相关的引文表达中的年份遗漏、未正式发表前的被引以及错误信息提供等情况。
为了获得检索的满意结果,应该对于上述步骤进行反复,直到获得满意结果为止。需要注意一点,应该尽量要求被引文献作者本人参加。
参考文献
[1] 王荣,秦江敏,林平.正确认识和利用SCI的评价作用[J].长江大学学报:社会科学版,2010,33(4):39-41.
[2] 薛培荣.计算机文献检索与科技期刊编辑工作[J].中国科技期刊研究,2000,11(6):387-388.
[3] 孙嘉杰.Dialog数据库在科技查新中的灵活应用[J].创新科技,2013(12).
[4] 莫愚,罗勤,王旭.由Web of Science(R)数据库浅析4种非SCI科技期刊引发的思考[J].中国科技期刊研究,2012,23(6):992-994.