摘 要:信息时代如何在海量信息中找到所需信息非常重要,而如何寻找自己研究方向中具有参考意义的重要文献,以及筛选出含金量高的论文,是一名优秀的科研工作者所必需的一项技能。文章通过论述搜寻主题为“Trajectory Data”的论文时积累的经验,列举了检索和筛选中文文献与英文文献的方法,最后总结全文,并对如何进行特定主题的文献检索的方法进行初步探讨。
关键词:文献检索;检索方法;筛选文献
中图分类号: TP391.1 文献标识码:A 文章编号:2096-4706(2020)06-0007-03
Abstract:In the information age,it is very important to find the information needed in the massive information. How to find the important literature with reference significance in their own research direction,and how to select the paper with high gold content,is a necessary skill for an excellent scientific research worker. By discussing the accumulated experience in searching for papers with the theme of “Trajectory Data”,this paper enumerates the methods of searching and selecting Chinese and English literature,and finally summarizes the full text,and makes a preliminary discussion on how to search for literature with a specific theme.
Keywords:literature search;search method;screening literature
0 引 言
文献检索是信息检索中的一个部分,主要在科学研究方面用处很大。进行文献检索,检索者要根据自己所需文献的主题,借助国内外各大中英文数据库以及各种搜索引擎寻找自己所需要的含金量高的论文等资料。大部分本科生对文献信息资源的重要性没有充足的认识,需要一种经由实践总结出来的高效寻找重要文献的方法,针对该问题的探讨也对提高本科生获取信息的能力具有十分重要的意义。
本文拟从笔者自身检索主题为“Trajectory Data”这一主题的重要文献这一较有代表性的活动入手,分别对寻找中文文献的过程及所用方法和寻找英文文献的过程及所用方法进行叙述,然后从中总结出高效检索特定主题的文献的方法,最后就其检索文献所得结果的科学性与准确性进行探讨。
为了保证文中所提方法的准确性,作者首先总结了“文献检索与论文写作”这门课程上自己所学习到的检索方法,而后通过CNKI平台,在其论文数据库中进行检索,检索时采用的中文关键字为“文献检索”,对于检索出的论文,通过人工审查的方式移除掉与所探讨问题相关度不高的文章,从中挑选出几篇有代表性和实用价值的文章进行阅读后,按照从中归纳总结的方法,加上已有的知识与经验,最终选择出与该问题相关的高质量论文共3篇(截止到2019年10月)来作为撰写这篇论文的参考文献。
本文第1节对进行特定主题的文献检索过程中选择目标论文的两个参考点进行列举,对评判论文含金量的几个因素进行列举分析,并对其中3个重要因素(相关度、引用量和下载量)以及为什么选择这三项指标作为评判标准进行分析阐述。第2节对进行中文文献检索的过程进行具体说明与总结。第3节对进行英文文献检索的过程进行阐述和说明。第4节综合第2节和第3节所叙述的在中文数据库和外文数据库查找文献的过程,对文献检索方法进行总結,并对如何进行行之有效的文献检索进行初步探讨。
1 特定主题的文献检索过程中选择目标论文的参考点
1.1 时效性
计算机专业的前沿技术更新换代非常快,因而除了极其具有里程碑式意义的文章外,首先应该选择发表时间不是很长的论文,这样我们才能对研究方向的相关前沿动态有更加深刻的理解,并从中掌握大量自己所需的、对自己有所启发的信息,或得到更多对于自己的研究更有价值的论证依据。正如本文所要论述的中文论文和英文论文的检索,进行筛选得到的目标论文都是近三年的论文。
1.2 含金量
一篇论文的含金量主要从三个方面来进行考量:相关度、引用量和下载量。
相关度是文献检索过程中最需要把控的一个指标,如果检索结果与所寻找的主题间的相关性很低,那么这样的检索结果是没有意义的。以“Trajectory Data”这个主题为例,在CNKI数据库中进行搜索时,搜索结果中出现的《金属板材数控单点渐进成形加工轨迹优化研究》等论文就是无效的。
引用量是评价一篇论文含金量的一个相对客观的指标。虽然可能受发表时间影响,但如果一篇论文的引用量较高,说明其中所叙写的研究成果价值很高并经得起科学的检验与推敲,后来的研究者们可以借由论文中的结论进行更加深入的研究。在实际的文献检索过程中,论文的引用量也是占比重最大的一个参考因素。
下载量相比较引用量来讲,其科学性与信服度要差一些,因为下载量对论文来讲无法说明其对其他人进行研究所起到的帮助性作用,但如果下载量极其高,某种程度上说明其可能是最前沿的研究,且下载量与被引用次数在大多数情况下是呈现正比关系的,因而可以将下载量作为进行结果筛选时的一个非主要因素。
2 中文论文的检索
在进行文献检索前,我们需要对要去检索的主题有明确的认识和理解,即明确主题究竟是什么。因此我们首先要分析主题,抓住待检索文章主题的本质,掌握代表课题内容的主题概念及其相关事物,然后依据关键词来选定相应的检索工具,并从中选定检索标识,确定检索方式。在百度百科上搜索Trajectory Data的对应中文翻译“轨迹数据”,得到了轨迹数据的定义,随后开始进行论文的检索。我们使用知网来进行中文文献的检索。
进入CNKI,选择“高级检索”-“期刊”,在“主题”的搜索框中输入“Trajectory Data”,检索时间选择从2016年到2019年,来源类别中选择“SCI来源期刊”和“EI来源期刊”,如图1所示,因为选择的期刊水平越高,其收录的论文水平相对越高,越容易找到具有高参考价值和高含金量的论文。一切条件都输入后进行检索。在新的界面得到检索结果后,在“排序”一栏选择“相关度”,而后通过引用量与下载量进行筛选,对引用量和下载量较高的篇目,通过浏览篇名、查看摘要、在线阅读全文等人工审查方式,选择出与相关主题最贴近的论文,作为目标检索结果的一部分。
进行文献检索的过程中笔者使用了顺序筛选法与追溯法两种方法。顺序筛选即通过上文所提的人工查找和人工审查的方式,对检索结果进行逐一筛选,得到目标文献清单。而追溯法即通过一篇文章的参考文献,得到在时间范围内的其他与主题相关的参考文献,紧接着通过得到的论文的参考文献继续寻找与主题相关的参考文献,如此往复,得到一系列目标文献。顺序筛选法借助现在在线的搜索工具,能根据限定条件快速得到所需文献,操作迅速简单,得到目标文献的准确性与含金量相对较高,适合短期的、时间限定较紧的文献检索。追溯法容易寻找到偏向综述性的文章资料,这些资料往往已经对某一种问题或某一类问题进行了一定的归纳和总结,所以這些资料能够节约查找、通读原始文献的时间。追溯法适合在现有论文较少的条件下使用,适合初次进行文献检索时使用。因为通过这种方式寻找到的论文多为被作为参考文献的论文,其相关度和含金量均有所保障,并且一定程度上在所属主题的领域中是具有指导意义的文章,有很高的参考价值。
由于CNKI本身具有强大的条件检索和筛选能力,在作者输入上文中的一系列条件后,其得到的结果根据相关度降序排列后,高引用量和高下载量的文章同样也在搜索结果靠前的部分,因而笔者在进行中文论文的检索时只用了顺序筛选法。
通过上述方法,笔者选择了15篇与“Trajectory Data”有关的中文论文,至此中文文献检索的工作圆满完成。
3 英文文献的检索
目前外文数据库里,在计算机科学领域,比较有名的有ACM数据库、Engineering Village数据库(EI数据库)、Springer出版社、IEEE数据库、SCI数据库等。在进行英文论文的检索过程中,直接使用顺序筛选法或者追溯法,在ACM数据库中的检索中或许还能找出一些根据第一节中所描述的判断方法所筛选出来的相对而言含金量高的文章,但在诸如Springer数据库、EI数据库等数据库中进行搜索时,根据相关度进行排序后,许多论文的引用量和下载量不会那么明显地显示出来,这时就不能单独采用其中的某一种方法,所进行的文献检索也显得不那么行之有效。
而对于英文论文,初涉文献检索的人很难在短时间内根据文章内容判断其含金量,在这种情况下,笔者采用分段法进行英文论文的检索。所谓分段法,就是将顺序筛选法和追溯法交替使用,即一方面利用外文数据库检索平台经过输入一系列筛选条件后,得到的结果经过筛选后作为目标论文的一部分,一方面根据已得到的目标论文最后所附的参考文献进行追溯,得到在相应时间范围内的具有参考意义的论文。通过分段法进行文献检索时,我们不必对每一篇文章都了解得十分详细,只需根据一定的指标筛选出少量的目标论文,而后视需要根据已有论文不断追溯论文,进而不断扩充目标论文集合,从而获得足够的文献资料。
分段法的操作过程如下:以ACM Digital Library为例,进入到ACM数据库新平台,在其主页的搜索栏下点击“Advanced Search”,在新界面中“Search Within”的“Anywhere”后填写“Trajectory Data”,在“Publication Date”一栏中选择“Custom range”,然后日期填写从2016年10月到2019年10月,点击“Search”得到搜索结果。ACM数据库默认按Relevance(相关度)进行排序,每一篇文章的引用量和下载量一目了然。通过浏览搜索结果筛选出其中引用量和下载量相对较高的几篇文章,而后查看已得到的文章,获得其参考文献内容,再度进入数据库中进行查找,如图2所示。例如我们通过顺序筛选得到了一篇名为“A Cloud-Based Trajectory Data Management System”的文章,查看文章的References(参考文献)部分,其中的“Queryingassive trajectories by path on the cloud”这篇论文与“Trajectory Data”相关度很高,因此将其纳入目标论文中,并对这篇文章重复上述方法继续进行检索,如此经过几次循环,我们便能得到我们所需要的目标论文集。
通过上述方法,笔者共选择了15篇与“Trajectory Data”有关的英文论文,至此英文文献检索的工作也顺利完成。
4 结 论
在给定主题为“Trajectory Data”的情况下,通过在中文数据库进行中文论文的文献检索和在外文数据库中进行英文文献的检索,笔者共采用了三种方法:顺序筛选法、追溯法和分段法。
顺序筛查法主要通过由近及远的顺序,基于在线搜索平台,输入一定的限制条件后,由评判论文含金量的三个因素(相关度、引用量和下载量)进行筛选,得到所要寻找的目标论文。这种方法在进行中文数据库中的文献检索里较为适用,其操作简单,得到的结果建立在一定的较为科学的依据上,得到结果的速度快、成效好。
追溯法主要是通过已有文章的参考文献,获取与已有同主题论文内容相近且更加具有参考价值的论文。这种方式本质上是一种递归,通过不断在参考文献中寻找论文可以得到更具有参考性的论文,但重复次数取决于限定的论文发表时间段的长度。
分段法则是上述两种方法交替进行,一方面借助在线检索平台,一方面借助已有文章,得到的结果更多且更具有可信度。
因此在笔者看来,采用分段法更有利于进行特定主题的文献检索。随着信息时代文献资料的爆炸式增长,在线检索平台逐渐取代纸质检索工具,进行高效的文献检索成了每一位大学生所应具备的一项技能。文献检索与利用是大学生进行科研活动的基础,因此好的文献检索方法就显得尤为重要。
参考文献:
[1] 刘冲.论大学生毕业论文写作中的文献检索与利用 [J].赤峰学院学报(自然科学版),2016,32(23):178-180.
[2] 吴江艳,王海燕.文献检索与利用能力培养研究 [J].出国与就业(就业版),2012(6):234-235.
作者简介:冯禹隆(1999.08-),男,汉族,山西夏县人,本科,学士学位,研究方向:计算机软件开发。