网络时代学术论文关键词标引的原则及方法

2014-08-15 00:44李海中
中国石油大学胜利学院学报 2014年2期
关键词:标引学术论文检索

李海中

(南京信息工程大学 期刊社,江苏 南京210044)

作为学术论文的传播平台——学术期刊和文献数据库承载着把学者的思想和观点传播给广大读者的使命。在学术论文传播过程中,各期刊编辑部对促进学术研究规范和学术论文质量提升肩负重任。作为学术论文主要构件之一的关键词(另有题目、摘要、注释、参考文献等其他构件),是学术论文被用户检索使用的主要手段。最初,关键词是为了适应计算机检索的需要,紧随在论文摘要之后出现的。20世纪60年代初,美国Chemical Abstracts从第58卷起,就开始采用电子计算机编制关键词索引,提供快速检索文献资料主题的途径[1]142。

在当今信息化时代,全球每天发表的学术论文数万篇。如何在海量的学术论文中找到自己需要的文献呢?学术界早已约定利用主题概念词(即关键词)去检索最新发表的论文[2]。学术论文关键词标引是否科学、规范,是否能够准确地传达文章的主旨含义、创新之处、研究结果等,是衡量学术论文质量高低的重要标志之一,更是该文发表后能否被用户便捷地检索到的关键。信息化技术和互联网的迅猛发展,使得学术论文在传播中对关键词的依赖度越来越大。关键词的选择和标引是否科学准确,从一定意义上来说,成为影响一篇学术论文传播效果和影响力的“试金石”,事关论文的传播范围和影响力,最终决定着作者的思想和观点究竟能走多远[3]92。

一、关键词遴选的基本原则

学者在研究过程中,一般是通过相关数据库输入关键词来检索所需信息和文献的,一篇文献的主题概念也是通过关键词这一自然语言表达出来的。按照目前规范,学术论文的关键词一般列出3~8个,依次写在“摘要”的下方。学术论文的关键词是从题名、摘要和正文中选出来的,能反映论文主题概念的词或词组。关键词包括3部分:叙词(正式主题词),经过规范化的并收入主题词表中的词或词组;非正式主题词(词表中的上位词+下位词+替代词);自由词(标引需要但主题词表中找不到的词)[4]。

由于关键词是检索时的重要依据,所以其遴选质量潜在地影响一篇论文的传播力和影响力。作者应选用能反映论文主旨内容特征的通用性强的为同行所熟知的词[5]51。作者(或期刊编辑)在遴选关键词的过程中,应把注意力重点放在论文题目、摘要、论文的分级标题、结论这四个方面,并要遵循一定的规范和原则,目的是能够满足文献标引或检索工作的需要。

(一)专业指向性原则

应选用专业性强、指向性强并为相关专业领域读者所熟知的词汇作为关键词,而不是选用与专业内容“不搭界”或联系不紧密的非专业词汇。这样,研究成果上传数据库后,才有可能避免被海量信息所淹没,能被同行研究者便捷地检索出来。

(二)前沿性原则

学术论文一般是最新研究成果的集中展示和详细报道。创新性是其生命力,也是其得以被学术期刊采用的“卖点”。关键词作为一篇论文的“文眼”,其揭示的是该文最核心的主题内容,也是该文最基本的学术思想、研究方法、结论成果的集中表达和高度凝练[5]53。因此,只有该专业领域前沿性较强、先进性突出的关键词,才能精确地表达文章的“关键点”,才更容易引起读者的关注,激发读者的阅读兴趣。

(三)精准性原则

在选取关键词时,应尽量将论文的主题概念精准地表达出来,既不能芝麻西瓜一把抓,也不能抓了芝麻丢了西瓜,同时要注意分析论文所包含的隐含概念,使选出的关键词能全面、客观地反映论文主题。所选“关键词”的外延太过宽泛和内涵过于狭窄,都是不符合关键词的选词规范和要求的,也不利于文章的有效传播。

(四)规范性原则

为了能更加准确地反映论文的主题,提高论文的检准率,应尽量向主题词靠拢,选取规范化的词语(可查阅最新版《汉语主题词表》);应尽量避免选取不适合作标目的非关键词,如冠词、代词、连词、感叹词、副词、形容词和某些动词,化学结构式、反应式和数学式原则上不用。同样,国际著名的数据库系统,如SCI、EI(Engineering Index)、SDOL(Science Direct Online)等把诸如“理论”“报告”“实验”“研究”“方法”“分析”“问题”“途径”“特点”“目的”“概念”“规律”“发展”“现象”等词语,视为无特殊检索意义的半禁用词。这些半禁用词表意过于空泛,不宜独立用作关键词。此外,应避免选用与专业内容不甚相关的不足以反映实际内容的通用词,如“意义”“影响”“方法”“对策”“策略”“分析”“探讨”“问题”“理论”“报告”“试验”等[3]93。英文缩略语或符号无法满足关键词所要求的词义明确原则,英文缩略语、符号不宜作关键词。

(五)顺序性原则

关键词的排列顺序应有利于清楚明晰地、层层深入地反映论文主题。一般标引顺序为研究目的、研究类别、研究方法、研究结果。对于同一序列的一个或多个具有属种关系或在深浅程度上有差异的关键词,应按属种关系或由浅到深的顺序排列[6]105。表达同一范畴的概念和意义紧密相连的关键词,一般要相对集中,同一语义场中的几个关键词,上位词在前,下位词在后,如“中国史”“中国古代史”“清史”。反映论文研究的目的、对象、范围、方法、过程等内容的关键词在前,反映研究结果、意义等的关键词在后[7]。

(六)控制性原则

关键词的标引应遵循自由原则,但绝不是天马行空,想当然地凭感觉来标引。关键词的标引工作,是一种“带着镣铐跳舞”的遴选过程,既要遵循《汉语主题词表》的基本规范,又不能为其所束缚,要能很好地利用有关主题词表,用理性约束随意性,控制住自由词的标引量,在保障关键词遴选规范性的同时,又不遗漏新信息,从而保证检索的有效性和命中率。

二、论文关键词标引中常见问题

自20世纪八九十年代以来,我国相继制定了一系列有关学术论文关键词标引的国家规范标准,但大部分作者对此却不甚熟悉,更缺乏对关键词基本常识和实质意义的了解,更谈不上重视关键词标引,也缺乏规范关键词标引方面的训练[1]143。因而,在关键词标引时可谓是“一头雾水”——既不知其然,更不知其所以然。从笔者多年的编辑实践来看,除了在学术上造诣较深的学者外,大部分的论文作者均不重视关键词标引,投送的论文十有八九不合规范。遇到类似情况,编辑一般会“打回”稿件请作者重新拟定,但作者修改后往往依然难以达到要求,最后责任编辑不得不亲自“操刀”,帮作者重新标引关键词。基于对以上情况的多年积累和不断思考,笔者对论文关键词标引中常遇到的问题梳理如下:

(一)和主题不匹配,遗漏主题信息

大多数未经过严格学术训练的作者,习惯性地认为关键词就是论文题目的“缩影”和“肢解”,直接从题目中选取即可。对于部分学术论文来说,这种“省事”的方法可能不会错,但这样标引关键词,难免会造成和主题不够匹配、遗漏主题信息等问题。在编辑实践中,常会遇到部分题名不能涵盖文章主题的论文,这时文章的关键词如果出自题名,就会出现遗漏主题或对主题分析不充分的现象。

(二)喜用通用词汇,漏掉专指词汇

在实际标引中,许多作者喜欢用“研究”“探析”“探讨”“初探”“刍议”“比较”“对策”“原则”“路径”等通用性词语作为关键词,这样做是十分不妥的。通用词是适用范围较为广泛的词语,可以适用于不同的领域,可以解说各种不同的问题,其所指示的对象千差万别,根本不能归于一类。把通用词作为关键词,在数据库中检索时会把包含该词语的所有学科的文献全部“击中”并展现出来[6]104,形成“一锅烩”,很难找到所需要的目标信息。与此相反,另一种易犯的错误做法是:漏标专有名词。一些重要的关乎文献主题的专有名词应当作为关键词加以标引,但作者却忽视选取专有名词的情况也很常见[6]105。

(三)标引深度不够,难表文章内涵

关键词的数量隐含着一个标引深度的概念,关键词的标引数量和标引深度是指对一篇文献所给予的全部检索标志的数量之和,它标志着关键词对文献主题揭示的程度。一般地说,关键词以3~8个为宜,关键词越多,揭示文献主题就越深,越详细,可供检索的范围也就相对越小,这与概念的内涵越多,外延就越小是一个道理[6]105。过少,容易造成漏标或少标,所选择的主题词不能完全代表论文中心内容;过多,容易造成过度标引和重复标引,这两种情况都将影响关键词标引质量和科技文献利用率。适当的标引深度应该是在文献的查全率和查准率之间达到某种平衡[5]51-53。

(四)逻辑关系混乱,次序颠三倒四

论文各关键词之间并不是散乱无章的,而是按照词与词之间的逻辑联系来“各就各位”的。笔者在编辑实践中发现,多数作者对自己撰写的论文的关键词该采取怎样的逻辑顺序排列并不清楚。据统计,来稿作者中有按研究结果→研究目的→研究类别来排列的,也有按研究方法→研究结果→研究目来排列的,造成词序颠三倒四或层次不清,引起逻辑上的混乱,对理解文章的主题产生误导,给检索或计算机数据库管理带来不必要的麻烦[6]105。

(五)构词不精炼,内涵不明晰

顾名思义,关键词就应该是反映文章核心思想和主题的“核心词汇”,一般多用名词和名词词组,以表意凝练简洁又无歧义为最高境界。但在编辑实践中,常常看到的是不仅仅有名词和名词词组,还有动词、形容词等词也来“掺和”,更有甚者弄来主谓结构、动宾结构的词组,表意繁琐冗余,违背了关键词的遴选原则,也降低了检索的精准率。

三、科学准确标引关键词的方法

科学标引是精确检索的前提。没有科学的标引,也就不可能有精确的检索。要想使论文发表后获得更大的关注度和社会影响力,就应掌握各种行之有效的标引方法[8]94。

(一)仔细分析全文,精确提炼主题

反复阅读论文的题目、摘要、各级标题、结束语等,甚至通读全文,从中查找那些多次出现、反复提及、能反映主题的概念,并做以标识[9]72;斟酌和判别文章的研究对象或重点问题,使文章的主题内容清晰呈现。在进行关键词分析时需要注意以下三点:

(1)全面性。把符合检索要求的所有关键词都提炼出来,并作笔记,尽量不遗漏隐含的主题概念,以便最后从选出的词语中进一步筛选。

(2)专指性。每个关键词词义应该简洁明了,一词一意,没有多义和歧义,不拖泥带水,也不含混不清。提炼出来的关键词所表达的主题概念,其外延和内涵应与文中所论述的主题概念的处延和内涵一致。

(3)高检索性。以充分满足检索系统目标和用户的需求为目标,锁定文献中有检索价值的关键词,正确理解和判断文中的主要内容和核心要点,准确领会文章的创新点、研究方法和结果,经过分析、判断后凝练成主题概念[9]73,然后将其语义转换成具有高“中靶率”的关键词,使文献利用者能轻松搜索到论文并能准确判断出文章的核心价值。

(二)主题概念适当转换,严格规范排列顺序

主题概念转换的实质,就是将文献中提炼出来的主题要素(自由语言)转换为主题词表中的正式主题词,即将选出来的自由词做规范化处理,变成符合检索要求的关键词[10]。这样处理的好处在于,加大论文被检索到的“命中率”,提高论文的传播效率。

此外,出于规范化要求,论文各个关键词应该遵循一定的排列次序,以便于反映出词与词之间的逻辑联系,有利于清楚明晰地层层深入地反映文献主题。表达同一范畴概念的关键词要相对集中,意义紧密相连的关键词位置靠拢;反映论文研究目的、对象、范围、方法、过程等内容的关键词在前,揭示研究结果、意义等的关键词在后 。标引顺序一般为主题内容→研究类别→研究方法→研究目的→研究结果。

(三)用数据库进行核验比对,为精准选取关键词导航

随着期刊的数字化、网络化发展,关键词在论文中的作用和地位更加凸显。如果把一篇没有关键词的论文投放到数据库中,就犹如一艘失去了雷达的航船,只能在无边的数据海洋中飘荡,始终难以“靠岸”(被用户搜索到)。该论文的“命运”可想而知。

根据反证理论,作者或期刊编辑在标引关键词的时候,可以反其道而行之,借助数据库的强大搜索功能来印证所选关键词的科学性和准确性。比如,在中国知网、万方数据库等国内大型学术文献数据库中预先检索自己拟定的关键词。如果自己确定的关键词查不到类似文献,可临时拟定几个含义相近的关键词,逐一输入数据库进行比较查询,查阅到文献总数最大、包涵信息较为丰富的那个即为最佳关键词。如果坚持每次都这样查询,经过认真的关键词检索训练,可以提升自身的科研洞察力,及时掌握自身研究领域的最新动态和文献查询的新需求,以规范化、高质量的关键词标引来服务读者。

(四)把关键词纳入评价指标体系,激励责任人在标引上下功夫

一般而言,文章质量优劣的主要评判标准,是文章创新价值。但在网络化传播日渐兴盛的今天,对期刊编辑部和评价部门来说,在对论文内容进行考核评价的时候,应该纳入关键词这一评价指标。这对提高关键词的标引质量有很大的促进作用。在编辑实践中,应在编辑部的审稿单上把关键词增加为一项评价指标。有关期刊评价部门,要把关键词标引质量作为期刊编辑规范的一部分来考核,在各类期刊评比或期刊质量检查中,把关键词的标引质量列入评价指标,可以激励作者不断提高学术论文写作能力,也能激励期刊编辑像对论文标题和摘要那样来对待关键词的标引,从而全面提高论文质量和期刊的整体质量[12]。

四、结束语

实践证明,学术论文关键词的遴选、标引和其他研究工作一样,也有一定的特点和规律,只有遵循这一特点和规律,认真遵守学术规范,按照一定规则、顺序进行标引,才能反映和揭示文章的主题,真正实现关键词的检索功能[8]95。

关键词标引本身是一项比较复杂、难度较大的工作,需要一定的专业知识、标引方法和工作经验。只有认真、深入、细致地了解文献的中心思想、主题内容,熟悉所用词表,掌握标引的规则和方法,积极开发并利用数据库来核验所遴选的关键词,同时不断加强编辑的专业技能和业务素质培训,提升论文的整体编辑水平,才能进一步提高文献检索的效率,扩大传播范围。

[1]汪湘.学术论文关键词标引规范化问题探析[J].西安邮电学院学报,2008(6).

[2]《流体传动与控制》编辑部.“关键词”的标引[J].流体传动与控制,2008(6):19.

[3]唐宏伟.学术论文关键词标引的检索意义[J].青海大学学报:自然科学版,2008(1).

[4]中国科学技术期刊编辑学会.科学技术期刊教程 [M].2版.北京:人民军医出版社,2007:111.

[5]朱彩萍.学术论文中关键词的规范[J].图书与情报,2005(4).

[6]张建蓉,陈燕.学术论文中关键词标引的常见问题剖析[J].编辑学报,2003(2).

[7]马利.社科学术论文中关键词的标引[J].中央民族大学学报:哲学社会科学版,2007(4):135.

[8]朱兴红.科技期刊论文关键词标引中的常见错误及其规范要求[J].西北民族大学学报:自然科学版,2013,34(4).

[9]江舟群.学术论文关键词不“关键”现象论析[J].浙江工商大学学报,2005(4).

[10]向飒,郑素侠.科技论文关键词的正确标引[J].郑州工业大学学报:社会科学版,1999(1):77.

[11]吴平.学术论文关键词标引的问题剖析与质量控制[J].黔东南民族师范高等专科学校学报,2006(2):119-120.

[12]袁玉琳.学术论文关键词标引问题及对策[J].情报探索,2012(10):48.

猜你喜欢
标引学术论文检索
本期主要学术论文英文题目及摘要
学术论文征集启示
中医古籍医案知识元标引方法的思考及对策
学术论文征集启事
瑞典专利数据库的检索技巧
一种基于Python的音乐检索方法的研究
档案主题标引与分类标引的比较分析
浅议专利检索质量的提升
第9卷第1-6期学术论文总目次