■张 萍 王 燕 姚 蔚 杜 敏 李亦轩 王文莉 刘高洁 陈 洁
中国农业科学院蔬菜花卉研究所《园艺学报》编辑部,北京市海淀区中关村南大街12号 100081
关键词是从文章中选取的用于表达主题内容的词和词组,能帮助读者快速理解文章主旨,已被广泛用于数据库的文献标引和检索。合理规范的英文关键词能使文章更容易被阅读,提高科研成果的利用率,促进中英文期刊的标准化发展和国际影响力提升。
目前研究英文关键词标引的文献多以中文学术期刊为样本,分析内容集中在标引存在的问题及对策[1-3]、国际检索系统关键词收录原则[4-5]等,多参考中国标准和规范,鲜有提及国际关键词标引情况。对国际期刊英文关键词标引的研究很少,且存在研究视角有限等问题[6]。于双成等[7]发现100种英文医学期刊的关键词形式繁杂,作者不仅要研读“投稿须知”,还要浏览最新刊文的关键词形式;该研究仅以医学期刊为样本,且未涉及关键词选取步骤和排序规则等重要内容。赵常友等[8]分析了68篇英文文章的关键词,发现最常见的模式是使用小写单词、名词或名词短语,并使用分号分隔。
近年来,我国园艺类英文期刊国际影响力不断提升,但笔者在SCIE(Science Citation Index Expanded)收录期刊HorticulturalPlantJournal的编辑实践中发现,关键词标引存在选词泛化、主题标引深度不够、排序混乱等问题。由于未查到国际园艺类期刊关键词标引规范方面的权威资料,笔者经常困惑于如何替换或补充关键词。引导作者重视英文关键词的正确标引、提高作者的规范意识是编辑义不容辞的责任。因此,本研究以36种园艺类SCIE期刊为例,调研英文关键词的标引要求和基本现状,以期为英文期刊关键词正确标引提供参考。
SCIE期刊一般代表了本学科较高的办刊水平。本研究对象为2021年版《期刊引证报告》(JournalCitationReports,JCR)收录的36种园艺SCIE期刊[9]。查阅期刊官网的“投稿须知”(Guide for Authors),仔细浏览并用Excel归纳统计英文关键词的标引数量、排序规则、用词与标题重复情况、参考主题词表等要求。
为了核实刊文关键词的标引是否符合期刊要求,对于要求明确的样本期刊,从期刊官网和Web of Science(WoS)数据库随机抽查30篇文章(在2020年至2022年间出版,包含研究论文和综述),计算各刊关键词的标引合格率(关键词标引符合要求的文章数量占30篇被抽查的文章的比例)。
HorticultureResearch和JournaloftheAmericanPomologicalSociety不设关键词,其他34种(94.4%)期刊都设有关键词。对于关键词的具体数量,5种期刊未作要求(InternationalJournalofFruitScience、Vitis、RevistaBrasileiradeFruticultura、MitteilungenKlosterneuburg、JournaloftheProfessionalAssociationforCactusDevelopment),其余29种期刊规定的关键词数量差别较大(表1)。出版商相同的期刊对关键词的要求基本相同,并没有根据期刊情况作出有针对性的调整,如:要求4~6个关键词的9种期刊中,有7种期刊都与Springer Nature合作出版;美国园艺学会的三大刊物(HortScience、HortTechnology、JournaloftheAmericanSocietyforHorticulturalScience)对关键词的要求也相同(5~7个)。综合来看,绝大多数期刊要求作者提供3~8个关键词。
表1 园艺类SCIE期刊对关键词数量的要求
有的期刊对关键词具体数量作出要求,有的只给出范围。抽样调查发现,前者刊文的关键词标引合格率较低(40.0%~63.3%),说明对不同主题、类型和长度的文章限定相同数量关键词的做法较不合理,而限定关键词数量范围的做法较合理。
对关键词数量作出明确要求(0~10个)的31种期刊中,26种(83.9%)期刊刊文的关键词标引合格率达到60%(含)以上。标引合格率最低的TheoreticalandAppliedGenetics虽要求稿件标引关键词,但仅有6.7%的刊文列出关键词,其中的原因是编辑部已弃用关键词,但未及时更新“投稿须知”,还是关键词仅在稿件处理过程中发挥作用(如根据关键词自动匹配审稿专家),有待进一步研究。与上述期刊相反,JournaloftheAmericanPomologicalSociety提示无需作者提供关键词,但66.7%的刊文都标注了关键词。笔者追溯数据发现,此刊从2013年开始就有部分文章标注关键词,每期文章标引关键词的规范性较差。刊文关键词来源于作者还是编辑?是在哪个出版环节被补充的?这些问题都容易引起作者的困惑,表明该刊对关键词规范化的重视程度有待加强。
关键词和标题都展示文章的主题内容,用词可能存在重合现象。设有关键词的34种期刊中,20种(58.8%)未提及关键词能否与文章标题重合。浏览发现,很多刊文的大部分甚至全部关键词来源于标题,导致一些重要主题内容被漏标,关键词未充分发挥作用。
10种(29.4%)期刊规定关键词不可包括文章标题用词(表2),以免造成词汇浪费;除Fruits外,其余9种期刊刊文关键词的标引合格率都在60%以上,其中与标题重复的关键词多是揭示文章主题的关键性词汇,这种关键词可理解为对题目信息的补充说明。关键词与标题重复的原因可能是在常见的搜索引擎中,搜索结果会先按搜索内容与文章标题的相关度排序,关键词需要辅助展示标题未覆盖的内容。WoS等数据库最常用的检索选项是主题(Topic)检索,默认搜索范围包括标题、摘要、作者、关键词和附加关键词。当任意一个检索选项命中搜索主题词时,相关文章就会被检索到。与之相反,泰勒-弗朗西斯出版集团(Taylor&FrancisGroup)出版的4种期刊(Journal of Horticultural Science & Biotechnology、International Journal of Fruit Science、Biological Agriculture & Horticulture、New Zealand Journal of Crop and Horticultural Science)规定标题中要前置重要关键词:“文章题目前65个字符中要包含1~2个最重要的关键词。”由于搜索引擎通常只展示标题前半部分,放置关键词能使文章显示在搜索结果中,文章更容易被搜到。这与国际生态学知名期刊Journal of Ecology的规定(将2~3个最重要的关键词放在标题开头)相似。此类期刊刊文的关键词标引合格率在46.7%~76.7%,可见在实际出版中遵守此规则有一定难度。这两种截然不同的关键词标引规则,哪种的检索效果更好,有待进一步探讨。
表2 园艺类SCIE期刊关键词与题目重合的要求
关键词按照一定逻辑关系排序,有利于清晰反映文章主题。设有关键词的34种期刊中,只有10种(29.4%)说明了关键词排序规则(表3)。8种期刊要求关键词按字母顺序排列,这个规则使关键词无法显示文章研究主题与结构。该规则容易被理解和运用,但仍有2种采用该规则的期刊的关键词标引合格率在60.0%以下,推测与期刊对关键词标引重视程度不够有关。1种期刊(HorticulturaBrasileira)只要求首个关键词是物种学名,其关键词标引合格率高达93.3%。1种期刊(ActaScientiarumPolonorum-HortorumCultus)笼统规定关键词从一般到具体排列,没有详细解释此规则,这产生了解读多样化的问题,给作者带来困惑,其实际刊文的关键词标引合格率也只有50.0%。
表3 园艺类SCIE期刊对关键词排序的要求
由此看出,不同期刊对关键词排序的要求多样、简单且笼统,而同一要求下刊文关键词的标引合格率也参差不齐,导致期刊关键词排序的逻辑关系普遍混乱。
选用主题词表中的规范词汇作为关键词,有利于提高文献检索的准确性,防止误检、漏检。但是在设有关键词的34种期刊中,32种(94.1%)未提供可作为关键词选取参考的主题词表。
AmericanJournalofEnologyandViticulture和FoliaHorticulturae提供的主题词表存在词汇过时、数量少、专指性差等问题。AmericanJournalofEnologyandViticulture的词表于2016年更新,只有594个词汇,analysis、color等含义宽泛的词汇较多,易造成无效标引。同时,该刊要求从主题词表以外选取的自由词不超过2个,这显然难以满足快速发展的园艺类期刊的关键词标引需要。FoliaHorticulturae建议作者参考美国国立医学图书馆(National Library of Medicine)编制的《医学主题词表》(Medical Subject Headings,MeSH)。该表是生物医学领域的权威词表,但是由于学科的差异性,词表无法完全覆盖园艺类的主题词,对园艺类期刊的适用性不强。
园艺类SCIE期刊英文关键词的标引要求简单、笼统且多样,刊文的关键词标引合格率也呈现诸多差异。可见作为关键词的把关者和加工者,期刊编辑没有足够重视关键词的规范化标引。
除了掌握扎实的学科专业知识,编辑还需强化关键词标引的标准意识和规范意识。(1)期刊编辑部要与学科专家和数据库通力合作,借鉴国际先进的关键词标引理念,结合刊物实际,编制科学合理、表述详尽的标引规范。(2)应充分利用官网“投稿须知”、投稿系统操作提示及期刊微信公众号、期刊版面空白处等,多方位展示并实时更新关键词标引规范。(3)加大关键词的编校管控力度,确保编校原则与“投稿须知”要求一致,仔细审查文章关键词,并及时与作者沟通。(4)向作者宣传关键词正确标引的重要性,举办关键词标引规范和实证分析讲座,帮助作者提高标引水平。
目前园艺类期刊没有统一的英文关键词标引规范。用什么步骤选取关键词比较科学?选取哪些词汇才能最大限度地发挥关键词的检索作用?类似的很多问题值得业内思考与讨论。笔者基于本研究的调查资料,并结合相关文献,整理出以下心得,供编辑同行参考。
3.2.1 关键词标引步骤需合理
标引关键词要按照正确的步骤,尤其要重视主题分析[10]。《文献主题标引规则》提出:关键词标引,要先理解文章主题思想,进行主题分析,从题目、摘要、正文等提炼出能深入揭示文章主旨的词汇,再按照关键词标引规范进行修改。
4种园艺类SCIE期刊列出了其合作出版商泰勒-弗朗西斯出版集团的关键词标引步骤。首先通读文章,列出最能体现研究重点且频繁出现的关键性短语和术语。然后在数据库或搜索引擎中输入词汇检索,检查搜到的文献是否与文章主题相应。如果领域相差太远,则需要逐渐缩小关键词范围,删除含义过于宽泛、狭窄、模糊以及具有误导性的词汇,使它们越来越准确。最后根据拟投期刊的关键词数量要求确定最终关键词,并再次确认它们是目标读者检索使用的有效词汇。这种方法从文献检索率最大化的角度出发,有一定的科学性和可操作性,值得借鉴。
3.2.2 关键词用词宜有效简练
园艺类SCIE期刊要求的关键词数量多为3~8个,这也是中英文期刊最常见的关键词数量[11],与《科技报告编写规则》和《学术出版规范——关键词编写规则》的规定一致。关键词数量过少会降低文章被检索到的概率;过多会导致文章研究重点不突出,而且会导致读者检索出无关文章。作者可根据文章研究的深度和广度,在拟投期刊规定范围内灵活控制关键词数量。
在标引形式上,关键词普遍使用概念明确的名词或名词词组形式,禁用冠词、介词、代词、感叹词等无实质检索意义的词,不宜选取语义过宽或过窄的词汇[12-13]。泛化词缺乏对文章主题内容的专指性,对精确检索文章的作用不大,也无法引起小同行的兴趣,如:园艺类期刊报道本领域的一个重大发现时,关键词就不宜用“horticulture”“plant”等。同样,如果关键词含有过多专指性强的词汇,只有少数小同行会检索到此类文章,这就降低了文章显示度。
在准确反映文章主题的前提下,要减少关键词的修改成分,做到言简意赅。科技语言要求在保持信息量不变的情况下,尽可能减少语量投入,以达到语用效能最大化[14]。
3.2.3 关键词选取需慎重
关键词不能从文章中随意选取,需要小心斟酌,以包含比文题更丰富的内容[15]。多层次的关键词不仅能充分揭示文章的核心内容,还能准确展示学科热点,提高文献检索效果。美国园艺学会的3种SCIE期刊(HortScience、HortTechnology、JournaloftheAmericanSocietyforHorticulturalScience)对关键词的涵盖范围作出了要求:关键词应包括植物的学名和俗称、所用化学试剂的俗称、生理和病理术语等。James[16]建议,英文关键词应涵盖学科类别(Discipline)、研究方法(Method)、数据来源(Data Source)、研究地点(Location)和研究主题(Topic)等范畴,以使文章被更多人检索并引用。这与《科技报告编写规则》的要求相似:中英文关键词应反映科技报告的研究对象、学科范围、研究方法、研究结果等。
一些关键词有不同的写法,在文章标题和关键词中灵活使用其同义词与近义词,是很多园艺类期刊采取的策略,这也符合任胜利[17]的建议:“同义词、近义词不应并列为关键词,当它们在题目中出现概率差不多时,可在题名和关键词中各采用一个。”如:JournaloftheAmericanSocietyforHorticulturalScience的文章“Genetic Diversity and Population Structure Analysis of Chinese Wild Grape Using Simple Sequence Repeat Markers”[18],关键词是genetic structure and differentiation、genetic variability、molecular markers、SSR、Vitis,其中genetic variability和genetic diversity、Vitis和grape含义相近。类似做法还包括在题名和关键词中分别采用植物学名与俗称(如Solanumlycopersicum和Tomato)、专业术语的全拼与简写(如Carbon-to-nitrogen Ratio和C/N ratio)等,这有利于多方位展示文章关键信息,无论读者用哪个关键词检索,文章都有可能被发现。
3.2.4 关键词排序宜有逻辑
绝大多数园艺类SCIE期刊关键词排序规则空白,刊文关键词顺序混乱。现有的三类排序规则(按首字母顺序排序、从一般到具体排序、规定首词是物种学名)都很难提示文章的主题与层次。
各刊需对排序规则作出更合理、细化的规定,优化关键词标引质量。中国的园艺类SCIE期刊可参考《学术出版规范——关键词编写规则》和中国科协学会学术部的规定。《学术出版规范——关键词编写规则》规定:关键词应按照反映主题的重要性排序,表达核心主题因素的关键词排在前面,表达非核心主题因素的关键词排在后面。中国科协学会学术部《关于在学术论文中规范关键词选择的决定(试行)》中的要求则更详细:“关键词排序,应反映出主题范围、研究方法、具体内容和有利于检索和文献利用的其他关键词。第一个关键词为该文主要工作内容或内容所属学科名称;第二个关键词应列出该文研究得到的成果名称或文内若干个成果的总类别名称;第三个关键词应列出得到成果或结论时采用的科学研究方法的具体名称;第四个关键词应列出前三个关键词中没有出现的,但被该文作为主要研究对象的事或物质的名称,或者在题目中出现的作者认为重要的词。”
将专业术语用作关键词,应首选各学科权威主题词表中的规范名词,以提高文章的查准率。然而园艺类SCIE期刊可以参考的主题词表基本处于空白状态。现有的一部词表——AJEV & Catalyst Key Words Master List,由AmericanJournalofEnologyandViticulture编辑部自制,词汇覆盖面窄、专业性差;MeSH专注医学领域,不能完全涵盖园艺领域的主题概念,且较难上手。
相比之下,农业领域的主题词表收录词汇多,词表体系也较完善[19]。具有代表性的包括联合国粮食及农业组织的AGROVOC叙词表(AGROVOC Multilingual Thesaurus)[20],包含41个语种、4万多个农业概念;农业和生物科学国际中心的CAB叙词表(CAB Thesaurus)[21]涵盖310多万个术语;美国国家农业图书馆农业词表(National Agricultural Library Thesaurus, NALT)[22]2022年扩充到76933个主题概念。目前这3部词表都建立了定期更新、免费开放的网络服务系统,园艺类英文期刊可在结合自身特色进行借鉴使用的同时,加快研制完善的园艺领域的主题词表。
对于未及时被主题词表收录的新技术、新术语、新学科等词汇,可作为自由词用作关键词。但选取的词汇要被专业人士广泛使用、被文献检索机构接纳,且能反映文章主题的特殊性。此外,可有意识地从相关领域高被引或新发表文章的标题中选取关键词,以提高文章被检索到的概率。
英文关键词是国际数据库的重要检索信息,利用关键词检索更容易找到目标文献[23]。可观的是,94.1%的园艺类SCIE期刊设有关键词。
WoS数据库中标有作者关键词(Keywords)和附加关键词(Keywords Plus)。作者关键词是作者分析文章主题后精炼出的关键词,即本研究所指的关键词。附加关键词以参考文献标题中频繁出现的单词或短语为基础,通过自动算法进行标引[24]。对于不设关键词的园艺类期刊HorticultureResearch和JournaloftheAmericanPomologicalSociety,WoS数据库只提供附加关键词。附加关键词往往数量多,且不少词汇含义笼统,能提高文章查全率[24],但查准率较低[25]。目前有些WoS用户建议取消附加关键词,他们实践发现附加关键词不仅对文献检索作用不大,而且会导致检索出大量无关文章。由此可见,让作者投稿时标引关键词对提高文献检索效果很有帮助。关键词在稿件处理过程中也发挥重要作用,如ScholarOne稿件处理系统可统计特定时间来稿关键词的出现频率,在一定程度上预测学科发展趋势。编辑也可以根据关键词的出现频率,有针对性地策划出版专题。虽然一些国际名刊不设关键词,也有学者号召取消关键词,但关键词对于数据库准确标引和提高文章利用率的作用不容忽视。
本研究调查了园艺类SCIE期刊关键词标引要求和基本标引现状,初步发现关键词标引要求笼统、标引形式繁杂,提示编辑应提高英文关键词规范标引意识:英文关键词的标引数量要合理(3~8个),用词规范、简练、有层次;避免关键词与文章标题的用词大量重合,在标题和关键词中灵活使用同义词和近义词;关键词排序有逻辑,可清晰反映文章主题。本研究选取36种园艺类SCIE期刊作为调查样本,研究数据和结论仅供参考,后续研究将增加样本量。关键词标引还有很多问题需要探讨,例如:如何科学衡量关键词标引质量对文献检索和阅读的实际影响?每个编辑部设定当前关键词标引规范的出发点和动机是什么?相信随着关键词标引的不断规范和相关研究的层层深入,高质量的关键词标引会促进期刊发展和文献传播。