乔彦
(解放军总参谋部警卫局卫生保健处,北京 100017)
药学信息检索策略的探讨
乔彦
(解放军总参谋部警卫局卫生保健处,北京 100017)
通过对药学信息检索步骤的分析,探讨如何根据检索课题选择数据库、确定关键词、制定检索式,以及调整检索策略的方法和技巧,以期为医药学专业人员高效、便捷地检索和获取所需的药学信息提供借鉴与参考。
药学信息;检索策略;医学主题词表
随着互联网技术的发展,目前大量医、药学期刊及数据库都发布了网络版本。利用互联网对数据库进行检索,能够很方便地获取最新的医药学文献信息。但随着药学研究的快速发展,药学文献浩如烟海,如何搜集到自己所需要的信息是摆在每一位药学工作者面前的一道新课题。因此,只有在进行文献检索时制定出合理、恰当的检索策略,才能高效、完整、便捷地获取所需的信息。
检索策略是指在分析课题内容具有哪些概念单元的基础上,确定检索系统、检索文档、检索途径和检索式,并科学安排各检索词之间的位置关系和逻辑关系以及查找步骤等[1]。制定检索策略通常包括以下步骤。
检索过程的首要环节,就是明确课题的需求。针对具体课题,逐项列出课题的主要内容和技术要点,为制定检索策略打好基础。
根据检索课题的实际需要选择合适的数据库。常用的医药学数据库见表1、2。
表1 常用药学全文数据库
表2 常用药学文摘数据库
其中,Ovid全文期刊库已收录了超过1 000种期刊,涉及药学、临床医学、护理学、生命科学等多个学科领域。不仅收录期刊的全文,还有期刊的书评、综述、编者述评、读者来信、分类广告、会议文摘等内容。其中超过350种属于核心刊种,被美国科学信息研究所(ISI)收入的有300多种刊[2]。Medline提供70多个国家5 000多种生物医学期刊的题录与文摘的免费检索服务,还提供部分免费和付费的全文链接服务,是世界上最权威的医学数据库之一。其收录的学科范围包括临床医学、护理学、神经病学、内科学、药理学等。
需要检索某种药物用于治疗或预防某种疾病的情况,可选择综合性的全文或文摘型数据库(如CNKI、Ovid或Medline);需要检索某种药物进行临床试验的具体情况,可选择Clinical Trails数据库。
在文献检索中,采用一个或多个检索词可准确找到与项目密切相关的文献。而如何获取恰当表达检索概念的检索词是常见的难题,如果选择检索词不准确,检索结果就会含有大量不相关的文献,对我们找到想要的文献带来麻烦。这时可以参考Medline的医学主题词表(Medical Subject Headings,简称MeSH),MeSH是美国国立医学图书馆编制的规范化的可扩充的动态权威性主题词表,MeSH词表在检索过程中对保证检索结果的查准有很大作用。Medline数据库中的文献都会按照MeSH词表进行标引。通常一篇文章可有多个MeSH词,但根据文章的内容有主次之分,主要主题词讨论文献重点内容,次要主题词仅描述一般涉及的问题。
例如想检索有关肺癌诊断和治疗方面的文献,在MeSH数据库中检索“Lung Cancer”,检索结果返回9个主题词,根据每个主题词下的注释确定“Lung Neoplasma”是需要的检索词。
每个MeSH主题词下面还有副主题词。副主题词又称为限定词,与主题词进行组配,可以对主题词的概念进行限定,使主题词具有更高的专指性。进行检索时,主题词与副主题词之间进行组配时,必须有逻辑关系,分析两者之间的关系(如因果关系、应用关系等)是正确组配的关键。例如在“Lung Neoplasma”的副主题词中选择“diagnosis”和“therapy”作为检索词,就可以编制检索式,检索有关肺癌诊断和治疗方面的文献。
Medline数据库中的文献都进行了MeSH词标引,进行检索时还可以选择是否只检索把某个主题词作为主要主题词的文献,或者不扩展检索某个主题词下位的副主题词。将检索词限制为主要主题词,检出的文献数量较少,但内容更相关。其他数据库的文献虽然没有进行MeSH词标引,但可以通过MeSH词作为确定检索词的参考。
但有时根据项目要求可能无法确定具体的检索词。例如“曲匹地尔在心血管方面的临床应用”项目,“心血管”方面的疾病包括心脏病、心肌梗死、窦性心动过缓等很多疾病名称,不仅表述方式可能不同,也无法穷举所有“心血管”方面的疾病。这种情况下,就只能将药物名称作为检索词,扩大检索范围,再一一筛选文献,才能避免漏检。
在构建检索式时,要确定检索词之间的概念关系或位置关系,准确表达课题需求的内容,灵活使用各种算符,将检索词进行恰当的组配。实际检索中常常需要多个检索词组合应用来表达要求[1,3]。
布尔逻辑关系词用以表达检索词之间逻辑关系,包括AND、OR、NOT。
①AND表示逻辑“与”,使用AND连接检索词,得到的文献中包含所有检索词。可以用空格来代替。
②OR表示逻辑“或”,使用OR连接的检索词只要其中任何一个出现在文献中就满足检索条件。可以用竖线“|”来代替。
③NOT表示逻辑“非”,用以寻找包含NOT前的检索词但排除NOT后关键词的文献。可以用横线“—”来代替。
使用逻辑“非”时要特别慎重,需要对检索结果有基本的了解。不恰当地使用逻辑“非”会排除掉很多有用的文献。例如,“阿柏西普的临床前药理研究”,不能排除“临床试验”(clinical trial)这个检索词,因为有的文献可能会提到以后进行的临床试验。
④绝大多数网络检索工具都具备布尔检索功能,但是在功能的实现和应用上有所差异。有的检索工具完全省略了布尔逻辑词,直接把布尔关系隐含在菜单之中(图1)。需要根据不同检索工具的功能确定检索式。
图1 CNKI的高级检索功能界面
⑤括号可以使括在其中的运算符优先执行,用于改变复杂检索式中固有逻辑运算符优先级的次序。例如,“贝伐单抗用于治疗糖尿病性黄斑水肿的临床研究”这个项目,对中文数据库进行预检索时发现有的文献使用中文通用名“贝伐单抗”,而有的文献使用英文通用名“Bevacizumab”或商品名“Avastin”,“贝伐单抗”、“Bevacizumab”、“Avastin”三个词为并列关系,应该用“OR”连接,这三个词语又与“糖尿病性黄斑水肿”之间具有交叉或限定关系,为了缩小检索范围,提高查准率,则应使用“AND”将它们连结起来。
因此根据检索词编制的检索式为“(贝伐单抗OR Bevacizumab OR Avastin)AND糖尿病 AND黄斑水肿”。这个检索式要求先执行括号中的OR运算,再执行括号外的AND运算。
将一个短语或语句用双引号(“”)括起来作为一个完整字符串,进行严格匹配,以提高搜索的精度和准确度。它体现了临近位置运算的功能,即它不仅包含检索式中各个具体的检索词,而且规定了检索词之间的临近位置关系。
使用双引号可以排除不相关的文献,使检索结果更加精确。但是如果不对预检索的情况进行详细分析就使用双引号,有可能造成漏检。例如对“糖尿病性黄斑水肿”这种疾病,如果使用双引号,检索“macular edema”,就会漏检使用“oedema”表述“水肿”的文献。
截词是指在检索词的合适位置进行截断,然后使用截词符进行处理。截词检索的特点是可预防漏检。截词符多采用“?”或者“*”。一般来说,一个“?”只代表一个字符,一个“*”代表多个字符。有的检索工具支持任意位置的通配符检索。但是有的数据库有其本身特定的通配符,需要阅读其帮助文档得到准确的符号。
截词检索的类型有:
①右截词,允许检索词尾部有若干变化形式。
②中间截词,允许检索词中间有若干变化形式,如“pharma*ist”能将 pharmaceutist和pharmacist两种不同的拼写方式都检索出来。
③左截词,允许检索词前端有若干变化形式。
截词检索的作用包括:
①能将一个词的不同拼写形式都检索出来,如“贝伐*单抗”能将含有贝伐单抗和贝伐珠单抗的结果检索出来。
②能将具有同一词根的词都检索出来,如“pharma*”,可以将 pharmaceutical、pharmacological、pharmacopoeia 等检索出来。
用于限定提问检索词在数据库记录中出现的区域,控制检索结果的相关性,提高检索效果的方法,多以字段限定方式实现。一般是选用“高级检索”功能,从下拉字段中选择所需限制的字段,输入检索词。例如,Scirus数据库的字段限制检索符有au-Author(作者检索)、ti-Title(题目检索)、ke-Keywords(关键词检索)等。
一般而言,在实际检索工作中根据需要可选择“题目”、“摘要”或“全文”字段进行检索。
①正确使用布尔逻辑关系词AND、OR、NOT。
②对于不同表达方式,尽可能使用截词。
③正确使用位置算符。
④正确而合理地使用各种限定检索方法。
⑤注意逻辑算符与位置算符的先后处理次序,注意括号的使用。
⑥各个数据库中高级检索的选项各不相同,应该根据制定的检索式和数据库检索功能的具体情况,选择最佳的检索方法和范围。
各个互联网数据库中信息的无限、动态发展的特点,决定了在文献检索过程中必须不断转换检索策略,以期达到最佳的检索效果。即使通过预检索的情况确定了检索策略,但是也可能在正式检索中遇到一些问题。调整检索策略的技巧主要包括扩大检索范围、缩小检索范围及找出检索式中检索词与算符表达的错误[4]。
①选择的检索词不恰当,应当进行核对、调整。可以根据MeSH多选择几个同义词,并用OR方式与原检索词连接后加入到检索式中。还可以删除某个不重要的副主题词,或者减少AND算符的限制。
②检索词之间的关系限制太严格。例如检索中可能对两个检索词使用了精确匹配搜索,例如“糖尿病视网膜病变”,可以将“糖尿病”和“视网膜病变”这两个检索词使用AND算符连接,这样两者之间的限制更宽,得到的结果更多。
③对课题的隐含概念理解不充分。应当减少检索词并对检索情况进行分析,尽量选择上位词。
①选择的检索词概念范围过大。可以增加限定词以缩小概念或者使用专指度更高的检索词,还可以使用NOT算符排除不相关的概念,从而减少检索结果。
②检索词之间的关系限制太宽松。可以将原来使用的逻辑算符改为限制更严格的位置算符,使检索结果更精确;可以限制文献的年代范围,例如最近5年或10年,以查找到最新的文献;还可以限制在某一个或几个字段如“题目”、“关键词”字段,而不选择“全文”字段来进行检索,使检索结果减少。
③截词检索使用不恰当。对于词根太短的单词不适合使用截词检索,否则可能会出现很多不相关的结果。应该通过预检索确定大部分文献使用的词语或单词的拼写方式。
在Medline等文摘型数据库中只能查阅文献的摘要,但摘要中也包括了文献的一些重要信息,例如试验的方法、结果、结论等。可以通过摘要的内容判断文献是否符合课题的需求,再根据课题的要求、摘要的内容判断是否需要下载全文。
CNKI、Ovid等全文数据库可以直接下载需要的文献全文。Medline数据库中也给出了部分文献的全文链接,可以通过全文链接获取全文。如果文摘型数据库中无法直接获取全文,可以通过摘要中的作者、发表刊物、发表时间、页码等出版信息从图书馆或其他途径获取全文。
[1]聂少平,朱培元,张政宝,等.医学信息搜集的途径与方法.北京:人民卫生出版社,2008.
[2]郝节梅.Ovid医学信息平台在医学科研中的应用[J].中国医学教育技术,2004,18(2),67-69.
[3]李双燕.医学文献检索应注意的一些问题[J].中国卫生事业管理,2007(2),141-142.
[4]高文泊.计算机检索策略的制定及调整[J].图书馆学刊,2002(6),44-45.
Discussion on Retrieval Strategy of Pharmaceutical Information
Qiao Yan (Health Care Division of Guard Bureau of the Headquarters of the General Staff of the P.L.A.,Beijing 100017,China)
Based on the analysis of the retrieval steps for pharmaceutical information,the ways to select database and keywords,to establish retrieval type and to adjust methods and skills for retrieval strategies were discussed in this article,so as to provide some reference formedical and pharmaceutical professionals to retrieve and access pharmaceutical informationmore efficiently and easily.
Pharmaceutical Information;Retrieval Strategy;Medical Subject Headings(MeSH)
乔彦,女,主管药师。研究方向:临床药学。E-mail:qiaoyan0508@sina.com
2011-04-15)