邹振飞,刘洪麟,韩晓腾,沈秋君,杨睿智,牛 攀
1.四川省科学技术信息研究所,四川 成都 610016 2.四川省工程科技发展战略研究院(四川省高新技术产业研究院),四川 成都 610000
随着信息时代的到来,科技进展飞速,带来了知识信息的爆炸式增长。在这个背景下,科技查新作为获取科学与技术发展前沿信息、确保研究工作创新性和避免重复研究的重要手段,显得尤为关键。检索策略的制定是查新工作中的重要一环,查新检索策略的准确制定对查新结果的准确性、全面性起着非常重要的作用[1]。一个合适的检索策略能够大大提高查找效率,减少无效查找,并能更准确地锁定目标信息。其包括对检索词的精确选择、上位词与下位词的辨析、搜索逻辑的构建以及对不同类型数据库和搜索工具的熟悉运用。本文将着重探讨如何构建有效的检索策略,包括如何选择检索词提高搜索的全面性及准确性、如何运用布尔运算符精细化搜索条件以及如何优化检索式来精准定位所需信息。
检索策略的定义可以参考GB/T 32003—2015《科技查新技术规范》。在该标准中,检索策略被定义为一系列科学安排的步骤,包括分析检索需求、选择检索工具、确定检索词、明确各检索词之间的逻辑关系和查找步骤。狭义上,检索策略指的是检索式,即用户检索的逻辑表达式。通常,检索提问式由检索词和检索工具规定的各种逻辑算符、截词符、位置算符以及其他连接组配符号构成,形成计算机可识别并可执行的检索语句[2]。
根据检索策略的定义,检索策略的典型要素包括多个关键组成部分。首先,检索词是核心,需要选择与查新主题直接相关的术语或词汇。这涉及对同义词、上位词、下位词及相关词汇的深入分析和确定,以确保检索范围得以拓展,覆盖研究领域内的各个方面。其次,逻辑算符的运用是构建精确搜索逻辑不可或缺的一环。通过灵活使用布尔运算符(AND、OR、NOT),可以巧妙地组合关键词,形成精准而有针对性的检索表达式。合理使用括号对检索表达式进行分组,有助于确保逻辑运算的正确执行顺序,从而提高检索的准确性。在英文检索中,截词符的使用是一个有效的手段。截词符可用于截断词根或词干,以便在检索过程中匹配相关的词形变化。这有助于扩大检索范围,覆盖涉及词的不同形式,尤其适用于英文单词的复杂变化。最后,位置算符对于指定搜索词在文档中出现的相对位置关系方面起到关键作用。这些符号通常用于约束搜索词之间的相对位置,明确它们在文献中是靠近还是远离。通过精准地定义位置关系,可以更好地控制检索结果,使其更符合研究的具体需求。综合而言,这些检索策略要素相互协作,共同构建检索体系,为科技查新提供了有力的支持。
检索策略的制定是科技查新工作中的关键步骤,其具体步骤涵盖了多个方面。首先,根据查新项目技术主题的要求,需要准确选择检索词,并建立它们之间的合理逻辑关系,以构建准确的检索表达式。这涉及到对技术领域的深入了解,确保选用的关键词能够准确反映研究的主题。通常,检索式的设计是从严格到宽松,以确保覆盖各个层面的相关信息。在设计过程中,需要经过反复试检、字词拆分更替、组合、字段调整等多轮调整,以最终确定最合适、最具针对性的检索表达式。
在编制检索式时,有几个重要的要求需要满足。首先,检索表达式必须精准地反映查新项目的技术主题及相关查新点,以确保检索结果的相关性。其次,检索表达式应适应所查数据库的索引体系和检索用词规则,以确保在数据库中能够获取全面而准确的检索结果。检索策略的制定主要包含以下步骤。
确认检索词是进行查新工作的首要步骤,这一过程包括2个关键步骤:确定初选检索词和扩展检索词。在此过程中,可参考用户提供的检索词,通过项目名称、技术方案、查新点等途径初步选择检索词[3]。在初步检查之后,可以对检索词进行必要的扩展。在进行检索词扩展时,应充分利用专业术语标准、辞海、词典等工具书以及已检出的文献。同时,要考虑关键词扩展时是否存在同义词、近义词、上位词以及外来词翻译偏差等因素[4]。最终,要确认所选检索词符合查新项目的主体。
在科技查新领域,上位词和下位词构成了词语之间的层级关系,用以描述概念之间的包含关系。上位词涵盖了更为普遍的概念或类别,其中包含了其他更具体的概念或类别。举例来说,在科技领域,“电子产品”可被看作是“计算机”的上位词,因为计算机属于电子产品的一种。相反,下位词指的是更为具体的概念或类别,其被包含在另一个更为普遍的概念或类别之中。以“笔记本电脑”为例,它可被视为“计算机”的下位词,因为笔记本电脑是计算机这一更宽泛类别的一种表现形式。利用上位词和下位词进行查新时,可以灵活地扩展或收紧检索范围,使得查新结果更为全面或精准。这种层级关系的应用为科技查新提供了有效的语义框架,帮助研究人员更准确地定位和获取所需信息。
制定检索逻辑运算符时,需要根据研究问题和检索需求选择合适的运算符。首先,明确逻辑运算符的基本作用至关重要。“AND”运算符用于确保检索结果同时包含所有指定的关键词,有助于缩小检索范围并提高结果的相关性。“OR”运算符则用于扩大检索结果的范围,使其包含任何一个或多个指定的关键词,从而捕捉更多的潜在信息。而“NOT”运算符则用于排除某些关键词,以过滤掉与研究主题无关的文献。
考虑到研究问题的复杂性,通常需要灵活运用这些逻辑运算符。例如,可以通过组合使用“AND”和“OR”运算符来构建更为复杂的逻辑结构,以更准确地定位相关文献。这样的组合运算可以在一定程度上平衡查准率和查全率,确保既不漏掉重要文献,也不淹没在海量的无关文献中。此外,了解布尔运算的优先级也是至关重要的。使用括号确保逻辑运算的正确顺序。这有助于避免由于运算符优先级不当而导致的检索结果偏差。
例如,如果要查找关于太阳能和风能的可再生能源的相关文献,首先将关键词设定为“太阳能”“风能”“可再生能源”。接下来,需要确定关键词之间的逻辑关系,这就涉及到布尔运算。可以使用“AND”操作符来表示同时包含2个关键词的文献,如“太阳能AND可再生能源”;使用“OR”操作符来表示包含任意一个关键词的文献,如“太阳能OR风能”;使用“NOT”操作符来排除某个关键词,如“可再生能源NOT生物质能源”。通过这些逻辑关系的组合,可以构建出有效的检索式来准确获取相关的文献资源。
在科技查新检索式制定中,检索策略的迭代优化是关键环节。一开始,可能会根据已有的信息和经验制定初步的检索策略。然后,在实际检索过程中,需要不断检查和评估检索结果,以及时发现和纠正可能存在的问题。这一过程涉及对检索逻辑、检索词等进行反复优化和调整,以提高检索的准确性和全面性。
当需要优化检索逻辑以扩大或者缩小检索范围时,可以采取以下措施。
1)扩大检索范围:若需要扩大检索范围,可以考虑使用更宽泛的关键词或者增加同义词、相关词汇来扩大主题的覆盖范围。例如,如果最初的检索逻辑中只包含了“太阳能”和“风能”这2个关键词,为了扩大检索范围,可以加入类似“可再生能源”“清洁能源”“新能源”等词汇,以涵盖更多相关文献。
2)缩小检索范围:若需要缩小检索范围,可以尝试使用更具体、更精确的关键词或者添加限定词来缩小主题的范围。例如,如果最初的检索逻辑中使用了较为宽泛的关键词,如“太阳能”,为了缩小检索范围,可以加入限定词,如“太阳能发电”“太阳能取暖”等,以确保检索结果更加精确和相关。
另外,为提高检索结果的准确性和相关性,如果进行专利检索,可采用IPC(国际专利分类)专利分类号进行优化。根据查新主题,确定与该主题高度相关的IPC分类号。例如,若研究主题是人工智能在医学图像处理中的应用,可选择与人工智能、医学图像处理相关的IPC分类号,并将其整合到检索表达式中。例如,检索表达式可以是:“人工智能AND医学图像处理AND (IPC分类号1 OR IPC分类号2)”。
对文献进行检索时,中图法分类号是优化检索策略的有效工具,通过合理选用分类号,可更精准地定位相关领域。例如,若需查找有关“铁路路基承台桩施工工艺”的文献,可将检索式“TI=铁路 AND 路基 AND 承台桩”优化为“CLC=U2 AND TI=路基*承台桩”,其中“CLC=U2”表示将文献限定在铁路运输这个主题中。在优化检索逻辑时,还可通过调整布尔运算符号的组合方式,如增加或删除AND、OR、NOT操作符,来进一步控制检索结果的广泛性和精准性。
一位委托查新人欲申请一项专利,提供的查新点为“一种水轮发电机组零部件数据测量装置,能够非接触式采集、记录零部件数据。”根据此查新点制定相应的检索策略。
首先,从提供的查新点中提取关键词,包括水轮发电机、零部件、测量、非接触。为了更全面地涵盖相关领域,对这些关键词进行了同义词、上位词和下位词的扩展。例如,“水轮发电机”扩展的关键词有“水力发电机、水电机组”;“零部件”扩展的关键词有“零件、部件”;“测量”扩展的关键词有“采集、记录”;“非接触”扩展的关键词有“传感、光学、超声波”。
其次,由于委托人的查新目的是专利申请,所以选择incopat专利数据库进行检索。按照数据库的检索规则,制定了检索式:TIAB=(水轮发电机OR水力发电机OR水电机组) AND (零部件OR零件OR部件)AND(测量OR采集OR记录)AND(非接触OR传感OR光学OR超声波)。使用incopat专利数据库检索上述检索式,获得了20件专利的检索结果。考虑到结果较为有限,应对检索式进行进一步扩展,以获取更为全面的检索结果。观察到检索结果中关于水轮机零部件的描述相对较少,所以应对“零部件”关键词进行拓展。通过查阅资料和与委托人沟通,将“零部件”的关键词扩展为“零件、部件、定子、转子、叶片、叶轮、盘车、定位筋”。同时,将“非接触”的关键词拓展为“传感、光学、超声波、红外”。得到新的检索式为TIAB=(水轮发电机OR水力发电机OR水电机组) AND (零件 OR 部件 OR 定子 OR 转子 OR 叶片 OR 叶轮 OR 盘车 OR 定位筋) AND (测量 OR 采集 OR 记录) AND (非接触 OR 传感 OR 光学 OR 超声波 OR 红外)。
最后,通过在incopat数据库中输入新的检索式进行检索,获取了与水轮发电机组零部件数据测量装置相关的117件专利检索结果。通过人工筛查,确认了这些专利与查新主题具有较高的相关性。因此经过优化后的检索式可以作为科技查新的有效支持。
在科技查新的过程中,精心设计的检索策略是获取高质量信息的关键。通过本文的探讨,了解了如何根据查新目标和需求、确定关键词和扩展词、制定有效的检索逻辑和布尔运算以及实施检索策略的迭代优化等关键步骤。每一步骤都是构建成功检索的基石,相互依赖、共同作用以确保检索结果的准确性和全面性。
科技查新人员应该认识到,检索策略不是静态的,而是一个需要评估和调整的动态过程。在科技快速发展的今天,有效的检索策略不仅可以节省宝贵的时间,还可以显著提高研究和开发的质量。最终目标是通过精确的查新检索,支持创新的发展,并为科学技术的进步做出贡献。