闫蕾 周珑 赵义强
摘 要:随着专利申请数量的逐年增长,为了实现精准检索,快速准确的定位对比文件,以中国知网CNKI为检索平台,合理确定检索词,通过材料领域的两个具体发明专利案例中对比文件的检索,比较了一般高级检索和句子检索确定对比文件的准确性和效率,探讨句子检索在定位最优对比文件的快速性和精准性。研究发现,从检索词的设定方面比较,一般高级检索输入检索词时更加灵活,无需考虑检索词之间的关联度以及位置关系,而句子检索时则需要选择可能处于文献同句或同段中出现的两个关键词。一般高级检索虽然入口多样,检索词数目没有限制,但是某些情况下可能会经过各种组配均无法快速定位有效的对比文件。但是,合理扩展检索词,并判断可能位于文献中同句或同段的两个关键词,结合句子检索能够大大提高检索效率,减少噪音,有效提高对比文件的查全率,减少文献漏检的可能。
关键词:一般高级检索;句子检索;关键词
中图分类号:TP 391 文献标识码:A 文章编号:1672-7312(2020)05-0462-06
Discussion on the Application of CNKI Retrieval Mode
Combined with keyword Selection in Retrieval
YAN Lei,ZHOU Long,ZHAO Yi-qiang
(Patent Examination Cooperation Center of the Patent Office,SIPO,
Material Engineering Invention Examination Department,Beijing 100096,China)
Abstract:With the increasing number of patent applications
year by year,in order
to achieve accurate retrieval and locate the comparative documents quickly and accurately,the CNKI of China Knowledge Network is used as the retrieval platform to determine the retrieval terms reasonably.Through the retrieval of the comparative documents in two specific invention patent cases in the field of
materials,the accuracy and efficiency of determining the comparative documents by general advanced retrieval and sentence retrieval are compared,and the rapidity and accuracy of sentence retrieval in locating the optimal comparative documents are discussed.It is found that,compared with the setting of search terms,it is more flexible to input search terms in general advanced search,without considering the relevance and positional relationship between search terms,while it is necessary to select two keywords that may appear in the same sentence or paragraph of the literature in sentence search.Although the general advanced
search has various entrances and there is no limit on the number of search terms,in some cases,it may not be possible to quickly locate effective comparison files after various combinations.However,reasonably expanding the search terms and judging the two keywords that may be located in the same sentence or paragraph in the literature,combined with sentence retrieval,can greatly improve the retrieval efficiency,reduce the noise,effectively improve the recall rate of comparative documents,and reduce the possibility of missing documents.
Key words:advanced retrieval;sentence retrieval;keywords
0 引言
隨着科学技术的蓬勃发展,我国专利的申报数量逐年增长,专利检索技术显得尤为重要[1-2]。每一件发明专利申请在被授予专利权前都需要进行检索,以评价其获得授权的可能性[3-4]。在专利检索中,检索资源包括专利文献和非专利文献[5-6]。检索非专利文献的数据库主要包括CNKI系列数据库、万方数据资源系统、超星数字图书馆和化学文摘等[7]。其中CNKI是日常专利审查中常用的中文非专利数据库,其囊括了期刊杂志、博士论文、
硕士论文、会议论文、报纸、工具书、年鉴、专利、标准、国学、海外文献资源等。CNKI的检索方式包括一般检索和高级检索,高级检索又分为一般高级检索、专业检索、作者发文检索、句子检索、科研基金检索和文献来源检索[8-10]。其中一般高级检索和句子检索是最常用的两种检索方式。在实际的检索过程中,当选用一般高级检索时,要么检索结果众多,难以快速筛选出有效的对比文件;要么限定检索词太多,容易造成漏检,极大地影响了检索的准确性。而句子检索是根据查询主题从多个文档中查找相关的句子。句子检索则能够通过文献中检索词之间距离的远近快速定位有效的对比文件。在实际审查过程中,合理地使用
句子检索能够极大提升检索的准确性和检索效率。
鉴于以上原因,文中以中国知网(CNKI)为检索平台,通过确定检索词,比较了句子检索与一般高级检索两种检索方式对应的检索结果,分析其结果异同和精准性,重点探讨句子检索在定位最优对比文件的快速性和精准性,以期给我国相关领域的专利检索提供方法参考。
1句子检索和一般高级检索的检索结果比较分析
一般高级检索是CNKI在检索方面的优势,是最常用的检索方式。一般高级检索具有多个检索入口,如主题、篇名、关键词、摘要、全文、作者、作者单位等,可以根据实际需求进行多维度的檢索,检索界面如图1所示。
一般高级检索可以通过页面中的“+”和“-”来添加或者减少检索项,检索项之间可以进行“并且(and)”、“或者(or)”、“不包含(not)”的布尔关系的逻辑组配[11-12]。检索词可以为1个或多个,并且可以选择任意检索入口进行检索。然而,在一般高级检索过程中,有时会遇到这样的问题:检索词限定少了,检索结果太多,难以快速筛选出有效的对比文件;检索词限定多了,检索结果则太少,容易漏掉所需文献,因此,极大影响了检索有效性。
句子检索是指通过输入2个关键词,查找同时包含两个关键词的句子;另外,还可同时查找包含两个关键词的段落,检索界面如图2[13-14]所示。由图2可见,句子检索则只能输入两个检索词或四个检索词在全文中进行同句或同段检索。通过句子检索,能够通过文献中检索词之间距离的远近快速定位有效的对比文件。
通过二者检索界面比较发现,一般高级检索输入检索词时更加灵活,无需考虑检索词之间的关联度以及位置关系,而句子检索时则需要选择可能处于文献同句或同段中出现的词语,检索词需要两两配对输入,最多输入四个检索词。在实际审查过程中,通过合理的确定位于同句或同段的检索词结合句子检索能够大大提升检索的准确性和检索效率。
下面,笔者选取材料领域的2个案例,具体介绍一般高级检索和句子检索的特点以及关键词的选取。
2 案例1中2种不同检索结果比较
发明名称:“石墨烯薄膜的形成方法、MEMS麦克风及其形成方法”(申请号:201710681563.5),其发明人为李鑫,王伟,周鸣,申请日期为:2017年8月10日。其权利要求1关于一种石墨烯薄膜的形成方法论述如下:提供一衬底,并对所述衬底执行预处理以在所述衬底中引入气体离子和/或气体原子;在所述衬底上依次形成一过渡层和一石墨烯薄膜;在高于常温的预定温度下去除所述过渡层,在所述预定温度下,所述气体离子和/或气体原子在所述衬底的表面上产生气泡;以及,在去除所述过渡层的过程中,由所述气体离子和/或气体原子在所述衬底表面上所产生的气泡吸引所述石墨烯薄膜,以使石墨烯薄膜附着在所述衬底上。
通过对说明书的理解可知,本申请所要解决的技术问题是现有技术中在目标基底上形成石墨烯薄膜的工艺较为复杂,并且在利用目标基底承接石墨烯薄膜的过程中,极易发生石墨烯薄膜开裂或破损的问题。本申请的发明点在于:通过在衬底中引入气体离子和/或气体原子,所述气体离子和/或气体原子可在衬底的表面上形成气泡,该气泡能够吸引所述石墨烯薄膜,从而在去除衬底和石墨烯薄膜之间的过渡层后,可直接将脱离出的石墨烯薄膜吸附在衬底上,有效减小了石墨烯薄膜发生开裂或破损的风险。
依据常规检索流程[15-16],首先,需要确定检索所需的关键词。分析该发明专利,从权利要求1的主题名称中可以提取到关键词:“石墨烯”、“薄膜”,从权利要求1的特征部分还可以提取关键词:“过渡层”、“气泡”。下面通过两种不同的方式进行检索,分别给出检索结果。
2.1 以一般高级检索模式进行检索
首先,采用“石墨烯”和“薄膜”以主题为入口,采用“气泡”和“过渡层”以全文为入口进行如下检索,其检索界面设定如图3所示。
该检索结果44篇,并没有合适的对比文件。为了扩大筛选范围,同时侧重本申请的发明点,省略“过渡层”的使用,再次采用“石墨烯”和“薄膜”以主题为入口,采用“气泡”进行全文入口,进行检索,其检索界面如图4所示。由图4可见,第二次的检索结果939条,检索结果太多,无法有效筛选对比文件,并且该检索结果中出现的“气泡”大多并非是本发明专利申请中用于吸附石墨烯薄膜的“气泡”。
为了进一步缩小文献筛选范围提高检索精准度,对“气泡”重新以主题为入口进行检索,检索界面如图5所示。如图5所示,第三次检索结果34条,并未出现最接近的对比文件。考虑到“气泡”虽然为发明点,但是可能未必出现在主题中,因此可能会遗漏相关对比文件。
分析3次一般高级检索的结果发现,采用一般高级检索很难有效消除“气泡”的噪音,均无法准确定位本申请发明技术中涉及用于吸引石墨烯薄膜的“气泡”的相关文献。
2.2 以句子检索模式进行检索
经前述分析可知,本申请的发明点在于制备过程中气泡能够吸引石墨烯薄膜,从而有效减小石墨烯薄膜发生开裂或破损的风险。为了准确定位发明点,希望能够精准定位到“气泡”的作用就是在于“吸引”石墨烯薄膜的文献。这表明“气泡”与“吸引”两个词语应该出现在较近的位置。因此,采用句子检索模式进行检索,其检索设定如图6所示。
经过该句子检索可见,主要检索结果有4条,其中第一篇为“大面积石墨烯薄膜转移技术研究进展”,该文献是制备石墨烯薄膜的综述性文献,其记载了:新加坡 Loh课题组在 2014年报道了一种“面对面”直接湿法转移法,通过形成气泡使得石墨烯和基片之间产生粘附力而不至于脱落。可见,该“气泡”的作用于本申請完全相同。追踪该引用出处获得参考文献[45]GAO L,NI G X,LIU Y,et al. Face-to-face transfer of wafer-scale graphene films[J]. Nature,2014,505(7482):190-194.该参考文献与本申请发明构思相同,方法步骤也基本相同,可以作为本申请的X类对比文件。
2.3 基于案例1的2种检索结果对比分析
为了在相同检索条件下,进一步对比一般高级检索与句子检索的差异。设定与上述句子检索相同的四个关键词进行一般高级检索,其检索界面如图7和图8所示。通过这两个界面显示的检索结果可知:当采用“石墨烯”、“薄膜”、“气泡”和“吸引”均以主题为入口,检索结果为0(图7显示检索结果);当采用“石墨烯”、“薄膜”以主题为入口,“气泡”、“吸引”以全文为入口,检索结果多达500多篇(图8显示检索结果)。
通过与句子检索的结果比较发现,在相同的检索词设定下,采用一般高级检索模式无论是进行主题检索还是全文检索,都无法有效快速获得合适的对比文件。而相比一般高级检索而言,采用句子检索模式通过在全文中筛选“气泡”(名词)和“吸引”(动词)处于同句的文献,有效的定位了与本申请发明点相同的对比文件,极大的提高了检索的准确性和检索效率。
3 案例2中2种不同检索结果比较
发明名称:“一种表面复合结构抗冲击涂层压铸模具及其制备方法”(申请号:201711409118X),其发明人为杨冠军、宋忠孝、朱晓东、李雁淮、钱旦和孔文,申请日期为2017年12月22日。通过对权利要求的分析发现一种表面复合结构抗冲击涂层压铸模具其主要包括模具基体、表面过渡层和表面附着层。它的主要特征为:表面过渡层是基于氮原子在模具基体表面形成的氮化物层,表面过渡层的厚度为50~300 μm;表面附着层是基于材料沉积在模具基体表面形成的陶瓷附着层,表面附着层的厚度为表面过渡层的0.05~3倍。通过对说明书的理解可知,本申请所要解决的技术问题是现有的压铸模具在压铸生产中要经受频繁的冷热循环压铸模具表面易产生疲劳裂纹及涂层与基体的结合不理想的技术问题。
根据检索流程首先需要确定检索词。从权利要求描述的特征可知,该复合涂层包括表面过渡层和表面附着层,其中表面过渡层为氮化物层,表面附着层为陶瓷附着层。由于表面过渡层和表面附着层是申请人自己定义的名称,在本领域有多种表达方式,如中间层、粘合层、粘附层、表面层、外层等。采用“表面过渡层”和“表面附着层”两个词作为检索词显然不能有效的进行检索,然而上述两个层的材料是可以唯一确定的。因此,从权利要求1的主题名称中选取检索词“复合”、“涂层”,从涂层的结构中选用其各层的材质“氮化”、“陶瓷”作为检索词。下面通过两种不同的方式进行检索,分别给出检索结果。
3.1 以一般高级检索模式对案例2进行检索
首先,采用“复合”+“涂层” +“陶瓷”+“过渡层”以主题为入口,同时设定“氮化”或“渗氮”以全文为入口进行第一次一般高级检索,其检索界面如图9所示。第一次检索结果20篇,并未检索到相关对比文件。
为了扩大筛选范围,避免漏检,将“过渡层”和“陶瓷”重新以全文为入口进行检索,同时,从本申请说明书可知,其中表面过渡层的氮化物层通过渗氮工艺形成,因此,扩展“渗氮”一词作为“氮化”的等同检索词,采用“渗氮”或“氮化”以全文为入口进行检索。其检索界面如图10所示。由图10可见,第二次检索结果接近800篇,无法有效进行筛选。
一般高级检索的结果显示,该案例检索的特点在于关键词比较常见,技术方案本身并不能提供有效关键词,采用一般高级检索无法快速有效地定位到相关文献。
3.2 以句子检索模式对案例2进行检索
考虑到句子检索需要确定可能处于同句或同段的检索词,由于前述检索词较为常规,句子检索的话仍然会有大量的噪音,所以需要对检索词进行针对性的重新选择。由于检索词不仅可以从技术方案本身去选择,还可以从多角度出发,即从用途、功能、技术问题、技术效果等方面扩展关键词。本案解决的技术问题是涂层表面易产生疲劳裂纹以及涂层与基体的结合不理想的问题。本领域技术人员知道裂纹产生的原因在于陶瓷涂层与模具基体的热膨胀系数不匹配导致。根据该技术问题可以提取到关键词“结合”、“热膨胀”,而且这两个词如果出现在文献的同句或同段中则很有可能与本申请相关。由于句子检索,最多进行四个检索词进行同句或同段检索,因此从本申请技术方案本身提取涂层各层的材质“渗氮”和“陶瓷”进行同句检索,同时采用“结合”和“热膨胀”进行同段检索,具体检索界面如图11所示。由图11可见,检索结果31条,其中第8篇:“国内外热作模具钢的研究进展”(李勇等,特殊钢,第31卷第3期,2010年6月,第20~23页)公开了应用陶瓷涂层的最大问题在于陶瓷涂层在热膨胀性能上与模具钢基体不匹配,这会造成涂层的早期开裂失效。在陶瓷涂覆前进行等离子渗氮是提高陶瓷涂层与基体结合力的有效方法。此处引用了参考文献[30]High temperature wear resistance of(TiAl)N PVD coating on untreated and gas nitrided AISI H13 steel with different heat treatments。该参考文献与本申请发明构思相同,均是先渗氮然后制备陶瓷表层,因此能够作为本申请的X类对比文件。
3.3 基于案例2的一般高级检索和句子检索的结果对比分析
为了在相同检索条件下,进一步对比一般高级检索与句子检索的差异。再次设定与上述句子检索相同的4个关键词进行一般高级检索,其检索界面如图12~14所示。由图12可知,“渗氮”、“陶瓷”、“结合”、“热膨胀”均以主题进行检索,检索为0(图12检索结果)。“渗氮”、“陶瓷”以主题进行检索,“结合”、“热膨胀”以全文进行检索,检索结果为82,然而并未获得有效对比文件(图13检索结果)。“渗氮”、“陶瓷”、“结合”、“热膨胀”均以全文进行检索,检索结果则多达3 100多篇,无法进行有效筛选(图14检索结果)。
在相同的检索词设定条件下,通过比较一般高级检索和句子检索的结果发现,当检索词比较常规不能有效体现发明专利申请的特点时,即便采用一般高级检索进行复杂组配,仍无法准确定位相关文献。而在句子检索中,根据发明专利申请所解决的技术问题重新提取关键词,虽然选取的检索词仍然比较常规,但通过句子检索中对于检索词位置的限定,有效地定位了与本申请发明点相同的文献,极大的提高了检索的准确性和检索效率,避免了漏检。
4 结论
从检索词的设定方面比较,一般高级检索输入检索词时更加灵活,无需考虑检索词之间的关联度以及位置关系,而句子检索时则需要选择可能处于文献同句或同段中出现的2个关键词。一般高级检索虽然入口多样,检索词数目没有限制,但是某些情况下可能会经过各种组配均无法快速定位有效的对比文件。句子检索虽然在全文中进行检索,检索词只能为2个或4个,但是通过“同句”或“同段”限制检索词之间的位置,反而能够更加快速地定位对比文件。
通过从发明专利申请的发明点以及其解决的技术问题、用途、功能、技术效果等多个角度可以合理扩展检索词,并判断可能位于文献中同句或同段的两个关键词,结合句子檢索能够大大提高检索效率,减少噪音,有效提高了对比文件的查全率,减少了文献漏检的可能。
参考文献:
[1]陈海英,文禹衡.Innography、WIPS和Patentics专利引文分析比较研究[J].图书情报工作,2015,59(18):117-126.
[2]赵阳,文庭孝.专利技术信息挖掘研究进展[J].图书馆,2018(04):28-36+43.
[3]罗晓宁,郑乃章.科技查新中专利检索式的构建[J].科技情报开发与经济,2014,24(18):112-113,118+119.
[4]陈旭,彭智勇,刘斌.专利检索与分析研究综述[J].武汉大学学报(工学版),2014,47(03):420-425,432.
[5]唐凯旋,张旭光.浅析非专利文献检索及检索策略的调整[J].中国发明与专利,2019,16(02):167-171
[6]孙轶楠.基于专利引用的技术领域主题的知识流动时间研究[J].情报杂志,2015,34(07):95-99.
[7]刘伟成,数字信息资源检索[M].武汉:武汉大学出版社,2018(02):115-117.
[8]黎子辉,刘亚娟.常用中国专利数据库评析[J].图书馆研究,2020(01):43-49.
[9]刘斌,冯岭,王飞,等.支持技术创新的专利检索与分析[J].通讯学报,2016,37(03):79-89.
[10]王晓丽,景怀宇.科技查新中专利文献的检索与对比分析[J].现代情报,2015,35(07):89-92.
[11]罗立国,余翔,郑婉婷,金泳锋.专利检索网站比较研究[J].情报杂志2012,31(03):163-167.
[12]刘彤.基于“专利之星”专利检索系统的精细化检索策略[J].中国科技信息,2013(17):79-80.
[13]支丽平,张珊靓.基于专利本体的语义检索研究[J].图书馆学研究,2014(07):57-61.
[14]代霄燕.科技查新中的专利检索及专利情报分析[J].图书情报导刊,2018,3(04):42-46.
[15]杨薇炯.专利申请流程中的专利查新检索与专利情报分析[J].竞争情报,2013(03):6-10.
[16]李更,范文,赵今明.TRIZ创新流程与专利检索系统的结合探索[J].情报杂志,2013,32(02):79-81.
(责任编辑:严 焱)