潘红英,徐波,黄河
(1.国家知识产权局专利局专利审查协作广东中心,广东 广州510555;2.四川大学轻工科学与工程学院,四川 成都610065;3.徐州千百度鞋业有限公司,江苏 徐州221200)
我国制鞋业经过多年的快速发展,已经成为我国现代化产业体系的一个重要组成部分,我国也成长为全球鞋类产业大国。为保证制鞋行业的高质量发展,我国制鞋企业投入大量成本进行技术研发,并且加大了对技术成果的专利保护。截至2022年底,我国制鞋创新主体已累计申请了超过9.5万件的发明和实用新型专利,而其中的发明专利授权率却低于40%①。不具有新颖性或者创造性是发明专利申请不能被授权的主要原因,因此,在发明专利申请前进行高质量的专利检索是非常必要的。在专利实质审查中,高质量的检索对于确定合理的权利要求保护范围、保持权利要求的稳定性至关重要;在涉及专利侵权的现有技术抗辩以及专利无效阶段,高质量的检索往往是成功进行现有技术抗辩以及进行专利无效的重要保障[1]。因此,如何优化检索策略、提高检索效率是专利检索中需要探讨的重要问题[2]。下面笔者将结合自己在制鞋领域的检索经验从数据库的选择、分类号扩展、关键词调整三个方面探讨如何对检索策略进行及时调整来提高检索效率,以期为制鞋领域相关从业人员的专利检索工作提供参考。
近些年随着人工智能和大数据技术的发展,智能化语义检索应运而生。目前,黑马专利数据库(Himmpat)、Patentics专利数据库、Incopat专利数据库、智慧芽专利数据库以及国家知识产权局的智能化检索系统均开发了智能语义检索功能,该功能是通过系统对用户输入的文本进行分析、分词、词频统计等相关处理,构建词向量空间,然后与目标文献库中的文献进行词向量模型比对,通过词向量余弦算法计算相似度,从而查找到最接近的文献[3],用户只要输入专利申请的案件号(申请号或公开号)或一段描述技术方案的文本就可以进行纯语义检索,并将检索结果基于语义相关度进行排序输出;另外,除了纯语义检索功能之外,以上几个专利数据库还提供先布尔检索后语义排序以及先语义检索后布尔筛选的检索方式,将语义检索和人工干预相结合,进一步提高了检索效能[4]。因此,针对制鞋领域的专利检索,可以优先选择具有智能语义检索功能的专利数据库来提高检索效能。
智能语义排序的基准主要包括“案件号”“文本”两种形式,在专利数据库中选用“案件号”作为智能语义排序基准时,智能检索程序会对案件的分类号、关键词词频进行统计并赋予权重,其中分类号的权重较大,而采用描述发明构思的“文本”作为语义排序基准时,关键词的权重会明显增加;因此,根据案件具体的技术方案特点可以采用不同形式的语义基准进行排序,下面以案例1(申请号:2017101855176,发明名称:“一种鞋子TPU内衬加工设备”)以及案例2(申请号:2020108914800,发明名称:“一种制鞋用鞋底涂胶装置”)来进行说明,上述两个案例均在国家知识产权局智能化检索系统的中文全文库(CNTXT)中进行检索。
笔者采用案例1的申请号作为语义排序基准进行纯语义检索,检索结果如图1所示,在第17位获得与本申请技术领域相同,且能评述所有权利要求创造性的对比文件CN 204363104U;但采用权利要求所记载的内容作为文本基准进行语义排序,在语义推送的前400篇文献中都未能命中该对比文件。
图1 案例1采用申请号作为语义排序基准的检索结果截图Fig.1 Screenshot of retrieved result for case 1 using application numbers as basis for semantic ranking
案例2是针对设置在鞋底涂胶机构中的可拆卸净化机构进行检索,具体技术方案为“净化机构设置在箱体内部,箱体内底部设置有多个定位弹簧,净化机构的底板设置有与定位弹簧配合的限位槽,箱体的顶部开设有开槽,箱体的两侧壁活动连接有锁紧销,锁紧销的一端贯穿箱体并固定连接有拉杆,净化机构的顶板的两侧壁均开设有锁孔,锁孔与锁紧销相配合,通过拉杆向两侧拉动锁紧销使其脱离锁孔后,利用定位弹簧将净化装置顶起而便于对其拆卸”。笔者采用检索式“簧S 顶S(拆or 更换)”进行布尔检索,得到92041篇文献,然后采用“解除锁定后,通过弹簧将净化装置向上顶出箱体,而便于对其拆卸维护”作为语义排序基准,对布尔检索结果进行语义排序,其检索结果如图2所示。在语义推送的第3位得到能评述案例2上述技术方案创造性的对比文件CN 21136406U;但采用申请号作为语义排序的基准,笔者浏览了语义推送的前200篇文献都未能命中对比文件。
图2 案例2采用文本作为语义排序基准的检索结果截图Fig.2 Screenshot of retrieved result for case 2 using text as basis for semantic ranking
从上述两个案例可知,在采用专利数据库中的智能语义排序功能时,为了提高命中目标对比文件的效率,在针对领域相关度高的技术方案检索时,应优先采用“案件号”作为语义排序的基准;而针对领域相关度低,且存在大量结构细节的通用结构检索时,则推荐采用具有相关结构细节以及附加技术效果的“文本”作为语义排序基础。
超星读秀数据库、中国知网(CNKI)、万方数据库等非专利数据库,以及豆丁、道客巴巴等涉及文档分享的网站中均有大量与制鞋工艺相关的文档,因此,专利检索人在针对制鞋工艺类技术方案检索时,除了在专利数据库进行检索外,还应重视在上述两类非专利平台的检索;例如笔者在针对公开号为CN 104172659A、以及公开号为CN 104257015A这两件制鞋工艺类发明专利检索时,分别在超星读秀数据库、豆丁网中通过关键词检索得到了能够评述上述两件专利申请创造性的对比文件,但在专利数据库中却并未命中任何对比文件。
对于注重论文发表的高校、科研院所类专利申请人,检索时应当优先以申请人、发明人作为检索入口在中国知网(CNKI)、万方数据库等中文数据库,以及ISI Web of Science等英文数据库中进行检索,避免遗漏申请人或者发明人早于申请日前发表的、与本申请技术构思相同的论文。
沐风网、开拔网等图纸网站,存在大量关于制鞋机械的三维结构图、爆炸图、三视图、细节图等,因此,在针对制鞋机械类专利申请进行检索时,需要关注在沐风网、开拔网等图纸网站进行相应结构的检索。在上述两个图纸网站采用关键词进行检索时,开拔网主要针对输入的关键词进行“与”运算,因此,应当采用表述术语单一的关键部件作为关键词进行检索,而沐风网则会自动拆分关键词且进行自动搭配,则可以增加关键词的个数来提高检索效率。
分类号检索是十分常用且重要的检索手段,准确的分类号能够将检索范围快速锁定在相关度高的现有技术范围内,有助于提高检索效率。每一件专利文献都被标引了若干个体现其技术要点的分类号,分类号主要包括国际专利分类体系的IPC分类号、美国专利分类体系的UC分类号、欧洲专利分类体系的ECLA分类号、日本专利分类体系FI、FT分类号以及联合专利分类体系的CPC分类号,其中IPC分类号以及CPC分类号属于检索中使用频率最高的两类分类号。制鞋相关的IPC分类号大类为A43(鞋类),而该大类下包括A43B(鞋类的特征;鞋类的部件)、A43C(鞋类的紧固物或附件;一般的鞋带)以及A43D(制鞋或修鞋的机械、工具、设备或方法)三个小类,因此,针对鞋类部件相关的技术方案,应注重在分类号A43B下进行检索,而涉及鞋带的技术方案则应注重在分类号A43C下进行检索,而涉及制鞋机械的技术方案则应注重在分类号A43D下进行检索。
鉴于CPC分类体系是欧洲专利局和美国专利商标局协调各自分类系统而进行有效融合的产物,相较于IPC分类体系更为细致、精准[5],因此,采用合适精准的CPC分类号来进行检索,往往能够更加高效的命中对比文件,例如笔者在国家知识产权局智能化检索系统中的外文虚拟库(VEN)中对公开号为CN 107549931A、发明内容主要涉及靴撑结构的案例3进行检索时,检索过程如图3所示,直接利用公开文本给出的IPC分类号A43D3/14进行检索,需要浏览的文献达2 676篇,而采用更加细分的CPC分类号A43D3/1416(靴楦)进行检索,待浏览的文献仅为302篇,且很快命中对比文件US507845A。
图3 案例3的检索过程截图Fig.3 Screenshot of the retrieval process for case 3
如果公开文本中给出的分类号并不能完全表述本申请发明构思的核心技术手段,检索人员则需要结合技术方案重新扩展获取合适的分类号。首先可以利用检索系统中的辅助工具进行查询,例如黑马专利数据库的高级检索模块中设置有“IPC工具”,输入关键词即可进行对应分类号查询;其次,可以根据自身对于技术领域的知识储备,扩展IPC分类号的范围,例如针对一种具有工件夹持机构的鞋料切割机构进行专利检索时,除了采用公开文本给出的IPC分类号为A43D8/02(鞋部件的切割)进行检索之外,笔者会进一步拓展到通用的裁切设备B26D小类中,采用与发明点密切相关的分类号B26D7/02(带有工件夹紧装置的裁切设备)进行检索;再次,可以针对与本申请类似的现有技术文献的分类信息进行追踪来获取准确的分类号,也可参考语义检索后推荐的相关度较高的文献的分类号;最后,可以综合利用数据统计的方式在专利数据库中高效准确的获取专利申请的相应分类号信息,以满足检索的需要,例如黑马专利数据库中的分类号统计功能。
关键词的选取在检索中至关重要,关系到检索的查全率和查准率。关键词在形式上可以采用截词符进行扩展、在词义上可以通过别称、俗称、缩略语、同义词、近义词、上下位概念方面进行扩展,还可以进行中英文同步扩展,例如在针对“鞋底”这一关键词进行检索时,构建了如下检索式:“鞋底or 外底or 大底or 中底or+sole?”。在关键词的选词角度方面,需要从与检索要素相关的结构、效果、性质、用途、作用或解决的技术问题的各个角度上对关键词进行扩展。在利用关键词检索时,除了使用“与”及“或”等布尔逻辑算符之外,还可以选择位置算符(例如表示两关键词必须出现在同一子字段中S算符)对关键词进行组配来降低检索噪声,例如在针对制鞋机械中的横向滑动结构进行检索时,构建了如下检索式:“(横向or 左右or 往复or“X”)S(滑or移or 运动)”。
在针对制鞋领域的专利申请进行检索时,选择具有智能语义检索功能的专利数据库能够提高检索效能;在检索最接近的现有技术时,优先选择以“案件号”作为智能语义排序基准,而在检索具有多个结构细节的通用结构时,则优先选择以“文本”作为语义排序基准,能够提高检索效率。根据技术方案以及申请人特点选取合适的数据库进行检索,能够提高检索效率;而在采用专利数据库的过程中,根据技术方案的发明构思,获取合适的分类号以及关键词,能够提高检索效率和检索命中率。
注释:
①上述数据由笔者采用黑马专利数据库、利用国际分类体系(IPC)中涉及鞋类的分类号A43对我国制鞋领域的专利申请进行统计获得。