刘佩佩,陆丁天,苏 伟,遇炳昕,于得水,来 燃
(1.中国民航大学学报编辑部;2.中国民航大学计算机学院;3.中国民航大学空中交通管理学院;4.中国民航大学民航技术研究院;5.中国民航大学信息网络中心,天津 300300)
2019 年,我国国际专利申请量跃居世界第一[1],知识产权进入高质量发展阶段,高价值专利成为热点。以“质量优先、转化导向、政策引导”为基本原则的创新驱动发展战略和知识产权强国战略[2],对专利质量评估工作提出了前所未有的高要求。设计一种能够从海量专利中迅速识别出高质量、高价值专利的批量评估体系,有利于全面推进专利资助和管理改革,提高技术转移和成果转化效益。
国内外关于专利质量评估体系的研究由来已久,OECD 等国际组织、Innography 等专利数据库陆续提出了专利强度(Patent Strength)、专利记分牌(Patent Scorecard)、IPScore、IPQ 报 告、Ocean Tomo 300th等专利质量评估体系;国内方面,专利价值度(PVD)、合享价值度(IncoPat)、P2I(Patent to Intelligence)主要从专利转化角度进行价值评估。
各种体系的外在区别主要包括指标体系(indices)的建立、指标权重(weights)的确定和专利数据库(database)的选择。追根溯源,其本质区别在于如何理解专利“质量”,从而产生了3 个流派:(1)价值创造法(value creation approach)[3],从企业视角[4]将“质量(quality)”等同于专利能够产生的经济“价值(value)”;(2)文献信息法(bibliographic approach)[3],从学术理论视角[4],基于专利文献的著录信息评价专利的“三性”,辅之以内容分析法(content-based approach),从摘要、权利要求等内容提取技术主题、分析技术趋势;(3)综合评估法,系统评估专利的技术质量(发明点高度、技术思路等)、保护质量(技术覆盖范围、权利要求数量等),辅之以应用价值和社会经济效益[5]。
价值创造法从市场价值角度评估专利质量,采用少量指标,结合经济数据评价专利价值,且主要针对市场前景好、转化利润高的热点技术领域(纳米技术、生物医药、半导体、移动通信、人工智能等)。Beaudry 等[6]利用纳米科技数据库(Nanobank)的企业合作数据证实了专利权力要求项数与企业利润空间的正相关性。Caviggioli 等[7]利用Ocean Tomo的专利拍卖数据,从技术复杂度、市场价值和专利策略三方面建立评估模型并验证了指标间的相关性;该体系适用于各领域,数据获取方法透明、客观,但程序复杂,不适用于大批量专利质量分析。谢智敏等[8]利用专利实际交易价格验证了Innography、IncoPat、PatSnap 的专利价值评估有效性,结果表明PatSnap 的专利价值预估结果更加可靠;分析区别,PatSnap 的指标体系更加注重专利申请人的研发投入、发明人数量、专利市场覆盖程度和市场吸引力等指标。
文献信息法方面,吕晓蓉[9]选取了6 项专利技术质量指标,利用DWPI 数据验证了评价结果,该方法可操作性强、定量分析和评价客观,应在此基础上提高系统自动化程度。
综合评估法是目前研究的主流。肖国华等[10]比较了3 种指标体系的构成、流程、分析角度、适用范围、优势和不足,提出应从法律价值、技术价值、经济价值和学术价值4 个方面,建立专利价值分析指标库。伊惠芳等[11]引入时间序列来反映技术领域变化,实现了指标权重的动态赋值。
权重设置方面,专利质量评估愈加注重评估体系的严谨性和科学性,运用主成分分析法PCA、BPN、层次分析法AHP、文本挖掘(text mining)、SOM-KPCA-SVM model、“三阶段—两维度”模型、两阶段概率模型(two-stage probit model)、多元胜算对数模型(multinomial logit model)等[12],从统计学角度验证指标和权重的信度和效度。但以上统计都是基于少量样本、自建评估模型的内部检验,未引入外部评价,所得结果缺乏说服力。
董海珍[13]对我国专利价值评估能力进行了分析,提出现有专利价值评估方法通用性较弱、评估体系有待完善,应制定统一的评估标准、提高专利价值评估机构的公信力和权威性。综合来看,现有专利质量评估体系存在以下问题:(1)多数体系利用若干企业、少量样本的统计结果来设置权重,指标赋值依赖于小范围样本的比值,所得结果缺乏说服力;(2)指标设置覆盖面较窄,部分指标依赖专家人工打分,不利于批量分析;(3)针对单件专利的评估方法稀缺。此外,具体到操作层面,仍需考虑数据的可获取性、指标及权重的透明度、评估结果的可解释性、操作的便利性(人工/机器)、评估速度、评估费用等问题。另一方面,现有研究大多关注热点技术领域的专利质量,对于新兴产业的研究较少,评估标准缺乏一致性和普适性,不利于新技术和新市场的培育。
基于以上考量,从科研成果管理的角度,以全面分析竞争对手、筛选技术合作伙伴、选拔种子团队和科研人员为目标,将宏观分析与重点专利分析相结合,研究设计了创新主体专利竞争力评估系统(Patent Competitiveness Assessment System,PCAS),实现了专利的快速批量分析、多维度对比和可视化结果生成。
结合现有专利质量评价办法的优点,考虑科技创新高质量发展的实际需求,利用Python、Java 等程序语言的算法优势,对专利竞争力评估系统提出以下4 项功能要求:单件专利质量评价、多件专利批量评价、创新主体专利竞争力分析、对比结果可视化。创新主体专利竞争力分析包括数量分析、单件专利分值统计、专利技术领域分析。分析结束后,利用ECharts 技术将结果以图表方式显示出来。系统功能模块如图1 所示。
图1 专利竞争力评估系统功能设计
借鉴现有评估体系,从4 个维度构建专利竞争力评估指标体系:技术竞争力、法律竞争力、市场竞争力和社会效益。指标设置采用加权评价型,各二级指标依照重要程度由专家给出不同的权重,结合主成分分析法,计算最终权重。以“专利类别”指标为例,下设3 个选项:发明专利、实用新型、外观专利,权重分别为:0.69、0.23、0.08。由系统根据指标代码字段和选项字段为其匹配相应权重,自动计分。指标体系如表1 所示。
表1 专利竞争力评价指标体系及代码
随机选取其中6 个指标进行相关性检验,结果如表2 所示。
表2 指标相关性系数
可以看出,除引证数量外,专利法律效力与其他指标均在99%的置信区间内显著正相关;其他指标大部分均显著相关,表明该指标体系及权重设置有效。
系统采用B/S 架构,服务器端以Java 为开发语言、开发框架为Spring MVC。Spring MVC 作为经典的框架,拥有良好的可扩展性,可配合大多数Java企业框架进行开发[14]。后台数据库采用MySQL,前 端 技 术 采 用HTML、CSS、JQuery、Bootstrap、Ajax&Json。
选定航空制造业样本单位共28 家(包括企业、高校、科研院所),从国家知识产权局、Innography等国内外商用专利数据库下载并进行交互验证、去重等数据清洗,获取各单位专利数据共21 883 件,利用MySQL 的InnoDB 存储引擎进行数据存储,建立航空制造业专利数据库,利用该数据库构建实验环境,为系统设计提供基础数据。数据库包括4 个数据表:用户数据表、专利信息数据表、专利评分数据表、创新主体专利总得分数据表。
首先,读取专利信息,判断专利信息是否完整。然后,对信息完整的专利进行评分赋值,继而将赋值完整的专利存入数据库。最后,从数据库中读取分析数据,配置图表参数,生成可视化图表。系统工作流程如图2 所示。
图2 系统工作流程
将自建数据库专利数据和外部数据相结合,采用背对背方式,对系统性能进行验证。结果表明,对于千件级专利数据,系统响应时间为秒级,流程顺畅。实例检验证实了该系统对高质量、高价值专利的有效识别。
下载历年航空金奖专利,命名为“单位1”;从数据库随机选取3 家国内大型航空制造企业,编号“单位2”~“单位4”。共计1 479 件专利,总耗时97s,评估结果如表3 所示。
表3 专利竞争力评估结果(测试1)
可以看出,历年航空金奖专利的平均分、最高分均高于其他创新主体,验证了专利竞争力评估系统在高质量专利识别方面的有效性。为了更加直观、全面地对比各单位专利在具体指标上的表现,系统提供了可视化分析功能,以部分指标为例,结果如图3(a)~3(d)所示。
图3 评估结果可视化对比(测试1)
分析图3 可知,金奖专利在有效性(包括法律效力和维持期)、同族数量指标上具有显著优势,体现出了良好的专利布局意识,值得各创新主体借鉴。
科技成果高水平创造和高效率转化是加快“双一流”建设的重要指标,孵化企业是提升高校服务经济社会发展能力的重要载体[15]。以某航空高校孵化企业为例,进行高转化价值识别测试。园区企业专利竞争力评估前5 名得分如表4 所示。
表4 专利竞争力评估结果(测试2)
评估结果可视化对比如图4 所示,可以看出,平均分最高的企业,其专利维持期和引证数量也遥遥领先。进一步,将该企业单件专利得分进行排序,得分最高的前4 件信息如表5 所示。
图4 评估结果可视化对比(测试2)
表5 孵化企业高分专利详情
资料显示,该企业也是所在高校成果转化最为活跃的孵化企业。以这4 件专利为核心技术的转化成果“全自助行李托运系统”于2019 年中标大兴机场建设,34 台设备已投建完成。测试2 表明,该专利质量评估系统可有效识别高转化价值专利。
目前,该专利质量分析系统已获得软件著作权(证书号:软著登字第5194530 号),并向区域航空创新主体开放使用,试用反馈及外部数据自检结果表明,系统具有鲜明的优势,适用于各类创新主体,但仍有很大的完善空间。
(1)客观全面。系统指标客观、全面,数据易获取,避免主观评价带来的偏差。
(2)可靠快速。运算速度快,可分析批量专利和单件专利,性能可靠。
(3)结果可视化。系统自动生成可视化对比图,直观体现创新主体在具体指标上的差异。
(4)多层次评价。可进行企业内部、企业之间、同一技术领域、不同技术领域之间的多样比较,有利于综合评价。
(5)多角度分析。可迅速生成逐项指标差异和全局差异的可视化对比,有利于创新主体对行业参与者的竞争力进行全局把握和具体分析。
根据实证检验结果,在广泛参考同类研究的基础上,针对高价值专利的申请书撰写特点和布局特点,提出以下改进方向,以进一步完善所建系统,真正为高质量发展提供参考。
(1)细化指标体系。国民经济分类应当细化为四位数代码并分别赋值,区分前引和后引,将专利维持期改为专利有效期。
(2)动态指标赋值。技术先进性是随着时间变化的,应根据技术进步和创新主体的自我技术迭代,加入所在领域技术生命周期分析,动态更新指标权重。
(3)专利申请前评估。积累后验数据,反推优质专利特点,分析申请书和申请后的引证和交易情况,总结优质专利的技术要点和申请书写作思路,探索专利申请前评估办法,根据申请书初稿评价其“可专利性”,有利于科学推进高等学校专利质量的提升[2],指导专利申请和转化。
(4)完善配套技术。包括数据库更新、数据模板规范、缺失信息处理等技术。
完善以上功能后,该系统可推广至不同技术领域,其前提是建立相应专利数据库,对系统指标权重进行深度学习训练,并结合技术进展,动态调整指标体系。