宋 凯,冉从敬
知识经济时代下,具备技术、经济、法律属性的专利在区域产业和企业发展中发挥着重要作用,发展知识产权是赢得新一轮生产力布局调整主动权的重要路径。高校集聚大批具有重要应用价值的专利资源,能够为国家科技发展和企业技术创新提供重要支持。因此,企业通过与高校开展专利许可或专利转让,将极大提升技术创造效率。近年我国高校院所产学研合作助力创新驱动发展的能力持续提升,2018年3,200家高校院所签订技术转让(包括转让、许可、作价入股)、技术开发、技术咨询、技术服务合同总金额达930.8亿元[1]。与此同时,高校专利产业化率3.7%、许可率2.9%、转让率3.2%[2],说明仍有大量专利成果束之高阁,专利应用比例偏低,导致大量科技浪费与闲置。科技成果评价体系缺位、缺少科技成果评价标准是当前高校专利技术转移面临的关键问题之一。2020年11月习近平总书记在中央政治局第25次集体学习会议中指出要健全知识产权评估体系,研究制定防止知识产权滥用相关制度[3]。探索高校专利价值评估方法,一方面能够帮助企业快速锁定高校高价值度专利,另一方面也帮助高校提升专利价值评估效率。专利评估的本质是对专利隐含的技术、法律、经济价值进行评估[4],国内外学者也从多个角度对专利价值评估方法展开了研究。
首先,从定量分析视角出发,通过构建评估指标体系进行专利价值评估。国外学者如Grimaldi等从专利的内在属性和外在属性两个方面,对专利价值指标进行了系统整合[5]。Martinez-Ruiz等提出了一个结构方程模型,将决定专利价值的技术范围、保护范围、技术可用性等专利指标进行了系统关联[6]。Chai等以LED领域为例,从网络特征的角度探索了影响专利价值的指标因素[7]。国内学者如刘勤等从专利特征、发明人特征以及权利人特征3个维度,形成了专利价值评估模型[8]。胡小君等引入专利结构指标,形成了基于专利结构化数据的专利价值评估指标体系[9]。李小童等选取已被市场检验的代表性高价值专利,提取并归纳其主要特征,形成了高价值专利的判定方法[10]。
其次,从机器学习视角出发,借助机器智能实现自动化的专利价值评估。国外学者如Woo等从技术性、权利性和可用性3个角度出发对专利价值进行了划分,并进一步采用贝叶斯结构方程模型对专利价值进行了评估[11]。Choi等提出了一种评估单个专利商业潜力的方法,通过应用机器学习算法预测专利存活到保护期限截止的概率[12]。Chung等提出了一个基于深度学习的专利等级评估模型,并对半导体领域的专利进行了价值识别[13]。国内学者如韩盟等基于贝叶斯理论和组合赋权法,提出了高校可转移专利识别方法[14]。资智洪等提出了用于专利价值的二元分类评估方法[15]。王思培等构建了基于随机森林算法的潜在高价值专利预测模型[16]。
此外,也存在多种实践方法对专利交易价格进行预估。一是为市场法,在评估过程中寻找市场上相近专利的成交价格,通过对比确定待评估专利的价格。但此方法对知识产权交易市场的完善程度要求较高,需要较为全面的知识产权交易数据。二是收益法,涵盖贴现现金流量法(DCF)、内部收益率法(IRR)、CAPM模型和EVA估价法等,通过对专利的预期收益进行预测来估计专利价格,更加注重专利的实施效果。第三种为成本法,即根据专利的投入成本估计专利市场价格,但投入成本与专利自身价值存在弱对应性,研发专利的成本有时并不能真实反映专利市场价值,尤其是技术尚处于早期研发阶段,其结果具有强烈的不确定因素,如疫苗研制、药物研发。
已有研究主要从定量分析视角和机器学习视角,通过专利价值评估指标体系构建或应用机器学习算法进行专利价值评估,但存在评估效率低,缺乏人工干预等不足。此外,已有实践中应用的专利价格评估方法,操作复杂度较高,对参考数据依赖性较强,实用性较差。因此,本文结合已有研究,构建了一个高校专利价值评估模型,该模型具有两大核心功能:其一是价值识别,采用人工评价与机器学习相结合的混合方法,识别高校专利的许可/转让价值和失效风险;其二是价格预估,通过构建高校专利市场价格预估方法,对存在许可/转让价值的专利进行市场价格预估。此模型能够较为全面地展现高校专利价值,提升高校专利向企业的技术转移效率,推动校企之间的协同创新发展。
(1)熵权TOPSIS模型。对高校中未发生许可/转让的专利进行价值评估,识别出具有许可/转让价值和存在失效风险的专利,选用熵权TOPSIS模型进行计算。Hw ang等人在1981年提出TOPSIS法,又将其称为逼近理想解的排序方法[17]。TOPSIS法是通过计算各个指标的正、负理想解,建立评估指标与正、负理想解相对距离的二维数据空间,在此基础上确定最优方案[18]。但TOPSIS法不能反映变量之间的相关重要程度,因此,通常将熵权法与TOPSIS法结合,形成熵权TOPSIS模型,在客观确定指标相对权重的基础上,实现对多属性问题的排序选择,保证结果的科学性和合理性[19]。
(2)梯度提升树算法。在人工评估的基础上,本文采用机器学习中的梯度提升树算法对高校专利的许可/转让价值进行识别。提升Boosting法是一种应用广泛且有效的集成学习方法,它基于PAC框架下强可学习和弱可学习的关系,根据分类误差率改变数据集的权值分布来学习多个基分类器,通过基分类器的线性组合构建最终分类器。提升树是以决策树为基函数的提升方法,为解决提升树在一般损失函数上的性能问题,Freidman进一步提出了梯度提升树,保证了梯度提升树算法具备强大的处理混合类型数据和模拟复杂功能的能力[20]。本文在使用梯度提升树算法进行高校专利价值评估时,需要进行超参数优化以获取最优模型,参数组合中涉及的重要参数有:①学习率learning_rate,表示每个弱学习器的学习率,防止模型过拟合,取值在0→1之间;②子采样比例subsample,取值在0→1之间,取值小于1有利于减少方差,防止过拟合;③最大深度max_depth,控制每棵树对数据集处理的专门化程度,具体取值需要根据数据的分布情况;④最大迭代次数n_estimators,表示弱学习器的最大迭代次数,取值太小或太大都容易过拟合[21]。在模型评估方面,采用AUC值衡量模型预测性能,AUC值越大,表示模型性能越好[22]。
(3)曲线拟合方法。识别出高校中具有许可/转让价值的专利后,需要进一步对专利的市场价格进行预估,在此过程中需要确定专利综合价值度与专利诉讼判赔额度之间的关系,此处采用曲线拟合的方法实现。在科学实验过程中,通过实验或观测得到一组数据对(xi,yi),往往希望用一条连续曲线近似地刻画离散点组所表示的坐标之间的函数关系,常用的拟合函数有指数函数、对数函数、幂函数等。此外,衡量拟合优度的标准有很多,通常采用的是决定系数R2,它表征了方程对观测值的拟合程度,R2的值越接近1,说明拟合曲线对观测值的拟合程度越好[23]。
高校专利价值评估模型具体分析流程见图1。
图1 高校专利价值评估模型
评估指标选取是高校专利价值识别的基础。本文在参考前人研究成果的基础上[24-27],结合佰腾专利价值评估体系,从3个维度出发,选取了13个指标,见表1。分析表1发现,技术维度涵盖专利页数、IPC分类数、发明人数量、引证次数、家族引证次数、被引证次数、家族被引证次数、合享价值度8个指标,其中专利页数反映专利撰写质量,IPC分类数反映专利覆盖的技术领域,发明人数量反映研究团队规模,引证次数和家族引证次数反映技术基础扎实程度,而被引证次数、家族被引证次数、合享价值度反映技术影响力。经济维度涵盖申请人数量、简单同族个数、扩展同族个数3个指标,申请人数量反映技术合作程度,简单同族个数和扩展同族个数反映了申请人对专利技术的市场前景、产品竞争、战略布局的重视程度。法律维度涵盖权利要求数量、首权字数2个指标,均反映对技术的保护范围。需要说明的是,在已有评价方法中,法律维度会将专利审查时间融入,通过网络调研以及与业内专家进行交流,专利审查时间受多种因素影响,与专利法律价值度相关性较弱,因此本文并没有将其纳入评估指标体系。综上分析,这13个评估指标能够较为全面反映专利特征,将在后续应用于对高校专利许可/转让价值进行评估以及对市场价格进行预估。
表1 专利评估指标汇总表
依据选取的评估指标展开检索形成专利数据集合,首先对专利数据集合进行划分,其中对比集包含高校中已发生许可/转让的专利和权利已失效的专利,评估集包含高校权利有效但未发生许可/转让的专利;然后,参考熵权TOPSIS模型的计算流程[28],计算每件专利的相对接近度Di;在此基础上,计算对比集中已发生许可/转让专利和权利已失效专利的平均相对接近度Di_avg_transfer和Di_avg_invalid;最后,对评估集重复上述过程,将相对接近度大于Di_avg_transfer的作为具备许可/转让价值的专利,将相对接近度小于Di_avg_invalid的作为存在失效风险的专利。
在人工评估基础上,应用机器学习中的梯度提升树算法对高校专利的许可/转让价值进行识别。首先将高校中已许可/转让专利和权利已失效专利进行融合,通过比例分割,形成训练集和验证集;然后,采用训练集对梯度提升树算法进行训练,通过调整关键参数,以准确率作为判别模型性能优劣的标准;进而采用验证集对模型性能进行检验,结合AUC值对模型预测性能进行评估;最后,将高校未发生许可/转让的专利形成预测集,并采用评估模型对其进行价值识别。
通过上述两种方法,分别以人工评估和机器学习评估获得高校未发生许可/转让专利中存在许可/转让价值和失效风险的专利集合。对二者进行取交集操作,最终得到基于混合方法的高校专利许可/转让价值评估结果。此方法既充分发挥机器学习的优势,又通过人工评估对结果进行了进一步筛选,保证了评估结果的科学合理性。
通过基于混合方法的专利价值识别过程,能够获得存在许可/转让价值的高校专利,需要进一步对高校专利的市场价格进行预估,为校企之间的技术交易提供决策参考。具体过程如下:
(1)对基于混合方法识别的存在许可/转让价值的专利进行汇总,形成高校存在许可/转让价值专利数据集。
(2)依据流程一的专利指标维度划分,对专利数据集进行拆分,分别从技术维度、经济维度、法律维度计算技术价值度、经济价值度和法律价值度。计算公式如下:
Vi为第i个维度的专利价值计算,i=1→3,涵盖技术价值度、经济价值度和法律价值度;m表示该维度中指标的数量;xk为第k个指标的log函数标准化后数值,为了避免指标数值为0的情况,在具体计算过程中,对指标数据作加1处理;wk表示xk对应的权重,此处指标的权重继续沿用流程二中通过熵权法计算得到的评估指标权重。
(3)计算专利综合价值度。在专利价值评估过程中,三个维度的单项价值被视为同等重要,因此每个单项维度价值就不另外赋予权重,专利综合价值度计算公式如下:
V1表示专利技术价值度,V2表示专利经济价值度,V3表示专利法律价值度。
(4)检索技术领域内发生诉讼且权利有效的专利,寻找出诉讼内容里明确划定判赔额度且额度较大的专利数据,将判赔额度作为对应专利市场价格的映射。采取该策略的原因:当企业提起专利诉讼时,其索赔的金额是综合专利所涵盖的技术价值、经济价值和法律价值,而法院的最终判决也是在综合上述因素的基础上作出的裁决结果,所以将专利诉讼的判赔金额作为专利的市场价格具备一定的科学性和合理性[29]。因此,对相关数据重复(2)(3)的步骤,计算专利综合价值度,并基于专利综合价值度和判赔额度进行曲线拟合,根据R2值判断拟合效果,形成拟合计算公式。
(5)依据拟合计算公式,对存在许可/转让价值的专利进行市场价格预估,为企业和高校之间的技术交易提供决策参考。
本文数据来源于incoPat专利数据库,选择特定高校对评估模型进行验证,为其他高校提供案例参考。评估高校选择“青岛大学”,检索范围为“中国发明授权专利”,申请人设置为“青岛大学”,时间不限,检索到权利有效的专利1,809件,其中权利有效且发生许可/转让的专利151件,权利失效的专利582件,权利有效但未发生许可/转让的专利1,076件。检索时间为2021年5月12日。
按照熵权TOPSIS模型计算过程,首先构建包含733件专利的对比集;然后计算13个指标的权重,结果为:w={0.016,0.035,0.020,0.083,0.038,0.556,0.126,0.012,0.005,0.002,0.003,0.046,0.059};进一步,通过对比集获得每件专利的相对接近度,并进一步获得许可/转让专利和权利已失效专利的平均相对接近度分别为0.077、0.072。在此基础上,对包含1,076件专利的评估集进行计算,统计专利相对接近度大于0.077的专利有58件,相对接近度小于0.072的专利有1,001件。
按照梯度提升树算法的实验过程,首先依托Python的Scikit-learn库,按照标准比例构建模型训练集和验证集,通过划分得到训练集包含专利数据586条,验证集包含专利数据147条,当专利发生许可/转让,则标签设置为1,权利失效专利的标签设置为0。然后采用训练集对梯度提升树模型进行训练,通过参数调优,当n_estimators=500,max_depth=7,learning_rate=0.1,subsample=0.7时,模型的识别准确度约为0.979。在此基础上,应用验证集对模型进行检验,通过绘制ROC曲线,获得AUC值约为0.998,与已有研究相比[30-31],基于梯度提升树的识别模型预测效果更优。最后应用基于梯度提升树的高校专利许可/转让价值识别模型,对预测集中的1,076件专利进行价值识别,得到291件专利具备许可/转让价值,785件专利存在失效风险。
综合上述的实验过程,对青岛大学未发生许可/转让的专利进行评估。将两种方法计算得到的具备许可/转让价值的专利集合和存在失效风险的专利集合取交集,分别获得专利16件和729件。统计两个专利集合中的评估指标数据平均值,结果见表2。分析表2发现,具备许可/转让价值专利的指标平均值均高于存在失效风险的专利,这为企业判断高校专利是否具备许可/转让价值提供了参考依据,更为重要的是,给高校和科研团队在进行技术研发和专利申请时提供了参考。在研究团队层面,新技术的研发要建立在广泛深入的科技查新基础上,并组建专业的技术团队,以有效支撑技术的开发应用;在高校知识产权信息服务中心层面,为科研团队撰写专利申请书时要做到全面扎实,保证技术的创新性和保护性;在高校科技成果管理部门层面,要形成科学完备的专利运营规划,围绕高价值度专利,及时做好专利布局工作,并采取多元化方式推广专利,实现专利的技术价值转化为产业应用。
表2 具备许可/转让价值和存在失效风险专利的指标统计表
通过专利许可/转让价值的识别过程,得到青岛大学存在许可/转让价值的专利16件,分析16件专利的IPC主分类发现,存在3件专利的IPC主分类皆为D01(见表3),因此重点对这3件专利进行市场价格预估。在incoPat数据库中,限定IPC分类号为D01,对权利有效且发生诉讼事件的专利进行筛选,查询阅读每件专利的诉讼书,对其中明确划定判赔额度的专利数据进行统计,共检索到6件专利。依据专利综合价值度的计算流程,对6件专利的技术价值度、经济价值度、法律价值度及综合价值度进行计算,见表4。根据表4的计算结果,选择专利综合价值度和判赔额度进行曲线拟合,见图2。其中X轴为专利综合价值度,Y轴为专利判赔额度,剔除专利5和6后,其余4件专利的曲线拟合符合指数函数分布,公式为y=27204.70e52.70x,其中R2=0.89,表明曲线拟合效果较好,适用于高校存在许可/转让价值专利的价格预估。
表3 高校存在许可/转让价值专利统计表(部分)
表4 发生诉讼专利的价值度及判赔金额
图2 专利综合价值度与诉讼判赔额度拟合曲线
为验证价格预估拟合公式的有效性和可用性,查询高校已发生许可/转让专利的价格。由于选择预估价格的专利,属于纺纱和纺丝技术领域,因此,重点查询“武汉纺织大学”的专利转让/许可公示,获得IPC属于D部的许可/转让专利6件,使用价格预估拟合公式对6件专利进行计算,并与实际金额进行比对,计算结果见表5。分析表5发现,“Method and apparatus for pneumatic guiding and capturing strand fibers on ring frame”“一种尘笼摩擦包缠式高光洁增强纱线的后加工方法”“一种梯度包缠纱线毛羽的装置”“一种定向伸展式精确测试纱线毛羽的装置”4件专利为打包转让,实际转让金额为120万元,依据专利市场价格预估流程,计算得到4件专利的综合价值度分别为0.066、0.050、0.048、0.039,通过拟合公式预估市场价格共计155.67万元。“一种液膜纺纱方法”实际转让价格为10万元,专利综合价值度为0.052,预估市场价格为36.917万元。“一种双向拉伸的聚乳酸纤维多孔膜的制备方法”实际转让价格为50万元,专利综合价值度为0.056,预估市场价格为44.138万元。采用RMSE(均方根误差)衡量预估市场价格同实际交易价格之间的偏差,通过计算可得RMSE=26.021,即预估市场价格与实际交易价格的偏差约为26万。考虑到高校专利估价的多重因素影响及复杂度,预估的市场价格是接近于实际许可/转让金额,验证了本文所提方法具有实用性,能够快速高效的预估专利参考价格,为企业和高校进行专利交易提供决策支持。因此,在验证价格预估拟合公式可用性的基础上,首先根据专利综合价值度的计算公式,对青岛大学识别出的3件D01领域的专利进行价值度计算,进而采用拟合公式进行市场价格预估,见表6。通过以上过程,实现了对特定高校专利的价值识别和价格预估,对本文提出的高校专利价值评估模型进行了验证。
表5 价格预估拟合公式计算验证表
表6 高校专利市场价格预估
本文按照“研究背景→方法概述→模型构建→实验评估”研究思路,对高校专利价值评估模型进行研究,解决了高校和企业开展专利交易过程中存在的“评估什么价值”问题。当前我国高校和企业的专利交易呈增长趋势,但缺少科学高效的科技成果评估方法,导致高校专利转让率偏低局面没有得到改善。因此,本文从价值识别和价格预估两个视角出发,构建高校专利价值评估模型,首先从技术、经济、法律3个维度选取了13个指标;然后结合熵权TOPSIS模型的人工方式和梯度提升树的机器学习方式实现了对高校专利价值的识别;最后,采用曲线拟合方法对专利综合价值度与专利诉讼判赔额度进行拟合,形成计算公式,并对存在许可/转让价值的高校专利进行市场价格预估。本文提出的评估模型,解决了当前已有方法操作复杂度高、分析角度单一等不足,对各个高校具有普适性,为提升高校专利的价值评估效率提供了创新方案和实践路径。需要说明的是,本文的专利特征维度还需要进一步拓展,评估指标数量有待进一步扩充;此外,预估专利市场价格的方法有待进一步深化,以降低与实际交易价格的偏差。因此,在今后的研究中,将进一步深化高校专利价值评估研究,切实为推动高校专利转移转化效率助力献策。