刘子辰,李小娟,韦 伟
(中国科学院计算技术研究所,北京 100190)
(*通信作者电子邮箱lixiaojuan@ict.ac.cn)
知识产权保护在我国经济发展过程中的地位不断提高。围绕知识产权的交易已经成为知识产权保护与服务的重要组成部分。而作为知识产权的交易核心,专利交易在知识产权保护的大背景下,它对经济活动的作用也必将更加突出。但是,专利交易过程中的一个突出的核心矛盾是如何保证专利的交易价格能够实际地反映专利的价值。这其中要解决的首要难点问题是专利交易价格的评估问题。
使用计算技术对专利价格进行自动评估被认为是解决上述问题的可行路径之一,在近年来获得了大量关注。Lanjouw等[1]使用七个技术领域的专利详细信息来开发专利质量指数,基于四个专利特征构建最小方差指数,结果表明使用多个指标可以大大降低质量的测量差异。龚娅等[2]基于对专利权价值影响因素的分析,指出了目前专利权价值评估方法存在一定的局限性,构建了专利权价值评价指标体系,在此基础上运用层次分析法(Analytic Hierarchy Process,AHP)和模糊综合评价法建立了专利权价值评估模型,用于对传统评估方法所得的评估结果进行纠偏。Danish 等[3]通过经验模型分析了555 项专利,将专利权人的续约决定模型化为有序的概率,使用变量(例如专利家族规模、技术范围、发明人数量和授予滞后)在相应回归中用作解释变量,将专利权人的续约决定以及专利的特征和续约成本表结合在一起,以估算专利价值分配。Gu等[4]基于专利技术的视角,将专利分为三种类型:基本型专利、技术专利和实用型专利,根据三种专利的特点,进一步分析不同的专利质量评价标准,从实证研究的角度出发,构建科学合理的评价指标体系。李玉等[5]针对专利价值的不确定性和影响因素的复杂性,以及评估工作中缺乏可操作性等问题,对价值评估指标体系进行分析,使用随机森林算法选择最有效的指标集,同时基于具有噪声的基于密度的聚类(Densitybased Spatial Clustering of Applications with Noise,DBSCAN)方法选择高精度且一致性低的决策树子森林,改进传统随机森林算法,实现专利价值评估。谢文静等[6]在对影响专利价值评估因素进行分析基础上,加入了发明人特征指标建立专利价值评估指标体系,运用粗糙集理论构建专利价值评估模型。Liu 等[7]旨在解决使用迄今收到的被引用信息进行专利估价的局限性,通过设计基于点过程的专利引用类型感知(自引用和非自引用)预测模型,该模型结合了专利的各种信息,为进行预测性专利评估提供了可能性。资智洪等[8]根据专利价值分布特点,分析专利价值的影响因素和专利价值评估的关键指标,提出了一种“二级分类评估”的专利评估方法,该方法结合了定量指标和专家评估,用该方法分别计算出专利的定量指标(Ps)值和定性指标(Qs)值,然后将Ps和Qs相加得出专利值(Patent Value,PV),并反映专利价值。Liu 等[9]假设专利估价的实现始于专利的价值路径:辩护、实施或转让,探索基于贝叶斯神经网络的模型,以预测实现专利估价的途径,并提出了一种基于功能效果的专利表示,并从中提取了一些技术特征,给定专利特征,使用贝叶斯神经网络进行专利估价。Ma 等[10]针对特定领域的技术特点,建立了一套包括指标体系、指标权重计算、评分标准确定、专家评分计算在内的专利价值评价体系,基于价值获取理论模型有效地将成本法和收益法结合了传统的评估方法,避免了获取市场法所需的专利交易数据的问题。
由于人工智能相关技术的不断成熟,其在工程领域的应用更加广泛,也有研究者采用人工智能的相关技术实现专利价格的自动评估。寿向晨[11]基于专利价值评估时的影响因素、参考文献和专家意见,设计了比较合理的专利价值评估的指标体系,并对指标体系进行计量经济学量化,同时针对专利数据属性的特点,对深度置信网络算法进行多角度优化,设计出了适用于专利价值评估的改进的深度置信网络算法模型。吕霁[12]针对专利技术产业化过程中的价值评估问题,构建专利价值评估指标体系和样本体系,结合专利价值理论及逆向传播(Back Propagation,BP)神经网络理论,构建了专利价值评估神经网络模型,完成专利价值评估。Trappey等[13]开发了用于物联网专利质量评估的机器学习实施方案,在开发深度神经网络模型进行专利质量评估之前,采用主成分分析来简化专利指标,实现工业物联网专利申请过程中的专利价值发现。赵蕴华等[14]从机器学习技术的角度出发,首先对专利价值评估指标进行分析和选择,其次采用机器学习方法中决策树、支持向量机和神经网络三种算法对样本进行训练并测试,最后对测试结果进行了分析。Lin 等[15]提出了一种基于深度学习的专利质量评估模型,该模型可以整合专利文本材料和许多其他有用的属性信息来评估专利质量,模型包括属性网络嵌入和基于注意力的卷积神经网络,分别实现从引用网络和属性中学习专利嵌入和从专利文本材料中提取语义表示,然后将它们的输出连接起来,以预测新专利的质量。林弘杰[16]设计了一种利用专利多项信息的基于深度学习的专利价值评估模型,该模型可以充分利用上述专利信息来预测评估专利的价值,模型由基于专利引用网络的属性网络表征模型和基于注意力机制的卷积神经网络模型组成,将两种模型的输出表征向量连接起来预测评估专利的价值。Hasan 等[17-18]提出了一种利用文本抽取的,基于关键字进行价值专利评估的方法,该方法针对专利的核心关键词与其价值建立关联关系,形成针对关键词的专利价值数据库,用来对之后的专利进行评估。Hu等[19]在进一步在关键字抽取的基础上,通过对专利涉及主题进行了建模,构建了以主题为基准的专利技术强度评估方法。Hido 等[20]则提出了基于专利审查结果作为训练集对专利进行创新性价值评估的方法,采用类似的思路,Jin等[21]则采用了专利维护数据,即专利是否及时缴纳了维护费用等,作为数据来源建立专利评估的模型;Liu 等[22]则基于法庭判决结果为数据集,采用图数据结构构建了针对不同专利的评估模型,判断不同专利在进行法律诉讼时胜诉的可能性。
上述文献在进行专利价格评估时均采用了自动化的处理方法,但是,在实际操作中,专利的实际价格评估过程还包含市场、法律、技术等多方面的多个维度。不同的评价方法对不同维度的考量也不尽相同。但是上述文献评估专利价格时均没有考虑专利的市场、法律、技术维度对专利价格的影响,而专利的市场因素对专利价格评估起到关键作用。专利价格评估的市场法指利用市场上同样或类似知识产权的近期交易价格,经过直接比较或类比分析(包括对交易时间、交易因素、交易目的、资金成本、经济寿命等因素的分析、修正)来估测专利资产价格的评估方法。市场法进行价格评估的流程与机器学习的流程非常类似,即通过已有的经验数据训练评估模型。同时,人工智能的深度学习技术在各个工程领域已经得到广泛的应用,尤其是针对普遍评估方面的应用也取得了较好的效果。为此,本文提出了基于循环神经网络(Recurrent Neural Network,RNN)的专利价格自动评估方法,该方法以市场法为基础,通过对其他各种因素的综合考虑,利用门控循环单元(Gated Recurrent Unit,GRU)构建RNN的方法,实现对专利价格的自动评估。
本文所提出的专利价格评估模型如图1 所示,模型包含四大部分:市场要素、专利组合要素、法律要素与技术要素,分别记为M、G、L、T。首先,由市场要素经神经网络评估出基础价格,此基础价格用于后期修正;然后使用专利组合要素、法律要素、技术要素分别经GRU 神经网络得到相应的评估值;最后,使用将所有的评估值经过GRU 神经网络得到修正后的专利价格。
图1 本文专利价格评估模型Fig.1 Patent price evaluation model in the paper
对于任意专利p,上述各要素的组成包括市场要素评估、专利组合要素评估、专利法律因素评估、专利技术要素评估。
对于市场要素的评估,主要考虑的因素为:专利p所对应领域近5 年来的专利交易数量nt、申请数量na、交易价格Vx。交易价格是一个专利在本领域的综合交易价格加权平均,如式(1)所示:
其中:si代表专利p所在领域中的除专利p外的其他专利(以下简称其他专利)与专利p的相似性。相似性计算采用基于领域关键词的文本相似性给出,文本相似性计算可用现有文本相似性方法进行计算,具体为采用WMD(Word Mover’s Distance)算法[23]。D(p)代表专利p所在领域的其他所有专利所构成的集合。对于D(p)的求解可以根据p的国际专利分类表(International Patent Classification,IPC)三级分类号获得。进一步对专利交易数量与专利申请数量进行归一化处理,处理方法如式(2)~(3)所示:
其中:Nt和Na为近5 年内所有专利的总交易数量和总申请数量。对于上述因素,综合为基础价格因素M,计算公式如式(4)所示:
式(4)的计算过程为计算神经网络内部参数值的过程,需要计算的参数在1.6 节进行详细说明,参数的初始值为随机值,采用神经网络递归训练不断更新参数值,直到使专利评估结果的相对准确度(Relative Accuracy,RA)值最大时停止更新参数值。
对于专利组合要素考虑以下两方面因素:第一个因素为专利p申请者(或申请单位)在专利p领域所拥有专利的数量在该领域中所占比例Bpa,定义为式(5):
其中:Npa代表专利p的申请者(或申请单位)在专利p所在领域中持有的专利的数量。专利组合因素考虑的第二个方面为专利p的依赖关系含义为依赖于专利p的其他专利的数量。该数量关系可以通过专利申请时的前置专利信息获取。综合以上,专利组合要素G表述为式(6):
其中:G2 为循环神经网络,其输入数据分别为Bpa、Dp,最原始数据为团队积累的科技成果转化情况组建的专利库数据和参考国家知识产权局得到的相关数据。式(6)的计算过程同式(4),不同点在于计算得到的神经网络参数不同。
专利法律因素考虑以下几个方面的因素:1)专利剩余有效期Yp。2)专利授权国家数量Cp。3)专利诉讼情况。对于专利诉讼情况,考虑以下几个方面:a)专利p申请者(或申请单位)作为原告涉及诉讼数量La;b)专利p申请者(或申请单位)作为被告设计诉讼数量Lb。对于法律因素L表述为式(7):
其中:G3为循环神经网络,其输入数据分别为Yp、Cp、La、Lb,最原始数据为团队积累的科技成果转化情况组建的专利库数据和参考国家知识产权局得到的相关数据。式(7)的计算过程同式(4)。
专利技术评估方法的具体步骤如下:
1)对于专利p获得相关的论文集合,获取方法为:首先搜索与目标专利具有相同作者或者是同一单位的论文,获得集合Pa;其次,根据专利p对应的关键字集合Kt,对任意k∈Kt,获得非目标专利作者的其他论文,所得到的论文集合为Pna。
其中:Si表示第i篇论文得分分数,若该篇论文为成功发表的论文,则得分分数为1;否则得分分数为0。式(8)的实际意义表示作者已成功发表论文的数量的总和。同时,对于,计算与p之间的相似性,得到。由此,得到论文的表征向量
4)针对步骤1)中获得的论文集合Pa和Pna。对于∈Pa,采用式(9)所示的循环神经网络进行计算:
式(9)代表论文与p之间的评价关系,反映的是利用论文来对p进行质量评估时的计算结果。其中:G4 表示循环神经网络,其输入分别为t、r、a、,其含义与步骤2)中的含义相同。Ma(p,)的值域为(0,100],取值越高代表专利技术质量评价越高。
G4 和G5 这两个神经网络结构与式(4)相同,即每个输入输入至一个GRU 入口,形成循环神经网络,具体阐述详见1.6节。
5)利用如下模型计算专利的技术质量因子:
综合上述因素,最终对于专利p的价格评估模型为:
G6为循环神经网络,其输入分别为M、G、L、T,式(12)的计算过程同式(4)。
对于1.2~1.5节模型的训练,本文采用如图2所示的神经网络进行训练。本文所用的专利价格评估共使用6个GRU循环神经网络,每个神经网络评估的值如1.2~1.5 节所述,所有GRU 循环神经网络的结构相同,但是内部参数不同,GRU 循环神经网络的结构如图3所示。
图2 专利价格评估模型的训练网络Fig.2 Training network for patent price evaluation model
图3 GRU循环神经网络Fig.3 GRU recurrent neural network
GRU内部的前向转播过程如式(13)~(16)所示。
经过神经网络训练后得到6 个神经网络的网络参数,网络参数的具体计算过程是由神经网络训练过程中不断调节得到,每个神经网络的输入数据如1.2~1.5 节所述,由于每个神经网络的参数不同,因此本节需要构建6个GRU神经网络。
以团队积累的科技成果转化情况组建专利库,专利库中共2 022条专利数据,同时参考国家知识产权局检索到的专利数据和中国知网检索到的论文数据,专利库中每条专利数据包含的数据内容如表1所示,同时表1中列出了相应数据内容的数据说明,专利数据用于本文所提专利价格评估模型的训练,其中,60%的专利数据用于模型的训练,20%的专利数据用于训练时的模型验证,20%的数据用于专利价格评估模型的测试,使用专家定性评估的方法得到专利的真实价格评估值。
表1 专利数据Tab.1 Patent data
6 个GRU 循环神经网络采用相同的网络结构,每个GRU循环神经网络由4 层GRU 层组成,每个GRU 层由32 个GRU组成。模型训练时的初始学习率为0.1,学习率的递减率为0.99,用于在模型训练时不断调整学习率。使用Tensorflow实现模型。模型训练时的损失函数使用均方误差损失函数,即均方误差(Mean Square Error,MSE)值。使用相对准确度体现专利价格评估模型的性能,定义如式(17)所示:
为了验证所提专利价格评估方法的有效性,将404 个测试专利随机分成4 组对本文方法进行测试,专利价格评估结果如表2 和图4 所示。图4 中的相对准确度(RA)是本文方法的评估结果与专家定性评估结果进行比较的数值。
从表2 和图4 可以看出,与专家定性评估结果相比,所提出的专利价格评估方法评估结果的RA 值基本维持在0.85,说明本文所提专利价格自动评估方法具有一定的自学习能力,所提方法是有效的。本文方法的评估结果与专家定性评估结果最相近的是测试组3 中的一篇专利,RA 值为0.93;评估结果与专家定性评估结果相差较远的是测试组2 中的一篇专利,RA 值仅为0.77。对相应的专利进行查看,训练专利中存在多篇与测试组3 中RA 值最高专利的专利内容同类的专利,而训练专利中与测试组2中RA 较低专利的专利内容同类的专利较少,导致出现上述现象。因此,为了能够有效避免上述现象的发生,在设置模型训练库时需要保证具有大量同类型专利数,而本文使用专利数量有限,并不能有效避免这个问题。
表2 专利价格评估结果Tab.2 Patent price evaluation results
图4 专利价格评估结果值Fig.4 Patent price evaluation value
进一步,分别采用测试组1~4 中的专利,使用本文方法与采用基于AHP、粗糙集理论方法和BP神经网络方法的评估结果进行比较,所得到的RA均值分别0.85、0.82、0.81和0.83,与对比方法相比,本文方法RA 值分别提升了3.66%、4.94%和2.41%。从如图5 所示的对比结果中可看出:本文方法使用本文所用数据集能够取得优于对比方法的性能。此外,相对与其他方法,虽然粗糙集理论方法的总体性能相对较差,但是对于测试组2 的专利的评估性能是所有方法中最优的,但在其他测试组的评估性能则表现不佳。AHP 和BP 神经网络方法在测试过程中,性能表现则基本一致。
图5 专利价格评估方法的相对准确度对比Fig.5 Comparison of relative accuracy of different patent price evaluation methods
为了进一步验证本文所提基于循环神经网络的专利价格自动评估方法的实际应用效果,对国内某高技术企业的所有芯片相关专利价格进行评估,待评估的专利数量为15,同时也对待评估的专利进行专家价格评估,评估结果如表3所示。
本文方法以市场法为基础,通过对其他各种因素的综合考虑,利用GRU 神经网络的方法实现对专利价格的自动评估,从表3 可以看出,与专家评估结果相比,本文方法能够得到较一致的结果,最低RA 值为0.74,最高RA 值为0.90,平均RA 值为0.84。使用本文方法最终为客户进行了特定领域的专利价格评估,且评估结果在一定程度上得到客户认可。
表3 本文方法在应用案例中专利价格评估结果Tab.3 Patent price evaluation results of application cases with proposed method
本文通过研究国内外先进专利价格评估方法,分析现有评估方法的优势及缺点,现有方法在进行专利价格评估时没有有效地考虑专利的市场、法律、技术维度对专利价格的影响,而专利的市场因素对专利价格评估起到关键作用,同时,人工智能、深度学习技术在工程领域不断成熟,使用深度学习技术可实现专利价格的自动评估,即提出了基于循环神经网络的专利价格自动评估方法。该方法以市场法为基础,通过对其他各种因素的综合考虑,利用GRU 神经网络的方法实现对专利价格的自动评估,并通过对比实验验证本文所设计方法的有效性。
由于本文所用专利数据集的有限,并不能发挥出所提模型的最佳性能,因此,随着后续专利数量和类型的不断积累,将进一步优化所提专利价值自动评估模型,设计更优的评估模型。