■ 仇华炳 魏凤 潘璇 蒿巧利 赵晏强
1.中国科学院武汉文献情报中心 武汉 430071
2.湖北省科技大数据重点实验室 武汉 430071
3.中国科学院科技战略咨询研究院 北京 100190
随着我国自主创新能力的不断加强,我国专利申请的数量也保持着持续的增长,代表科技事业发展的发明专利申请量连续9年世界第一[1]。专利申请和授权数量增长的同时,专利质量和价值成为值得关注的问题。吴红[2]认为专利维持时间越短,市场价值就越小。失效专利的相关分析可以反映出某个机构的专利质量和对专利运营维护的重视程度。自2019年开始,我国正在抓紧研究制定“知识产权强国战略纲要”[3]。从专利失效这一微观的角度出发研究推进我国专利质量工程建设和知识产权强国战略实施,或许是解决我国诸多高校专利成果质量不高,有效专利失效多、失效快问题[4]的一个突破口。
截至2020年,在专利领域学术界主要聚焦于有效专利的研究,对失效专利相关领域研究处于起步阶段,国内在失效专利方面的研究论文不多[5],将“失效专利or无效专利”设为关键词,在知网中搜索相关文献,仅得到253条搜索结果(截至2020年11月5日)。
按照我国专利法规定,专利授权后必须缴纳年费(年费通常按年递增)才能维持专利有效,一般只有那些有实施前景的专利才可能维持足够长的时间,但是往往因为专利本身质量或者市场价值的原因,很多专利权人提前放弃专利权,这些专利就成为了失效专利。一般情况下,授权专利的放弃通常是专利权人认真评估后的结果,反映了专利的质量和专利权人的布局思路。因此,对专利活动中产生的授权后提前失效专利进行分析,可以更清楚地揭示专利活动背后隐藏的信息,比如专利质量和失效速率的动态变化规律等。这正是本文研究失效专利要着重研究的内容,从前述检索知网获得的文献来看,国内关于这方面的研究较少。
国内学者关于失效专利的研究,主要集中于以下几个方面:专利失效的原因与专利质量问题[6-9],失效专利的开发利用[10-14];从地方到全国,从高校到企业不同层面的失效专利现状统计与规律研究[15-19]等。其中对于失效专利规律性的研究主要是从失效专利数量、占比、趋势、专利类型、维持年限等方面,从定量的角度揭示失效专利的现状、主要原因;研究中往往使用常规的计量统计方法,对于专利失效规律和理论的研究大都比较片面。对于特定专利权人的授权专利发生失效的时间分布规律缺乏系统研究,多采用年度失效累积量或失效专利平均寿命等静态指标概括。失效专利比例多采用静态失效率(即截至统计时间点专利失效量除以累计授权量),没有考虑失效专利比例动态变化的特征。栾春娟[20]研究了大学、个人、科研院所和产业的提前失效专利,构造了提前失效专利比例的逆时序推测计算方法,分析了提前失效专利对专利价值的影响,是少有的逐年计算失效专利比例动态变化指标的研究,有一定的参考意义。但是,栾春娟使用的方法本质上是套用生存分析方法中的生命表模型,采用了假定Cohort 法(假定同生群生命表法)。所谓假定Cohort 法,就是指采用某一年度内的由若干个Cohort 组群所组成的有序按龄分布并据以来编制生命表的方法[21,22]。套用这种方法的缺点是它仅仅从一个断面来看专利过去从维持到失效的经历,它完全取决于制表这一年的专利年龄别失效率,所造成的误差较大。假定Cohort法本质上是在获取所有个体(如专利)完整生命过程数据比较困难的情况下采取的妥协的方法,在当今专利数据库信息更新及时完整易得的时代,采取这种方法并不是最好的选择。
由于上述研究中所用的指标和方法并不能真实反映专利失效的动态过程,不能反映不同批次授权专利失效的速率差异,不能反映同一批授权专利后续不同阶段的失效状况,也不能反映创新主体不同时期专利的质量的变化;关于失效专利的现有研究缺少较好的理论模型。因此,本文试图设计一种动态跟随式授权专利失效率计算方法,并在此基础上构建专利失效模型和失效速率测度指标,用以解决上面提到的问题。
针对引文中提到的失效专利研究的局限性,本文提出“跟随式专利失效率”概念以及相应的计算公式。“跟随式专利失效率”中的失效率是指某授权有效专利集合在后续某时间点的累计失效专利量占该授权专利集合初始总量的比例,反映该授权有效专利集合在后续时期的衰减失效程度。
与现有静态的专利失效率指标以及通过假定cohort法计算的失效专利比例动态变化指标相比,“跟随式专利失效率”能够更准确的揭示某一批专利失效水平的动态变化过程,通过观测这批专利在授权后的若干个时间区间内的专利失效率增长过程,可以帮助我们了解该实体在某个时期的专利产出的质量、对专利运营维护的重视程度以及这批技术的老化速度等。
计算步骤为:首先,获取指定年份内的新授权专利数量,作为授权专利初始集;其次,获取这批授权专利从授权年至观测年之间历年失效的专利的数量(由每条专利法律状态字段所记录的专利法律状态变更时间序列信息判断专利的失效时间);然后,计算截至各观测年累计失效的专利数量,并除以初始授权专利数量,得到截至观测年的专利失效率,多个观测年的专利失效率就构成了“跟随式专利失效率”序列。
用Gt表示t年初始专利授权量。用Fi表示上述t年授权的专利,在之后第i年内失效的数量。令ft+i为t年授权专利在t年到t+i年间所有累计失效量占初始专利授权量的比率,即“跟随式专利失效率”:
随着时间的推移和技术的进步,专利技术会因为失去技术先进性或者市场价值等因素而老化甚至失效,专利权人决定让一件授权专利失效的因素也千差万别,但是对于一个较大的样本空间,其专利在一定时间内的失效规律服从统计学规律。
可靠性理论是研究系统运行可靠性的普遍数量规律以及对其进行分析、评价、设计和控制的理论和方法。可靠性是指产品在规定的条件下,规定时间内,完成规定功能的能力或可能性。可通过失效率、平均失效时间等来评价产品的可靠性。产品丧失规定功能称为失效。实践表明,产品的失效时间往往是不确定的,要定量描述产品的失效时间,应当采用统计学方法。将失效时间作为一个随机变量,用一个恰当的概率分布函数去描述它[23]。从数据的统计分析中找出产品失效时间分布的规律,是预测其失效发展,研究其失效机理的重要手段。
国外已有借用可靠性理论中的指数模型对图书馆书籍和期刊的信息老化程度进行定量分析的相关研究[24];对于专利文献的失效时间的观测和统计,我们也可以借用可靠性理论中的指数分布模型。指数分布模型是可靠性理论中用于描述失效时间的常用统计学模型。将专利的失效时间T 看作一个随机变量,那么当失效时间T的概率密度函数为:
则称失效时间T 服从参数为λ的指数分布。在反应动力学中,λ是这个反应的反应速率系数。本文中我们将λ定义为(特定年份的)授权专利的失效系数。λ可以作为专利失效速率的测度指标,λ越大,专利失效速率越快。
通过(2)式积分得到服从指数分布的专利失效率函数为
上式中t 表示专利从授权开始算起的时间。容易证明F (t) ∈[0,1],且为单调增函数,并且当F (t)=0.5,既失效率过半时,对应的时间t1/2为半衰期,且有:
可以通过统计某特定年份的初始授权专利集和后续历年专利失效量,计算后续若干年份的专利失效率ft+i的值作为观测值。运用最小二乘法拟合专利失效率函数F(t),并得到特定年份的专利失效系数λ。
本文以国内某机构作为实证分析的对象,检索并下载了该机构从1999年到2018年申请的所有中国发明专利的著录信息数据集,数据集共含133016 件发明专利,其中有效专利53843 件,在审专利31374 件,无效专利47799 件。检索所使用的数据库为incopat 专利数据平台,检索日期为2019年12月29日。在本文的研究过程中,主要使用了Python进行数据清洗处理和拟合分析。
根据前文静态专利失效率的定义,在本数据集内,计算该机构截至2019年12月29日的专利静态失效率为27.14%;通过法律状态反推计算2018年12月31日的专利静态失效率为27.19%,几乎没有变化,或者说这种变化说明不了什么问题。因为在这一年间,失效量(分子)在增加,授权量(分母)也在增加,且不具有相关性。可见通过静态专利失效率并不能很好地揭示一个机构专利失效的特征,下文将通过计算跟随式专利失效率来揭示该机构授权专利失效的动态变化特征。
通过数据分析,我们提取到该机构的这一批专利申请,从2001~2018年每年的授权量情况,如图1所示:
从图1中可以看出,从2001~2017年每年授权的专利量逐年增加(受到国家相关政策影响,2018年授权专利数量有所降低,但是对本文理论模型研究不产生影响)。本数据集的这批专利中最早授权份为2001年,但仅有16 件专利,样本数量太少,后续失效率容易受到个别年份小量异常数据影响,参考意义不大;2002年的授权专利为161 件,样本数量较有意义,因此本文从2002年开始逐年计算跟随式专利失效率。
图1 某机构2001~2018年各年授权专利数量
按照公式(1)所定义的专利失效率的计算方法,分别计算各年份授权的专利,在后续各观测年份(截至2018年12月)的专利失效率,得到跟随式失效率统计表(如表1所示),再根据表1绘制失效率观测点,连接成失效率变化曲线图,如图2所示(授权年越靠近2018年,曲线样本点越少,但仍能反应出授权后的失效状况和大体趋势)。
表1 2002~2017年授权专利跟随式失效率统计表
通过观察单条曲线我们可以发现,随着时间的推移,授权专利的失效率逐年变大。通过观察多条失效率曲线的走向,可以发现从2010年往后所有失效率曲线变得更为平滑,表明从2010年开始,该机构对于存量有效专利的保护力度明显加强。同时,从图2中明显可见2010年曲线和2009年曲线间距变宽,表明2010 授权的专利质量提升较多,专利价值提高,后期失效速率有明显降低。后续将通过计算各个授权年份的专利失效系数进一步验证相关结论。
通过授权专利失效率曲线图(图2)观测各年份的授权专利在后续年份逐渐失效,直到达到失效率过半(50%基准线),所需要的年数(取整),即授权专利半衰期的长度,结果如表2所示(2012年以后授权的专利,截至检索日失效未过半)。
从图2和表2,可以看到,可观测到的半衰期T1/2时间长度最短为4年,半衰期的中位数和众数都为5年,最长为7年,即T1/2∈[4,7]。从总体上看,授权专利半衰期在变长,表明专利的失效速率在放缓。
图2 2002~2017年授权专利失效率曲线图
表2 2002~2011年授权专利半衰期观测值
在对各个年份授权专利失效率曲线进行拟合的过程中,为了使拟合曲线有更好的拟合效果,观测时长至少要覆盖一个半衰期的长度;同时为具有一致性,各授权年的拟合曲线尽量选取同样数目的观测点,本文选取样本点时,以授权年年末后推7年期的失效率数据集作为拟合样本数据,即从授权年(包含)连续往后观测,共计8年的失效率值构成“跟随式专利失效率”观测序列。利用观测序列和公式(3),运用最小二乘法拟合专利失效率函数F(t),得到各年份的授权专利的失效系数λ(2002年授权专利的失效率一直观测到2009年,2011年授权专利连续观测到2018年,2012年观测点为7 个,往后略有减少,可能会对个别曲线的拟合精度产生轻微影响,但依旧可以反映出大体形态)。
通过Python 结合表1数据,拟合计算可以得到2002~2016年各年的授权专利失效率函数的拟合曲线和专利失效系数值(表3)。如图3所示,展示了拟合曲线效果图(受篇幅限制,仅展示部分年份),可见拟合曲线和大部分观测点可以较好的吻合,拟合效果较好。
图3 授权专利失效率函数拟合效果图
利用表3中某一年份的授权专利的失效系数,结合公式(3)和(4),可以得到该年份授权专利至今的失效率历年变化情况和对应的半衰期,还可以对未来几年的失效情况进行一定程度的预测。
表3 2002~2016年授权专利失效系数
将拟合计算得到的该机构2002~2016年各年的授权发明专利失效系数λ绘制成变化趋势图,如图4所示:
由公式(3)可知,专利失效系数越小,表明授权专利失效速率越慢。从图4中看出,整体而言,从2003年开始该机构各年发明专利的失效速率在逐步放缓,并且这种放缓趋势从2010年的授权发明专利开始愈发明显;同时也说明该机构授权专利质量从2003年开始持续提升,并且在2010年有较大飞跃。产生专利失效系数降幅最大的3 个时期依次为2014年、2010年和2005年,相应降幅数值分别为0.024,0.023 和0.021。表明该机构对发明专利的质量和运营维护的重视和管理,陆续在2005年、2010年和2014年显示出明细的成效。
图4 2002~2016年授权专利失效系数变化趋势图
根据前述拟合结果,通过失效系数的变化,可以发现该机构专利质量和维持水平从2003年以后开始持续提升,其中2005年、2010年和2014年是提升效果表现的重要时间节点。事实上,2003年科技部颁布的《关于加强国家科技计划知识产权管理工作的规定》,对国家科技计划的知识产权管理、保护和维持费用等方面进行了规定[25]。2008年,国务院发布《国家知识产权战略纲要》,明确到2020年把中国建设成为知识产权创造、运用、保护和管理水平较高的国家[26]。2014年,国务院办公厅转发了《深入实施国家知识产权战略行动计划(2014-2020年)》[27],在“主要目标”中强调了“发明专利平均维持年限”的提升,在“强化知识产权管理,提升管理效能”中强调了“突出专利质量导向”。实际上,在国家层面出台了上述重要知识产权政策后,该机构都会积极响应,并制定一系列内部战略、政策和措施加强知识产权创造和运用,提升专利质量和保护水平。
考虑到专利从申请到授权有一定的滞后性,上述不同层面在2003年、2008 和2014年重要知识产权管理政策和战略的出台对专利申请质量与维护活动造成的影响,与该机构在2005年、2010 和2014年授权专利失效水平出现的加速降低是相吻合的。这表明利用跟随式授权专利失效率、授权专利失效系数可以为政策规划部门提供一个新的政策效用参考指标,帮助决策者在制定提高专利质量和提升知识产权管理运维水平的政策、调整和优化相应机制方面提供参考。
因此,本案例有效验证了跟随式授权专利失效率计算方法和基于可靠性理论的专利失效指数分布模型及其失效系数可以有效揭示该机构专利失效率动态变化的规律,并且在分析机构实体在某个时期的专利产出的质量以及对专利运营维护的重视程度方面具有可操作性。
本文在调研了失效专利的研究现状后,总结失效专利的定义,归纳有关失效专利研究的方向,在分析关于失效专利的时间分布规律和失效率的现有研究不足的基础上,设计了跟随式专利失效率计算方法,并基于可靠性理论,构建服从指数分布的专利失效率模型,同时引入了专利失效系数和半衰期测度指标。利用该跟随式专利失效率计算方法和专利失效系数测度指标,针对该机构2002~2016年每年的授权专利的后续失效情况展开追踪,开展了实证分析,得到几点结论。
(1)从2003年开始,该机构授权专利失效速率逐年降低,对发明专利的质量和维护的重视,陆续在2005年、2010年和2014年显示出明细的成效。
(2)本文所构建的指数分布的专利失效率模型和专利失效系数测度指标可以有效地揭示该机构授权专利失效率动态变化的过程,可以反映不同批次授权专利失效的速率差距,可以反映创新主体不同时期专利的质量和价值。
(3)专利失效系数和半衰期测度指标比专利静态失效率能够更好地反映同一批授权专利后续的失效状况,并具有一定的短期预测功能。
(4)在进行专利政策回顾分析时,专利失效系数指标可以给知识产权政策制定部门提供一个新的观察政策效用的维度。我国正在抓紧制定“知识产权强国战略纲要”,这一维度或许有一定价值。
本文的研究模型有待进一步完善,研究模型和指标除了应用于机构的评价方面,未来还可以应用在研究某一技术领域的专利技术更新换代或专利价值衰减速率等方面,这些是今后可以进一步研究的方向。