尉心渊
(山西大学,太原 030006)
专利是科技进步的产物,是科技水平的体现。其所蕴含的信息对于科技型企业的发展和竞争有非常重要的参考价值,是制定正确的专利战略、衡量科技进步的重要指标。谁能最先掌握核心专利,谁就能在市场中占据主导地位。当前,在转化收益普遍不公开的情况下,被引次数无疑是预测核心专利的最为重要的指标。提前准确地预测出某一领域的核心专利,也就可以挖掘出企业的经济价值,可以为企业制定专利战略、尽早布局技术研发或转让等提供参考。
技术创新和进步促进了专利申请量的大幅增加,而核心专利的识别与评估也成为专利计量学的一个热门领域。现有的对于核心专利识别方法的研究有很多,大都是基于专利质量评价指标来进行。在所有指标中,专利被引次数指标使用最广泛。一般而言,被引频次较高的专利在产业链中所处位置较为关键,在一定程度上反映了专利在某领域研发中的基础性、引导性作用。一些专家认为,专利的被引频次是衡量一个专利价值的重要指标,通过分析专利的被引频次能够识别出核心专利。因此,专利的被引频次可以用做确认企业重要专利及核心技术的指标[1]。有研究表明,专利发布后几年的被引频次服从的偏态分布与专利质量的分布非常相符,被引频次高的专利就是高质量的专利[2]。这说明,研究专利的被引频次对于核心专利的发现以及专利价值的预测有很重要的意义。通过预测某一专利的被引频次,衡量该专利的价值程度,可以非常准确的预测该专利是否会成为核心专利。现在专利质量评价指标的研究较为成熟,常用的指标大致可以归为以下四个方面:(1)被引。主要是考察现有专利被后续专利的引用情况,一般认为某专利被引次数越多,它对后续专利的影响越大,越有可能成为核心专利。(2)引用。主要是考量该专利引用已有相关论文以及与现存科学知识的关联度,主要指标包括科学关联度、科学强度等。这方面的指标数值越大,表明该专利跟技术的联系相对紧密。(3)技术保护范围。这类指标是发明人对该专利技术保护程度的体现,主要有权利要求数量、技术覆盖范围等指标。专利权人对该专利越是重视,申请保护的权利范围越广,说明该专利对技术发展越重要。从本质上讲,这类指标最能反映专利质量。(4)区域保护范围。该类指标主要是考量专利权人对其专利申请了法律保护的国别数。专利族大小指标是这个角度的代表,该数值与专利质量为正相关关系,说明该指标对于专利质量衡量有很重要的参考意义。
通过国内外研究的分析可以看出,核心专利的识别有一定的研究成果,但是对于专利被引频次的预测不够具体,对于核心专利的研究也有待深入。为了解决这些问题,本文构建了一种专利被引频次的预测模型,通过分析专利信息以及被引频次与核心专利之间的关系,选择正确的指标体系,以确保模型的科学性和适用性,使用支持向量机回归的方法实现核心专利的预测,为企业寻找未来的发展目标、实现在技术上的突破提供参考。
回归分析的关键是变量的选择,通过具体分析核心专利的影响因素,确定影响被引频次的因素,正确选择预测模型中的变量,综合分析现有专利质量评价指标的研究,选择3个指标:科学关联度、权利要求数、专利族大小,进行模型中指标体系的构建。本文选择的3个指标是专利指标三个方面的代表。虽然其他指标对于模型的构建也有作用,但相关性较低,所以选择了这3个指标进行指标体系的构建。
支持向量机是一种小样本数据的机器学习方法,凭借其极强的泛化能力,可以解决传统预测方法面临的“维数灾难”和“过学习”等困难[3]。该方法在专利领域有很广泛的应用,徐晟为了对我国专利申请量进行预测,使用支持向量机进行回归分析,发现该预测方法有很高的预测精度[4]。Fall和Benzineb等以IPC分类号为研究对象,分别对朴素贝叶斯算法、支持向量机、K近邻算法进行分类运算,比较后发现支持向量机的分类效果最好[5]。
综合比较各个核函数的作用,并结合专利数据的性质,我们发现使用Gauss径向基核函数对于该模型的构建更加合理,模型的预测结果比较精确。另外,惩罚系数和核函数的参数使用交叉验证法和网格搜索来进一步确定,这两种方法因其科学性和准确性在现有研究中使用较为广泛。通过使用专利数据对模型进行验证,我们发现该模型的预测准确率都比较高,可以说明支持向量机在专利被引频次预测以及核心专利发掘方面有很强的适用性。
通过模型预测出的核心专利可以实现产品质量的改进和服务水平的提升,加快产品的更新换代速度,以获取更多的经济利润。另外,通过核心专利可以精准监控竞争对手的实力水平,掌控产业发展的方向,通过正确布局外围专利,围绕核心技术进一步开发新的外围技术和产品,有可能实现产业垄断。
参考文献:
[1]Harhoff D.,Narin F.,Scherer F M.,etal.Citation Frequency and the value of patented inventions[J].The Review of Economics and Statistics,1999,(8):511-515.
[2]万小丽.专利质量指标中“被引频次”的深度剖析[J].情报科学,2014,(1).
[3]Vapnik V.N.An overview of statistical learning theory[J].Neural Networks,IEEE Transactions,1999,(5):988-999.
[4]徐晟,赵惠芳,郭雪松.我国专利申请量的支持向量机预测模型研究[J].运筹与管理,2007,(5).
[5]Fall C.J.,TorcsvariA,Benzineb K.,etal.Automated categorization in the international patent classification[C]//ACM SIGIR Forum,2003.