基于多目标优化的核心专利挖掘方法研究
——以基因工程疫苗领域为例*

2019-08-17 00:48曾荣强许海云胡正银
世界科技研究与发展 2019年6期
关键词:专利体积疫苗

崔 斌 董 坤 曾荣强 许海云 胡正银

(1.南京农业大学信息科学技术学院,南京210095;2.山东理工大学科技信息研究所,淄博255049;3.西南交通大学数学学院,成都276826;4.中国科学院成都文献情报中心,成都610041)

当今社会正处于知识大爆炸的时代,随着科学技术的飞速发展,科学文献及科技成果相应地也越来越多,覆盖的领域也日渐广泛。专利是技术信息最有效的载体,亦是最为集中的技术竞争情报分析数据源,对于目标对象竞争地位的巩固和稳定具有重要作用。Schankerman等[1]通过对欧洲专利价值评估数据发现约5%~10%的专利文献价值占据了当时欧洲专利文献总价值的一半。核心专利是具有原创性且蕴含巨大经济效益和战略意义的专利或专利组合[2],亦是在某一技术领域中处于关键地位、对技术发展具有突出贡献、对其他专利或者技术具有重大影响且有重要经济价值的专利[3]。核心专利可以为创新活动提供有针对性、有价值的技术支撑,同时也是把握领域技术发展水平和发掘技术突破口的重要数据源,对于社会生产实践具有重要的潜在经济价值。鉴于此,如何从海量的专利文献数据中挖掘核心专利对把握相关领域的技术发展水平,准确预见技术的突破方向与应用领域,为相关机构、企业或个人的创新活动提供更有针对性的背景技术支撑变得尤为重要。随着信息技术的不断进步,人们开始探索对专利引证数据、同族专利数、权利要求数等信息进行分析,试图挖掘更深层次的技术知识,目前已有众多挖掘和评价核心专利的方法:

1)专利引证频次识别法

引证数据可以表征对象在领域中的技术延续性,还可以表征科学间及技术领域间的交叉渗透,因此利用专利被引频次进行核心专利挖掘成为最常见的方法之一。Harhoff[4]和 Albert[5]等在相关研究中指出专利被引频次越高,专利价值相应地就越高,可以直接作为识别核心专利的指标;Rysman等[6]研究指出四大标准制定组织(Standard-Setting Organizations,SSOs)标准下的核心专利与对照组相比引证频次更高且影响力更持久。Bekkers等[7]以移动通信领域为例,基于时间维度构建专利引文网络,分析引文路径,识别核心专利;Chen等[8]利用专利引文分析方法挖掘1978—2002年间台湾地区核心工业技术以及关键工业技术;Lee等[9]基于帕累托/负二项分布(Negative Binomial Distribution,NBD)模型,提出了随机专利引文分析方法,综合专利未来引用计数构建专利引文矩阵用于识别核心专利技术,并以显示技术领域为例开展了实证研究;王庆稳等[10]通过引用矩阵的形式将高被引专利凸现出来,并通过专利间的相互引用,分析核心专利的技术发展方向。

2)同族专利识别法

同族专利代表的是专利的受保护地域范围,该指标值越大说明专利受保护范围越广,专利保护成本也更高,按照趋利性原则,专利本身的价值也更高。所以如果一项技术申请了大量同族专利,可间接反映出该技术的重要程度,因此,可借助同族专利指标值大小来确定核心专利[11]。栾春娟等[12]也指出申请人指定的有效国越多,说明该项专利技术越重要,价值越大,因此可以通过《专利合作条约》(Patent Cooperation Treaty,PCT)专利申请中的指定有效国确定核心技术。Parisi等[13]通过同族专利检索识别出了植物生态技术领域的有价值专利;Su等[14]以冠状动脉闭塞领域专利族为研究对象,提出了“关键链”启发式程序构建专利优先网络,用于识别该网络中最有价值的专利路径挖掘核心专利;孙立冰[15]指出同族专利可以反映专利潜在的技术市场和经济势力范围,以及专利的技术水平和经济价值。

3)权利要求数量识别法

专利权利要求数量对应的是专利受法律保护的领域范围,每一项权利要求,都包含若干技术特征。因此,从一定层面上可以认为该指标值越高,专利的技术特征越密集,相应的专利价值越高。Llanes等[16]研究指出专利的权利要求数量与其技术创新程度具有一致性;Lanjouw等[17]指出权利要求数量反映专利保护技术点,从一定程度上反映了专利质量,并利用专利权利要求数量构建了专利质量指标;Berger等[18]通过生存模型对电信领域的相关专利进行识别与评价,发现核心专利具有更多的权利要求数量。

4)综合指标识别法

科学评价专利一直是科研领域的一大难题,单一指标难以覆盖到专利的整体特征,依靠单一指标挖掘核心专利已经不能够满足当前的专利分析需求,因此结合多个指标进行综合分析以及专利指标评价体系的构建逐渐受到科研人员的重视。孙涛涛[11]等选取乙肝防治技术领域,采用被引频次、权利要求数和同族专利数识别领域的核心专利;郑玉荣等[19]提出以总引证指数为主,并以专利强度值、同领域引证指数等为补充的基于产业尺度的核心专利集成判别方法;袁润等[20]运用汤姆森科技的知识产权研究与分析工具(Thomson Innovation,TI)以战略性新兴产业为研究对象,通过专利地图、文本聚类、专利引文、权利要求、同族专利等7类核心专利识别维度对战略性新兴产业的核心专利进行综合分析;谢萍等[21]提出基于逼近理想解排序法(Technique for Order Preference by Similarity to an Ideal Solution,TOPSIS)方法确定核心专利指标权重的方法,研究指出确定核心专利指标权重受技术领域和时域的影响;钱过等[22]提出核心专利的综合价值指数,采用层次分析和专家打分相结合的方法识别我国风能产业核心专利。

5)其他核心专利挖掘方法

虽然基于专利多项指标的综合判别法可以比较全面的分析评价核心专利,但是此类方法缺乏广泛适应性,在解决特定要求的案例时并不能够适用,因此还有部分人员基于特定的案例要求而开发对应的核心专利识别方法。贾佳等[23]结合引文分析法提出类交叉延伸分析方法模型,对纳米压印技术领域核心专利进行分类延伸分析;Hu等[24]研究自动核心专利挖掘领域,提出了基于主题的时序挖掘方法,挖掘维基百科108家大型上市公司最有新颖性和影响力的专利;张群等[25]和陆萍等[26]基于 Innography强度分别对全球燃料电池车领域和高校高产出学科领域展开研究,挖掘领域的核心专利;罗爱静等[27]利用IPC分类体系和Bradford规律分析了我国中药领域核心专利技术分布;肖沪卫等[28]通过专利的技术生命周期来进行核心专利识别;美国汤森路透科技集团[29]利用专利诉讼信息来判断专利价值。

随着专利数据加工的更加细化、专业化,更多的专利文本信息可以通过专利数据库获取,对于专利分析领域就有了更加多样的选择,因此就有了更多样的核心专利识别方法。还有部分指标像申请人和发明人数量、专利实施、专利许可、专利诉讼和政府支持等数据由于可操作性较差,而较少用于核心专利的挖掘与分析中,但其在指标体系分析中占有较高权重,说明这些指标对核心专利的识别工作也能起到一定的补充作用。鉴于此,研究人员就不得不思考一个问题,怎样合理的综合应用众多专利指标进行专利价值评估或者挖掘核心专利呢?致力于将两个或者多个可能相互冲突的目标在一定的约束条件下同时达到最优化的多目标优化(Multi-objective Optimization Problem,MOP)思想为解决上述问题提供了渠道,本文将多目标优化方法应用于核心专利挖掘,并以基因工程疫苗领域为例进行了实证分析。

1 方法构建

1.1 多目标优化

较为经典的处理多目标优化问题的方法是将多目标问题转化为单目标优化问题。尽管这类方法不能充分考虑个体间的相互占优,但也能保证得到一个非劣解集。为了更好地处理个体之间的相互关系,基于帕累托占优的样本方法和基于质量指标函数的方法相继提出,从而可以保持在各个目标之间的平衡[30]。多目标优化的最终目标是得出结果做出决策,多目标决策是同时考虑两个或者更多的可能相互冲突的目标,并在此基础上做出决策的过程。在多目标决策中,最常用的理念是帕累托占优(Pareto Dominance),假设所研究的多目标优化问题的所有目标都要求最小化,f1,f2,…,fn表示需要最小化的 n个目标,定义如下:

Pareto Dominance[30,31]:设 f,Rn→RM,x1,x2∈Ω⊆Rn称个体x1Pareto占优个体x2,当且仅当 f(x1)部分地占优于 f(x2),即对∀k∈{1,…,M},都有 fk(x1)≤fk(x2),且至少有一个 i∈{1,…,M},满足 fi(x1)<fi(x2),则称个体 x1Pareto占优个体 x2,记做 x2≺x1。

在以上概念的基础上还衍生出了帕累托最优解、强/弱帕累托占优、帕累托最优解集等相关概念[30,31]。Goldberg提出基于 Pareto Dominance关系的适应值计算方法,为群体中的个体计算一个适应值[34],至今该方法仍在多目标优化领域中普遍使用,并且基于此提出了许多基于Pareto Dominance关系的适应值分配方案[30,35]。Horn等[36]提出的定位帕累托遗传算法(Niche Pareto Genetic Algorithm,NPGA);Erickson等[37]在 NPGA算法基础上提出该算法的新版本NPGA-2算法;Knowles等[38]提出基于 Pareto Dominance关系的群体管理策略进化算法。Zitzler等[39]提出基于Indicator的多目标优化方法,通过定义质量指标函数将个体间相互占优关系转化为一个整体。该质量指标函数给帕累托最优近似解集分配一个反映其质量优劣的适应值,多目标优化的最终目标转变为优化这个表征帕累托最优解集质量的指标函数,一般该函数值越大,表示该解集质量越高[40]。

当前基于专利评价的指标已经越来越多,要想尽可能全方位地评价专利的价值就需要同时考虑多个目标因素,而这也是多目标优化理念产生的契机。超体积也被称为S测度或Lebesgue测度[41,42],多用来评价多目标优化问题的搜索结果。Basseur等[43]提出超体积指标函数模型并在流水车间问题、环形星问题和护士调度问题三个组合优化问题上得到了较好的测试结果;Zeng等[44]基于指标函数理念提出多目标路径链接算法,并在双目标流水车间调度案例中得到了较好的应用。因此本文将多目标优化方法与超体积思想应用于核心专利挖掘实践中,结合前人研究的基础上提出基于超体积指标函数的核心专利挖掘算法。

1.2 基于超体积指标函数的核心专利挖掘算法

本研究中提取专利的有效数据,并选取权利要求数量、发明人数量等总共九项指标作为核心专利识别的相关指标,并根据各指标特性归结为技术价值目标、经济价值目标、法律价值目标三类。基于上述三类目标约束条件并结合已有研究[43,44]中超体积指标函数模型思想,构建了基于超体积指标函数的核心专利挖掘算法,具体步骤如下。

1)基于二元指标函数的超体积适应值分配

为了挖掘所研究领域中的核心专利,采用基于二元指标函数的核心专利挖掘算法,分别基于专利的技术价值、经济价值和法律价值进行核心专利挖掘,为每项专利分配对应的超体积适应值。

①专利的超体积二元适应值分配

为了实现在不同价值属性下的核心专利的挖掘,采用二元指标函数为每项专利分配一个超体积二元适应值。根据专利之间相互占优关系,分为被占优与非占优两种情形进行计算。如果专利x2占优专利x1,即专利x2在所有指标上都优于另一专利x1,如图1(a)所示,图中阴影部分面积即为二元指标函数值的大小,对专利x2而言,它被专利占优,其二元指标函数值为负值;对专利x2而言,它占优专利x1,其二元指标函数值为正值。

如果专利x2和专利x1相互不占优,即专利x2没有在所有指标上都优于另一个专利x1,如图1(b)所示,对专利x1而言,图中左上方的阴影部分面积大小即为专利二元指标函数值;对专利x2而言,图中右下方的阴影部分面积大小即为专利x2二元指标函数值。然后,对于每个专利而言,根据相互占优关系,把所有的超体积二元指标函数值相加,即得到其超体积二元适应值。

图1 专利的超体积二元适应值分配[43]Fig.1 Hypervolume binary fitness allocation of patent[43]

②专利的超体积二元适应值的更新

当所研究领域有新的专利,我们需要在不同价值属性下分别更新原来的核心专利集合。让新增加的专利x与原来的所有专利,按照在不同价值属性下的相应指标值,进行相互占优关系比较。然后,根据相互占优关系,按照算法1对专利x进行超体积二元指标函数的计算。另一方面,原来的每个专利将增加与新增专利比较后的适应值,从而实现其超体积适应值的更新。

基于上述步骤对应该算法的基本框架如下所示:

算法1 基于二元指标函数的核心专利挖掘算法

输入:专利集合P(|P|=n)及其指标值,i=1,…,p

输出:核心专利集合A(|A|=m)

01:Repeat:

02:Fitness(xi← I(xi) =∑z∈p{xi}IHyp(z,xi),i=1,…,n-1;

03:Until遍历所有专利

04:A← 核心专利Fitness(xi)>Fm

05:Repeat:

06: x*← 新增专利;

07: Fitness(x*)←I(x*)=∑z∈pIHyp(z,x*),i=1,…,n;

08: Fitness(xi)←Fitness(xi)+IHyp(x*,xi),i=1,…,n;

09:Until遍历所有新增专利

10:A←核心专利 Fitness(xi)>Fm

如算法1所示,所研究领域中共包含n个专利。根据专利的技术价值(f1)、专利的经济价值(f2)和专利的法律价值(f3),我们分别采用二元指标函数为每个专利分配一个不同价值属性的二元超体积适应值I(xi)。然后,根据预先设定的核心专利数量m,得到其超体积适应值满足Fitness(xi)>Fm的不同价值属性下的核心专利集合A。

2)基于超体积指标函数进行核心专利挖掘

步骤(1)我们分别实现了基于专利的技术价值、专利的经济价值和专利的法律价值的核心专利挖掘,并给出了每一项专利在不同价值目标下的超体积二元适应值。接下来,我们将通过基于超体积指标函数的核心专利挖掘算法,整合专利的技术价值、经济价值、法律价值三类目标,基于已获得的各项专利在三类目标下对应的超体积适应值,在此提出基于超体积指标函数的核心专利挖掘算法,计算理念与前文一致,同样是分为了适应值分配与适应值更新两个步骤,具体如下:

①专利的超体积适应值分配

为了从综合维度实现核心专利挖掘,在此基于超体积指标函数为每个专利分配一个超体积适应值,继而根据最终的综合指标值进行核心专利抽取。与步骤(1)相仿,根据专利之间相互占优关系,把所有专利分为被占优集和非占优集两个集合。

对于被占优集中的每项专利,在非占优集中找出所有占优于该专利的专利(至少存在一个),然后分别计算相对于被占优集专利的优势,从中选择相对优势最大的那个。如图2(a)所示,由于专利x被三个非占优专利占优,其中专利y与专利x的相对优势最大。因此,计算相对优势最大的那一部分(图中阴影部分)的面积,由于专利x属于被占优集,即赋予这部分面积的负值,该值就是专利x的适应值。

图2 专利的超体积适应值的分配[44]Fig.2 Hypervolume fitness allocation of patent[44]

对于非占优集里面的每个专利,把只属于该专利且不属于其他任何非占优专利的那部分超体积大小,作为该专利的超体积适应值。如图2(b)所示,图中阴影部分的面积为非占优专利x的超体积适应值,由于专利x属于非占优集且对所有专利的超体积有贡献,该专利的适应值为正值。

②专利的超体积适应值的更新

当所研究领域有新的专利,我们需要更新原来的核心专利集合。如图3(a)所示,红色的点表示属于非占优集的专利,蓝色的点表示属于被占优解集的专利,黑色的点表示新加入群体的专利x。由于专利x属于被占优集,图中蓝色部分的面积为被占优专利x的超体积适应值的大小,且该适应值为负值。由于新增专利x属于被占优集,所有专利的超体积适应值不需要更新。

图3 专利的超体积适应值更新Fig.3 Hypervolume fitness update of patent

如图3(b)所示,其中专利x属于非占优集,在二维平面上,对专利x来说仅有两个非占优区域,找出在非占优集中受影响的两个专利y0和y1,它们的超体积适应值由于专利x的加入而变小,即减去图中灰色部分的面积,专利x的超体积适应值即为红色部分的面积大小。

对应上述步骤的算法的基本框架如下所示:

算法2 基于超体积指标函数的核心专利挖掘算法

输入:专利集合P(|P|=n)及其三类目标值f1、f2和 f3

输出:核心专利集合A(|A|=m)

01:Repeat:

02:Fitness(xi)←为每个专利分配超体积适应值 Hyp(xi),i=1,…,n;

03:Until遍历所有专利

04:A← 核心专利 Fitness(xi)>Fm

05:Repeat:

06:x*← 新增专利;

07:Fitness(x*)← 计算该专利x*的超体积适应值 Hyp(x*);

08:Fitness(xi)←更新超体积适应值受到影响的非占优专利的适应值;

09:Until遍历所有新增专利

10:A←核心专利 Fitness(xi)>Fm

如算法2所示,所研究领域中共包含n个专利。根据算法1得到的专利的技术价值(f1)、专利的经济价值(f2)和专利的法律价值(f3),我们采用超体积指标函数(Hypervolume-Indicator)为每个专利分配以一个表征其价值的超体积适应值Hyp(xi)。然后,根据预先设定的核心专利数量m,得到其超体积适应值满足Fitness(xi)>Fm的核心专利集合A。该集合即为本文最终识别出的核心专利集合。

近年来我国明确大力发展生物医药行业,疫苗是该行业的重要子产业更是治疗疾病的有效武器,而基因工程疫苗是在传统疫苗的基础上发展而来的新兴疫苗,具有广阔的研究前景。因此为了验证本文在多目标优化理论下所引入的基于超体积指标函数的核心专利挖掘算法,并以基因工程疫苗领域为例,挖掘该领域的核心专利技术,以期分析当前的研究进展。

2 实证分析

1)数据收集

本文选取基因工程疫苗领域的专利数据作为研究对象,通过incoPat科技创新情报平台进行数据收集。基于前期对基因工程疫苗领域主题要素的调研,构建了详细的检索式,通过检索共得到2159项基因工程疫苗专利数据,该数据集中包括专利的标题、摘要、权利要求数量、法律状态等多项数据类型,检索日期2017年6月5日。

2)指标归类

本文选取权利要求数量、发明人数量、IPC数量、家族被引证次数、简单同族个数、是否转让、是否许可、专利有效性和剩余时间(月),共九项指标作为核心专利识别的指标数据。虽然专利IPC号的数量不是常用的核心专利判断指标,但在此处之所以要把IPC数量考虑在内,一是随着专利分类标准越来越精准之后,专利的IPC数量能从一定程度上表征专利的技术特征,再者本文使用多目标优化策略,旨在尽可能涵盖更多的专利有效数据,使得分析结果更加全面。根据专利各项指标功能特性,我们对这九个指标进行了分类:第一类指标为专利的技术价值,包含权利要求数量、发明人数量、IPC数量、家族被引证次数四项指标;第二类指标为专利的经济价值,包含简单同族个数、是否转让、是否许可三项指标;第三类指标为专利的法律价值,包含专利有效性、剩余时间(月)三项指标。三类指标的含义及其分类如表1所示。

3)数据标准化

由于以上9项指标数据的原始数值具有较大差异的量纲,因此本文对该数据表中的各列数据进行了归一化处理,选取的方法为离差标准化方法,即每一列数据的处理方式为当前格值减去该列数据的最小值与当前列的极差值的比值,表达式如下:

其中,max表示该列数据的最大值,min表示该列数据的最小值,x为某一格值。结果如表2所示。

4)核心专利挖掘

根据上文构建的基于超体积指标函数的多目标优化算法,在此分三步进行基因工程疫苗领域的核心专利挖掘研究。首先分别对专利的技术价值、经济价值、法律价值三个目标进行多目标优化测算(计算结果分别对应表3中的fitness1/2/3列);然后再以上述三目标作为最终核心专利挖掘的指标进行计算(计算结果对应表3中的objective function数据列);最后根据目标函数列选定得分最高的前200项专利为本文识别的基因工程疫苗领域的核心专利。结果如表3所示。

表1 相关指标含义Tab.1 Meaning of related indicators

表2 数据归一化Tab.2 Data normalization

表3 基因工程疫苗领域的核心专利Tab.3 Core patents of genetically engineered vaccines

从表3可以看出,在此识别出基因工程疫苗领域的核心专利中可以看出主要领域有病毒类疫苗的制备与应用(腺病毒载体SARS疫苗及其制备方法等)、核酸疫苗相关技术与应用(一种经黏膜使用的HSV-2 DNA疫苗及其制备方法和应用等)、基因工程载体疫苗相关技术(冻干剂型艾滋病重组痘病毒安卡拉株载体疫苗及其制备方法等)、树突状细胞疫苗相关技术(一种树突细胞靶向的pH响应型DNA疫苗递送系统及制备方法)等。

为了进一步分析各个指标下的核心专利分布情况,本文研究了三类指标下的分别对应的高得分专利。表4~6分别为基因工程疫苗领域的相关专利对应技术价值(fitness1)、经济价值(fitness2)和法律价值(fitness3)三类指标下得分靠前的5项专利的标题、摘要核心词和得分结果数据。

观察表4中的fitness1得分较高的五项专利数据特征可以发现,每一项专利在fitness1的所对应的四项基础数据中均存在至少一项数据处于整个数据集合中的较高值,而且每项专利均有较高的技术特性比如第三项专利在摘要中就明确提出该专利属于疫苗生产制备工艺的技术领域,其他几项专利也对应着很强的应用和实践说明。

表4 技术价值目标高得分专利Tab.4 High-scoring technology value patent

表5 经济价值目标高得分专利Tab.5 High-scoring economic value patent

专利“非整合型逆转录病毒载体疫苗”因为是对方法的具体描述,因此具有更多的权利要求数量;专利“从邻近启动子的基因表达保护性抗原的呼吸道合胞病毒疫苗”详细描绘了呼吸道合胞病毒疫苗的工作原理,因此对于权利要求数量的设置也较多,权利要求项的设置往往体现的是专利技术密集程度,因此具有更多技术要求项也能从很大层面上表征专利的技术价值;专利“皮内注射用重组乙型肝炎卡介苗联合疫苗及制备方法”是具体的乙肝卡介苗联合疫苗的生产制备的技术所参与的人员较多说明是集合众研究人员的集体智慧的结晶,因此具有更高的技术价值;专利“用于预防猪水肿病的疫苗”具有更多的IPC数量,IPC是对专利的功能或者应用领域的界定,因此具有更多的IPC数量能够体现专利具有更加广阔的功能和应用情景,从而具有更高的技术实践价值;专利“非A和非B肝炎病毒的诊断及疫苗”具有较高的家族被引证数量,专利被引较多可以说明该专利被社会环境关注和认可,具有更高的影响力和实践基础。

表6 法律价值目标高得分专利Tab.6 High-scoring legal value patent

从表5中可以看出,经济价值目标得分较高的专利多数已经在社会市场中通过转让或者许可等方式产生了实际的效益,专利的转让和许可是专利经济价值体现的主要方式,同时专利的同族专利数量也可以反映该专利具有进行高投入的经济潜力。

专利“一种重组禽流感细胞源灭活疫苗抗原病毒含量的测定方法”提供了测定禽流感抗原病毒含量的有效的测定方法,这对于该领域疫苗生产而言具有广泛的应用性,因此专利转让和许可频次较多;专利“负载重组人HSP70多肽复合物的树突状细胞疫苗、制备方法与应用”是对抗肿瘤疫苗的制备和应用的说明,对于肿瘤系列药品生产而言是必不可少的,因此也发生了专利的大量转让和许可;专利“腺病毒载体SARS疫苗及其制备方法,冠状病毒S基因的应用”主要对腺病毒载体SARS疫苗生产制备流程和应用场景进行了介绍,正在投入临床应用的阶段,虽然未发生专利的转让,但发生了较多的专利许可,说明该专利在SARS疫苗生产中重要的一环;专利“表达禽流感病毒H9亚型HA蛋白的重组新城疫病毒LaSota弱毒疫苗株”是充分结合现实社会中禽流感疾病发病案例的基础上,运用重组蛋白的方法制备新城疫疫苗,并对该疫苗在禽流感和新城疫预防中的应用做了说明,该专利在新疫苗生产中重要基础因此发生了多次专利的许可,体现了较高的经济价值;专利“表达传染性法氏囊病毒VP2基因的重组新城疫LaSota弱毒疫苗株”与上一专利有些类似也是对重组新城疫疫苗的主题专利,该专利主要是对于如何制备重组新城疫LaSota弱毒疫苗株的方法的详细介绍,同时对于该疫苗株在疾病预防中的应用进行了介绍,从数据上来看,该专利具有比前面几个专利更多的简单同族专利,而且也产生了较高层次的专利许可,该专利更加侧重疫苗制备的原理因此具有更为广阔的市场占有和生产应用。

专利的价值除了以上两个面向专利本身的技术价值和经济价值之外,还应该具有更加重要的面向市场环境的法律价值,一项专利只有具备时效性才能够保证自身的经济效益,也只有有效的专利才具有更为广阔的市场发展前景。同样对于具有法律效力的专利如果具有更长的专利有效期,可以反映该专利具有更多的剩余价值,随着市场的不断拓展也会产生更加无法预测的价值。

表6中列出了本文基于专利的法律价值目标得分较高的专利,具体如下。专利“一种经黏膜使用的HSV-2 DNA疫苗及其制备方法和应用”详细介绍了HSV-2 DNA疫苗的原理以及制备方法,并对该疫苗的特性和市场应用进行了说明;专利“一种树突细胞靶向的pH响应型DNA疫苗递送系统及制备方法”隶属于药物制剂领域和基因疫苗载体给药领域,对通过树突细胞靶向的pH响应型DNA疫苗递送系统原理进行了详细说明,对于促进DNA释放提高基因转染效率具有重要意义;专利“一种针对羊种3型布鲁氏菌感染的DNA疫苗及其制备方法”是针对羊种3型布鲁氏菌感染病实际案例中通过分离DNA片段制取DNA疫苗从而有效预防控制疾病的说明;专利“一种兔支气管败血波氏杆菌基因工程亚单位疫苗”是为了预防和治疗由于败血波氏杆菌引起的兔支气管疾病的基因工程亚单位疫苗,分步说明了疫苗生产流程并对疫苗产品进行了临床验证,效果显著;专利“一种重组弱毒肠炎沙门氏菌疫苗”主要是对于肠炎预防治中弱毒肠炎沙门氏菌疫苗的效用和疫苗的和优势进行了说明。可以发现以上几类疫苗多是针对于具体流行疾病中疫苗制备原理和疫苗应用市场进行了说明,能较好的与实际应用有效结合,因此在专利有效性的基础上也具有相对较长时间的专利剩余价值。

综上可以发现本文通过对专利的技术价值、经济价值和法律价值三个层面的核心专利识别,再结合专利本身的特征,发现该识别结果具有较为理想的解释准确性,比对发现本文的识别结果与前期研究文献[46]也具有较好的一致性。结合以上三个层面对基因工程疫苗领域的所有专利进行综合识别,最终识别出200项核心专利。

3 结语

本文在总结了单指标评价核心专利的片面性以及常规综合指标评价核心专利主观性导向的弊端前提下,结合多目标优化理论,提出基于超体积指标函数的核心专利挖掘算法。在此选取了当前科学研究热点基因工程疫苗领域作为分析对象,根据基于超体积指标函数的多目标优化算法进行核心专利挖掘,最终识别出CN200410044285.5(腺病毒载体SARS疫苗及其制备方法,冠状病毒S基因的应用)等200项基因工程疫苗领域的核心专利,对于全面的了解该领域的当前研究形式具有一定的实践价值,也为当前的核心专利识别提供了一定借鉴。

研究基于多目标优化的核心专利识别方法以三个目标约束作为切入点,综合考虑了专利的技术、法律、经济价值,比传统的综合指标识别方法更为凝练。但该研究仍然存在不足之处:对于当前专利文本数据的挖掘方面还不够精确,对于政策数据的采集处理尚处于探索阶段,对于识别结果的区分度细化等问题会在接下来的工作中继续展开。在后续研究中将会从以下方面展开,首先是对指标权重的更精细化设定,再者基于市场环境数据分析技术产业化潜力从而进一步促进核心专利的转移转化。

猜你喜欢
专利体积疫苗
专利
多法并举测量固体体积
HPV疫苗,打不打,怎么打
聚焦立体几何中的体积问题
我是疫苗,认识一下呗!
我是疫苗,认识一下呗!
我是疫苗,认识一下呗!
专利文摘
小体积带来超高便携性 Teufel Cinebar One
谁的体积大