基于专利动态特征的技术转移潜力识别研究

2021-06-21 02:31:28许海云李姝影

农业图书情报学刊 2021年6期

许轶，李婧，许海云，李姝影

(中国科学院成都文献情报中心,成都 610041)

1 引言

技术转移是指知识或技术通过某种载体（人、物、信息）在国家、地区、行业、科研生产内部或之间的输出和输入过程。技术转移是实现技术有效利用的重要手段，也是将科技成果转变成现实生产力并实现其经济价值的基本途径[1]。专利作为世界上最大的技术信息源，包含了世界科学技术信息总量的90%～95%，是公认的知识和技术创新重要结晶和载体[2]。目前专利的许可和转让已经成为转移数量最多、创新性强和市场认可度高的技术转移方式[3]。

高校和科研院所是创新的原始发源地，储备了大量的专利技术，仅2020 年Incopat 专利数据库中检索其获得发明授权专利148 928 件，但当年有效发明专利转让和许可率均未超过6.7%[4]，绝大多数专利未实现技术产业化。对于当前技术领域分布广、管理资源有限的高校和科研院所来说，如何在海量的专利申请中准确识别可转移的专利技术进行精准高效的运营是当前专利管理工作面临的一大难题。

专利动态特征是从提交专利申请到审批、维持直至失效的生命周期内处于动态演变的特征属性[5]，专利动态特征随技术知识的扩散呈现动态演变，其价值和影响力也并不是一成不变的。而专利转移的预测往往需要参考专利价值水平。因此，揭示与专利转移相关的动态特征，用动态发展的视角为识别专利技术转移潜力提供更为科学合理的方法，帮助高校和科研院所开展有效的专利分级管理和精准产业化，对盘活高校院所专利存量，发挥其在创新驱动中的引领作用具有重要的现实意义。

2 文献综述

2.1 专利引文网络研究

专利引文是当某项专利文献公布时，在专利文本中列出的与该专利申请相关的其他文献，包括专利文献和科技期刊、论文、著作、会议论文等非专利文献。专利引用关系反映了某件专利研发的技术基础和科学基础，体现了技术之间的累积和传承关系。专利之间的引证关系形成了引文网络，专利引文网络是知识传播的重要途径。当前，研究专利引文已经成为专利信息分析研究的重要组成部分[6]。已有分析大都继承了文献计量学的研究手段，提出了诸如被引次数、科学关联度、技术生命周期、专利引用的外延性指数等分析指标[7-9]。还有一些研究从社会网络学的角度，基于专利引用关系构建网络模型，揭示和分析隐藏的创新系统构建方式以及知识流动模式。其中，识别重要专利是重要的应用之一。WANG[10]分析不同的技术发展阶段的专利引证网络节点的中介和闭合位置对其专利价值的影响。专利引文分析有助于识别新兴技术以及重点专利，但目前在方法层面仍存在一定的局限性。

2.2 专利技术转移识别研究

总体来说，对具有转移潜力的专利技术预测的核心因素之一在于对专利技术质量和价值的识别。近年来国内外研究人员从宏观、中观、微观层面不断探索识别具备转移潜力的专利技术的方法。部分学者从专利价值评估的角度探讨专利可转移性问题，认为具有高价值的专利更具有可转移性，通过研究高价值专利的认定，实现可转移专利的识别。

随着专利研究的不断发展，尤其是针对专家智慧法的不足，一些学者提出了运用专利指标体系法开展专利价值评估。SOHN[11]基于技术开发者、技术接受者和环境因素3 个方面构建技术转移的预测模型，有学者[12]从技术许可方角度建立了专利评价体系，上述研究包含了大量经济与市场评价，如技术转移者的经验、研究者经验、技术接受者市场能力、企业技术市值、新产品导入频率等，这些指标很难单纯从专利文献计量中获取实测值。美国CHI Research 公司提出专利数量、同族专利指数、专利成长率、技术重心指数、专利引证数等11 项专利量化指标，评估机构专利的价值。TONG[13]发现专利权利要求数量越多，技术创新能力越强。王天歌等[14]基于被引次数、权利要求数、同族专利国家数等指标用于识别核心专利技术。上述研究多基于专利文献本身性质设置可量化的指标，针对专利特征属性进行了多角度的研究，但总体上对专利价值的探讨过于片面，不够细致。

PARK 等[15]提出了利用TRIZ 演化趋势作为评估技术的标准，识别可能发生技术转移的专利。WANG[16]用多维决策和二元语义分析设计了航空发动机涡轮制造方法类专利技术转移可行性评价模型。但上述方法都还处于探索阶段，对处理的数据规模存在限制。部分学者运用专利引文分析法来识别具有转移潜力的技术。PARK 等[17]将技术与产业之间的关系作为量化指标，从知识流动的角度研究了技术转移的可能性。CHOI等[18]利用网络关联度、特征向量、新颖性作为评价指标提出了预测技术转移的综合模型。张克群等[19]采用引文网络分析了专利的外向度数中心性、内向度数中心性、内向接近中心性和有效规模等指标对专利价值的影响。专利引文分析有助于识别新兴技术以及重点专利，但所采用的指标，如度中心性，计算简单，仅仅依据邻居信息判断节点的重要性，且在多数情况下，网络中的大量节点容易被赋予相同的度值，基于度中心性的排序常常难以将这些节点的重要性区分开来。因而在很多情况下精准度不够高。

3 研究方法

3.1 识别指标的选取

本文认为专利技术转移潜力是动态变化的，其产业化成熟度随着技术发展和知识传播而动态发展。专利之间的引证关系反映了技术知识的流动，体现了其对后续技术的影响力。并且，随着时间的推移，先前专利（先有技术）被后续专利（在后发明）引用的情况也随之变化，因此专利技术影响力应该是动态发展的（图1）。

图1 专利引用网络动态示意图Fig.1 The dynamic schematic diagram of the patent citation network

专利的大多数静态特征在专利申请时就已确定，如权利要求数量、申请人数量、发明人数量等，而专利的动态关系是随着以下两个因素发展而成的：一是与先前专利和后续专利的引证关系变化（包括直接引用和间接引用等结构化数据），二是基于产品布局战略而引起的专利家族的变化。高校院所专利能否转移与其法律、技术和市场3 种因素密切相关。本文将专利转移潜力视为静态特征和动态关系的结合，在已有的研究基础上，从动态发展的视角设计专利技术转移预测评价指标体系（表1）。以下将重点动态关系指标进行阐释。

表1 专利技术转移评价指标体系Table1 Evaluation index system for patent technology transfer

3.1.1 局部网络特征与专利技术转移潜力

专利引用网络中的“节点”即各件专利，“连接”即各专利自引和他引的关系；专利直接引文网络是一种有向网络，对知识流动、创新传播研究具有重要价值[20]。专利引文网络节点自身及其邻域节点的结构属性可用于度量节点技术重要性和对信息的控制力。

度数中心性（Degree Centrality）指网络中一个节点所有链接的数量，如果节点的邻居规模越大则该节点越重要[21]。专利引文网络中具有较高度数中心性的节点，表示其与更多专利具有直接的联系，获取资源的能力更强。

其中，mij表示与节点i 相连的边。

结构洞（Structural Hole）是Burt 基于“弱连接”基础上提出的，他认为处于结构洞位置的个体连接了不同的群体和资源，占据结构洞越多的节点会获得更多的竞争优势和网络控制能力[22,23]，结构洞约束系数用于描述网络中某个节点与其他节点直接或间接联系的紧密程度。专利引用网络中，处于结构洞位置的专利在不同群组或节点之间传递资源或信息，因此更容易导致新技术的产生、促进技术发展。

约束度计算公式为

其中，节点q 是节点i 和节点j 的共同邻接点，Cij表示在节点i 的所有邻接点中节点j 所占的权重比例。则节点i 的网络约束系数为

3.1.2 网络全局属性与专利技术转移潜力

基于专利引用网络的全局结构信息可以更全面地衡量某节点获取资源、控制资源的能力，本文引入了社会网络分析中常用的中心性度量方法——接近中心性和中介中心性。

接近中心性（Closeness Centrality）表示节点i 到其他节点距离的平均值的倒数[24]，用于反映节点不受其他节点控制的能力。专利引文网络中，一件专利的接近中心性越大，说明该专利不受其他专利影响的能力越强，在网络中越处于中心位置。节点q 的接近中心性计算公式为

其中，dij表示节点i 到节点j 的距离。

中介中心性（Betweenness Centrality）[25]利用担任其它两个节点之间最短路的桥梁的次数来评估节点的重要性，反映了知识传播过程中重要节点对整个网络中信息流的控制能力。专利引文网络中，中介中心性越高，说明该专利对其他专利的影响力越强。节点q的中介中心性计算公式为

其中，gij表示节点i 到节点j 的最短路径数目，gij(q)表示节点i 到节点j 途中经过节点q 的最短路径数目；Bij(q)表示节点q 能控制节点i 和节点j 的能力。

3.1.3 专利布局与专利技术转移潜力

专利家族规模是指专利家族涵盖的专利申请数量。专利的申请和维护需要付出人力和经济成本，只有当专利技术越重要，专利权人才会围绕该技术布局多件专利，以实现技术垄断性。专利家族规模是随着技术创新发展和技术重要性的提高而逐步扩大的。

专利家族覆盖国家数量用于表征专利保护的地域范围。专利保护具有地域性，专利权人需要在多个相关法律管辖区申请保护才能避免被侵权，这需要专利权人支付高昂的费用。专利保护的地域范围越宽，说明该专利的产业化潜力越大。

3.2 构建技术转移预测模型

决策树是一种典型的机器学习分类方法。首先对数据进行处理，利用归纳算法生成可读的规则和决策树，然后使用决策规则对新数据进行分析。本质上决策树是通过一系列规则对数据进行分类的过程。决策树构造分两步进行。第一步，决策树的生成：由训练样本集生成决策树的过程。一般情况下，训练样本数据集是根据实际需要有历史的、有一定综合程度的，用于数据分析处理的数据集。决策树的生成就是不断的选择最优的特征对训练集进行划分，是一个递归的过程。第二步，决策树的剪枝：决策树的剪枝是对上一阶段生成的决策树进行检验、校正和修下的过程，主要是用新的样本数据集中的数据（测试集）校验决策树生成过程中产生的初步规则，将影响预衡准确性的分枝剪除[26]。

决策树中的每一个判断节点对应数据集的某一属性，越靠近根节点的属性对于分类结果越重要。因此，基于决策树算法直观的逻辑推导过程，可以对专利技术转移影响因素的重要程度进行研究。

已发生转让或许可的专利是被实践证明具有转移转化潜力的技术。因此本文采用专利转让和许可数据作为技术转移潜力的代理变量，用于预测专利技术“能”或“不能”转移转化。因变量Y 是分类变量，当专利发生交易行为时，因变量Y 取值为“1”，专利未曾发生交易行为时，因变量Y 取值为“0”。自变量则为表1 中列出的指标（X1，X2，……）。在交易专利集和迄今未发生交易行为的专利集中分别随机取样，构建训练样本集和测试样本集。

4 实证研究

为了评估专利转移转化预测模型的效果，验证该模型在院所高校专利分级管理中的可行性和有效性，本文选取石墨烯传感器领域的专利为研究对象进行实证研究。本文的专利交易包括专利转让、许可、质押等法律事件。

实证过程中，专利基本数据和专利引用数据来源于德温特创新平台（Derwent Innovation），中国的专利转让、许可和质押数据来源于IncoPat 科技创新情报平台，美国、欧洲专利局、德国的受理专利的交易数据来源于Relecura 专利检索分析数据库。截至检索日（2018 年11 月），石墨烯传感器技术全球专利共计4 120 项家族，专利申请共计6 643 个，其中中国、美国、欧洲专利局、德国受理的专利中发生交易的专利申请共计372 个。

根据检索得到石墨烯传感器相关专利的引用数据，利用Pajek 软件构建专利引用关系图谱。节点代表专利申请，连线表示各专利申请之前存在的引用关联，连线的粗细是引用强度的反映，及引用次数与连线粗细成正比。连线的箭头方向代表引用关系发生的方向。本文借助社会网络分析工具Pajek 对数据进行分析，计算网络节点影响力指标。本文认为专利在其交易发生年的引文网络指标达到了转移转化的标准，故交易专利的引文网络动态指标均采集于交易发生年的引用关系图谱（表2）。

表2 石墨烯传感器专利技术转移评价指标值示例Table2 Examples of evaluation index values of patent technology transfer of graphene sensors

表2 （续）Table 2 （continued）

在交易专利集和迄今未发生交易行为的专利集中分别随机取样，构建训练样本集和测试样本集。训练样本集专利数量为375 个，测试样本集为251 个。输入机器学习程序，构建决策树模型。

如图2 所示决策树模型，图块的颜色代表了判断方向，黄色为Ture，蓝色为False。图块颜色深浅代表了分类效果，颜色越深，分类效果越好。

图2 决策树分节点图示Fig.2 Diagram of decision tree model sub-nodes of patent technology transfer of graphene sensors

结果显示，该决策树模型共有57 个叶节点。树型结构的第一层是按照研究对象的内向度数中心性（X6，X4）来进行拆分，所以在本文对专利转化价值影响最大的因素是内向度数中心性（X6）。其次是外向度数中心性（X3，X5）、内向接近度数中心性（X8）、外向接近中心性（X7）和专利年龄（X13）。这些指标位于决策树顶端、分类的Sample 数量多、且大部分分类结果区分度大，说明这些指标对于分类预测具有重要影响。其中内向度数中心性（X6）、外向度数中心性（X5）、内向接近中心性（X8）、外向接近中心性（X7）均为专利引文网络计算得到的指标，可见专利引文网络指标成为对专利价值分类的重要判断因素。

而中介中心性（X9）、结构洞约束系数（X10）、权利要求稳定性（X14）并未出现在决策树模型中，这说明在本次测试的样本集中，上述3 个指标对判断专利转移转化价值的影响不显著。本文专利转移转化预测模型检验效果如下。该预测模型准确率（Accuracy）为0.90，说明正确预测的正反例数在总数中的占比达到90%，这表明模型较为可靠。通常认为AUC 值介于0.5 到1.0 之间，较大的AUC 代表了较好的分类预测效果，本文的模型AUC 值为0.887，实现了较好的分类预测效果。Kappa 检测用于测量两次判断的一致性，即两个判断的结果是否相似，Kappa＞0，此时说明有意义，Kappa 值愈大，说明一致性愈好；Kappa≥0.75，说明已经取得了相当满意的一致程度。本文Kappa 为0.79，说明结果一致性较好。命中率（Precision）、覆盖率（Recall）等指标平均值也达到0.9 以上，说明模型预测效果较好（表3、表4）。

表3 预测模型准确值及AUC 值Table 3 Accurate value and AUC value of prediction model

表4 预测模型评估指标Table 4 Evaluation indicators of the prediction model

从根节点开始，对实例的某一特征进行测试，根据测试结果，将实例分配到其子结点；这时，每一个子结点对应着该特征的一个取值。如此递归地对实例进行测试并分配，直至达到叶结点。最后将实例分配到叶结点的类中。

本文中，决策树分析法对于14 种维度进行考量，对于不同的维度分配不同的概率，然后根据不同情况下的概率值进行专利转移转化价值的计算，这样使最终得到的专利评估值更加接近真实值，为专利的成功转化提供条件，使未经商业化的新技术的运用成为可能。将所得的预测模型应用于石墨烯电容器领域现有专利（共计6 107个）转移转化预测，其中共预测出1 197 个专利申请具有转移转化的可能。

5 结论与展望

本文的目的是构建技术转移的预测模型，需要确定预测模型的重要变量。在本文中，我们从统计学角度进行了选择技术转移的预测模型的重要变量，提出了一种预测专利分析的技术转移模型，基于统计分析和机器学习的回归分析和决策树建模。为了找到更具体的关系，利用决策树模型用于定位各个变量对技术转移的影响。通过该模型，高校和科研院所可以根据研究所得的重要指标来动态监测专利转移转化可能性的变化，可针对性地提前制定转移转化方案。

在下一步工作安排中，数据规模可以进一步扩大，对模型设计的科学性以及方法运用的有效性还有待进一步的研究。评价指标可更丰富，研究不同领域指标敏感度的差异性。同时，将专利价值指标中考虑技术发展阶段，不同技术发展阶段面临不同的指标判断组合。