产学研关联创新技术主题分析及实证研究

2020-08-13 07:05李姝影许海云朱月仙
科技管理研究 2020年14期
关键词:专利技术产学研石墨

李姝影,张 鑫,许 轶,许海云,张 娴,朱月仙

(中国科学院成都文献情报中心,四川成都 610041)

1 研究背景

在我国新经济形势与需要下,提升高质量产学研科技供给是满足创新经济需求、建设现代化经济体系、显著增强我国经济质量优势的关键所在。研发与制造的协调发展是创新的重要来源和驱动,基础研究与应用研究的交叉流动有助于技术成果早期商业化。目前,企业作为创新主体,其技术创新能力还存在多重短板,与大学/科研院所的技术衔接及合作创新需求较为迫切,有必要促进产学研创新的集群式发展,产出更多有助于企业发展所需的科学技术成果。因此,识别与研究产学研创新主体潜在关联的技术主题,有助于不断扩展产学研创新主体在知识生产与技术创新的合作广度和深度,使高校和科研机构产出更多有助于企业创新所需的科学技术成果,而企业也更容易找到适合的研发合作对象。

企业、大学、研究机构作为创新主体,研究他们之间的知识流动、技术转移以及合作网络,有助于分析创新主体间的知识传递、知识交互、资源共享的机理[1-2]。在产学研创新网络中,基于文献计量分析常见的产学研关联场景包括:合作专利申请、技术领域交叉共现以及技术相似度。其中,从专利文献中抽取有价值的技术信息,利用专利分析来研究产学研创新主体关联的相关研究取得了较大进展,例如产学研合作发明创新网络、基于国际专利(IPC)共现网络和区域-技术二模网络研究产学研合作专利技术发展趋势等[3-6],目前相对较为成熟的研究主要基于专利权人合作网络和领域共类网络,以单模网络为主,能够很好地揭示显性的关联创新主题。其次,产学研机构与专利技术的二模网络有助于研究产学研关联创新活动,例如许海云等[7-9]提出基于扩展多模数据分析,综合考虑产学研机构的技术关联分析、机构间竞争地位分析、合作网络中机构间核心边缘分析以及机构类型辅助挖掘潜在合作主题及其关系;傅俊英等[10]基于引文分析与文本挖掘构建专利与专利权人之间的异构网络;Chang[11]利用国家和产学研合作专利二模网络分析,探讨了不同时期技术网络的合作发展趋势以及关键技术领域。产学研关联创新主题研究主要是在共类和合作主题方面探索较多,对潜在隐性的关联创新主题识别方法较少。

目前研究专利技术主题的分析方法较为丰富,定量分析方法在很大程度上推动了具有文本表示功能的主题特征的抽取与识别,主要包括引文分析、共现分析和文本挖掘等方法[12]。引文分析的主要思路是利用专利引文耦合关系作为技术相似性判断依据来探究技术之间关联关系,发掘机构间技术的高度相似性[13-14];共现分析基于专利共类计算技术接近性以发现企业潜在的研发伙伴及技术组合[15];文本挖掘方法计算特征向量之间的相似度[16-17]。为了提升技术主题细粒度和分类的准确性,定量和定性方法在不断地改进优化,复合型方法促进了产学研关联创新主题识别的精细化发展,例如结合数据挖掘、社会网络分析、共现分析等方法,构建了专利权人-技术交叉共现网络,判断权利人在技术上的技术交叉程度,并寻找有望构建专利组合的潜在技术和建立合作关系的专利主体[18-19]。鉴于在专利技术主题的实际分析过程中现有方法面临诸多挑战:专利文本自动化处理结果的清洗与解读工作量巨大[20],词频较高且趋于稳定的主题词不能揭示技术新趋势[7],术语来源与选择策略将对聚类或文本分类的结果产生显著的影响[21],可见现有方法主要的不足在于专利技术主题识别的效率以及准确性,所揭示的关联创新主题粒度较粗。

为了解决上述问题,本研究基于核心专利集识别专利技术主题,以机构-技术二模共现网络分析企业、大学和研究机构之间的相似技术主题,并以石墨烯在生物医药的应用作为实证领域,探索分析和研究产学研关联创新的热点主题和潜在合作对象,以便帮助产学研创新主体了解关联创新趋势,推动学术界与产业界的技术对接与合作。

2 研究方法与样本选择

2.1 研究方法

本研究主要采用专利分析方法,以产学研潜在的创新关联主题为研究对象,研究除了专利权人合作网络、领域共类分析所揭示的显性创新关联之外潜在的隐性技术关联,即企业、大学、研究机构之间相似的专利技术主题,以便探讨产学研关联互补的可能,研究分析产学研关联创新合作的潜力。主要的研究思路借鉴前人的核心专利文献集合以及专利技术组合识别方法[22-24],基本步骤如下(见图1):第一,基于核心专利集合利用德温特数据分析器(Derwent Data Analyzer)抽取标题、摘要以及技术要点中的技术特征词,经过文本预处理、数据清洗,获取技术特征词;第二,利用向量空间模型构建专利与技术特征词矩阵,矩阵权重为术语频率-反向文档频率(term frequency-inverse document frequency,TF-IDF),利用UCINET聚类生成专利技术主题;第三,构建机构与专利技术主题的二模网络,将拥有类似专利技术主题的机构进行聚类,识别与分析相应的企业、研究机构和大学等不同类型机构的潜在关联创新主题和合作对象。

图1 产学研关联创新专利技术主题分析的技术路线

2.2 样本选取

核心专利集包含了领域中重要的技术关键词、对后续技术发展具有重要影响的技术要素,以及具有代表性的技术术语,专利引文信息能衡量专利技术价值、协助技术规避设计,基于引文关系的技术网络更有助于挖掘核心技术要素,因此,本文采用了基于核心专利集抽取专利语义特征作为技术主题分析的目标集合[25],不仅有助于提升特征选取的效率,又强调了领域内重要的技术特征词在技术专利网络中的关键作用。本研究基于Ha等[23]提出的专利引文强度指标设计了两项判定规则,如图2所示。其中,P1被P3、P4和P6引用,频次均为1(表示为C1,3=C1,4=C1,6=1),若C1,j=0,则j取值1、2、5、7、8、9。以此类推,直接引用可表示为:Cij=1;间接引用可表示为:若Cij≠1,但是Ci,k=1且Ck,j=1,则Pi和Pj呈现间接引用关系。利用线性关系公式表达为:若n>0,则若n=0,则V(P)=0,其中V(P)为专利p的引用强度,n为专利直接被引频次,Qi为1~n项施引专利。

图2 专利引文网络示例

判定规则一:基于引用重要性确定专利强度指标,根据β间接引用的参数权重来筛选专利引文强度前100位(Top100)的核心专利集。分别使β取值为0、0.3、0.5、0.7、1计算专利强度值取并集:若β=1,直接引用=间接引用;若β=0,只计算直接引用。

判定规则二:为了克服引用滞后性(即越早申请的专利,专利引用率越高),所选取的核心专利集的专利引用率大于同年申请专利引用最大标准差。

最后,两项规则取交集获得核心专利集。

本文选取石墨烯在生物医药领域的应用作为研究对象,基于德温特世界专利创新索引(Derwent innovation index,DII)构造检索式,主要从石墨烯在药物载体、抗菌材料、荧光标记、人造骨骼、人造皮肤、细胞培养以及造影剂等应用方面检索,获得900项专利数据,检索日期为:2017年6月7日。基于DII数据库获取每件专利的被引频次以及被引专利数据,收集直接引用和间接引用的专利数据。

利用编程计算专利引用强度指标V(p),分别取β间接引用的参数权重0、0.3、0.5、0.7、1,计算Top100的专利引用强度指标V(p)在不同引用权重下的值,5种不同情形取并集获得119项核心专利集清单。根据专利被引的平均值、标准差、极大值和极小值等描述性统计(见表1),例如一项专利申请年为2009年,它的引文频次如果大于10.53,即可被认为是核心专利;反之亦然。基于此原则筛选119项核心专利集,最终获得了86项;在识别出的86项核心专利集的基础上,利用Derwent Data Analyzer抽取核心专利集的标题、摘要以及技术要点中有意义的词或词组,通过文本预处理、数据清洗,结合专家意见和叙词表补充技术关键词,共计465个技术关键词。

表1 生物医药领域石墨烯技术专利被引的描述性统计

3 实证分析:以石墨烯在生物医药领域的应用为例

3.1 专利技术主题聚类

向量空间模型旨在表示出现在文档中各个词的权重,以便对文本进行分类。通常使用TF-IDF方法,其中IF衡量技术关键词在专利文档中的重要性,如果该技术关键词在某一件专利文档中出现的频率越大,则该词对该篇专利的贡献越大;IDF表示技术关键词在整个专利文档集的分布情况,文档集中含有技术关键词的数量越少,该技术关键词对文档的表示越重要。本研究基于向量空间模型来构建专利文档与技术关键词矩阵(见表2),专利技术关键词的权重以TF-IDF得分为准,计算公式如下:

式(1)中:W(tk,d)为技术关键词t在专利文档d中的权重;tf(tk,d)是技术关键词在专利文档出现的词频;N为专利文档的总量;nt为专利文档集中出现t词的文档数量,即主要用于增强词的频率,以减少长篇幅文档对结果的影响。

表2 生物医药领域石墨烯技术的核心专利集-技术关键词TF-IDF权重示例

基于文档-技术关键词多值矩阵,通过UCINET的二模网络转换为一模网络,为了更好地选择合适技术分支聚类的数量,衡量技术分支聚类的凝聚程度和网络分派的情况,在此选取E-I指数(external internal index)[26],计算公式如下:

式(2)中:EL为技术分支之间的关系数量;IL为技术分支内部的关系数量。

E-I指数最初是衡量一个大网络中的小团体现象是否严重,进一步可分析网络凝聚子群的分派程度,在此可用于判断选取技术分支的聚类数量。E-I指数的取值范围一般为(-1,+1):如果值越靠近1,表示所生成的技术分支之间距离越近,独立性不强;如果该值越靠近-1,则表示技术分支之间的距离越远,独立性强;该值为0,则是随机网络关系分布。

我们利用UCINET计算不同技术分支聚类数量的E-I指数发现,当聚类的数量在小于12个时,E-I值为0.929,接近1,技术分支之间的联系程度比技术分支内部的联系程度还高;当聚类数量达到26个及以上时,E-I值为-0.823,靠近-1,技术分支之间具有较好的区分度。因此,本文利用UCINET进行层次聚类生成26个技术主题,采用欧式距离计算技术特征词之间的相似度,衡量和观测在多维空间中各个节点的绝对距离。最终聚类形成了26个技术分支,根据每个类别的核心专利来表征和命名技术主题(见表3)。

表3 基于聚类的生物医药领域石墨烯专利技术分支

表3(续)

3.2 产学研机构-专利技术主题二模网络

本文在已识别的26个专利技术主题的基础上,选择专利数量大于等于3项的企业、研究机构或大学作为产学研机构研究对象,去掉个人作为专利权人的数据,分别构建了产学研机构与技术主题矩阵(见表4)。

表4 生物医药领域石墨烯专利技术产学研集群与技术主题矩阵(部分)

利用UCINET软件生成机构与技术主题的二模网,基于欧式距离测算各机构之间技术主题相似度,并基于相似度将拥有类似技术的集群进行聚类。产学研关联创新主题可视化如图3所示,其中英文代表机构名称,正方形代表关联创新主题,三角形代表研究机构,圆形代表企业,菱形代表大学。

图3 生物医药领域石墨烯专利技术产学研关联创新主题可视化

产学研关联创新主题包括:T1癌症检测治疗、T2聚合衍生物(生物医学)、T3空气净化、T4红外设备、T5抗菌材料、T6光致变色化合物、T7石墨烯复合材料(医用)、T8石墨烯制备材料、T9石墨烯氧化物、T10聚合物复合材料(医疗器械)、T11纳米结构、T13合成纤维复合材料制备、T14骨组织修复治疗、T16药物载体系统、T17人造膜、T18脑植入冷却装置、T20石墨烯增强型合金(医用)、T21石墨烯搅拌系统、T22造影剂、T23柔性聚合物导体、T24功能性表面覆盖物、T25紫外线吸收材料以及T26石墨烯衍生物合成。在此基础上,基于Girvan-Newman算法,当社群数量为9的时候Q值最大,分别是C1合成纤维复合材料、C2抗菌材料、C3硅胶聚合物材料、C4石墨烯氧化物及纳米颗粒、C5医用复合材料、C6骨组织修复、C7气凝胶、C8癌症治疗与诊断以及C9空气净化。如表5所示,产学研合作可能性最大的是C2抗菌材料、C4石墨烯氧化物及纳米颗粒、C5医用复合材料和C8癌症治疗与诊断。

表5 生物医药领域石墨烯专利技术产学研关联创新主题及潜在合作机构

表5(续)

3.3 产学研关联创新主题分析

通过分析石墨烯生物医药应用领域的关联创新热点主题C2抗菌材料、C5医用复合材料、C4石墨烯氧化物及纳米颗粒和C8癌症治疗与诊断,识别并分析其潜在关联的机构(见图4)发现,产学研机构均有所参与且相对活跃的创新主题是C2抗菌材料和C4石墨烯氧化物及纳米颗粒。

通过分析潜在的关联创新特征发现:C2抗菌材料和C5医用复合材料的关联创新,主要是以企业为主的技术应用创新,产业化进程相对更快;C4石墨烯氧化物及纳米颗粒和C8癌症治疗与诊断的关联创新,主要是以大学为主的基础研发创新,仅有零星几家企业涉猎到了该技术主题的专利保护,相关科技成果转移转化还不够成熟,可转化实施的成果不多,所保护的技术和产品距离市场还比较远。

从参与机构的来源国家及范围来看:C4石墨烯氧化物及纳米颗粒是最受关注的技术主题,全球46家机构进行了专利保护,其中中国34家、韩国5家、美国4家、日本1家和印度1家。该领域产业界只有韩国三星公司和Graphene Square公司进行了专利布局,这显示了韩国在C4领域产学研关联创新的产业相对优势;中国虽具有显著的技术研发优势,包括国内28所大学和中国科学院6所研究机构,但对产业界的科技供给不足,未来有必要推动和引导具有关联性的创新成果向产业界转化。

图4 生物医药领域石墨烯专利技术产学研关联创新热点及潜在合作对象

3.4 产学研关联创新合作潜力分析

为了分析产学研潜在关联创新的技术优势、关联潜力以及研发差异,本文分析对比了企业、研究机构、大学的技术创新热点主题(见图5、图6、图7),基于创新主体技术创新的特色领域,识别出大学/研究机构分别与企业潜在关联的技术主题(见表6),探讨具有产学研关联互补优势与集成的可能。

研究发现,大学在石墨烯生物医药领域协同创新网络最为密集,参与的机构最多且技术主题覆盖范围最广。从不同集群技术主题的差异来看,企业更偏向于具有产品实用价值的应用领域,例如空气净化、可穿戴设备以及医用抗癌材料,在合成纤维复合材料、空气净化、抗菌以及癌症治疗等领域企业关联创新呈现集群趋势,未来潜力的合作薄弱技术主题将可能是柔性聚合物导体,例如电子皮肤、可穿戴设备、人造血管以及弹性驱动力等。研究机构的技术主题专业化集中化程度极高,主要集中在中国科学院下属研究机构,重点在于石墨烯复合材料的制备,主要应用领域是抗肿瘤药物、骨组织修复以及造影剂等医用器械,与企业具有一定的合作潜力。大学的技术主题相对于研究机构来说极为分散,在纳米复合材料的制备上具有显著的关联创新优势,该技术主题的规模最大,与企业界具有较大的合作潜力和互补可能。

图5 生物医药领域石墨烯专利技术的企业(大于等于3)协同创新主题

图6 生物医药领域石墨烯专利技术的研究机构(大于等于3)协同创新主题

图7 生物医药领域石墨烯专利技术的大学(大于等于3)协同创新主题

通过对比企业、大学以及研究机构的关联创新主题来看,3个群体在石墨烯与生物医药领域关联创新主题上具有一定的交叉重合,未来在创新投入上需要多方面考虑产学研关联互补优势与集成的可能,更有效地配置研发资源以及创新的投入。此外,企业在创新中的主体地位还有待加强,有必要在石墨烯生物医药的应用上加强产学研合作,将大学和研究机构的创新技术转化为创新。

表6 生物医药领域石墨烯技术产学研创新主体的专利技术主题和关联主题

4 结论

基于专利计量结果,本文结合专利分析和社会网络分析,构建了一套面向产学研关联创新的技术主题分析流程,以便识别产学研关联创新的技术主题及潜在合作对象,通过分析产学研集群关联创新中的技术优势主题、互补性主题以及差异性主题,揭示产学研关联创新热点方向和合作潜力,推动学术界与产业界的技术对接;并选取石墨烯生物医药领域开展相关实证研究,发现本研究所构建的方法和流程具有可行性和有效性。

产学研关联创新主题分析,从方法层面来说,基于不同类型产学研机构之间潜在的技术主题相似来挖掘特定技术领域潜在关联创新的特征与模式,是探索和研究产学研关联创新活动的有效途径。与以往研究相比,本研究探索了从核心专利集合出发聚类生成技术主题,相对于全数据集来说,能够快速简化技术网络、聚焦重要的技术主题,有助于减少数据清洗的工作,提升专利技术主题识别的效率;其次,本研究提升了所识别的技术主题细粒度,在技术分支的聚类与命名上具有更多信息揭示,便于专家结合技术特征词与专利技术文档对结果的解读和归纳,未来利用核心数据集来挖掘具有代表性的技术主题的思路将有可能在大数据分析方面有更多的应用价值。

本研究不足之处在于:核心专利集的筛选规则主要源自引用扩散模式,即被引频次越大,技术关键词的覆盖率越大,未来研究有较大的扩展空间;核心专利集虽然有助于分析技术主题分支的命名以及聚类,但仍然存在专家的主观判断,未来自动化识别与归纳海量文献数据将更准确。此外,产学研协同创新的问题较为复杂,需综合考虑各种因素,本文期望从技术主题的角度帮助产学研创新主体在研发方向和合作决策上提供一些参考,但要面向市场去推动产学研合作或协同创新的场景更为多元化,目前的方法距离真正融合知识链、创新链和产业链还有较大的差距,未来或许可以从更为多源的信息入手,研究与揭示更多元化的关联关系和合作模式,以丰富相关理论与实践。

猜你喜欢
专利技术产学研石墨
精益求精产学研 继往开来朝阳人
2021年中国产学研合作创新与促进奖关于2021年中国产学研合作促进会产学研合作创新与促进奖的表彰决定
防爆电机专利技术发展综述
推行产学研一体化基地建设
石墨系升温球的实践与应用
全新充电专利技术实现车队充电
修饰还原氧化石墨烯的味觉传感器的制备应用
石墨烯桑蚕丝变身传感器
“电力杀手”——石墨炸弹
低压差线性稳压器专利技术综述