纪亚琨 余 翔 张 奔,2 彭文波
(1.华中科技大学管理学院 武汉 430074; 2.华中科技大学法学院 武汉 430074)
颠覆性技术能够提升产业竞争力,并对经济社会发展产生深远影响,因此对颠覆性技术进行识别具有重大意义。调研发现,现有方法包括基于专家意见的主观方法和基于文献计量的定量方法两大类。其中,主观方法需要多领域专家协作,耗时长且难以排除主观因素引起的偏差[1]。近年来,以文献计量方法对颠覆性技术特征进行量化成为新趋势。其中最常见的是以领域内专利被引次数作为标准,直接将高被引专利视为颠覆性技术[2, 3]。在此基础上,Wu等[4]采用多代次引文表征知识扩散,通过观察“引文间断”筛选具有颠覆性特征的发明。刘云等[5]基于学术论文三方组引用结构绘制新兴领域颠覆性发展路线图。李乾瑞等[6]提出基于专利引文的技术主题-时序分析模型,定义主题突现性和融合性等指标用以识别和预测3D打印领域的颠覆性技术主题。可以看到,由于专利数据的规范化和商业化价值,现有关于颠覆性技术识别的量化研究大多围绕专利展开,且专利引用关系和结构是研究关注的重点。然而,受到专利申请人引证动机等影响,单靠专利引证信息进行分析可能导致结果失真[7]。而大量未包含专利引证信息的专利亦因此被忽视。鉴于此,本文采用专利数据并提出基于领域知识网络视角综合使用国际专利分类号(IPC)和专利文本识别潜在颠覆性技术的方案,弥补现有方法的不足。
为达到此目的,本文基于技术融合理论,以专利IPC分类号构建领域-发明-主题多层分析结构。在领域层面,通过构建IPC共现网络,观测技术节点在网络中位置的变化,找到对领域已有知识结构具有“入侵”和“扩散”倾向的IPC节点;并映射到发明层找到包含上述节点的一系列专利,进一步于主题层进行主题聚类,最终获得潜在颠覆性技术的识别结果。为说明该方法的可行性,自动驾驶汽车领域被作为案例进行分析。
根据哈佛商学院教授、颠覆式创新理论奠基人Christensen的表述,颠覆性技术的出现将改变原有技术发展轨迹,并对商业模式和行业竞争带来重大影响[8]。
从宏观领域层面来看,颠覆性技术演化过程由知识融合性驱动[6]。在新兴领域发展初期,知识库具有非结构化和小体量特征,大量探索性实验引发外来新知识占据边缘位置并与现有知识体系产生新型融合关系[9]。随后一些边缘知识依靠持续融合发生扩散,位置向中心跃迁,领域知识结构亦随之改变[10]。黄鲁成等[11]学者形象地将这一过程比喻为外来物种入侵。
对应于微观技术层,颠覆性技术是上述跃迁知识节点的实际载体。在早期,由于包含此类知识节点而吸收了更多新知识导致颠覆性技术在知识结构上具有激进新颖性特征,亦即与领域内其它技术相比具有低相似性和高差异性[12]。随时间发展,颠覆性技术开始被更多创新者认可,产生连锁效应引发后续一系列持续性创新,技术影响力不断凸显直至完成颠覆过程[13]。
综上所述,颠覆性技术的形成过程是具有新颖性、低影响力的一类技术创新影响力逐渐扩大的过程;在宏观上该过程由技术融合驱动。
具体识别模型如图1所示。首先利用领域专利数据构建萌芽期专利IPC共现网络,观察领域知识库结构和融合关系。专利IPC分类号能够结构化表征专利所包含的知识要素和技术融合,并具有结构化和国际通用性。适用于对跨国大规模专利数据的初步分析。为兼顾分析结果精度,本文将IPC保留至大组水平。本文重点关注发展早期位于知识体系边缘位置的知识节点(图1中六边形),在技术层则对应着包含此类IPC节点的新颖性专利(图1中星形)。然后,在领域层追踪所选节点网络位置随时间的变化,通过多项指标计算其在以后成长期各阶段网络中的位置变化,确定随领域发展发生扩散和地位跃迁的IPC节点。相应地映射到发明层,保留对应专利即获得潜在颠覆性技术。之所以称之为潜在颠覆性技术,是考虑到众多新兴领域处于快速发展期,主导技术选择尚未完全确定,影响力变化需长时间持续观察[13]。
图1 潜在颠覆性技术识别模型
结合社会网络中心性理论和参考前人成果,在该过程中4个指标被用于衡量网络节点的进入与扩张过程。节点扩散特征使用度中心度(Degree Centrality)和中介中心度(Betweenness Centrality)两个指标进行衡量[15]。度中心度高的节点处于网络中心位置,与众多节点产生交流融合,算法见式(1)。其中xij表示节点i和j之间的连接关系,当且仅当两点具有连接关系时xij=1,否则为0;n为网络节点总数。中介中心度则代表节点对网络全局的控制力,因充当网络中信息传播的必经之路而地位突出,权力扩散性特征显著,其算法见式(2),gjk(i)为连接j和k且经过i的最短路径数,gik表示所有最短路径数,n为网络节点总数。
(1)
(2)
萌芽期新颖的低影响力节点根据是否与重要节点联系分为两种类型。如表1所示,类型1节点在进入知识网络后与重要节点连接而更靠近中心位置。其具有高接近中心度值,且具有低度中心度和中介中心度;接近中心度算法见公式(3),dis(i,j)表示点i与j的网络距离,n为网络节点总数。类型2中节点在引入知识网络时未与现有知识网络的重要节点发生连接而处于更加偏远的网络位置。其在中心性特征上表现为具有较大的偏心度值,同时度中心度和中介中心度值较低。偏心度计算见公式(4),dis(i,j)定义同式(3),N为网络节点集合。
(3)
CE(i)=max{dis(i,j),∀j∈N}
(4)
表1 萌芽期新颖性低影响力节点类型及特征
随后,在获得目标专利后,为对潜在颠覆性技术所包含的研发方向进行深度剖析和解读,在主题层提取潜在颠覆性技术专利摘要文本进行LDA(Latent Dirichlet Allocation)主题模型分析。该分析过程注重结合政策文件等外部信息,在使用专利IPC分类号的基础上提供更细粒度结果,同时初步证实识别结果合理性。最后,通过与现有前向引文识别方法进行对比验证,进一步证明了结果的可靠性。
自动驾驶领域是当前发展迅速的新兴领域之一,其知识体系由计算机、自动化、机械、材料等众多学科组成,导致领域内专利涉及IPC分类号极为广泛,可较好反映多学科融合和知识结构演化。此外,相应分析结果也将为我国企业制定研发计划和选择投资方向提供一定参考。本文选取德温特全球专利数据库检索专利申请记录,数据涵盖美国、欧洲、中国等主要创新国家和地区的创新活动。专利检索式参照世界知识产权组织所发布的工作论文,具有一定权威性[16]。为精确划分技术领域发展阶段,同时虑及专利数据公开的滞后性,检索时间区间选定为1970—2018年,经同族合并后最终共获得有关专利17 235件。
辩证的看,伊博人民以“变”看待世界的态度给殖民者入侵提供了契机,造成了自己部落的分崩离析,但这种“变”也为伊博部落带来了新的机会,剔除了无人性的陋习,接触到外界的新知识,使得伊博人也在不断进步之中。正如庄子所说,“盛衰之杀,变化之流也”[8]474,盛与衰永远在不断交替变化之中,这乃是世界之本质。当时的伊博部落位于衰,欧洲处于盛的位置,但是二十一世纪的伊博人却在非洲人的知识分子中占比最多。这与伊博族的人生观和世界观不无关系。
根据检索结果,本文采用S曲线模型拟合和推算本技术领域的技术生命周期,此过程应用Loglet Lab 4.0计算软件进行。本文将专利数据的累计年申请数输入软件,经技术生命周期拟合最常用的Logistic曲线拟合,得到自动驾驶技术生命周期阶段划分结果。
如表2所示,由于技术发展水平限制,自动驾驶领域经历漫长萌芽,2003年前专利数量极少。之后随着计算机和人工智能相继迎来发展,大量探索性实验展开,导致专利申请数开始稳步上升。此外,根据技术生命周期理论,萌芽期具有最显著的激进和间断性特征,这成为驱动技术领域走出萌芽期的内在动力。进入成长期后此特征将逐年衰减,反之持续性创新激增直至领域发展成熟。综上,本文进一步选取2003—2018年的专利数据并划分为4个阶段,以本文思路,通过观察萌芽期(2003—2007年,2008—2012年)边缘技术节点在成长期两阶段的位置变化,并识别具有颠覆性潜力的发明。
表2 自动驾驶技术生命周期各阶段划分(单位:年)
在技术领域层面,分别构建萌芽期两阶段IPC共现网络,计算IPC节点的度数中心度、中介中心度、接近中心度和偏心度指标以确定各节点在该时期知识网络中的位置。以阶段1为例,将计算结果展示于表3中。可以观察到,少数技术节点具有较高度中心度或中介中心度值,占据领域知识网络核心位置,其中包括G05D-001(运载工具的位置、航道、或高度的自动控制),G06F-017(数字计算和数据处理设备)等,而探索性实验引发网络整体呈松散结构,大量代表新技术的IPC节点占据网络外围位置。阶段2领域知识网络与阶段1具有相似结构特征,受篇幅所限有关计算结果不再赘述。
表3 各IPC网络位置指标计算结果(阶段1,部分)
经过不断尝试,最终确定以上述两阶段网络中系列中心度指标的均值作为参考,确定萌芽期具有新颖性低影响力的边缘节点。共得到符合表1所描述的两类型技术节点919个。进一步地,分别计算上述节点在阶段3(2013—2015年)和阶段4(2016—2018年)网络中的中心度和中介中心度值是否至少有一项大于当期均值,由此观察原节点的影响力扩张倾向。最终发现198个节点在阶段3和阶段4至少发生过1次跃迁,即影响力指标至少一项超过均值。与其它节点相比,它们具有对领域知识结构造成破坏的倾向。进一步分析发现,H04W-016(无线通信网络的网络规划和资源划分),H04W-076(无线通信网络的连接管理)等等多个涉及无线通信网络有关技术的IPC节点影响力扩张性质最为明显;例如H04W-076在阶段4的领域知识网络中度中心度为0.06,远大于当期均值0.019,与80个其它IPC节点发生融合;而在阶段1与该节点共现的IPC数目为8。这说明无线通信网络技术对于自动驾驶领域潜在的颠覆性作用。需要指出的是,所筛选IPC节点中有50个节点在阶段3发生地位跃迁,但未在阶段4继续扩大影响力。考虑到本领域处于成长期以及颠覆性技术影响力可能呈波动上升的事实,应长期观察,故仍纳入分析范围。另外,经统计发现,类型2节点发生跃迁的概率为32%,明显高于类型1的18.3%。
最后将领域层所筛选节点映射于专利层,获得相关专利779件。这些专利包含诸多具有潜在颠覆性的技术研发方向,因此有必要进行进一步解读。
为挖掘颠覆性技术所包含的更多技术信息,并证明筛选结果的合理性,通过LDA主题模型对779件专利摘要文本进行主题聚类,设定LDA模型参数为默认值[17],并计算各个主题的困惑度值,观察计算结果并结合实际分析情况最终选定主题数目为8个。
自动驾驶领域潜在颠覆性技术所包含主题如表4所示。主题1包含object、sensor、target、driver、user、input等主题词汇,是指驾驶员状态监测,多驾驶模式切换等人机交互技术。我国于2018年首次发布《智能汽车创新发展战略》,将人机交互列为“前瞻性”重点研发内容。
表4 潜在颠覆性技术8大主题
主题2和主题8与园区自动驾驶技术相关。其中主题2为应用于厂区、物流的自动驾驶及其衍生功能;而主题8则是厂区自动引导车的路线规划。专家表示,园区自动驾驶技术将为公路级自动驾驶提供必要技术积累,现已成为发展自动驾驶的战略任务[18]。
主题3表示融合V2X的定位感知技术。引入无线网络通信实现车辆与交通环境、技术设施的通信,将大大提升车辆安全性。我国已将基于5G的V2X技术列为重点研发内容。
主题4可概述为多车辆间的数据传输(V2V)。V2V技术是由V2X技术演化而来的重要分支技术,可有效弥补单车智能缺陷。该技术已被麻省理工大学评选为有望影响人类未来的颠覆性技术[19]。
主题5、主题6与电驱动系统相关。其中主题5表示电驱动系统的实时响应和变速等。而主题6则是对电池、电机的智能化监测、管理。汽车电动化已对汽车工业带来颠覆性影响,而自动驾驶技术与新能源的融合也将成为新的重点。我国在《新能源汽车产业发展规划(2021—2035年)》中多处指出,要重点支持应用于新能源汽车的智慧化、自动化技术研发。
主题7为用于V2X的数据存储技术。V2X技术在打破视野限制的同时使数据量骤增,相关车用数据存储技术成为发展V2X的关键,专家预计其地位将持续凸显[20]。
综上,通过专利网络视角所识别出的潜在颠覆性技术可被总结为8个研发方向,且识别结果与自动驾驶领域的发展趋势相一致,具有一定合理性。
为了进一步说明本文方案的有效性,参考颠覆性技术识别的前向引文方法,考察所筛选专利是否在前向引文数量上显著高于未入选专利。本文将萌芽期全部专利划分为两组,将依照本文方案入选潜在颠覆性技术的样本定义为组0,其余为组1。考虑到专利引文数据所具有的“偏态特征”以及引文时滞,本文参考Grimaldi等[21]的思路定义引文指数如公式(5)所示,并采用曼-惠特尼检验法进行两独立样本秩和检验。
(5)
结果显示Z=-2.783,P值=0.005<0.05,组0秩平均值1080,中位数0.8;组1秩平均值1000,中位数0.65。因此两组在引文指数上具有显著差异,且组0的CI值显著大于组1。亦即组别0内专利获得更多前向引用,它们更具有颠覆性技术的特征。
针对现有颠覆性技术识别方法所存在的缺陷,本文提出一种基于专利网络的方法,在领域层采用IPC分类号构建领域知识网络,通过系列网络指标动态观察新颖性知识节点的入侵和扩散过程,对应于专利层识别出潜在颠覆性技术,并采取LDA模型对潜在颠覆性技术进行深入分析和结果的初步检验。最后进一步采用曼-惠特尼检验法,从另一视角进行结果可靠性分析。
通过将本方案实施于自动驾驶领域,识别出以无线通信网络等技术对本领域知识网络影响力有扩散趋势,具有颠覆性潜力;这些IPC节点对应潜在颠覆性专利779件,具体到技术主题包含人机交互、V2V技术、电池智能化管理等8个研发方向,根据与多份权威文件和规划的比较结果,发现预测结果与本领域发展趋势较为符合,具有一定有效性。曼-惠特尼检验结果亦支持了该结论。
此外,本文的结果还带来以下启示:在新兴领域发展萌芽期,外部知识的融入引发较强不确定性,大量新颖性技术无法越过“死亡之谷”,而少数颠覆性技术的形成需要较长时间。应关注早期知识网络中的新颖性低影响节点,并持续观测找出其中具有影响力扩张倾向的子集,其对领域知识体系具有重塑作用,常蕴含着潜在的颠覆性趋势,是新兴技术领域走出萌芽期转向快速成长的内因所在。尤其是具有高接近中心性特征的新进技术,具有更高发生影响力扩张的可能。这印证了此前一些学者的观点,亦即新技术与重要的成熟技术发生融合,有较高新颖性且更易引起更多的技术融合,它们更可能被重视和优先发展从而产生更大颠覆性[10]。这也为后续开展技术发展趋势预测研究进一步提供依据。
本研究尚存在不足之处。首先,该方案需要实施于更多技术领域,从而进一步验证其普遍性和可行性。第二,现有识别方案仅仅使用专利数据。在未来应考虑构建多源数据分析结构,将消费者、政策等因素纳入考虑,提高模型精确度和效率。