曹 兴 谭蒙盼
(1.中南大学商学院 长沙 410083;2.湖南第一师范学院商学院 长沙 410205)
新兴技术发展是技术、知识等要素的跨场域整合,体现了跨学科、跨领域、跨产业的知识深度耦合过程[1]。知识耦合是两种及以上相互依赖的知识元素,通过相互渗透、连接和组合等方式,整合成为新知识的过程与结果[2]。知识元素或知识单元在不同维度、不同程度地与其他知识形成耦合关系,进行知识的传承与更新,极大地促进了新兴技术的涌现与持续发展。
新兴技术演化的主要驱动力是知识元素的组合和集成[3],不同领域下个体和组织进行知识共享和知识转移,其演化轨迹具有显著的非线性特征。已有文献从社会网络视角,通过知识节点关系、节点自身属性、网络结构等维度对新兴技术知识耦合的形成机制展开了分析。在知识节点关系上,Gao等采用两层复杂网络进行模拟,发现互补性耦合、替代性耦合和彼此独立三种模式作用下,知识的扩散机制不同[4];李莉等以新能源产业专利引文网络为研究对象,指出知识异质性会刺激网络内成员之间建立更多的群间桥接关系,促进群体耦合[5]。在知识网络节点属性上,曹兴等在分析新兴技术跨界创新过程中,发现其跨领域知识耦合导致知识网络呈现出异质性知识增加、知识连接灵活、网络规模扩大的特征[1];王萍萍等构建纳米技术领域的知识网络,提出了知识单元的网络嵌入性对知识耦合的影响表现为倒U型[6]。在网络结构上,俞荣建等人提出创新组织需要通过跨界知识搜索,促进组织内部异质性知识耦合,通过构建结构洞低、中心势适度的知识网络,推动了新兴技术创新[7];潘李鹏等发现较为发散的知识结构有利于创新活动的展开,此时企业涉及知识领域较多且领域间耦合程度较低,同时知识结构不存在显著的中心知识领域[8]。以上文献研究发现,由于知识的冗余性和重叠性的特征,新兴技术知识耦合分为不同耦合策略,在创新尤其是技术创新过程中,表现出知识耦合过程中网络逐渐增强的流动性,且网络中耦合关系涌现易受节点属性与网络结构的影响。
因此,本文将知识耦合网络定义为多个知识元素之间,同时或相继通过共享、整合等方式发生关联,形成不同强度的耦合关系,建立非线性的知识联结,产生知识的传承、创造等一系列结果,最终形成的网络,网络中包含多种异质性知识,在新兴技术创新过程中,表现为跨领域的网络交互行为。为探究新兴技术创新阶段性特征及其路径实现规律,从网络结构、节点属性、关系属性等维度出发,分阶段地提出新兴技术知识耦合网络形成机理及驱动机制,运用网络指标与ERGM模型进行实证检验。
新兴技术知识耦合网络是一个复杂系统,其网络耦合关系的形成是网络结构变迁和节点涌现共同作用的结果,且网络结构和节点之间相互影响。知识网络大多具有一定的小世界特征[9]和无标度特征[10],在知识网络形成中,体现为驱动网络结构演化的内生机制[11-12]:一是择优性,表现为知识节点倾向于与度数大的节点进行连接,呈现非均匀度分布;二是传递性,表现为知识节点倾向于与存在共同耦合对象的节点进行连接。网络结构的变化,同时也影响节点涌现,使耦合过程中节点属性的偏好引导着耦合关系的变化[13]:一是节点重要性,体现为知识节点倾向于与重要节点进行连接;二是节点位置,体现为知识节点倾向于与相邻节点进行连接,产生邻近效应,知识节点利用中介节点去建立连接,产生中介效应;三是节点关系,知识节点倾向于与具有相似特征的节点耦合,表现为同配性,与具有互补特征的节点耦合,表现为异配性。
新兴技术知识耦合网络形成初期,如图1(a)所示。A为初始时刻的知识网络,表示技术萌芽时已形成的知识领域,领域内为新技术创意驱动下新知识的原始生成,以及既有知识的再集成[14]。由于初期网络中节点量较少,网络的形成主要受到结构的影响,择优性和传递性就成为耦合的动力机制。当新技术创意出现时,产生技术萌芽,形成技术初次突破,A领域的热门研究主题,往往能得到更多研究者的关注,表现为A领域中的核心节点1成为知识耦合网络的择优对象。考虑到新技术创意不确定性较高,该阶段更多是与A领域相近领域的研究者,围绕择优对象进行初步探索,图1(a)中相邻领域B中的知识节点围绕A中核心节点1进行耦合。同时,B领域的研究者通过对节点1进行知识搜索[15],利用传递性机制,与相邻的知识节点2耦合,形成多个闭合的三角形,组成三元闭包结构,由于纳入更多异质性知识,扩大了知识领域。
图1 新兴技术知识耦合网络的形成过程
新兴技术知识耦合网络形成中期,如图1(b)所示。经过初期发展,知识耦合网络规模增大,节点数量变多,知识耦合的现象增加,节点属性对耦合关系的影响开始显现。经过初期发展,技术得到进一步关注[16],与A领域核心节点相关的其他知识逐渐被重视,图1(b)中节点2成为新增的择优对象,吸纳另一领域C中的知识节点与之耦合,使得网络出现多个核心节点,择优机制驱动知识耦合。知识节点从邻近位置开始,如图1(b)中节点3,通过传递性机制向外转化、扩散[15],传递机制、邻近效应促使知识耦合。在扩散过程中,知识耦合网络某些节点成为知识中介,连接着不同的知识元素或者知识单元,使得远距离的异质性知识能够相互接触建立联系[17],为发明者创造性进行知识组合提供了更多的可能[18],节点的中介效应、领域间的异配性促进了知识元素的耦合,如图1(b)中C领域与B领域的异质性知识通过节点2作为中介桥梁发生耦合,推动耦合网络知识多样性增加,知识边界继续扩张,新兴技术进一步发展。
新兴技术知识耦合网络形成后期,如图1(c)所示。网络规模进一步扩大,网络结构趋于稳定,择优性、传递性、节点重要性、邻近效应继续影响耦合网络形成。由于知识耦合成为常态,A、B、C融合为一个新的领域D,中介效应、异配性不再是知识耦合网络形成的动力机制。知识与知识之间的边界变得松散而模糊,知识距离更近,知识耦合不再需要通过特定的中介[19]。为解决知识网络耦合形成的相关问题,需要对特定领域内的专业知识进行专门化[20],知识元素的耦合具有同配性,相似领域间、同一领域内的知识耦合频率增加,对相似知识的深度利用,强化了对该领域技术知识的理解[21],提高了开发效率[22],实现新兴技术多个细分方向纵深发展。
本文以自动驾驶技术为例,验证新兴技术知识耦合网络形成机理与驱动机制。自动驾驶是由信息技术与汽车技术融合而成的复杂智能系统,融合了图像感知、深度学习、人工智能等前沿技术,具有新兴技术高度融合、动态复杂等典型特征[1],是未来智慧交通发展的重要方向[23]。
关键词共现。基于专利关键词共现,构建分阶段知识耦合网络,分析其演化过程中网络拓扑结构变化,初步验证知识耦合网络形成机理。共现是一种典型的知识关联关系,而关键词是网络中知识单元的微观载体,关键词共现指一组关键词两两出现在同一专利数据中。专利包含有用的、详细的技术信息[24],其关键词共现蕴含了研究者的发明构思及研究框架中的知识互动,可用于分析技术领域内的知识创造和流动[25]。通过Python提取专利标题和摘要中的关键词,提取过程中采用无监督算法:快速关键词提取(Rapid Automatic Keyword Extraction,以下简称RAKE),RAKE能够有效提取出专利标题和摘要中有意义、相关的关键词短语[26]。
指数随机模型(Exponential Random Graph Model,以下简称“ERGM”)。知识耦合的本质体现为链路预测问题,通过已知的网络节点和网络结构等信息,预测网络中尚未产生连边的两个节点之间产生连接的可能性[27]。ERGM模型将机理中所提出的驱动机制作为变量,建立含有一组可调参数的模型,通过拟合真实网络的结构与关系特征,获得最优的估计变量参数,网络中两个节点耦合的概率就等于在该组参数下它们之间产生连边的条件概率。变量参数显著与否表明驱动机制对于知识耦合网络形成是否产生作用,参数值的大小与正负分别代表驱动机制的作用程度与方向。
通过德温特收集自动驾驶专利数据,其信息检索表达式:TS="autonomous vehicle*" or "driverless car*" or "self-piloting automobile",导出各条专利的标题和摘要,进行去重与合并。考虑到统计结果的意义,以及专利申请和审批的滞后性,检索时间为2006-2020年,该数据集中包含21 174个专利族,其专利申请趋势,如图2所示。
图2 2006—2020年自动驾驶专利申请趋势
Gartner公司2019发布的新兴技术成熟度曲线中,曾预测自动驾驶技术经过5-10年将达到技术成熟期。根据专利申请数量的变化趋势,将自动驾驶技术专利申请划分为三个阶段:2006-2010年为技术萌芽期,专利申请量少,增长速率几乎不变;2011-2015年为初步发展期,专利申请数量有所增加,增长速率变快;2016-2020年为快速成长期,专利申请数量总体有了极大的提升,虽然2018年后专利申请量略有下降,是因为自动驾驶研究进入深水区[28],逐步从“单车智能”转到“智能网联汽车”[29],研究进展有所放缓。
将专利数据的标题和摘要分为两个数据集,使用RAKE对每个数据集分别进行关键词提取,其步骤如下:对数据集所有文本进行词性还原;通过标点和停用词切分句子,获得候选关键词;根据其在共现网络中的度和词频的比值,对这些关键词进行评分;进行降序输出,得到总关键词表。
文献、著作等的关键词一般为3~5个,选取每篇得分最高的前五个关键词用于构建知识耦合网络。将总关键词表中的得分匹配到每篇关键词中,对每篇关键词,从标题中提取得分最高的前两个关键词,从摘要中提取得分最高的前三个关键词,构成关键词合集。对初步提取的关键词进行同义词合并,并删除一些无意义词,最终共获得53 789个关键词。
根据关键词所属专利数据年份,将关键词合集中的关键词分到以上三个阶段,对每一阶段关键词合集分别采取以下步骤:将关键词按频次从高到低排序;计算出每个关键词频次占总频次的比例,并按照排序顺序对该比例进行累计;将前20%累计词频覆盖率作为核心关键词,截取到数量合适的高频关键词;利用高频关键词的共现关系,构建共词矩阵,并导入Gephi软件,分阶段建立自动驾驶知识耦合网络。
关键词合集中,频次前10的关键词如表1所示。频次最高的关键词为控制系统,最早出现时间为2006年,出现时间较早的高频关键词还包括计算机系统、传感器数据、光检测等,最近几年出现的高频关键词包括无线通信系统、人工智能模块、神经网络等。根据关键词频次和最早出现的年份可以看出自动驾驶技术大体发展历程,车辆控制技术作为自动驾驶汽车行驶的核心贯穿始终,早期主要通过传感技术、激光雷达技术实现自动驾驶汽车对于外部环境的感知识别和路线控制,随着5G、人工智能等技术涌现,自动驾驶车辆的发展进入了“智能网联”的阶段,自动驾驶功能得到提升。
表1 2006-2020年自动驾驶专利数据中频次前10的关键词
将构建的自动驾驶技术知识耦合网络导入Gephi软件,其整体演化态势如图3、表2所示。图3标明了各阶段网络中频次前十的关键词,表2列出了相关网络指标。从图3和表2可以看出,技术萌芽期(2006-2010年)的知识耦合网络各节点较为分散,网络规模较小,网络中存在一个最大的子网络“Control System(控制系统)”,依次为Collision Avoidance System(防撞系统)、Simulate Vehicle Orientation(模拟车辆方向)、Cartesian Coordinate System(笛卡儿坐标系统)等知识元素,控制系统为自动驾驶领域的热门研究主题。同时纳入了地图技术、安全系统等相关技术领域的知识,根据目前的自动驾驶概念来看,路线规划和行车安全是最初优先考虑的因素。
表2 2006-2020年自动驾驶知识耦合网络整体演化态势测度指标
图3 2006-2020年自动驾驶知识耦合网络整体演化图
到了初步发展期(2011-2015年),以上一时期中最大的子网络为核心,其他分散的成分通过最大成分的连接,不断向外扩张,网络中开始出现多个闭合的三角结构,各领域知识元素从孤立到联通,产生了相应的核心节点,如图3所示,除“Control System(控制系统)”外,知识耦合网络中出现Computer System(计算机系统)、Sensor Data(传感器数据)以及Pricing Insurance Policy(定值保险单)等核心节点。为了对新技术创意进行推广并获得批准,推动新技术创意向前发展,需要拥有影响力和合法性[11]。各领域核心节点的出现表明知识耦合行为正在不断扩大网络边界,核心节点周围的知识元素彼此发生耦合,更多领域的知识元素被纳入进来,网络中异质性知识增多,新技术创意的影响不断扩散,新技术创意的合法性逐渐得到支持,初步体现出择优性、传递性、邻近性、中介性、异配性等驱动耦合的过程。节点数量和连线数量增加,网络规模增大,密度减小,新增的耦合关系相比于原始网络中的耦合关系为弱关系,平均加权度增大,耦合现象增多,平均路径长度变大,网络整体距离变大,网络边界向外扩张。
到了快速成长期(2016年-2020年),前一阶段产生的核心节点如Computer System(计算机系统)、Sensor Data(传感器数据)等成为新的择优对象,围绕择优对象,各领域进行进一步纵向深入的发展。从表2来看,节点和连线数量猛增,知识耦合网络规模大幅增长,产生了大量知识元素的积累,密度减小,相对而言新增耦合关系仍为弱关系,平均加权度增加,知识元素之间的耦合越来越频繁。值得注意的是,平均路径长度转而下降,表明尽管知识边界有所扩张,但知识元素之间频繁的耦合使得其距离进一步缩短,网络流动性增强。总体表现为在前期驱动机制继续作用的基础上,对异质性知识的吸纳,转为对细分领域内知识的深化,对中介效应的依赖减弱,与机理分析中耦合网络形成后期的变化得到印证。
将各项驱动知识耦合网络形成的机制作为假设变量,构建ERGM模型。ERGM模型的构建以基准模型为起点,基准模型由网络的边构成,依次纳入网络结构变量、节点属性变量和节点关系属性变量。参考以往研究,结合知识耦合网络形成机理分析与演化过程分析,选择几何加权度和加权边共享作为网络结构特征的解释变量,体现择优性与传递性。几何加权度考察观测网络中不断递减的度分布特征,能够确定度分布对于知识元素与其他节点联系倾向的影响,反映耦合关系形成的择优性。加权边共享衡量具有共享边的三角结构的数量,能够确定知识节点在网络中作为共同耦合对象的倾向,反映耦合关系形成的传递性机制。利用中心性指标作为节点属性的解释变量,考虑到度中心性与几何加权度在模型中可能存在重叠,选取接近中心性和中介中心性,反映知识耦合过程中的邻近效应和中介效应。利用关键词所属知识领域,反映节点关系中的领域同配性,余弦相似性反映节点关系中的节点同配性。考虑到时间序列对于耦合网络的影响,补充关键词出现的时间这一变量,反映知识耦合过程中存在的时间效应。以上各变量说明,如表3所示。
表3 ERGM的变量说明
ERGM模型的一般表达公式如下:
(1)
不同阶段知识耦合网络的ERGM模型拟合结果如表4、表5、表6所示。其中,Model1为基准模型,Model2仅加入了网络结构变量,Model3仅加入了节点属性变量和节点关系属性变量,Model4同时加入了网络结构变量、节点属性变量与节点关系属性变量。通过对比4个模型的AIC和BIC值,可以看出Model4的总体拟合效果最好,说明加入网络结构、节点属性和节点关系属性的ERGM模型更趋向于真实的知识耦合网络,所选取变量的意义得到验证。因此,以Model4模型,分析各阶段耦合网络的形成机制。
表4 技术萌芽期ERGM模型结果
表5 初步发展期ERGM模型结果
表6 快速成长期ERGM模型结果
表4为2006-2010年自动驾驶技术萌芽期ERGM模型结果,由前面机理分析可知,知识耦合网络形成初期,耦合动力机制为择优性和传递性,从Model4结果显示来看,几何加权度、加权边共享正向显著,得到验证。此外,发现接近中心性也显著为正,邻近效应驱动知识耦合,表明初期知识元素的择优和传递过程是从相邻节点逐渐向外扩散。由于知识耦合的现象较少,在此阶段其他节点属性和关系网络对于耦合网络的形成并不明显。
表5为2011-2015年自动驾驶初步发展期ERGM模型结果,Model4(2006-2010)为表4中技术萌芽期模型结果,对比发现:几何加权度、加权边共享和接近中心性正向显著,择优机制、传递机制和邻近效应仍驱动耦合网络的形成;中介中心性显著为正,处于结构洞位置的知识元素连接了各个知识领域的异质性知识,中介效应开始影响耦合网络形成;关键词时间因素显著为负,网络开始出现时间偏好,较早出现的知识元素更重要[31];知识领域因素显著为负,余弦相似性显著为正,知识元素倾向于跨领域建立耦合关系,同一知识领域内,语义相似的知识元素容易彼此耦合。
表6为2016-2020年自动驾驶快速成长期的ERGM模型结果,Model4(2011-2015)为表5中技术萌芽期模型结果。2016年国际自动机工程师学会(SAE International)颁布了《标准道路机动车驾驶自动化系统分类与定义》(SAE J3016),制定了一套自动驾驶分类标准,自动驾驶领域出现主导设计,与上一阶段Model4(2011-2015)进行对比,Model4结果产生了较大的变化。主导设计的出现导致爆发式的知识增长,几何加权度系数猛增,围绕几大核心技术的知识耦合活动成为常态;接近中心性显著为正,中介中心性从显著为正变为显著为负,表明耦合网络流动性增强,节点间的距离变短,知识元素耦合不再需要特定的中介;时间因素仍显著为负,但系数从-0.0285变为-0.0089,意味着新知识的价值增加,时间偏好带来的影响降低,知识领域因素从显著为负变为显著为正,余弦相似性显著为正,相同领域的知识元素耦合发生概率增加,知识冗余性增加,知识专业化程度增加,创新效率提高。
从不同阶段知识耦合网络的ERGM模型拟合结果来看,基本验证了机理分析中所提出的驱动机制。新兴技术知识耦合网络的形成受到知识网络特性与新兴技术特征的影响,由于知识网络具有小世界和无标度特性,新兴技术具有新颖性、跨领域、不确定性、广泛影响性和相对快速发展的特征[32],使得择优性、传递性、邻近效应、中介效应、异配/同配性等影响知识耦合网络形成。在不同阶段中,受其自身的目的和需求的影响,其驱动机制对知识耦合的影响和作用方式也有所差别。
本文分析了不同时期新兴技术知识耦合网络的形成机理,提出驱动网络形成机制,通过DII,收集了2006-2020年自动驾驶技术领域的专利数据,通过RAKE构建知识耦合网络,利用ERGM模型,从网络结构、节点属性和节点关系属性三个方面,验证不同阶段影响知识耦合网络形成及其机制,从微观视角揭示了新兴技术知识的产生、更新和演化规律,主要研究结论如下:
基于新兴技术知识耦合网络形成的机理分析,知识节点的耦合关系受到网络结构、知识节点属性和节点关系属性三个维度的影响,包括择优机制、传递机制中介效应、邻近效应、异配性/同配性,此外由于知识进化,耦合关系还受到时间效应的影响。
新兴技术知识耦合网络形成过程中,网络结构保持稳定,择优机制和传递机制始终驱动知识耦合,不同阶段择优机制作用的对象不同,且受到时间效应的影响,从初始知识领域到相邻领域、最新领域的核心节点,最终形成稳定的择优对象;节点属性上,邻近效应始终驱动知识耦合,中介效应的驱动作用从正向变为负向,初始网络从相邻知识领域开始,逐步向外扩张,耦合的频繁发生导致网络出现“液态化”,节点间距离变短,知识边界模糊,后期知识元素耦合不再需要中介;节点关系属性上,初期知识领域间的异配性驱动知识耦合,网络中异质性知识不断增多,随着知识进化,新知识的价值和复杂程度增加,前期吸纳的异质性知识充分融合,对异质性知识的吸收转变为对知识专业化的追求。
本文仅从技术知识层面出发,运用专利数据构建新兴技术知识耦合网络,结论普适性仍待进一步检验。在未来的研究中,还应结合非专利文献分析的方法,并考虑多个技术进行对比分析,更有利于验证和归纳知识耦合网络的形成过程。