段庆锋 蒋保建
〔摘 要〕虽然结构嵌入在技术合作过程中的重要性已受到学者重视,但仅停留在结构特征统计描述层面,并不足以揭示技术合作背后的因果机制。从网络视角,将技术合作影响因素划分为内生和外生两方面,通过ERGM模型,重点考察不同结构嵌入效应,以揭示技术合作网络生成机制。基于石墨烯领域合作专利的实证研究发现:技术合作倾向于嵌入闭合三角结构,而非星型结构、2-路径,说明闭合性是技术合作网络形成的关键内生机制;外生性因素方面,表现出强烈的地理同配倾向。研究结果说明网络结构是技术合作关系社会化特征的反映,技术合作是内生、外生因素交织结果。
〔关键词〕技术合作;网络结构;ERGM模型;指数随机图;石墨烯;合作专利
DOI:10.3969/j.issn.1008-0821.2018.08.011
〔中图分类号〕F204 〔文献标识码〕A 〔文章编号〕1008-0821(2018)08-0083-07
〔Abstract〕It could hardly discover the underlining causal relationship behind technology collaboration if only relying on statistical description about its structure characteristics,although structure embeddedness in technology collaboration network has been paid attention to by scholars.Influencing factors upon technology collaboration were classified into endogenous and exogenous parts from views of technology collaboration network,and ERGM was applied to mainly analyze the effects of structure embeddedness in purposes to discover mechanisms of forming technology collaboration network.Some conclusions were found by the empirical research based on collaborative patents in graphene field.Technology collaboration tend to embedded in closed structure of triangle,but not star or 2-path,which illustrated that closure in structure was the key endogenous mechanism to form technology collaboration network.Furthermore,tendency of homophily in geography could be significantly found in exogenous aspect.Empirical results demonstrated that network structure reflected the socialization characteristics of technology collaborative relationship,and intertwine between endogenous and exogenous issues ultimately resulted in technology collaborations.
〔Key words〕technology collaboration;network structure;ERGM;graphone;collaborative patents
开放式创新背景下,技术创新合作已经成为科技发展的常态形式,技术网络嵌入是创新主体接入技术前沿的有效途径。学界及工业界都发现技术合作不是随机呈现的,合作关系的分布受到了结构嵌入影响,也意识到特定技术网络结构背后存在着相应动力机制[1-2]。如何根据外部复杂多变的技术网络嵌入环境,选择最有利的技術合作方式,是每个企业及研究机构面临的挑战和机遇。揭示国际技术合作网络结构生成机制是技术创新内在机理理论基础的深化,同时对国际技术合作发展具有实践启发。
从结构视角分析技术合作网络的文献非常丰富。值得注意的是,社会网络和复杂网络理论及工具的发展是技术合作网络结构研究的助推器,从多视角、多层面揭示了网络结构的关键特征及动态演化[3-4]。梳理文献,这些研究虽然成果斐然,但是在揭示技术合作网络背后生成机制方面存在严重不足。一是,大量研究停留在网络结构统计特征层面,通过网络节点及边的统计指标来刻画网络拓扑,只是反映了网络外在特征,却难以揭示网络结构背后的动力机制。二是,针对网络生成机制的研究大多为理论仿真,理论演绎的研究逻辑缺乏实际证据支撑,研究结果的有效性受到制约。三是,建模方法上,基于传统回归模型的网络建模以网络边的独立性为前提,显然简单化的假设并不符合网络事实。网络边的相关性是网络结构形成的关键要素,因此非常有必要以网络边相关性为基础,构建网络因果模型,测度不同结构对技术合作网络生成的贡献程度。
指数随机图模型ERGM(Exponential Random Graph Models)是专门针对网络边的建模工具,能够刻画网络生成的因果关系,是社会网络分析的前沿成果。以Snijders、Robins、Goodreau、Wang为代表的学者推进下[5-7],模型方法趋于成熟,同时在多个领域日益广泛地应用,例如社会网络、组织网络、知识网络、贸易网络等[8-10]。不过,目前还未发现将ERGM模型应用于技术合作网络的有关文献。
针对上述研究缺口,采用指数随机图模型,从网络结构视角建模,并实证研究国际技术合作网络的影响因素。具体地,以石墨烯领域美国USPTO数据库专利为样本,构建网络模型,测度不同网络结构的影响效应,以揭示国际技术合作网络生成机理。
1 研究方法
1.1 研究框架
研究直接目标在于度量各种网络结构对国际技术合作网络生成过程的贡献程度。研究思路的关键在于针对合作网络构建因果模型,以揭示包括网络结构在内的各种潜在影响因素。指数随机图模型在表征网络结构效应方面具有分析优势,能够满足研究需要。主要体现在以下方面:其一,模型具有天然适用性。技术合作相互联结形成网络,如果将二元合作关系视为网络边,则可以将技术合作的影响因素研究,转化为技术合作网络的建模问题。而ERGM模型正是针对网络边建模的有力工具,能够揭示不同网络因素在技术合作过程中的作用机理。其二,模型能够刻画网络结构效应。传统回归模型虽然能够揭示因果关系,但是却难以刻画网络结构的影响性。原因在于网络边之间存在相关性,违反了传统回归模型要求的序列无关性假设,导致无法将网络结构作为模型变量,而基于Markov网络假设的ERGM模型能够克服这种拟合困难,能够有效刻画网络结构对网络生成的影响程度。其三,模型能够同时度量多种网络影响因素。从网络视角,将影响因素划分为内生因素和外生因素。网络结构反映了网络系统的内生动力,是内生因素;而基于节点及边的相关属性是外生因素。因此,模型可以纳入包括网络结构在内的多种变量,能够全面地揭示网络生成过程。
按照ERGM模型理论,技术合作网络的生成机制由2类因素构成:内生因素和外生因素,如图1所示。社会网络分析的重要理论基础是认为网络边存在相互依赖[11],即某条边是否发生是以网络其他边的配置情况为条件。这种网络边的自相关机制在网络宏观层面涌现为结构[12],因此通过呈现出的网络结构特征可以分析并推断潜在的网络内生动力机制。这里将网络内生机制归纳为3类:扩张性、闭合性和中介性。扩张性反映了不断新建技术合作关系,扩大个体中心网络规模的倾向,通常呈现星型结构;闭合性反映了技术合作关系的传递路径倾向,两创新主体间存在直接或间接联结的网络路径,例如三角结构;中介性反映了承担技术中介的功能倾向,技术创新主体与两个非直接联结主体建立联结关系,如2-路径结构。
除了内生性结构因素,ERGM理论还认为网络生成过程还受到系统外部因素影响,包括节点属性和边属性。这里将网络外生机制归纳为:同配性和马太效应。同配性机制指某种属性接近的创新主体更容易建立技术合作关系[13]。技术创新理论认为组织、技术、制度等方面的接近性有利于双方建立信任、提高知识交流效率、便于形成技术协同[14],因此同配性影响技术合作几率。另外,马太效应指技术创新能力越强,越倾向于建立技术合作关系。马太效应机制可以从两方面加以解释:一是吸收能力理论认为主体在将外部知识内化并转化为技术创新能力方法存在差异,吸收能力有利于提高技术合作绩效[15],因此吸收能力越高,对外技术合作动力越强;二是按照技术竞争理论,技术创新能力强的主体在技术合作选择博弈中具有优势,更容易被其他主体选择为合作对象[16]。
基于上述机制理论分析,可以选择相应的因素变量,尝试构建ERGM模型,研究大致流程如图2所示。构建模型的重要挑战在于模型的设定过程,合适的统计量能够有效捕捉结构效应,并有助于提高模型拟合程度。虽然研究概念模型给出了理论启发,但由于缺少应用于技术合作网络的实证研究参照,需要理性设计与反复尝试。模型构建的基本思路,如图2所示。首先,从最简单模型(只包含边统计量的贝努利模型)开始,以技术合作网络生成机制为指导,逐步加入有关统计量,直至确定模型;其次,对模型进行参数拟合,检验模型显著性,分析整体拟合程度;最后,判断模型拟合效果,如果达到预期目标,则给出分析结果,否则根据拟合效果,尝试调整模型,重新设定模型,重复上述过程,直至满足分析要求。
1.2 模型定义
ERGM模型是一套专门针对网络关系的统计建模方法[5],属于生成式模型,能够对网络结构的涌现给予解释。模型中,将网络联结的概率作为因变量,而基于各种网络结构的统计量作为自变量,其中这些网络结构也被称为构型(Configuration)。具体地,假定Y代表随机网络集合,y∈Y是随机网络的某个具体实现。进一步,将事实网络y发生的概率建模為各种可能的内生因素(网络构型)、外生因素(网络节点及边属性)。网络构型是ERGM模型重点关注的统计量,代表了各种不同的网络结构,常见的如星型结构、三角结构、甚至更复杂结构。一般地,模型设定为指数函数形式,如公式(1)所示[6]:
其中变量Y和y的定义如前所述;X为协变量向量,代表网络节点、边的外生属性;g(y,X)代表各种统计量组成的向量,包含构型变量及外生协变量;θ为待估计参数向量,取值反映了各个变量对网络生成的影响程度;κ(θ,y)是模型的归一化因子,该常数项能够保证模型计算值符合概率的数学定义,即∑z∈Yexp{θTg(z,X)}=1。θ是后续实证分析关注的焦点,取值反映了统计量g(y)对网络生成的边际效应,通过θ的显著性、方向、取值大小可以直接判断相关影响因素的贡献程度。
1.3 变量定义
由技术合作网络生成机制出发,选择有关统计量作为模型因素变量。下面,列出后续实证分析用到的统计量定义,如表1所示。
边数Edges。定义为网络边的数量。该统计量基于网络边同质性假定,即所有的边对网络生成过程具有相同影响。其反映了网络边的基准效应,解释能力相当于回归模型的常数项。
度分布Degree(k)。定义为度中心性为k的个体中心网络(Ego Network)数量,其中k为取值正整数的常数。该构型代表了星型结构,中心节点拥有k个邻居,而其他节点将关系资源聚集于中心节点。个体中心网络反映了技术创新主体向外扩张关系,形成冗余关系的合作倾向。
同配三角Triangle(δ)。定义为拥有相同属性δ节点形成的闭合三角数量。该构型代表了同配属性节点形成的三角结构;等价地,任意两节点不但存在直接联结,还有路径长度为2的间接联结。三角结构反映了技术创新主体间形成闭合路径的倾向,冗余路径的存在有利于提高主体间资源、知识的交流效率。
另外,还选取了3个表现为加权和形式的高阶统计量,具体包括:几何加权度分布项Gwdegree,能够捕捉呈现星型结构的倾向性;几何加权边共享伙伴Gwesp,能够捕捉边形成闭合三角结构倾向性;几何加权二元共享伙伴Gwdsp,能够捕捉网络形成2-路径或者节点承担中介功能倾向性[17]。模型加入高阶统计量的原因在于:一是能够有效降低简单统计量导致的模型退化风险[18];二是具有等价的结构效应解释能力[19],提高模型结果分析的可靠性。
除了上述内生构型变量之外,模型还加入了其他外生变量。选取两个典型统计量,节点同配和节点属性。
节点同配Nodematch(δ)。定义为两端点拥有相同属性δ的网络边数量。该统计量可以捕捉节点同质性对于网络生成的影响效应。
节点属性Nodecov(δ)。定义为对所有网络边的端点属性δ取值的求和。该统计量可以捕捉节点属性δ大小对网络生成的影响效应。
2 实证分析
2.1 数据来源及处理
专利合作是一种重要的深度技术合作形式,合作双方不但分享技术知识,更共同拥有专利的经济收益垄断权[20]。若干文献已经证实通过专利可以有效地揭示技术合作特征及机制[21],因此本文选择石墨烯领域合作专利,采用ERGM模型进行实证研究。
数据源为美国专利数据库USPTO。以“Graphene”为检索关键词,查询专利标题或摘要中包含检索词的记录,得到涵盖时间2005-2017年的初步记录1 800条。其次,进行数据筛选和清洗,对机构名称进行规范和统一,留下至少包含两个专利权人的合作专利,最终得到数据集合183条。然后,抽取专利元数据,主要包括专利所有权人、国家、城市,以用于网络构建及外生变量计算。
2.2 网络构建及描述特征
以专利所有权人为节点,共同申请专利为边,构建专利技术合作无向网络。网络包括节点144个,边200条,如图3所示。整体上看,聚类系数(0.109)和网络密度(0.015)都偏低,说明处于技术成长期的石墨烯技术[22]仍存在较大的专利合作增长潜力。
图3 石墨烯领域专利技术合作网络
技术合作网络微观结构是关注的焦点。表2列出了实证网络的典型拓扑结构特征分布,包括节点度分布、三角性及多边形。由于网络中没有孤立节点,故度分布从1开始。可以看出随度中心性增加,度分布急剧衰减,大部分组织只有1或2个合作者,最多达到7个。网络边形成的闭合结构中,三角结构7个,四边形1个,没有更多边数构成的闭合结构。闭合结构的分布说明三角结构是集中呈现的闭合式合作模式。
2.3 模型结果
模型变量的最终确定需要考虑两方面:一是能够检验不同结构的影响效应,揭示技术合作网络生成机制;二是利于模型拟合,避免模型退化问题。因此,模型不但选择了不同构型的简单统计量、外生协变量,还加入了高阶统计量。采用R软件中的STATNET程序进行模型拟合,方法为MCMC MLE,经过反复尝试和修正模型,得到最终拟合结果,如表3所示。
扩张性机制可以通过高阶构型Gwdegree和简单构型Degree(k)加以刻画。Gwdegree的系数显著为负,说明整体上网络并不倾向于生成星型结构。由于统计量Gwdegree是由多项度分布的几何加权和,无法反映不同度分布的结构效应,因此选择了数量排前3的简单构型。变量Degree(2)的系数显著为正,意味着度中心性为2的个体中心网络每增加1个,则网络边联结的概率约增加到68(=e4.222)倍。变量Degree(3)的系数显著为负,同理意味着度中心性为3的个体中心网络每减少1个,则网络边联结的概率约增加到3.5(=e1.262)倍。变量Degree(4)系数并不显著。另外经过验证发现再加入更高度中心性的构型都不再显著。总之,整体上看,石墨烯领域技术合作不倾向于形成资源集中的星型结构,但局部层面具有非常强的倾向建立度中心性为2的个体中心合作网络。
闭合性机制通过2个变量Gwesp和Triangle(Country)加以刻画。几何加权边共享伙伴Gwesp的系数显著为正,說明技术合作网络倾向于涌现三角闭合结构。为了深入理解闭合模式的生成机制,模型还加入了同时考虑外生属性的三角构型。国家同配三角Triangle(Country)的系数显著为负,说明不同国家机构形成三角合作结构的概率是相同国家的10(=e2.351)倍,反映了跨国技术合作更易于嵌入三角结构。
中介性机制通过变量Gwdsp加以刻画。几何加权二元共享伙伴Gwdsp的系数显著为负,说明技术合作网络并不倾向于形成开放三角结构。这种负效应可能原因在于:依赖于第三方组织的资源及知识获取方式并不可靠,间接传递的知识存在被扭曲的可能,不利于提供知识交流效率。
同配性机制通过变量Nodematch(δ)加以刻画。Nodematch(City)和Nodematch(Country)的系数都显著为正,意味着相同城市、相同国家机构建立技术合作关系的概率分别是不同城市、不同国家的4(=e1.392)倍、27(=e3.303)倍。结果反映了在地理层面(国家和城市),存在强烈的同配倾向。
马太效应可以通过Nodecov(Patents)加以刻画。变量Nodecov(Patents)系数显著为负,意味着历史累积申请专利数每减少1件,则对外建立技术合作的概率增加到13(=e2.567)倍。结果说明并不存在技术合作的马太效应,而是技术创新实力低的组织具有更强烈的对外技术合作倾向。导致马太效应机制失效的原因可能与石墨烯所处的技术生命周期有关,在发展初期,技术成熟度低,还没有形成明显的技术垄断或分化局面,因此出现大量分散的技术后来者技术合作机会。
2.4 拟合优度分析
为了判断模型对事实网络的还原能力,需要进行拟合优度分析。将事实网络与由拟合模型得出的模拟网络进行比较,如果统计指标指标分布接近,则说明模型拟合优度高,否则说明拟合优度低。选择4个典型的统计量作为比较指标,包括最短测地距离GD(i)、度中心性Degree(i)、边共享伙伴EP(i)、二元共享伙伴DP(i)。模型拟合优度分析,如图4所示,其中黑实线代表事实网络的统计特征,箱型图代表由拟合模型模拟得到的采样网络特征。可以看出,拟合模型高估了測地线距离特征(左上角子图),而在其他3个指标方面则与较好地还原了事实网络特征。整体上,通过4个指标比较分析,说明模型拟合优度满意,具有复原事实网络统计特征的能力,能够捕捉技术合作网络生成关键机制。
3 结论与启示
技术合作具有不同的结构嵌入倾向。以石墨烯领域合作专利为数据,采用ERGM模型,定量化测度不同结构的技术合作影响效应,以揭示技术合作产生机制。实证得到基本结论:①技术合作倾向于嵌入闭合三角结构,而非星型结构、2-路径,说明闭合性是技术合作网络形成的内生机制。②外生性因素方面,技术合作表现出地理同配倾向,而非马太效应。由上述实证结果,可以得到以下启示。
1)合作网络结构是技术关系社会化特征的体现。研究说明技术合作不是孤立存在,合作关系间交互性反映了技术合作的社会化特征,这种内生性机制被多数研究忽视。结构特征是技术合作网络自组织的结果,特定的合作自相关性分布将导致不同的结构嵌入倾向,进一步这种关系嵌入影响着技术合作成功与否。实证网络表现出对闭合三角结构的偏好,而对星型、2-路径的抑制效应,充分说明了技术合作社区化倾向,相对扁平化结构形态更利于形成平等、互利、共赢的技术合作。
2)技术合作是内生、外生因素交织的结果。从网络视角,将技术合作影响因素划分为内生和外生两方面,更有利于揭示技术合作背后生成机理全貌。虽然本文重点考察了内生性结构效应,但仍充分说明技术合作影响因素的多元复杂性。例如,实证揭示三角结构的国家异配性,说明跨国的技术联盟倾向性,充分反映了外生地理因素与内生三角结构效应的共同影响。另外,研究也充分验证了ERGM对技术合作网络的建模能力,能够同时将内、外生多种因素纳入同一分析框架,是全面揭示技术合作多元复杂机制的有力分析工具。
本文的贡献在于:不同于以往研究只是停留在技术合作网络结构特征的简单描述与统计,而是采用ERGM模型,定量测度了不同结构对技术合作网络生成机制的贡献程度。研究方法由一般统计扩展到因果模型,研究焦点由结构发现深入到生成机制,研究结果有助于技术创新合作理论的深入和研究方法的创新。研究难以避免的不足之处是样本局限性,石墨烯是典型新兴技术,未来研究有必要选取技术成熟度高的领域加以分析,以检验结论普适性和模型有效性。
参考文献
[1]丁莹莹,宣琳琳.我国海洋能产业产学研合作创新网络的实证研究——基于网络结构的视角[J].工业技术经济,2015,(5):29-40.
[2]吕鹏辉,刘盛博.学科知识网络实证研究(Ⅳ)合作网络的结构与特征分析[J].情报学报,2014,(4):367-374.
[3]袁剑锋,许治,翟铖.中国产学研合作网络权重结构特征及演化研究[J].科学学与科学技术管理,2017,38(2):115-126.
[4]颜端武,刘秋艳,陈坤.基于专利计量的电动汽车领域技术创新网络演化研究[J].现代情报,2016,36(7):144-150.
[5]Robins G,Pattison P,Kalish Y,Lusher D.An Introduction to Exponential Random Graph(P*)Models for Social Networks[J].Social Networks,2007,29(2):173-191.
[6]Goodreau S M.Advances in Exponential Random Graph(P*)Models Applied to a Large Social Network[J].Social Networks,2007,29(2):231-248.
[7]Snijders T A B,Pattison P E,Robins G L,Handcock M S.New Specifications for Exponential Random Graph Models[J].Sociological Methodology,2006,36(1):99-153.
[8]Cimenler O,Reeves K A,Skvoretz J.An Evaluation of Collaborative Research in a College of Engineering[J].Journal of Informetrics,2015,9(3):577-590.
[9]陈华珊.虚拟社区是否增进社区在线参与?一个基于日常观测数据的社会网络分析案例[J].社会,2015,35(5):101-121.
[10]时少华,孙业红.遗产地旅游发展利益网络治理研究——基于指数随机图模型、以农业文化遗产地云南哈尼梯田为例[J].经济管理,2017,(2):147-162.
[11]Robins G,Snijders T,Wang P,Handcock M,Pattison P.Recent Developments in Exponential Random Graph(*)Models for Social Networks[J].Social Networks,2007,29(2):192-215.
[12]刘雨农,刘敏榕.社会化问答平台的社区网络形态与意见领袖特征——以知乎网为例[J].情报资料工作,2017,(2):106-112.
[13]段庆锋,潘小换.文献相似性对科学引用偏好的影响实证研究[J].图书情報工作,2018,62(4):97-106.
[14]曹兴,宋长江.认知邻近性、地理邻近性对双元创新影响的实证研究[J].中国软科学,2017,(4):120-131.
[15]范群林.外部知识、吸收能力与创新绩效——基于文化科技融合的视角[J].现代情报,2016,36(2):12-19.
[16]Peng T Q.Assortative Mixing,Preferential Attachment,and Triadic Closure:A Longitudinal Study of Tie-Generative Mechanisms in Journal Citation Networks[J].Journal of Informetrics,2015,9(2):250-262.
[17]Morris M,Handcock M S,Hunter D R.Specification of Exponential-Family Random Graph Models:Terms and Computational Aspects[J].Journal of Statistical Software,2008,24(4):1548.
[18]Brughmans T,Keay S,Earl G.Introducing Exponential Random Graph Models for Visibility Networks[J].Journal of Archaeological Science,2014,49(1):442-454.
[19]Morris M,Handcock M S,Hunter D R.Specification of Exponential-Family Random Graph Models:Terms and Computational Aspects[J].Journal of Statistical Software,2008,24(4):1-24.
[20]周磊,张玉峰,吴金红.专利视角下企业合作竞争中三种接近性的作用[J].情报学报,2013,32(7):676-685.
[21]马艳艳,刘凤朝,孙玉涛.中国大学-企业专利申请合作网络研究[J].科学学研究,2011,29(3):390-395.
[22]乐思诗.基于专利分析的全球石墨烯技术发展现状及趋势研究[J].世界有色金属,2017,(9):94-95.
(责任编辑:孙国雷)