陈淑平
(燕山大学图书馆,河北 秦皇岛 066004)
社会网络分析(Social Network Analysis,SNA)[1-2]基于图论、矩阵等对社会关系结构及其属性加以分析,是一套对个体关系、社会现象、组织结构、社区关系等进行分析的规范和方法。近年来,社会网络分析在信息计量与情报分析等领域受到广泛关注,研究人员借助科研合作网络研究某一领域科研合作发展状况与趋势,反映合作者间的学术网络关系,揭示学术信息交流传播规律等。
社会网络分析在专利分析的相关研究主要从以下几方面开展。一是对核心团队和发明人的分析:王立杰等[3]基于Ucinet社会网络分析对专利发明人团队和核心发明人进行了分析。二是对区域产学研合作模式的研究:刘红光和刘琼[4]通过申请人合作演化路径反映浙江大学近20年间专利合作模式的变化情况。刘桂锋等[5]基于社会网络分析探讨了校企合作的技术领域和地理距离。刘桂锋等[6]又以清华大学为例,从可视化的角度展示合作主体分布以及相互之间的关联。三是对企业、高校或区域合作网络的分析:温芳芳[7]通过构建区域技术合作网络,直观展示和定量分析我国区域之间以专利为载体的技术合作现状及其模式与规律。贡金涛等[8]利用社会网络分析方法探测企业技术研发绩效水平、科研合作状况与核心技术人员分布等。四是通过专利引用网络分析专利分布和竞争态势:侯筱蓉[9]对行业竞争对手的分布以及相互之间的关联进行可视化。五是对企业科研水平的评价:贡金涛等[10]基于专利合著指标和引用指标,利用灰色关联分析法确定关联系数,利用熵权法计算出创新人员的技术水平综合值。目前在科研评价的研究方面,国内外的研究主要以论文为视角,而基于专利视角的研究较少。
另一方面,在科研评价的研究中,基于h指数的研究在学术论文方面正如火如荼地开展。h指数一经问世[11],就受到了广泛关注,它将论文的“质”和“量”结合起来,虽然h指数本身还存在多方面不足,但由于其计算简单快捷,成为不可或缺的衡量指标。在专利方面,基于h指数的相关研究主要有针对机构专利研发能力和影响力的研究[12-14],机构包括高校、企业、国家范围,这其中也包括基于分时间段和分领域的企业技术竞争力分析[15];基于h指数的专利权人评价[16-18];针对特定领域的专利影响力评价[19]等。
在专利研究领域同时涉及社会网络分析和文献计量的科研评价体系研究较少,本文基于专利视角,结合社会网络分析和文献计量2种方法,分析企业专利合作网络的整体结构特性和节点特性,结合申请量、被引频次、h指数,尝试构建综合指标。在数据处理与研究方法方面,利用NodeXL软件建立企业专利合作网络,利用SPSS软件的因子分析法获得综合指标。
本文以创维有限公司作为实证研究对象,以德温特专利数据库为数据来源,数据检索截至2019年12月31日。专利类型包括发明专利、实用新型、外观设计,共计得到3 395条记录,对合著情况、申请量、被引频次进行统计。其中合著专利数为1 756件,独著专利数为1 639件,合著专利占全部专利的51.72%;作者总计890人,其中,793人与他人发生合作,97人未与他人发生合作。利用NodeXL软件构建专利合作无向网络,该网络具有793个节点、8 248条边(见图1),图中边的粗细表示2个节点之间的合作频次,合作次数越多,边越粗。
图1 创维公司专利合作网络
社会网络整体结构特性分析包含凝聚性、连通性和节点度特性三方面内容。凝聚性通常采用网络密度、平均路径长度、聚类系数表征[1-2,20]。虽然本文专利合作网络规模较小,但网络密度值为0.012 4,相对较大,说明该网络中各个节点之间的连接较紧密,合作关系比较频繁。该网络的平均路径长度为3.245 6,社会网络中任意节点之间距离的平均值为4,符合复杂网络理论中的“小世界效应”,网络中的任一节点平均通过4次关联就可以沟通到其他节点。该网络聚类系数为0.511,说明该网络中与某一节点相连的其他2个节点彼此相连的可能性较大,具有聚类效应,该网络存在长期合作的团体。
网络连通性[20-21]是指社会网络中任意2个节点间至少有一条连接路径存在,具有连通性的子网络称为联通体。排除97位未与他人发生合作的作者,该专利合作网络具有11个联通体。其中最大的联通体包含773个节点,占整个创维公司专利合作网络的86.85%,联通体中边数最多的包含8 238条边,占整个合作网络边数的99.88%,说明该公司已经形成了绝对的群体效应,存在广泛的技术合作与交流。
度数描述了在无向网络中所有与某一节点相连的连线数量,在该专利合作网络中,度数为1的节点共计105个,而拥有最高节点度数为93的节点仅有1个,各节点度数分布情况(见图2),节点数量随着节点度数的增加而快速减少,直至趋于一条直线,节点度分布基本遵循“二八定律”[22],拥有较大度数节点非常少,而这部分节点与其他节点的联系较强,合作和技术交流频繁,说明该合作网络的专利技术合著存在明显的优势累加效应,即“马太效应”[23],少数技术骨干的节点度数较高,形成集聚的趋势。
图2 网络节点数与节点度数分布
上述分析结果表明,创维公司已经形成了比较稳定的科研团体,建立了初具规模的技术交流与科研合作模式,团体内部存在广泛的技术交流和合作,整体科研力量分布较集中,拥有卓越的技术骨干和创新带头人。
节点度分析考察的是节点的点度中心度指标,笔者发现拥有较小度数的节点大量存在,在节点度分布图中形成长尾,这部分节点与其他节点合作与技术交流较少,但是否在网络中发挥着其他作用,还需要继续分析节点的其他中心度特性,如中介中心度和特征向量中心度[20-21]。进而对网络节点集聚或离散进行干预指导,促进网络内部知识和技术的流动,推动整个合作网络的积极发展。
根据普赖斯核心作者的计算公式M=0.749(Nmax)1/2,计算出约有22名创新人员为该企业专利研发核心人员,表1为该专利合作网络中基于上述中心度排名前22名的作者。
表1 基于三个中心度指标的前22名核心作者排名
在该专利网络中,不具有中介中心度值的节点共计 415个,占整个连通体总节点数的 46.63%,表明有较大部分创新人员较少参与技术交流,或者不具有控制其他人员技术交流或合作的能力,在公司科研网络中处于不利地位,需要加强这部分科技人员的技术交流意识和能力,调动其工作积极性与创新性,培养和发掘潜在科研合作力与影响力的技术带头人。
为了清楚识别该公司的科研带头人,判断技术人员在企业中的作用,基于3个中心度建立x、y、z坐标系,x轴表示点度中心度,y轴表示中介中心度,z轴代表特征向量中心度,原点表示在3个中心度排名中分别排在第22位,获得的8个分区如表2所示。
表2 基于创新人员中心度指标数据的三维分区
从三维分区中,笔者发现,位于A分区的作者有Li Y、Wang X、Wang Y、Liu X、Wu Z、Wang L、Wang Z,这几位科技人员的3个中心度排名都在前22名之内,这些人员与其他人员有着更多的合作交流,在公司内部技术传播中发挥着重要中介作用,在整个专利合作网络中具有重要的影响力,在创维公司的科研研发中处于绝对的中心地位。
处于B、C、D分区的创新人员也有着较高的影响力,例如处于B分区的人员具有较高的点度和中介中心度,但特征向量中心度值略低,对重要节点的信息传递能力较弱;处于C分区的人员中介中心度较其他2个中心度低,具有广泛的合作和整体影响力,但在技术交流中的中介作用和组织能力较弱;处于D分区的人员具有较强的中介作用,是潜在的技术组织者,具有较高的整体影响力,但技术合作频率不高。企业可以针对这些人员进一步有针对性地提升其短板,培养全方位创新带头人。
同时,针对处于E、F、G、H分区的技术人员,首先要强化其交流合作的意识,并积极为其创造交流和合作机会,调动其积极性,促进合作网络的整体协调发展。
申请量从“量”的角度衡量创新人员的影响力,申请量越大,说明科研积极性越高,越容易获得合作交流机会,产出高水平成果的可能越大。专利被引频次从“质”的方面评估创新人员的学术影响力,单篇专利被引频次越高,说明该专利受到同领域研究人员认可的程度越高,研究内容或为该主题研究基础,或为具有较高价值的研究成果,获得越高被引频次的专利极有可能为该主题的核心专利。作者总被引频次越高,也说明了该作者所申请专利中存在具有较高价值的专利。但也存在申请量大而总被引频次反而低于申请量小的作者的情况,因而不能单独采用申请量或被引频次来评估创新人员的影响力。
h指数[11]将发文数量与发文质量有机地结合起来,同时考量文献数量和质量,比单纯采用数量或被引频次评价科学家个人学术影响力更加合理。该文对创维公司创新人员的专利申请量、被引频次、h指数进行计量分析,申请量排名在前22的作者如表3所示。
表3 申请量排名前22的作者
作者Wang X的申请量和被引频次都较高,因而h指数也较高,而作者Wang Y的申请量较高,但被引频次较Wang X低很多,h指数较低;作者Xu Y虽然申请量排名第六,但拥有较高的被引频次,其被引频次排名第二位,获得了较高的h指数。虽然h指数综合考虑了申请量与被引频次,但其排名区分度很低,常常出现多名作者具有相同的h指数的情况,同时,h指数也忽略了h核内的文献被引频次的高低。
结合该公司专利合作网络的中心度指标,笔者发现,在3个中心度指标中排名都在前22的7位作者中,有5位作者Li Y、Wang X、Wang Y、Liu X、Wu Z的专利申请量在前22名中,但点度中心度排名第一的Li Y,其申请量、被引频次、h指数都不是很高,而作者Wang C和Zhang S的申请量排名靠前,但其点度中心度仅为17。这说明创新人员个人科研能力和其在合作网络中的影响力并不完全相关。为了考察申请量、引用指标与中心度指标的相关性,采用Spearman计算相关性矩阵[24],结果如表4所示。
表4 相关矩阵
从表4可以看出,申请量和被引频次与其他指标显著相关,说明申请量越大,被引频次越高,越易获得合作交流机会,越易产生更高的影响力;同时,合作交流越频繁,也越容易产出成果。而h指数与点度中心度和特征向量中心度都为弱相关,说明合作对h指数的影响较间接。
从合作网络中心度指标和文献计量指标的相关性分析可以发现,基于2种度量方法获得的企业创新人员影响力评价结果不尽相同,中心度指标高的人员其文献计量指标有可能并不高,反之亦然。通过各自统计排名能分别分析创新人员的科研能力和合作影响力情况,进而可以采取相应的策略,提高其中某些指标的数值,但却无法定量地计算出综合影响力排名,这增加了企业或其他机构科研评价的难度,不利于促进企业整体技术交流。另外,在未与他人发生合作的人员中,一些作者的申请量和被引频次也不低,这类人员虽然未对企业技术交流和合作发挥作用,但其所申请专利归属企业,对提高企业创新能力也具有推动能力。因而,需要构建一个综合评价指标,综合考虑合作影响力、产出影响力和引证影响力对企业研发人员的创新能力作出整体评价。
为了构建综合评价指标,本文采用基于主成分分析的因子分析方法,该方法是1904年英国心理学家Spearman提出的社会科学研究领域的主要数据研究方法,在各个方面都有广泛的应用。其实质是通过分析原始变量的依赖关系,确定原始数据内部基本结构,最终用新的因子表征该结构。
图3为利用SPSS软件对数据进行因子分析[25-26]的流程图,最终采用计算因子加权总分的方法,以2个因子的方差贡献率为权数,得到综合评价公式:Y=(50.942y1+34.233y2)/85.175,代入相应数据即可计算得出企业创新人员专利科研影响力的综合得分值。
图3 因子分析数据处理流程图
为了分析该综合评价指标的有效性,结合表1,对表3中的22名作者的新旧排名进行对比,得出表5的结果。
表5 创维公司部分创新人员综合评价排名
排在前3名的作者分别是Wang X、Li Y、Li H。Wang X的申请量、被引频次、中介中心度都排名第一,点度中心度以1分之差排名第二,而特征向量中心度也排名较高,在产出、引用和合作三方面都表现优异,因而在综合排名中保持了领先。Li Y虽然申请量仅居于第8名,但其点度中心度排名第一,中介中心度和特征向量中心度都排名第二位,而其被引频次也较高,因而也取得了较高的综合排名。Li H的申请量排名仅在第13位,但其被引频次高达到161次,h指数值为6,点度中心度和中介中心度分别排名第四、三位,该作者所参与申请的专利包含多份具有较高引用价值的专利,合作影响力也较高,因而在综合指标评估中排名上升幅度较大。申请量在第三位的Wu Q由于被引频次和h指数较低,且其中心度指标表现也不突出,因而综合指标值下降较多。排名下降幅度最大的是申请量第10名的Wang C,综合排名为第46位,从表1、表3可以看到,该作者的被引频次仅有40次,h指数值为3,点度中心度排名127位,中介中心度和特征向量中心度也很低,该作者虽然有一定的产出,但具有较高引用频次的专利较少,其在技术交流和合作中的合作频率较低,传递信息作用较弱,因而综合排名降幅较大。
另外有6名作者未出现在申请量前22名中,但在综合排名中表现较好,究其原因,这6名作者申请量为23~40,而其都具有较高的被引频次,3个中心度指标中点度中心度和中介中心度值也较高,在产出影响力稍弱的情况下,引用影响力和合作影响力表现较强,因而综合指标值较高。
由此可见,综合评价指标克服了单一指标的不足,全面反映了企业创新人员的综合实力。企业创新人员如果想取得突出的综合影响力,不仅要在产出上下功夫,更不能忽视专利质量,同时,也要加强企业内部的技术合作和信息交流。
进一步对原始指标与综合指标进行Spearman相关性分析[24],如表6所示。由表6可以看出,综合指标与6类原始指标具有较高的相关性,反映了创新人员在技术开发的“质”与“量”的水平,也反映了其在公司科技信息交流和科研合作中的作用,综合体现了创新人员的创新能力与影响力。
表6 综合指标与原始指标的相关系数
本文基于社会合作网络视角来考察企业专利合作网络结构特征和节点特性,分析企业整体科研合作与技术交流状况,识别企业技术带头人,为企业调动员工创新积极性、加强技术合作和交流提供指导。在对比分析基于网络中心度指标和文献计量指标评价结果的基础上,提出了一种基于因子分析法的企业创新人员综合评价指标,综合考虑了专利申请量、被引频次、h指数以及网络节点中心度指标,集成了合作影响力、引证影响力和产出影响力。综合评价指标克服了单一指标的不足,综合体现了创新人员的创新能力与影响力。企业创新人员要想取得突出的创新影响力,不仅要注重专利研发的“质”与“量”,也要加强信息交流和科研合作。对企业创新人员的影响力和水平给出客观定量的评价,有利于推动企业整体的创新开发和技术交流。该综合评价指标的构建基于因子分析方法,客观设置指标权重,避免了人为主观性干扰,使评价结果更具有客观性。由于数据统计是在一段时间内完成,期间存在数据库更新的可能,导致本文综合评价排名存在一定误差,但该误差不影响综合评价方法的构建。该文中未考虑合著者署名次序,未对著者贡献按照署名次序进行分配,这是在后续研究中需要重点考虑的问题。