闵超++步一++孙建军
摘 要:经过多年的飞速发展,我国国内专利数量已经位居世界前列。然而我国的国际专利在世界范围的发展与影响仍然缺乏基于实证数据的系统研究。文章基于美国专利商标局(USPTO)发布的专利数据,从近400万件专利及引用网络中分析我国相关专利的发展态势与国际交流情况,以期为我国深度参与国际技术活动提供政策启示。研究发现,中国专利与特定地区的技术交流频繁,在某些技术领域具有显著特色,整体保持着良好的发展态势。不过,在USPTO专利数量和影响方面仍然与其他发达国家和地区存在明显差距。
关键词:USPTO;中国专利;国际专利;技术流动;引用网络
中图分类号:G322.5 文献标识码:A DOI:10.11968/tsyqb.1003-6938.2017091
Analysis on Technology Mobility of International Patents from China Based on Patent Big Data
Abstract After decades of fast development, China has listed at the top position in the world in terms of the amount of domestic patents. However, systematic research based on empirical data still lacks in the world-wide progress and impact of international patents from China. Based on 4 million patents and their citation network from the USPTO database, this study intends to unveil the international development and communication of USPTO patents from China, thus providing policy implications for China's deep involvement in world-wide technology activities. We find that, on the one hand, Chinese patents maintain frequent communications with certain areas in the world, exhibit prominent characteristics in certain technology fields, and keep a good momentum. On the other hand, however, China still has to catch up with other developed areas regarding its total number and impact of USPTO patents.
Key words USPTO; Chinese patents; international patents; technology mobility; citation network
1 引言
隨着金融、医疗、交通等行业大数据的迅速发展,大数据在科学技术领域也显露出巨大的开发价值。科技大数据中除了传统的学术出版大数据[1],另一块体量庞大、价值丰富的数据金矿也同样引人注目——专利大数据。专利文献规范详实地记录了特定技术的具体信息,专利的引用关系则指征了知识的流动与技术的内在联系[2]。因而大规模的专利数据为系统调查特定主体的技术发展与演化提供了客观的数据基础。我国国内发明专利拥有量在2016年首次突破100万件,成为世界上第三个该项数据超百万件的国家[3]。在经济全球化的背景下,我国的技术创新活动早已将提升世界范围的影响力作为目标,然而关于我国参与全球技术交流活动的情况仍缺乏系统的实证研究。美国专利与商标局(USPTO)发布的专利数据包含美国各地与世界各国在美注册的专利近400万件,其中由中国申请的专利为管窥我国的国际专利技术流动情况提供了一扇窗口。本文旨在从USPTO注册的中国专利及其相关专利的引用网络中挖掘有关中国专利的重要信息,刻画中国国际专利的整体态势、技术基础以及国际影响,尝试为我国参与国际技术竞争与交流提供政策参考与启示。
2 相关工作
科学文献之间的引用关系代表了知识从被引方传递到了施引方[4]。类似地,专利之间的引用关系也指征了知识的流动和观念的联系[2]。一次专利技术流动通过一个专利引用另一个专利而完成。为了定量研究专利的技术流动,专利引用分析的研究曾经使用过多种测度和指标。这些指标可以分为以下几类:第一类是比较基本的指标,包括:专利被引量,该指标在一定程度上代表了专利的质量;专利施引量,指征某专利吸收先前技术的能力[5];技术循环时间[5];专利引用频率[6],等等;第二类包括与引用网络相关的指标,如中心性(度中心性、中介中心性、接近中心性等)[7]、最短路径、密度、搜索路径连接统计值[8]等;第三类包括技术流动相关的测度[5],如吸收强度、吸收速度、吸收广度、扩散强度和扩散速度等。和前两类测度相比,这类测度更倾向于捕捉网络的动态特征。本文构建了与中国相关的专利引用网络,使用了第一类和第二类指标进行定量探讨。
通过专利引用网络研究专利技术流动的方法有着广泛的应用。一方面,构建某个特定领域的专利引用网络能够对该领域的技术发展定量评估,这一方法已经被应用到玉米育种[5]、半导体[9]、纳米技术[10]和数据挖掘[11]等多个领域;另一方面,专利引用网络分析作为一项重要的方法,可以帮助研究人员发现很多技术领域之间或者国家与国家之间技术流动方面的现象。如杨中楷等[12]构建了专利引用网络探讨了不同技术领域间的关系,他们发现技术领域间的相互影响在不断增强;任龙等[13]则使用回归分析的方法研究了中国区域技术流动网络,并给出了一定的政策建议。endprint
3 研究数据与方法
本研究采用的数据集来自USPTO在1975年至2010年间授权的专利。其体量巨大,包括约400万项专利及其之间的引用关系约4600万对。本研究从数据集中抽取出专利第一发明人国籍为中国的所有专利(以下简称“中国专利”,共有9384项)、这些专利引用过的专利(技术基础,共有49744项)和引用了这些专利的后续专利(技术影响,共有15184项)。这三个专利数据集相互连通,构成了一张包含73293个节点、85771条边的中国相关专利的引用网络。通过分析这些专利数据与引用网络挖掘中国专利在国际技术活动中的发展与流动情况。
本文主要用到以下一些指标做定量分析:(1)专利施引,在网络中表现为出度,表征专利技术的知识基础[5];(2)专利被引,在网络中表现为入度,表征专利技术的影响力[14];(3)中介中心度(betweenness centrality),网络中的节点在多大程度上是其他节点联系的“中介”,表征着节点对网络中资源的控制能力,中介中心度越高的节点越多地占据信息流通的关键位置;(4)接近中心度(closeness centrality),网络中某结点到其他结点最短路径之和的倒数,接近中心度越高的节点越处于网络的核心位置,表征该结点不受其他结点控制的能力;(5)K核,是在网络中反复去除度小于K的节点后剩余的子图,能够直观展现大型网络的内核。
4 研究结果与讨论
4.1 USPTO中的中国专利概况
尽管USPTO数据集内的中国专利的总数(9384条)在USTPO专利中的比重并不大,但是它们反映了中国专利在国际专利平台的显示度,并为中国技术参与国际技术活动提供了良好的线索。在这些专利中,平均每个专利声明权利13.99项,参考其他专利8.20条,参考非专利文献2.54条。值得一提的是,这些专利产生了显著的国际影响,截至2010年底平均每项专利被其他专利引用了2.12次。USPTO于1981年授权了第一项来自中国的专利,此后中国专利的数量呈爆炸式增长,一直保持强劲增长态势(见图1)。
中国专利在某些技术领域具有较高的显示度,显示出我国在这些技术领域的优势和较强的国际参与度。从专利数量看,在356个技术大类中,电连接器、电气系统与设备、多路通信、图像分析等四个技术领域占中国专利总数的20%多;从技术影响看,被引次数较高的中国专利来自有效固体器件、外科、服饰(靴、鞋、裤)、印刷品和半导体装置等技术类别。
4.2 影响中国的专利
在USPTO专利数据中,中国专利一共引用了49744项专利。这些专利涉及126个国家和地区、497个技术大类、4170个技术小类,成为中国专利在国际上的重要技术来源。可以发现,中国专利借鉴的技术类别远多于自身所属的技术类别数量,这体现了中国专利所汲取的技术来源较为广泛。同时,从更细的粒度来看,一些国家与地区以及技术领域为中国专利提供了更多的技术支持。
日本、台湾和德国等地区是除美国外中国专利借鉴技术最多的三个地区。尤其是日本,为我国提供了大量技术参考。在国际技术活动中,我国同样引用了国内的大量专利技术,不过数量远低于其他国家和地区,表明我国在这段时间内的国际技术活动中仍是以学习、吸收别国技术经验为主。另一个重要的发现是,中国对美国不同地区的技术参考也有明显的侧重。加利福尼亚州是美国高科技事业云集的硅谷所在地,其成为我国在美国最重要的技术参考地区,参考专利数量甚至远超台湾、仅次于日本。除此之外,纽约州、德克萨斯州、新泽西州、伊利诺伊州、马萨诸塞州等地区也为中国提供了大量技术参考来源(见表1);在技术领域方面,中国专利引用最多的国际专利集中在电连接器、电子系统与装置、多路通信、图像分析、电信等大类。
在我国引用的国际专利中,有些自身即具备强大的技术影响力。以被引次数前十的专利为例,来自加利福尼亚州的竟占了7席,其余3席分别被新喀里多尼亚(法国在大洋洲的属地)、新泽西州与德国各占一席。由此可见,加利福尼亚州强大的技术辐射力以及对我国专利的重要影响。在技术领域方面,这些高影响力专利主要集中在化学(分子生物学与微生物学)、多路通信、塑料与非金属塑形、电子计算机与数据处理系统等大类。
4.3 中国专利的影响
我国不仅越来越频繁地申请国际专利,吸收别国科学技术,而且自主研发的专利也产生了可观的国际影响。为了深入分析我国专利的国际影响情况,我们从USPTO数据库中抽取出引用了中国专利的国际专利,共计15184项(需要注意的是,这些仅仅是USPTO收录的数据)。这些专利来自117个国家或地区,分布于360个技术大类与2134个技术小类。
2010年以前中国专利仍然主要在亚洲范围内以及美国产生影响。除美国之外,中国、日本、台湾、德国、韩国与蒙古等国家或地区借鉴中国专利的次数最多。与中国借鉴了大量美国加利福尼亚州的专利技术相对应,加利福尼亚州同样大量借鉴了中国的专利技术,其数量甚至超过了中国自身与日本(见表2)。由此可见,中國与美国加州之间存在着非常频繁的、紧密的双向技术流动。除此之外,德克萨斯州、纽约州、马萨诸塞州等也成为中国国际专利技术流向美国的主要地区。与前文发现相对应,这些地域也向中国专利提供了大量技术输出。
从引用我国专利的技术大类看,我国专利在电连接器、电子系统与装置和图像分析三个领域具备的国际影响力最高,尤其是在电连接器领域具有显著的优势。其他影响力较高的领域包括:有效固体器件、半导体装置生产、外科、多路通信等。另一方面,我们从引用中国专利的自身影响力来看,如果一项自身影响力较高的专利引用了中国专利,那么被引用的中国专利也有可能具备良好和较高的技术价值。我们发现,在那些引用了中国专利、同时自身影响力又较高的前十项专利中,有半数来自图像分析领域,可见中国专利在此领域具有十分显著的技术优势与国际影响。类似分析显示,外科、半导体装置制造、药物等领域也是中国专利的优势所在。endprint
同时我们也可以从统计数据上直观地看到,引用中国专利的国际专利无论从总数还是涉及的国家或地区、技术大类以及技术小类等方面都少于中国专利引用的国际专利。在技术创新的道路上,我国仍有很多需要学习国际经验的地方,仍需提高技术创新质量、获得更大国际影响力。
4.4 国际专利引文网络中的中国专利
4.1.1 国家引用网络
将上述与中国直接相关的三个专利数据集根据引用关系相结合,得到一张包含73293个节点、85771条边的专利引用网络。如果以国家或地区为观察对象并对引用关系加权,则得到一张与中国相关的国家或地区专利引用网络图。图中包含139个国家或地区以及它们之间的242对引用关系(见图2)。
显而易见,中国处于这张网络的中心,其他国家或地区则大致以跟中国技术交流的程度由内向外分布。需要说明的是,技术流动网络图是一个双向加权网络,即节点之间可以相互指向,边的粗细则表示节点之间的交流强度。不过由于中国大量引用了其他地区的专利,同时逆向的引用则相比较少,因此中国指向其他地区的箭头更加显著。可以发现,中国主要向日本、加利福尼亚州、台湾、纽约、德国等地汲取专利技术,广泛兼顾其他众多国家和地区。图2直观地说明了我国1975年—2010年期间在国际技术交流活动中,主要处于技术引进的阶段。
为了更准确展示中国与其他地区的技术交流强度,列出了图2中边权重前16位的起始节点与目标节点(见表3)。从表中可以看出,其中前13条边均是中国引用其他地区,同时第8位、第10位与第14位则分别是加州、台湾与日本引用中国专利。这表明我国在重点参考其他国家或地区的技术的同时,自身的专利技术也产生了一定的国际影响力。
4.1.2 技术领域引用网络
本文所用的数据集中每个专利都隶属于一个技术领域。因此,本部分构建了一个技术领域引用网络,该网络中每个节点代表一个技术领域,一条由节点A指向节点B的边代表至少有一个属于A技术领域的专利引用了B技术领域的专利,该边的权重在数值上等于A技术领域的专利引用B技术领域专利的频次。表4展示了网络中接近中心度入度最高的10个技术领域。从表中可以发现,电气系统和装置、库存材料和电连接器三个技术领域拥有最高的接近中心性(见表4),这表明它们到其他节点的距离之和最小。
本文从中介中心性的角度展示了入度最高的10个技术领域。从表中可以看出,库存材料、电气系统和装置与金属制造领域中介中心性最高(见表5)。这表明这些领域对于这个专利网络有着较高的“资源控制”程度,处于引用网络中信息流通的最关键位置。对比表4和表5可以发现,两种中心性排名前十的技术领域存在一定的重叠:在10个技术领域中有5个存在于两个排名的前十名(库存材料、电气系统和装置、金属制造、电连接器和电力通讯领域)。这些专利不论是在于其他技术领域的联系还是在对整个网络的控制方面都具有举足轻重的地位。
另外,从两表的专利数一栏可以发现,排名靠前的技术领域其包含的专利数并非都很多;相反,某些排名靠前的技术领域仅包含较少的专利数,如库存材料等技术领域。这表明这些技术领域的入度高并非是由于其包含的专利多而造成的;其高入度更说明了该领域本身具有很强的影响力。
本文对技术领域引用网络进行了可视化。鉴于图中每个节点代表一个技术领域,为了更好的可视化效果,我们隐去了其中K核小于20和入度小于20的节点(见图3)。图中节点间的距离越小,表明从引用流动的角度讲这两个节点代表技术领域的关系越紧密。所有的主要技术领域可以明显分为5类。经过反复比对和参照,没有发现某一类簇仅包含有特定学科下的技术领域;换句话说,同一学科的技术领域在图中更倾向于分布在各个类簇内。传统观念往往认为,同一学科内的技术领域之间技术流动应当较不同学科间技术领域的流动更为频繁;但图3的现象表明,与中国相关的专利引用网络中,不同学科下的技术领域之间也存在较为频繁的技术流动。这一结论凸显出当前技术高速发展时代下不同学科间技术的交叉与相互借鉴。
4.1.3 专利引用网络
最后考虑单个专利在引用网络中的角色。单个专利的技术影响力(即被引次数)前文已经有所分析,这里主要分析技术控制力。
在所有专利构成的引用网络中,中介中心度最高的10个专利均来自中国在1989年—2003年间获得授权的10个专利。这些专利在国际技术流向中国、经过技术转化、继而为其他国家或地区所借鉴的技术流动路径上,具有最强的控制能力,因此在沟通中国与其他国家或地区的技术资源交流方面处于极其重要的地位。它们在USPTO数据集中的专利代号为:4845863、6530903、5380690、6403367、5059178、4921278、5951963、5670037、6355491和6211104。主要来自服饰(靴、鞋、裤)、外科、催化剂与吸附剂、化学(分子生物与微生物)、化学(无机物)、印刷品、矿物油等领域。
本文展示了与中国相关的专利组成的整体引用网络图(由于原网络节点过多,这里仅展示网络中度数大于3的节点)。图中的布局显示,技术关系紧密的专利聚集在网络中心位置,而技术关系松散的专利散布于网络边缘(见图4)。网络中有一些显著的发现:一些内部关系密切并且数量众多的专利形成数个大型的专利簇群,代表了中国相关专利的核心构成;同时还有一些专利形成了独立、分散的小型专利簇群,它们自身内部也具有较高的技术凝聚力;除此之外,一些专利构成了明显的技术流動结构,表现为一些长程的专利技术连线,这些连线有时成为不同专利簇群的沟通桥梁。
为了进一步展现专利网络的最核心结构,我们利用条件“K核 >= 3,入度 >= 8”对图4进行精简,并标出专利代号(结果见图5)。图中节点与标签大小与节点的入度(被引次数)呈正比。专利核心网络分化成五个明显的簇群,每个簇群里中国专利都处于绝对核心的位置但影响力相对较小,从引用箭头的指向可以看出技术活动中主要是中国专利在引用其他国家或地区的专利。簇群1、簇群4、簇群5都相对独立,簇群2与簇群3通过6752317(法国)、7142197(中国)、6585154(以色列)等专利建立联系。从中发现每个簇群中的核心中国专利都来自非常相近甚至相同的技术领域。簇群1中的5个核心中国专利是6954125、7195500、7295415、7289306与6580344,均来自跟电气系统与设备相关的领域,专利技术主要由纽约流向中国;簇群2中的3个核心中国专利是7262764、7133031与7142197,均来自345大类(计算机图形处理与选择性视觉显示系统),专利技术主要由日本和其他地区流向中国;簇群3中的8个核心中国专利中有7个来自382大类(图像分析),另一个则来自与之相关的数据处理(结构设计、建模、仿真与模拟),专利技术主要由加拿大、日本、纽约等地流向中国;簇群4中的3个核心中国专利均来自707大类(数据处理:数据库与文件系统或数据结构),专利技术主要由加拿大、纽约等地流向中国;簇群5中的4个核心中国专利则有一半来自催化剂与吸附剂领域,另一半来自相关的矿物油领域,专利技术主要在中国内部流动。可以看出,簇群2与簇群3均与计算机图形、图像的处理有关,进一步佐证了二者之间的技术关联性。总结来说,中国相关专利的核心网络主要涉及电气系统、计算机图形处理、图像分析、数据库与文件系统以及化学材料等领域,中国专利在这些领域具有一定的国家影响,但仍以引进、吸收国际技术为主。endprint
5 结论
对USPTO的全球专利数据(1975年-2010年)中的我国专利数据分析可以发现,在这段时间内我国的国际专利活动既有技术引入、又有技术输出,主要以学习国际技术为重头,自主研发的技术初具一定的国际影响力,具体表现为:(1)专利数量持续、迅速增长,保持良好的上升态势;(2)在特定领域具有显著的技术影响力,如电连接器、电子系统与装置、图像分析等技术领域;(3)某些地区成为我国重要的技术参考来源,如日本、台湾、德国等国以及美国的加利福尼亚、纽约、德克萨斯、新泽西等州;(4)我国国际专利的影响范围主要在美国、德国以及中国、日本、台湾、韩国、蒙古等亚洲地区;(5)来自服饰(靴、鞋、裤)、外科、催化剂与吸附剂、化学(分子生物与微生物)、化学(无机物)、印刷品、矿物油等领域的专利在我国的技术流动路径上扮演着重要的中介角色;(6)专利引用网络中明显分化出电气系统、计算机图形处理、图像分析、数据库与文件系统以及化学材料等五个核心领域。需要注意的是,相比于日本、德国、法国、英国、加拿大、韩国等国家,我国在USPTO中的专利不论在数量还是影响力方面都存在十分明显的差距。因此,我国在国际专利技术活动中仍需进一步增大参与强度、提高技术创新质量。
参考文献:
[1] Xia F,Wang W,Bekele T M,et al.Big Scholarly Data: A Survey[J].IEEE Transactions on Big Data,2017,3(1):18-35.
[2] Jaffe A B.Technological opportunity and spillovers of R&D:evidence from firms' patents, profits and market value[EB/OL].[2017-08-20].http://www.nber.org/papers/w1815.pdf.
[3] 中国国内发明专利拥有量去年首次突破100万件[EB/OL].[2017-10-03].http://www.zaobao.com.sg/realtime/china/story20171003-800149.
[4] Garfield E.Science Citation Index-A New Dimension in Indexing[J].Science,1964,144(3619):649-654.
[5] 孙轶楠.基于专利引用的国际化技术流动测度研究——以玉米育种技术领域为例[J].情报杂志,2016,35(1):51-56.
[6] 赵黎明,高摇杨.专利引文分析在知识转移机制研究中的应用[J].科学学研究,2002,20(3):297-300.
[7] 谭晓,张志强.基于专利分析的技术合作和流动研究[J].科学学研究,2013,31(9):1313-1320.
[8] Hummon N P,Doreain P.Connectivity in a citation network:The development of DNA theory[J].Social Networks,1989,11(1):39-63.
[9] 许琦.基于专利引证网络的技术范式分析——以半导体制造领域为例[J].图书情报工作,2013,57(4):112-119.
[10] Li X,Chen H,Huang Z,et al.Patent citation network in nanotechnology(1976-2004)[J].Journal of Nanoparticle Research,2007,9(3):337-352.
[11] 許琦,顾新建,陈芨熙.基于专利引证网络的技术进化路线分析——以数据挖掘领域为例[J].科研管理,2013,34(2):27-35.
[12] 杨中楷,刘倩楠,于霜.基于专利引文网络的技术领域间关系探析[J].科研管理,2011,32(5):149-155.
[13] 任龙,姜学民,傅晓晓.基于专利权转移的中国区域技术流动网络研究[J].科学学研究,2016,34(7):93-1004.
[14] 高继平,丁垄,滕立,等.专利-论文混合共被引网络下的知识流动探析[J].科学学研究,2011,29(8): 1184-1189.
作者简介:闵超(1990-),男,南京大学信息管理学院博士研究生;步一(1994-),男,美国印第安纳大学信息学、计算机与工程学院博士研究生,研究方向:科学计量;孙建军(1962-),男,南京大学信息管理学院教授,博士生导师,研究方向:网络信息资源管理、大数据分析。endprint