基于专利主体合作关系的学科领域关联研究*

2019-03-25 15:18:22宁子晨王思明
数字图书馆论坛 2019年2期
关键词:发明人申请人数据挖掘

宁子晨 王思明

(东北师范大学信息科学与技术学院,长春 130117)

近年来,融合、关联、共享逐渐成为学术研究的主流思想,数据上要开放关联,资源上要共享,检索上要一体化。在学科方面,各学科间知识不断相互渗透,交叉学科兴起,学科关联、融合成为图情领域研究的一大热点。现有对学科关联发现的研究,主要体现在对科技文献内容的研究上,如关键词耦合、引文耦合、主题词关联等。本体理论和RDA等开放关联数据的引入,也为学科关联提供了多种借鉴方向,但是仍以期刊文献的内容为研究主体,而期刊文献主要是学术研究相关的成果,在结果的呈现上存在一定的局限性。随着网络和新媒体的发展,部分学者从社交网络学术交流[1-2]的角度探究学科间的关系,提供了新的角度。此外,也陆续有学者从专利文献的主题[3-4]、专利引用[5-7]等专利文献内容方面探究技术的关联发现。

专利作为科学技术的重要信息源,是技术创新、产品创新、工艺创新等核心内容的重要载体,也是可获得的最大技术信息源。对专利文献、专利合作进行分析,一方面,可以从实际技术的角度来看技术间的关系,从而发现学科间的关联;另一方面,专利文献是按照其应用领域来分类的,这与传统的科技文献分类有很大的差别,因此,将以专利形式呈现的技术与学术研究相联系,一定程度上可以互为补充,弥补仅从学术文献角度分析的单一性问题。

将技术与学术研究相联系,最常见的是探究专利文献与学术文献的互引关系[8-10],从而发现二者之间的关系。但是,一方面,受科研人员习惯的影响,科技文献中少有引用专利文献的情况;另一方面,我国的专利数据库基本没有引用专利,仅有近年来专利审查员添加的极少数引用专利[11],基本没有引文数据,建立国内的专利文献与科技文献的引文网络是不可实现的。

专利合作网络及其引发的空间、社会与技术的集聚效应已经成为影响驱动企业成长的重要手段[12],也是专利竞争情报分析的重要途径之一。在Web of Science中进行相关主题检索,近年来关于专利合作的相关研究主要是基于企业视角,探讨多维网络结构对企业绩效的内在影响[13]、专利评估指标及促进机制的发展方向[14],以提高企业的竞争能力,增加盈利。也有一部分学者聚焦于小世界理论在专利主体合作中的应用与创新,探究专利合作网络的规律[15-16]、专利合作网络与创新生产力的关系[17-18]、知识在专利合作网络中的流动[19-20]等。本文以专利主体合作网络为导向,结合专利主体的学科背景,探究时间维度下主题专利发展所对应的学科演变情况,以期从专利分析的角度反映学科间关联情况。专利数据来自国家专利局的“专利检索及分析”中的数据,专利主体的学科背景则是以中国知网等学术库中给定的所属学科为准,这既符合国家学科分类标准,也可以减少写作过程中学科界定模糊的情况。

1 基于专利主体合作关系的学科领域关联内涵及界定

1.1 专利主体的内涵及合作关系界定

专利主体是与专利的形成、申请、利用等专利生命周期相关的主体。其中,发明人作为专利发明创造中的核心部分,直接参与完成发明创造,是对发明创造作出创造性贡献的人[21];申请人是指依法享有某项发明创造向国务院专利行政部门提出专利申请的自然人、法人或其他组织[22]。专利发明人和申请人作为专利形成过程中必不可少的两大专利主体,其合作关系比较复杂。因此,本文以发明人和申请人之间的合作关系为研究重点,下文所述专利主体也专指发明人和申请人。

在专利发明创造与申请的过程中,若始终为个体独立完成,则申请人就是发明人,即“发明人=申请人”;若发明人为多个个体,由其中一人申请,则此时发明人与申请人之间存在重复;若发明人为多个个体,而申请人为个体所属机构或合同所属机构,则申请人和发明人各自独立,即“发明人≠申请人”。其中,除“发明人=申请人”的情况外,发明人和申请人之间均有合作关系,可能是技术上的合作,也可能是上下级的雇用关系或机构间互惠互利的利益合作。

1.2 基于专利主体合作关系的学科领域关联可行性分析

专利主体是专利发明创造的重要组成,在一个专利研发团队中,技术人员的构成决定着该团队专利研发的方向与成败。随着时间的变化,某一专利领域不断吸纳新的理念、技术,实现专利的不断创新,在这个过程中需要吸纳拥有新理念、新技术的主体,以弥补新研究方向上的空缺;同时,一些旧有理念或是与专利发展相关度不高的技术不再被需要,其相关的单一性主体也不再被需要,从而退出该领域。专利主体是专利发明创造的核心。因此,从专利主体出发,结合其合作关系网络以及随时间的变化情况,探究专利主体拥有的技术及其所属的学科领域,分析学科领域的关联关系及关系的变化情况,可以反映出不同学科领域之间的可能联系,从而实现对学科领域隐性关联的挖掘。

2 专利主体合作关系分析和方式构建

2.1 专利主体合作关系的形成

结合专利主体类型及《中华人民共和国专利法》中提到的合作形式,本文将专利主体的合作关系分为主导型合作、职务型合作、支持型合作及互利型合作。

(1)主导型合作,指在自由发明创造中,申请人以指导(建议、推荐、要求)的身份存在于发明的过程中,从而与发明人形成一种指导形式的合作关系。申请人同时也是发明人且属于团队中的核心成员,处于团队的主导地位。

(2)职务型合作,指受职务所需而形成的合作关系。发明人在本职工作中进行发明创造,专利的所有权归发明人所在单位或其负责人所有,即申请人为机构或部门。申请人和发明人之间存在明显的上下级关系,申请人具有一定的权威。

(3)支持型合作,指个体或团队受第三方的资源、技术、资金等支持,从而形成的合作关系。专利发明方由于缺少资金、资源等无法正常进行发明创造,但其研究方向为第三方所需,因此第三方投资支持了该项发明,在专利完成后拥有该项专利的使用权,可能直接接受专利的转让,或在专利申请时成为专利申请人之一。

(4)互利型合作,指受利益的影响,在有共同利益方向的不同机构间构成的合作。在此合作过程中,单位或者个人接受其他单位或者个人委托,独自或共同完成发明创造,专利所有权为共同所有。双方间的利益方向相同,通过专利合作,共同创新,共同利用,从而达到互惠互利的目的。与支持型合作不同的是,互利型合作是机构间的利益合作,偏重专利竞合的情况。

在这4种合作关系中,主导型合作与职务型合作最为普遍,常见于企业(如技术公司)和学校;而互利型合作近几年兴起,常见于某一生产链或机构联盟之间。不同情形下的合作关系有所不同,专利主体间的关系也错综复杂,但专利申请人与发明人合作网络作为专利形成过程中必不可少的联系,是本文研究的要点之一。

2.2 专利主体合作关系的构建

根据上述4种合作关系,从时间维度出发,构建专利主体间合作关系模型,如图1所示。

图1 专利主体合作关系模型

2.2.1 时间维度视角

(1)个体-个体关系以主导型合作为主,也可能是职务型合作,由独立的专利权人与发明人构成。在三个时间段中,不断地有新的发明人或申请人加入,同时也有发明人或申请人退出,一个申请人可能拥有多个专利,一个发明人也可能参与多项发明,随着时间的发展,合作网络也不断拓展,团体间的联系性更强,主体间关系更加密切、复杂。

(2)个体-机构关系以职务型合作和支持型合作为主,由机构申请人与发明人构成。机构招纳所需的技术人员,为其进行专利的发明创造,发明人与机构间有合同关系。随着时间的发展,领域内参与专利创新申请的机构出现或消失,同样的也会有新的发明人出现、已有的发明人退出,一个发明人也可能在不同的机构中参与专利创新发明。随着发明人的人员变动,机构间不再独立存在,而是通过发明人构成关系,合作网络趋于复杂。

(3)机构-机构关系以互利型合作为主。机构间可能存在资金或技术的支持关系,如机构1接受机构2的帮助,在专利申请时,所有权归机构2所属或归机构2与机构1共有;机构间也可能因共同利益而进行技术上的合作,从而共有某项专利。市场受利益的驱动,机构间可能取消合作或产生新的合作,其内部的技术人员也存在流失和招纳的情况。随时间发展,机构间合作关系越来越密切,同一生产链上的机构可能共享已有专利,共同进行专利的发明创造,也就形成了专利竞合。

2.2.2 主体维度视角

(1)个体-个体与个体-机构间存在联系。①机构对个体的小团队提供资金或技术等帮助,但申请人仍是小团队中的自然人;②机构出资,个体构成的小团队为其进行发明创造,但小团队是独立的,此时二者仅通过利益建立联系,申请人是机构;③个体构成的小团队中存在自然人自动加入机构,为其进行专利的发明创造,此时申请人为机构;④机构收购了发展良好或技术吻合的小团队,小团队的个体成为机构的员工,为其进行专利的发明创新,此时申请人为机构。

(2)个体-机构与机构-机构间存在关联。当个体-机构关系中的两个或多个机构间正式建立合作,其关系就变成了机构-机构的关系,此时申请人按合同等约定指定。

3 基于专利主体合作关系的学科领域关联发现框架

为实现基于专利主体合作关系的学科领域关联发现,结合时间维度下专利主体合作关系网络的变化情况,首先需要确定专利主体所属学科,继而探究相关学科领域的关联关系。构建基于专利主体合作关系的学科领域关联发现框架(见图2),希望能从整体上揭示基于专利主体合作关系的学科领域关联发现的作用机理。

3.1 核心申请人的确定

确定某一时段下某一主题专利的核心申请人,它既可以是个人,也可以是机构。借鉴张鹏等[23]对核心申请人的确定,按照专利申请量将专利申请人排序,并进行分区,使得n1:n2:n3:…:ni=1:α:α2:α3…αi-1(i为分区个数),其中n1的申请人为核心申请人。

图2 基于专利主体合作关系的学科领域关联发现框架

3.2 专利主体合作网络的分阶段构建

在确定核心申请人之后,将专利公布的时间分为三个阶段,依次构建专利申请人和发明人之间的合作关系网络,形成个体申请人与发明人的合作网络(合作网络I-III)以及机构申请人与发明人的合作网络(合作网络i-iii)。这6个合作网络之间不是相互独立的,而是存在关联的。

合作网络I、II、III是三个时间段下个体申请人与发明人之间合作关系的呈现,合作网络i、ii、iii是三个时间段下机构申请人与发明人合作关系的呈现,由于合作网络I~III和合作网络i~iii是同一领域的专利主体合作关系的呈现,因此不仅I~III、i~iii是随时间发展扩大趋于复杂的,I~III与i~iii之间也可能通过某些关系而存在一定的联系,随着时间的变化,这些联系也会发生变化。如在合作网络I和合作网络i的关系中,可能拥有相同发明人;合作网络I的申请人或发明人可能成为合作网络ii的发明人;合作网络i中的发明人可能独立成为合作网络II的申请人或者发明人。申请人与发明人合作关系的可视化呈现,是学科领域关联发现的基础。

3.3 专利主体所属学科领域的确定

专利主体虽然投身于某一领域的发明创新,但其之前可能从事其他领域的相关研究,拥有不同学科的技术能力,且专利发明人大多进行过一定程度的教育,发表过相关的学术论文,因此可以从学术库中找到发明人涉及的学科。通过分析专利主体参与过的专利创造,检索专利主体学术论文的发表情况,以及在学术网站中给定的作者学科背景,可以确定专利主体的知识构成、学科所属。

3.4 学科领域关联关系的呈现

在某一领域专利主体合作关系构建完成以及专利主体所属学科确认之后,引入专利的IPC分类号以及相关发明人的所属学科,形成专利IPC分类与学科领域间的关联关系。通过分析时间序列下IPC大类的演变,可以确定某一专利的主要所属领域,再结合分析IPC分类下相关学科的演变情况,可以进一步探究某一领域下各学科之间的关联关系。

4 基于专利主体合作关系的学科领域关联实证

4.1 数据说明

“大数据”因为近年来互联网和信息行业的发展而引发人们的关注,有效地对数据进行收集、分析、保存及共享,可以为科研提供有效的帮助,为用户解决切实的问题[24]。数据挖掘对技术与算法改进的要求,使得其主要隶属于计算机技术、网络技术、数学等相关学科。本文选择数据挖掘为主题,试探究与其相关的学科及学科演变情况,并与传统思维下的所属学科相对比,发现数据挖掘主题下新的学科间的关系。在国家专利局专利检索与分析中进行检索,获得2004年1月—2018年4月共969条有效专利数据。利用bibexcel软件对数据进行处理,共得到申请人587个,排序后分区数目为4,α=2.5,最终确定对拥有专利数大于7的22个申请人及其248条相关数据进行分析。

本文用于实证的数据中,拥有专利数大于7的22个申请人均为机构,而个体申请人的专利拥有数皆小于或等于3,这可能与选取的数据特点有关,中国知网可查到的明确用到数据挖掘技术的文献最早发表于1997年,而相关专利申请主要始于20世纪90年代,兴起时间较短;相关技术产品的发明创新应用主要以企业为单位,结合数据处理结果。本文只对选定的22个机构申请人进行分析。

4.2 专利主体合作关系网络分析

利用社会网络分析工具gephi将发明人和申请人的合作关系可视化,由于在约1/3的数据中,申请人为多个,因此本文仅针对第一申请人和第二申请人与发明人之间的网络关系进行分析。根据分析需求,将248条数据按照时间2004—2008年(第一阶段)、2009—2013年(第二阶段)、2014—2018年(第三阶段)分为三个阶段,分别实现第一申请人/第二申请人与发明人的一一对应。根据时间维度,构建专利主体合作关系(见图3—图8)。

4.2.1 专利主体合作网络整体分析

(1)整体发展趋势。综合图3—图8来看,专利主体合作网络,逐渐趋于复杂,由2004—2008年的6个合作子群,到2009—2013年的16个合作子群,再到2014—2018年的34个合作子群,说明在这15年间,数据挖掘相关技术不断发展。

图3 2004—2008年第一申请人与发明人之间的合作关系网络

图4 2004—2008年第二申请人与发明人之间的合作关系网络

图5 2009—2013年第一申请人与发明人之间的合作关系网络

图6 2009—2013年第二申请人与发明人之间的合作关系网络

图7 2014—2018年第一申请人与发明人之间的合作关系网络

图8 2014—2018年第二申请人与发明人之间的合作关系网络

(2)中心节点变化。2004—2008年,中心节点为O(美国西门子医疗解决公司)和C(国际商业机器公司);2009—2013年,中心节点为I(中国移动通信集团公司);2014—2018年,中心节点为A(国家电网公司)和B(浙江大学)。可见不同时间段下,中心节点是发生变化的,即核心申请人是变化的。在本文选定的数据挖掘技术领域,核心申请人从外企单位变为国有通信企业,近5年变为国内央企和事业单位,说明数据挖掘早先是应用于企业竞争相关的,高度自动化地分析企业的数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,做出正确的决策;之后数据挖掘的重要性被国企所重视,开始用于通信相关,将数据挖掘用于移动网络中,可以优化网络,高度自动化地分析企业的数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,做出正确的决策;近年来,国家电网公司和浙江大学积极研究,重视大数据环境下的数据挖掘技术的重要性,无论是企业发展还是学术研究,都离不开数据挖掘技术的辅助。

(3)子群间联系。2004—2008年,专利主体合作网络数量较少,子群间相互独立;2009—2013年,专利主体合作网络相对变得复杂,子群数量增多,但相互间仍然无关联;2014—2018年,专利主体合作网络变得更加复杂,部分子群间通过发明人存在联系。如图7中,子群A(国家电网公司)通过发明人①与子群B(浙江大学)建立联系,通过发明人②与子群L(中国电力科学研究院)建立联系,而子群L与子群E(北京京东尚科信息技术有限公司)则共有发明人③。而通过具体数据的分析,可以确定两个机构间的关系,可能是发明人单位的变化,可能是机构间建立了合作。孤立的子群间逐渐形成联系,说明整个网络是正向发展的,创新主体间的合作交流增加,使得整体网络信息交流的效率大幅提升,有利于数据挖掘技术多领域、深层次地发展。

4.2.2 专利主体合作网络个体分析

(1)申请人变化。以第一申请人与发明人之间的合作关系网络来看,虽然不同阶段下的合作子群是增多的,但是实际上,在整个过程中,有新的申请人加入数据挖掘领域,也有申请人退出该领域。如节点O(美国西门子医疗解决公司)和节点P(上海交通大学),二者在2004—2008年和2009—2013年较为活跃,但2014—2018年,节点O不再申请数据挖掘相关的专利,而节点P也不再作为第一申请人进行专利申请了。这类申请人是数据挖掘领域的先驱,在产生利益的同时,也为后续的专利发明起到一定的启发作用。之后可能因为机构的需求、发展、研究方向等变化,O和P转移各自的研究方向,退出该专利领域。节点E(北京京东尚科信息技术有限公司)、J(河海大学)、L(中国电力科学研究院)、S(芜湖乐锐思信息咨询有限公司)、V(广东工业大学)仅出现在2014—2018年的时间段里,且在短短5年拥有数据挖掘专利的数量已超过7个,说明这几个机构是数据挖掘专利领域的后起之秀,在近5年的相关专利创新中发挥着较大的作用。

(2)第一申请人/第二申请人与发明人合作关系。2004—2008年以及2009—2013年,专利的第二申请人较少,形成的第二申请人与发明人关联网络也相对简单,与第一申请人和发明人关联网络相差较大,说明这10年的发明创新相对独立,机构间的联系较少,相对孤立。2014—2018年,第二申请人的数量大幅提升,与发明人形成的关联网络变得复杂,子群间存在关联,在整体形态上和第一申请人与发明人关联网络相似。子群间建立关系,不同机构间建立合作,可以利用双方丰富的条件和资源,互相渗透学习,进行发明创造的同时也可以促进自身的研究能力。

4.3 基于专利主体合作关系的学科发现分析

4.3.1 基于专利主体合作关系的学科关系的构建

根据选定专利数据,绘制时间序列下的专利IPC分类发展情况图(见图9—图11)。其中,“*”节点表示数据挖掘技术所属的主要IPC类别,“+”节点表示当年新出现的IPC分类。可以看出,数据挖掘技术最先出现于G06F小类中,随着时间的推进,G06F成为数据挖掘相关专利的主要所属大类。此外,G06Q出现于2006年,在2009—2013年得到发展,2014—2018年已经成长为数据挖掘技术的主要所属大类之一。

对比3个时间段来看,IPC分类是不断增加的,说明多个领域开始重视“数据挖掘”。“数据挖掘”技术除了应用于G06F领域以外,也在向其他领域渗透,技术得到发展的同时,各个学科领域通过“数据挖掘”也呈现出一定的联系。

图9 2004—2008年专利IPC分类演变情况

图10 2009—2013年专利IPC分类演变情况

图11 2014—2018年专利IPC分类演变情况

通过在学术数据库中检索选定机构的发明人,可以得到数据库给定的所属学科,从而确定专利发明人的知识构成、学科所属,结合专利主体合作网络以及专利IPC分类演变情况,构建时间序列下的IPC小类-IPC组-学科领域关联关系。得到2004—2008年的IPC小类-IPC组-学科领域关联共21个节点,50条边;2009—2013年的IPC小类-IPC组-学科领域关联共71个节点,346条边;2014—2018年共140个节点,1 591条边。由于IPC小类-IPC组-学科领域间关系成指数增长,整体分析较为复杂,因此针对主要所属大类G06F相关的IPC小类与学科关系进行重点呈现和分析,关系见图12。

图12 专利IPC小类与学科关联关系

4.3.2 基于专利主体合作关系的学科发现分析

以IPC-组为源节点,学科领域为目标节点,学科领域与IPC-组存在联系的同时,同一IPC-组下的学科领域间也存在关系,通过分析这些关系,可以发现不同学科间的关联融合情况。

从整体来看,三个时间段中,关系网络是趋于复杂的。2004—2008年,一个IPC分类仅关联少数学科,且集中于工学学科的计算机科学与技术领域。2009—2013年,ICP分类开始增多,关联的学科也大幅增加,更多的学科、技术融入数据挖掘专利开发,工学学科的水利工程、动力与电气工程、化学工程及土木建筑工程等学科领域出现,与计算机科学与技术相联系,共同出现在一项IPC中,进行不同领域下的专利发明。此时的关联开始趋于复杂,学科与学科之间、学科与IPC分类之间不再相互独立,学科间通过IPC分类号建立关联,IPC分类间也形成学科关系耦合。2014—2018年,IPC-组持续增多,专利所属领域不断拓展,IPC对应的学科也持续增多,教育类、经济类、文化、电力等相关学科出现在关系网络中;此外,IPC之间共有的学科领域也在不断增多,专利的发明间不再独立垄断。数据挖掘专利的相关学科领域关联逐渐复杂,不断有新的学科加入,说明整个网络仍处于一个发展的状态。

2014—2018年专利IPC-组与学科的关联关系数据中,2014年为30个节点(其中源节点5个),81条边;2015年为32个节点(其中源节点4个),79条边;2016年为38个节点(其中源节点5个),83条边;2017年为50个节点(其中源节点9个),163条边;2018年数据采集非全年,不作具体说明。2014—2017年,IPC分类与关联学科的数目大致相同,IPC分类与学科的关联情况也大致相同,学科耦合情况较为一致。2017年中,源节点为前三年的2倍,成边也为前三年的2倍,从数据上看,IPC分类之间的学科耦合情况与前三年变化不大,说明2014—2017年的发展较为稳定,学科间的关联也构成一定的模式。

仅从学科角度看,与数据挖掘技术有关的学科关联中,最初是相关性较高学科的融合,如同为计算机类的学科或相近学科的融合,主要是技术领域的融合;之后不同领域(如水利、电力、化工等领域)的相关学科融入,使得技术开发有了更加明确、实用的方向;随着时间的推移,逐渐有关联度较低的学科(如教育学、经济学等)加入,这类学科看似没有起到实际的作用,但其思想方法可能在数据挖掘相关创新中发挥着指导作用,也是数据挖掘逐渐应用到教育、经济等领域的体现。多学科的关联是目前的大趋势,学科间的合作能够促进学科间知识相互渗透,促进产生创新性成果,有利于新的技术专利的发明创新。

5 结语

本文以数据挖掘技术领域的发明人与申请人数据为基础,分析了发明人与申请人之间合作的类型和特点,形成专利主体合作网络,并基于合作网络探讨了该领域下学科之间的关联关系。改变了原来在单一标准的基础上判断学科关联的传统分析模式,既反映了演变下的学科关联情况,也能够发现学科间的关联趋势,从而可以为多学科之间的关联合作提供参考依据。

由于本文所做的分析研究只是对基于专利主体合作关系的学科发现的一个探索,主体所属学科来自学术资源库,会遗漏部分没有学术研究创作的专利主体,同时没有将创新主体的相关科技文献数据细化到主题层次,因此无法反映具体学科之间的关联程度。在后续的研究中,将寻求合适的量化指标,引入学科关联公式,对学科间的关联程度作进一步的研究,挖掘不同学科间的关联融合情况,揭示多学科间相互作用关系,明确学科关联的发展方向。

猜你喜欢
发明人申请人数据挖掘
探讨人工智能与数据挖掘发展趋势
发明人角色识别及二元创新能力差异分析
——社会资本视角的解释
7月1日起澳洲签证费将全面涨价上调幅度达到5.4%
留学(2019年12期)2019-07-29 07:04:12
浅析发明人(或设计人)变更的常见问题及建议
专利代理(2019年2期)2019-01-26 15:16:16
摇摆撞击洗涤装置
家电科技(2018年9期)2018-09-28 01:45:00
洗衣机
家电科技(2018年9期)2018-09-28 01:45:00
基于并行计算的大数据挖掘在电网中的应用
电力与能源(2017年6期)2017-05-14 06:19:37
一种含碘氢碘酸浓度的分析方法
一种黄霉素A组分的分离纯化方法
一种基于Hadoop的大数据挖掘云服务及应用