福建工程学院管理学院 邱 栋
基于知识图谱的区域科技资源分析*
——以福建省部分战略新兴产业为例
福建工程学院管理学院 邱栋
区域科技资源分析是区域科技管理的一项基础性工作,是科技资源整合、优化配置以及科技创新平台建设的前提步骤。该文研究运用知识图谱方法对福建省部分战略新兴产业进行专利分析,并以图谱形式显示相关产业的科技资源状况,为区域科技发展与管理提供借鉴。
知识图谱 科技资源分析 福建省 战略新兴产业
科技资源是开展科技创新活动的基本要素,包括人、财、物、信息等,其中创新人才是最核心的资源。区域科技资源分析是指分析区域内某一行业或技术领域的科技资源的类型、数量、质量、分布及其相互关联,目的是为科技创新活动及其管理提供依据。
区域科技资源分析对于政府部门、科技服务机构、企业以及其他创新主体都具有重要意义。具体来说,政府部门只有通过科技资源分析,才能明确区域科技发展的优势和劣势,从而加强宏观引导、顶层设计与管理干预,加快区域科技发展;科技服务机构通过科技资源分析,能够更好地为创新主体提供信息和中介服务,充分发挥资源优化配置功能;企业、高校及科研院所等创新主体,如果能掌握区域科技资源状态,便能更好地开展合作创新乃至协同创新,提升创新能力。
目前,科技资源分析在实践中还存在很多不足,例如政府部门掌握着大量的科技数据,但是整理、挖掘数据的能力有限;科技中介服务机构的服务方式落后,较多地依赖工作人员的经验以及人工查找资料,服务界面的实时互动能力较差;同时,企业等创新主体缺乏一种简便有效的方式了解其他创新主体及资源的状况。对此,本文引入知识图谱方法,并以福建省部分战略新兴产业为例进行分析,为区域科技资源分析提供一种思路与实践途径。
知识图谱(mapping knowledge domain) 是近年来科学计量学中比较热门的一种研究方法,它通过数据挖掘、分析和绘图,显示知识以及相互关系,目的是揭示知识的发展过程,发现相互关联的科学群体以及他们的思想[1]。2005年,一篇名为《悄然兴起的科学知识图谱》[2]的文章使知识图谱开始在国内得到关注,并迅速流行起来。近年来,知识图谱在国内得到越来越广泛的重视,应用也趋于成熟。
形成知识图谱需要三个环节:
一是数据收集。知识图谱的数据通常来源于论文、专利等科技文献,并对文献中的关键词、作者、机构、引文等对象进行分析。现有各类文献数据库为知识图谱的运用提供了极大的便利。
二是数据分析。这是知识图谱的核心,常用的分析方法包括:(1)共现分析(co-occurrence analysis)。共现分析是通过分析两个计量单元(如论文、专利)中共同出现的信息,来揭示两者之间的联系。根据分析对象的不同, 共现分析又可以分为词频共现、作者共现、机构共现等。而共词分析(co-word analysis)是其中最为常见的一种方法,通过分析研究对象中的词或短语共同出现的频率,发现对象之间的潜在关系。(2)引文分析(citation analysis)。引文分析通过分析文献及作者的引用与被引用情况,揭示文献或学者之间的隐性联系。通常,当一个学者引用了另一个学者的论文,他们的研究必然存在某种关联性。共引分析(co-citation analysis)是分析两个计量单元同时被同一对象引用的现象,从而发现更深层次的联系。(3)多元统计分析。包括因子分析和聚类分析等,主要目的是当数据数量或类型太多时,用以降低维度,从而突出重点信息。(4)社会网络分析(social network analysis)。社会网络分析方法将人或组织看作是一个个节点,而他们之间的关系则是节点之间的连线,由此构成了一个网络。通过分析网络的紧密性、中心性、中介性等,可以掌握网络的结构特征,并揭示占重要地位的人、组织以及群体。综合运用上述几种分析方法,知识图谱便可以发现知识之间的联系以及现存或潜在的科学群体。
三是数据及其分析的可视化。即以图谱的形式将复杂的数据直观地呈现在人们面前,这是知识图谱最具特色的一部分。正是得益于信息可视化,才使知识图谱不仅能够服务于专家、学者,也可以为非专家所用。如企业、政府部门、科技中介服务机构等都可以通过知识图谱来了解知识(或技术)的轮廓和脉络,了解科学技术的前沿热点和发展趋势,发现科技创新合作网络。
基于知识图谱的上述特性,运用它来分析区域科技资源也是十分合适的。
本研究选取福建省战略新兴产业中的几个技术领域来演示知识图谱的应用。在分析对象的选择上,知识图谱既可以分析论文,也可以分析专利。经过初步分析比较后,发现专利分析更贴近产业实际情况,因此选择专利作为分析对象。在数据来源方面,本文通过中国知识产权网(CNIPR)对相关领域近三年的中文发明专利进行检索。在分析工具方面,选取近年来在国内较流行的Citespace软件进行分析。该软件与传统数据挖掘方法相比,一个优势在于可以对机构、作者、关键词以及引用等进行多要素综合分析,从而更全面地发现要素的内在联系。此外,Citespace的信息可视化功能也是其一大优势。具体分析如下:
2.1福建省通讯技术领域图谱分析
对2011~2013年福建省“通讯”及“通信”相关的发明专利进行检索,共获得专利164条。通过Citespace对专利关键词、机构和发明人进行综合分析,得到如图1所示的图谱,其中包含了一个主要集群:以星网锐捷网络公司为首的多个企业在通讯设备和终端制造以及无线通信领域形成的集群。此外,图谱中还包含了两个主要分支,一个是厦门大学在光缆通讯和水声通讯领域形成的团队,另一个则是从无线通讯中延伸出的即时通讯技术领域。可以看出,福建省的通讯技术专利主要集中在通信(通讯)设备尤其是终端设备的制造方面,而且主要针对移动或无线通信。
图1 福建省通讯技术专利图谱
如果单独对专利申请机构及发明人进行分析,则可以得到如图2所示的创新主体图谱。可以看出,福建星网锐捷公司在福建省通讯技术领域中占据最重要地位,此外,厦门大学、福建联迪商用设备公司、福建星网视易、厦门雅迅网络、联想移动通信等组织成为该领域创新的主力军。从合作网络来看,不同企业及大学之间并没有合作关系,厦门大学自身形成了比较突出的科研团队。
综合上述分析,厦门大学在通讯领域上具备较强的基础科学研究能力,而众多企业则擅长无线通信设备的研发与制造。如果要对区域科技资源进行整合,一方面可以考虑联合多个企业来研发通讯设备共性技术,另一方面,如果厦门大学与上述通讯设备企业联手,很可能在水声通讯设备技术上形成突破,从而支持福建省海洋战略。
图2 福建省通讯技术专利的主要团队及核心人员
2.2福建省物联网技术领域图谱分析
物联网领域涉及的技术众多,在参阅相关文献资料后,本研究选取射频识别(RFID)、无线传感器、智能控制以及云计算技术作为搜索专利的关键词,通过对2011~2013年福建省物联网相关专利的搜索,共获得专利97条。从专利数量上可以看出,福建省的物联网技术还仅仅处于起步阶段。通过分析,得到如图3所示的图谱,从整体上可以看出,福建省物联网专利技术最主要集中在RIFD(射频识别)领域,而福州大学的研发能力是最强的。
图3 福建省物联网技术专利图谱
通过对专利申请人(单位)以及发明人的图谱分析(如图 4)可以看出,在物联网技术领域,福州大学、福建师范大学、福建物联天下信息科技公司以及厦门英诺尔(含电子科技和信息科技两个公司)在省内处于相对领先地位。同时,几个重量级的科研团队以及核心人员也都是来自上述几家高校或企业。而且,福州大学与福建师范大学、福建师范大学与厦门英诺尔之间有人员开展了专利合作。通过进一步的图谱分析可以得出:尽管福州大学在省内的物联网领域拥有较多的专利数量,但相关专利涉及射频识别、无线传感、智能控制等多个领域,比较分散;而福建物联天下信息科技公司专门针对物联网技术开展研发,专业性较强;厦门英诺尔公司也具有较强的技术实力,其专利主要集中在RFID领域。
图4 福建省物联网专利的主要团队及核心人员
2.3福建省太阳能电池技术领域图谱分析
搜索2011~2013年福建省太阳能电池相关发明专利,共获得专利103条。通过知识图谱分析,如图 5所示,福建省太阳能电池技术主要集中在太阳能电池的制造方法上,偏重于生产、工艺等应用层面。同时,主要针对薄膜太阳能电池和铜铟镓硒太阳能电池,这与太阳能电池发展的主流趋势基本吻合。在创新主体方面,厦门大学占据最主要地位,厦门三安光电科技公司紧随其后,在企业中领跑。
图5 福建省太阳能电池技术专利图谱
通过进一步的专利申请机构及发明人分析,如图6所示,除了厦门大学和厦门三安光电科技有限公司,福州大学、福建铂阳精工设备有限公司、南安三晶阳光电力公司、福建钧石能源有限公司等共同构成了该领域的创新主力军。此外,特别值得留意的是,在太阳能电池领域,科研人员构成的网络在知识图谱中十分突出,占据了图谱的很大比例以及很重要的位置,因此在产业发展、资源整合以及构建平台时应特别注重吸纳相关人才或听取他们的建议。
图6 福建省太阳能电池专利的主要团队及核心人员
通过上述实例分析可以看出,运用知识图谱方法可以直观地展示区域内某一行业或技术领域的科技创新状况,包括:该区域已有的技术领域、核心创新主体以及合作创新网络等。同时,还可以进一步提炼产业发展状况及趋势,如:产业创新趋向、企业需求取向、提炼企业的共性需求等。这些信息对科技创新活动具有重要的参考价值:(1)帮助创新主体更有效地寻找合作伙伴,包括:研究机构之间、企业之间的横向合作,以及研究机构与企业之间的纵向合作。甚至可以帮助投资公司以及大学生来选择发展前景较好的企业或研究机构。(2)帮助政府部门掌握区域创新体系的状况,包括:创新主体的能力和水平、创新主体之间的联系、区域创新热点等,为政府部门的科技发展决策提供依据。(3)如果在科技服务机构(平台)中引入知识图谱技术,将是对科技服务的重要改革。以知识图谱取代人工查询和咨询,能够帮助科技服务机构降低成本、提高工作效率。同时,具有良好交互界面的知识图谱将极大地提升用户获取科技信息的效率和乐趣。总之,知识图谱思想与方法在科技创新活动以及管理、服务中的应用将非常广泛。
同时,本文对知识图谱的应用只是抛砖引玉,还可以在以下方面进行研究的深化和扩展:
(1)本文只分析了专利,因为更贴合产业和企业,但如果将论文分析与专利分析结合起来,也许不仅能掌握产业创新的实际情况,还能更好地结合区域知识创造状况来引导产业发展。(2)本文只分析了近三年的专利状况,如果分析更长时间跨度的数据,还能掌握区域科技资源的演化历程与发展趋势。(3)如果将省内专利图谱分析与全国专利图谱分析进行比较,就能掌握福建省产业与科技发展的特色与优势、劣势。但全国范围的数据量过于庞大,以笔者目前掌握的工具和方法还难以实现,需要更高级的工具和方法的支持。
[1] Boyack. K.W. Mapping knowledge domains∶Characterizing PNAS[J].PNAS,2004, 101(l)∶5192-5199.
[2] 陈悦,刘则渊.悄然兴起的科学知识图谱[J].科学学研究,2005(2)∶149-154.
福建省教育厅一般课题“基于知识图谱分析的福建省科技创新平台建设及协同创新研究”(项目编号:JBS14115)。