李兰芳,陈云伟,张 雪,邓 勇*
(1.中国科学院成都文献情报中心科学计量与科技评价研究中心(SERC),成都 610041;2.中国科学院大学经济与管理学院图书情报与档案管理系,北京 100190)
随着大科学时代的到来,科学研究的复杂性不断提高,跨机构、跨区域和跨国家之间的科研交流活动日益频繁,科研活动全球化的浪潮推动了空间分布不均匀的科研学术资源在全球范围内的流动与优化配置。然而,在全球范围内,科研活动越来越受到顶尖发达国家的主导,科研的两极化分布进一步加深。因此,从空间的视角来理解和研究科研活动十分重要。作为科学计量学的重要研究领域,空间科学计量学被学者专门提出用于探讨科研活动空间方面的问题,主要基于科研成果的地理属性研究科研合作的空间分布结构、知识在不同空间单元之间流动的内在规律等,进而为科技政策制定者、机构管理人员进行决策提供更为科学合理的对策建议。
当前国内外学者开展空间科学计量学的研究应用众多,几乎涵盖了科学计量学研究的各个方面,然而,对空间科学计量学概念与研究进展的系统性梳理工作相对较少,如左丽华等对空间科学计量学概念及应用的研究进展进行了系统的梳理[1];FRENKEN 和HOEKMAN 基于学术影响的空间层面对空间科学计量学进行了解读[2]。总体而言,已有的梳理多停留在简介和直接引用概念的层面,存在概念内涵不统一、研究主题分散、应用领域不明确等问题,使得空间科学计量学的发展滞后,导致学者对空间科学计量学相关研究的关注不高,对于支撑高水平科学计量研究的作用发挥不足。
基于以上研究现状,本文以Web of Science 数据库为数据源,以TS=(spatial* OR “space” OR spatio*OR geograph*OR region*OR “cities” OR “city” OR international*OR country* OR “proximity” OR “distance”OR “mobility”) AND TS=(“publications” OR“co-publications” OR “articles” OR “papers” OR scientometr* OR bibliometr* OR citation*)为检索策略,按照被引频次筛选空间科学计量学重点文献,同时结合已有重要文献对其有价值的引用文献及引证文献进行回溯检索,在对上述重点文献进行梳理与总结的基础上,首先界定了空间科学计量学相关概念,然后从研究方法、研究主题和可视化实践3 个层面归纳了空间科学计量学研究成果,总结了现有研究存在的问题和挑战,归纳科学计量学者开展空间科学计量学研究所选用的理念和原则,为研究人员理解空间科学计量学的概念、了解相关研究工作、指导相关研究选题与方法设计提供参考借鉴。具体研究框架如图1 所示。
图1 空间科学计量学研究分析框架Fig.1 Analytical framework for spatial scientometrics research
科学计量学(Scientometrics)最早在20 世纪60年代由NALIMOV 和MULCHENKO 提出,被定义为一种用于研究作为信息过程的科学发展的定量研究方法[3]。之后,又出现了各种关于科学计量学的定义,如科学计量学是 “描述科学活动增长、结构、相互关系和生产力的学科”,是 “研究科学信息的结构和属性以及科学传播过程规律的学科”,是 “用定量方法处理科学活动的投入(如科研人员、研究经费)、产出(如论文数量、被引数量)和过程(如信息传播、交流网络的形成)的研究领域” 等[4-6]。尽管当前科学计量学的定义并不统一,但总结发现学者们普遍认为科学计量学具有以科学技术为研究对象、运用定量方法研究科学活动的各个方面、探索科学活动规律的共同特点。
由于科研活动在地理空间内的分布存在差异,早在20 世纪70 年代,就有研究讨论科研活动的空间分布,其研究重点主要聚焦于国家层面[7]。随着科研活动的全球化发展趋势加快,科学计量学对空间领域的关注越来越多,空间单元范畴也扩展到了次国家的区域或者城市层面,因此关于科学活动空间方面的定量研究就被归到了“空间科学计量学” 名下。“空间科学计量学(Spatial Scientometrics)” 这一概念由FRENKEN 在2009 年首次提出,旨在研究何处以及何种条件下进行知识的创造和转移,并建议将科学计量学中描绘科学地理方面的研究如涉及论文与引文的空间分布、科研主体对合作伙伴选择的空间偏好、不同类型的科研合作对科研成果的学术影响力的作用等纳入到空间科学计量学研究范畴中[8,9]。通过梳理文献发现学者们在继续沿用该内涵基础上开展了诸多研究,研究对象涉及国家、区域、城市、高校和科研院所,研究主题也扩展到科学合作、科研产出、知识流动与利用可视化工具进行科学地图的绘制等。在借鉴现有相关概念的基础上,本文将空间科学计量学界定为:以科学信息(常用的包括论文、专利等)为研究对象,主要基于其地理属性,运用定量研究方法揭示科学活动空间分布、关联特征和规律,是丰富科学计量学研究内容的重要研究领域。
本文以利用空间信息进行科学计量研究的论文为调研对象,即目标论文集研究内容主要如下:描述或解释跨空间单元(国家、城市、区域等)的地理分布特征、基于研究活动的空间关系(合作、引用)分析科学系统的内在运行机制、绘制可视化地理地图对出版物产出或者引用在特定地理位置的分布情况进行展示。通过对这些文献的研究内容进行分析发现,学者们主要从科研产出、科学合作和知识流动这3 个主题开展空间科学计量学的研究。并且对这些文献从研究主题、研究方法以及可视化实践三大方面对空间科学计量学研究进行系统的梳理,归纳共性特点,讨论不足与发展前景。
3.1.1 科研产出
利用科研产出开展研究的最大优势是可以基于相对客观的论文、专利、科技奖项等定量数据,呈现不同国家、地区或城市等的科研产出数量,如果计算被引数据,还可以在一定程度上揭示质量或影响力。根据科研产出开展空间科学计量学研究主要包括了解科研产出的地理空间分布情况和根据科研产出评估国家或地区的科研实力两个方面,各个视角研究内容分别如下。
(1)根据研究对象的不同,关于科研产出的地理空间分布情况研究主要是基于论文数量和科技奖项分析科研产出在地理空间内分布的集中或分散程度,进而揭示科研产出的空间结构。一方面是基于论文数量的研究。例如,MATTHIESSEN 和SCHWARZ 以科学引文索引(SCI)的论文数量对欧洲较大城市地区的科研产出进行了分析,发现欧洲西北部地区的研究成果最为集中[10]。ANDERSSON 和GUNESSEE 揭示了中国科研产出的内部空间结构,表明科研产出主要集中在以北京为主的单中心城市,并且省会城市在科研网络中也占有主要位置[11]。GROSSETTI 等从城市层面分析了Web of Science 数据库中的学术出版物,揭示了全球和国家内部科学活动的分散性[12]。另一方面是基于科技奖项的研究。SCHLAGBERGER 等对化学、物理和医学3 个学科领域的诺贝尔奖得主所隶属的研究机构进行分析,发现它们分布于美国、英国、日本和德国,并且加州大学伯克利分校、哥伦比亚大学和麻省理工学院这3 个机构拥有更多的诺贝尔奖获得者[13]。门伟莉等通过分析诺贝尔科学奖获奖机构信息揭示了诺贝尔科学奖的分布规律[14]。任晓亚等分析了主要科技领域的22 项国际科技奖项的国家分布,发现美国在获奖国家中占据领先优势且获奖领域分布均衡[15]。
(2)根据科研产出评估国家或地区科研实力的研究主要体现在基于专利数据了解在特定领域表现良好的国家或地区。例如,JIANG 等通过使用共同专利数据研究了中国城市R&D 合作的空间模式,发现城市间的研发合作活动主要发生在经济相对发达的直辖市和沿海地区,同时北京是跨城市研发合作的枢纽[16]。ZHENG 等基于专利数据分析了纳米技术领域的国际合作发展,发现美国是国际合作纳米技术专利中最重要的参与者,亚洲国家在其中起着相当重要的作用,而欧洲国家的重要性角色在减弱[17]。LIU 等通过专利分析描述了集成电路制造行业的国际技术合作特征,结果表明美国的技术合作水平最高,而德国有很大的未来发展潜力,同时亚洲和欧洲已经在合作网络中形成了各自的集群[18]。MAKHOBA 等从政府政策文件中已确定优先研发领域的视角出发对南非专利申请数量与金砖国家和埃及进行了比较,发现南非在专利方面比其他发展中国家表现良好,但获得专利的具体领域并不一定与政府政策中记载的优先领域保持一致[19]。国内彭帅等以专利数据为载体,基于 “科学-技术-产业”关联视角揭示了中、美、英、德、法、日、韩及中国台湾地区石墨烯的发展特征和竞争态势[20]。
以上关于科研产出的空间科学计量学研究可以得出科研产出在地理空间内的分布存在差异,科研产出的数量是一个综合的整体,不同空间单元的科研表现受到多种因素的影响。开展此类研究仍需要关注的5个问题主要包括:①科研产出的规模通常与科研院所、大学、科研人员数量相关,论文和专利数量并不是作为孤立指标存在,在分析解读时需严谨;②科研产出的数量是宏观的总体量化,即使区分了学科领域,仍然很难揭示某一具体技术的竞争地位,也就是说,论文或专利数量多,并不意味着技术领先或研发水平领先,特别是开展国家间的比较时,还要考虑学科领域布局、研究人员数量等诸多因素;③即便是在宏观层面的比较,当前研究通常基于的文献或专利数据库都是有限收录的文献集合,并未包含科研产出全部,也不能反映全貌;④除了论文、专利和科技奖项,科研产出的形式还很多,但通常不宜量化,因而用于比较的研究较少;⑤科研产出的数量和形式还受到科技政策、管理机制、科研氛围的影响,同等投入的前提下,研究机构和科研人员对科研产出的数量目标也存在差异。这些因素都会对基于科研产出的空间科学计量学研究结果产生影响。
3.1.2 科学合作
科学合作是指两个或两个以上科研活动主体通过共享知识、经验和资源相互作用来实现科学活动中共同目标的过程,是促进知识生产和文化交流的主要形式之一,为研究人员获取和整合知识、技能、材料和其他必要资源以解决科学问题提供了重要途径。空间科学计量学领域关于科学合作的研究主要包括科学合作模式与科研绩效关系的研究、地理距离对科学合作的影响分析两个方面,各个视角研究内容分别如下。
(1)关于科学合作模式与科研绩效关系的研究具体体现在根据论文合著者的隶属地理位置探讨国际合作、国内合作、机构间合作等不同合作模式对从事科研活动主体的科研绩效的影响。NOMALER 等基于2000 年发表的两个或两个以上国家的发文数据分析了引用影响因国家间合作距离不同而出现变化[21]。CSOMOS 等分析了2014—2016 年超过300 篇的城市间合作论文,发现美欧城市合著的论文比亚洲城市合著的论文更有可能被引用[22]。YAO 等发现美国顶级机构和普通机构的研究人员合作时,顶级机构的研究人员将面临研究生产率和影响力下降的问题,而普通机构的研究人员将提高研究生产率和影响力[23]。ZHOU等对发达国家和发展中国家的资助机构发表的国际合作出版物进行分析,发现国家资助机构(如美国国家科学基金会NSF 等)的引文影响力高于非重点机构,并得出由发达国家作者主导的合作具有对引用具有积极影响,而发展中国家作者主导的合作产生的影响是负向的[24]。通过这些分析可以得出:并非所有合作对科研绩效的影响都是正向的,一些合作可以提高,而另一些则减弱;因区域经济发展水平、地域环境等的不同,不同合作模式对科研绩效的影响程度存在差异。
(2)现有的空间科学计量学领域关于科学合作的研究集中在研究地理距离对科学合作的影响。由于科学合作不仅涉及显性知识,也涉及隐性知识。虽然通信技术的发展可以促进显性知识的表达或者交换,在一定程度上弥合地理距离阻碍科学合作的鸿沟[25]。但隐性知识之间的共享需要科研人员之间的频繁接触或进行面对面互动,并因合作项目规模、复杂性和周期的增加而变得更加重要,因此地理距离仍然被认为是影响科学合作活动的重要因素,分析地理距离对科学合作的影响可以更有效地为科学决策提供支持。如NAGPAUL 分析了全球科学领先的45 个国家的合作情况,发现地理位置相近的国家往往合作更加密切[26]。PONDS 等从机构层面对荷兰不同类型的科技组织合著的出版物进行了分析,得出在制度存在差异的情况下,地理空间邻近对组织间的合作起着重要作用[27]。HOEKMAN 等根据出版物地址和邮政编码统计分析了地理距离和领土边界(区域、国家、语言)对整个欧洲地区研究合作强度的变化影响,得出欧洲科学合作的空间模式受到地理位置的影响比较小,区域和国家之间的合作倾向受到规模、研究质量和可及性方面的差异[28]。同时,研究人员之间的合作本身就构成了一个社会网络,为更好地了解网络在合作地理区域中发挥的作用,LAURENT 引入了一种新的区域间网络邻近度的度量方法,探讨了网络邻近性对跨区域合作结构的影响及其如何与地理进行交互,发现区域间网络邻近更有利于国际合作,并且其重要性与地理距离的增加呈正相关[29]。此外,社会因素如个人差异、语言或文化差异、学术等级或制度障碍等与地理距离有关的因素对科学合作都有影响[30-32]。BOSCHMA 提出一个包括认知、组织、社会、制度和地理邻近的五维框架来研究涉及科学合作的各个方面[33]。
以上针对科学合作及其影响因素的研究,可以得出不同地区之间的合作强度对地理距离的依赖程度存在差异;不能孤立地评估地理邻近的重要性,应从多个维度考虑影响科学合作的重要因素。同时,有3 个待解的问题需要深入探究:①科学研究成果(如论文)的重要性或影响力与地理距离正相关的规律是否具有普适性,是否存在学科差异;②影响科学合作的因素都有什么,和地理距离存在何种关联;③已有研究中发现的上述正相关性的内在动因是什么,是高水平的成果需要更远距离的合作,还是因为存在某种固有的偏见导致的虚假的高影响力,需要审慎审视。
3.1.3 知识流动
知识逐渐成为促进经济发展的越来越重要的资源。知识流动是引发科技创新和区域经济发展的关键社会过程之一[34]。知识流动通过知识转移、知识共享等多种具体形式表现。对知识流动的研究,有助于提升科技创新政策的针对性,可提高科技政策与科技管理工作的科学性。空间科学计量学领域关于知识流动的研究包括研究科研人员的空间流动性及其对流入地的影响和分析地理距离对知识流动的影响两个方面,各个视角研究内容分别如下。
(1)研究科研人员的空间流动性及其对流入地的影响。作为知识的主要拥有者和载体,科研人员的学术流动是触发国际或者区域间知识流动的重要途径。了解科研人员的空间流动,可以揭示不同国家、地区或城市之间人才吸引力,分析其流动模式和挖掘背后的影响因素,对指导相关部门出台针对性的人才政策具有重要意义。MAIER 等以ISI 数据库中的高被引数据为数据源,分析了高被引科学家的空间分布和流动模式,发现美国是高被引科学家最为集中的国家,而西欧和英国则是失去大部分科学家的地区[35]。SCHILLER 等通过分析顶尖研究人员的流动方式和内在动机,探讨科学家流动与本地无形资产创造之间的关系,得出知名科学家的长期流动性增加了知识流动,同时创造了地方无形资产[36]。国内郦苏菲等基于上海科技创新资源数据中心的全球高层次科技专家信息平台的数据,对全球20 个热点城市科研人员的流动情况进行分析,得到上海、深圳在吸引人才数量方面有明显的优势,但相较于旧金山、伦敦、香港、新加坡等全球性城市对科研人员的吸引力还有待提升[37]。刘玮辰等分析了青年千人计划入选者回国前后国内科研人员对其论文引用的变化,发现科学家回国后,其知识扩散呈现出显著的正向效应[38]。
(2)分析地理距离对知识流动的影响。信息技术的快速发展缩小了限制知识流动的地理障碍,为节省知识流动的成本和时间做出了重要贡献。尽管如此,地理距离仍然是影响地区之间知识流动的重要因素。MICEK 以波兰IT 服务中小企业为例,确定了国际范围内建立的贸易关系和专家聘用是被调查公司最重要的市场和技术知识流动渠道,并且相对国家知识流动而言,全球知识流动对被调查公司的影响更大[39]。GUI等对国际知识流动的空间格局进行了阐述,认为地理、技术、社会和文化这4 个维度的邻近性促进了国际知识的流动[40]。ABRAMO 等根据意大利地区之间的引用分析了地理距离对知识流动的影响,认为地理距离是国内知识流动的影响因素,并且在国家层面的流动中不能忽略(从意大利流向欧洲国家),但在洲际一级(从意大利流向非欧洲国家)完全不相关[41]。赵炎等以中国生物制药行业1995—2010 年战略联盟数据为样本,发现联盟企业间的地理邻近性对联盟知识转移有显著的促进作用[42]。由地理距离对知识流动的影响分析可以得出,地理距离邻近对知识流动的影响并非都是正向的,因学科、技术等领域的不同而存在差别。同时,地理距离不是影响知识流动的唯一因素,知识流动过程的动态性和复杂性决定了其受到多种因素。
3.2.1 文献计量方法
开展空间科学计量学的多数研究中均有文献计量方法,主要基于论文数、奖项数等科研产出类指标和篇均被引频次、高被引科学家等基于引用的指标来了解国家或地区的科研表现情况,探索科研活动的分布规律。例如,ZHOU 等对诺贝尔物理奖得主发表的标志性论文所在期刊的分布进行了文献计量分析,发现美国的物理科学期刊占据了主导地位,之后是荷兰、英国、德国和日本[43]。BORNMANN 通过对Web of Science 数据库中2003—2014 年的论文总数和排名前1%论文(高影响力论文)的参考文献进行分析,发现中国已经成为科学研究的主要参与者,但对高影响力论文的贡献度比较低,而美国是对高影响力论文最具有贡献的国家[44]。DURAN 使用Scopus 数据库对引用次数最多的文章、作者和机构进行分析,研究期刊的增长方式以及未来的发展趋势[45]。
3.2.2 网络分析的方法
网络分析的方法是空间科学计量学领域常用的研究方法,在研究不同空间单元的网络特征结构特征与揭示地理距离对科学合作和知识流动的影响因素的研究时会用到此类方法,基于合作关系和引用关系构建的网络可以直观反映科研主体在网络中的节点位置和结构,并通过节点和边的参数如中心度、网络密度、聚集系数等揭示网络结构特征,进而探究这些结构特征与科研产出等的关系。例如,YAN 等基于图书情报领域研究机构的引用网络和协作网络研究了机构之间的相互作用[46]。CHEN 等从国家和机构层面分析了科学计量学协作网络并确定了在该领域占主导地位的领先国家和研究机构[47]。CHOI 等从大学、企业、政府层面分析OECD 成员之间的协作网络来理解国际科学合作关系和知识生产方式[48]。GIUSEPPE 使用欧盟发布的题为 “纳米技术研究映射门户” 的正式文件,采用社会网络分析方法对纳米技术的网络特征进行识别并评估了意大利组织(大学、研究机构、公司)在现有的欧洲纳米技术创新网络中的作用;之后又与FITJAR 通过收集有关组织之间知识交流的数据,使用该方法对实施地区之间的知识交流政策的有效性进行评估[49,50]。TU 通过对网络中心度、连接强度和h 指数的同质性进行描述,显示了相似性质的机构倾向于在协作网络中相互连接,揭示了研究机构之间的合作与科研产出的关系[51]。
3.2.3 基于模型和统计的方法
在空间科学计量学领域,为研究知识流动中的地理因素的影响,已经采用了不同的解释模型,其中最常用的是引力模型(Gravity Model)。引力模型的思想跟牛顿的万有引力定律有关,最初起源于经济学领域[52]。具体而言,是指两个实体之间的吸引力取决于它们的质量(经济规模或科学出版物)和它们之间的距离。引力模型被广泛用于探索国际贸易流动,之后又基于新的情境被研究人员扩展,例如用于研究不同类型机构之间的科学合作、欧洲R&D 网络社区识别、全球创新系统的特征分析、科学合作模式研究、国际和国内引用过程中距离和边界对知识传播的影响[53-58]。此外,数学模型如线性回归、负二项式回归模型和统计学方法包括描述性统计分析、和假设检验等也被用于揭示科学系统的空间结构[59,60]。
3.2.4 多指标构建的方法
由于单一指标通常适用性有限,许多研究通过整合多种定量指标构建综合指标体系进行科技评价,进而为政府管理部门决策提供依据,比较典型的就是多个国际组织机构发布的有关国家竞争力、创新能力的评价指标体系。例如,世界经济论坛(WEF)从1979年开始发布 《全球竞争力报告》,基于全球竞争力指数(GCI)从基础环境、人力资源、市场和创新生态系统4 个层面构建了包括社会制度、基础设施、稳定的宏观经济环境、卫生和基础教育、技能、产品市场效率、劳动力市场效率、金融系统、科技准备度、市场规模、商业活力、创新12 个一级指标和103 个二级指标的指标体系,并对每项指标进行0~100 分的计分来评估各个国家在全球的竞争力状况[61,62]。瑞士洛桑国际管理发展学院(IMD)从1989 年开始发布的 《世界竞争力年鉴》 用于衡量世界主要国家或地区的经济综合能力,评估指标体系分为经济表现效率、政府效率、营商效率和基础设施4 个维度以及314 项具体指标[63,64]。世界知识产权组织(WIPO)发布的 《全球创新指数报告》用于评估全球127 个国家或经济体的创新效率,创新产出和创新投入两大核心指标构成创新指数,其中创新投入又分为制度、人力资本、基础设施、市场成熟度和商业成熟度五大类,创新产出包括知识与技术产出、创意产出两种[65]。《欧洲创新记分牌》 由欧盟委员会推出,包含框架条件、投资、创新活动、影响力4个方面,基于27 项基础指标对欧盟成员国和其作为竞争对手的标杆国家的综合创新指数进行计算,依据指数高低来评估各国的创新绩效[66]。
比较各类空间科学计量学领域使用的研究方法可发现,文献计量和多指标综合的方法通常易于理解和重复实验,也是应用最为普遍的方法。基于模型和统计的方法可以从数学层面揭示空间内在的流动动力,可揭示特定模式、规律或共性特征,但其可观察性、解读性弱;而网络分析方法通常伴随着数据的解读或可视化呈现,与抽象的模型分析而言,更易于解读信息。事实上,在实际研究工作中,这两种方法常常相关关联在一起使用,例如,有些模型分析的基础数据关系就是基于网络分析方法进行构建的合作或引用等关系。
可视化可以识别出优秀研究区域,并可以直观地对全球各地区的优势领域进行比较。科学论文的地理地图不同于基于语义的认知地图,是基于科研成果中的地理属性研究科研交互,从地理维度揭示科学现象。在空间科学计量学中,越来越多的学者关注地理数据可视化并致力于研究支持科学空间方面的分析和可视化的工具。早在2006 年,BORNER 等[67,68]就基于论文的生产和引用关系可视化展示了美国500 家被引用最多的研究机构的引文模式的时空变化,并在2012 年对基于学科分类的USCD 全球科学地图的覆盖范围进行了更新,可用于识别优秀研究机构和国家。LEYDESDORFF 使 用Google Earth、Google Maps 和PAJEK 通过将科学出版物中地址之间的关系网络映射到地理地图从城市层面绘制了全球地图[69]。BORNMANN 提出了在全球范围内绘制科学卓越中心地图的方法。通过根据优秀论文的输出对全世界的城市进行着色,可以在其中找到这些论文的高(或低)输出城市[70]。BORNMANN 和WALTMAN 遵循这种方法,但是将重点从单个城市的地图更改为更广阔区域的可视化,使用密度图来检测全球范围内的卓越区域[71]。之后BORNMANN 认为仅使用优秀论文产出对结果是有误差的,使用多层次模型对机构优秀论文的数量进行估算和置信区间作为衡量机构引用影响的准确性指标对全球不同领域的卓越中心进行揭示。现在最新的研究是从城市层面可视化数据,其优势在于呈现在地图上的数据不会出现重叠,改善了用户对空间结果的感知[72,73]。
然而,开展可视化研究需要避免为了可视化而可视化,可视化仅是手段,不能替代计量分析、网络分析或指标分析,缺乏严谨的分析作为支撑的可视化图像并不建议单独进行解读,避免出现由视觉导致的严重偏差。可视化分析正确的利用方式是作为对计量分析、网络分析或指标分析结果进行解读的辅助手段,增强读者对相关研究结果的理解。
作为科学计量学的重要研究领域,空间科学计量学丰富了科学计量学的研究内容,拓展了研究方法和工具,也为开展科学计量学研究提供了新的视角和途径,同时得益于计算机技术的飞速发展,提升了科学计量学研究的总体水平。本文主要从国际视角出发,发现学者们主要基于出版物的地理属性从国家、区域、城市和机构层面综合运用文献计量指标、网络分析方法、模型构建和统计学方法开展空间科学计量学相关研究,研究主题主要有科学合作、科研产出和知识流动等。在可视化实践方面,科学活动的可视化地图有助于人们了解科学活动的地理分布和知识传播的演化路径。然而,空间科学计量学研究仍然存在一些问题和挑战,主要表现在以下4 个方面。
(1)在理论基础方面,空间科学计量学本质上是服务于科学计量学研究的特定领域,借鉴了来自计算机科学、网络科学、经济地理学领域的技术方法,没有形成相对独立的理论体系。例如利用社会网络方法和知识溢出理论对科学活动的空间结构进行解释和开展应用研究,但如何利用这些方法来构建系统性的空间科学计量学研究框架尚缺乏充分的理论支撑。为更好地对相关研究提供理论依据,深化空间科学计量学的研究与运用水平,需要学界提高对该研究方向的重视。
(2)缺乏方法适用性与效用性研究。理想的方法选择方式应该是为研究某科学问题选择最适用、恰当且有效的方法,然而,受困于理论体系的缺位,空间科学计量学的方法选择也存在随意性的情况,针对同样的研究问题,研究人员通常会基于经验选用自己所掌握的、熟悉的方法和工具。这种现状导致的结果是无法对分析结果的科学性、有效性进行准确的评估,甚至不同研究方法和工具还会揭示出截然相反的所谓“特征和规律”。同时,随着可用技术的增加,开展空间科学计量学研究时还需评估新技术带来的效用和价值,避免出现仅为片面追求新技术和利用新技术的误区。
(3)数据分析的来源比较单一,现有的研究多是围绕Web of Science 和Scopus 数据库的文献数据进行展开。然而,若是要对科学活动的空间结构进行全面客观的分析,还需要考虑报告、基金资助项目、统计年鉴、政策文件等其他形式的数据。同时,在研究方法上,需要充分利用机器学习、大数据分析等新技术来提升对文本进行处理与分析的效率和效果。如何采用来源更为广泛的数据以及拓宽研究对象也将是空间科学计量学领域具有挑战的前沿课题。
(4)在获取数据的准确性方面,例如利用数据库文献进行定量研究时,由于很多知名机构和公司都是分布不集中的组织,其研究人员分散在除这些组织总部之外的附属组织,所以数据库分配给出版物的地址不一定意味着是作者的真实地址。同时,由于不同国家对城市的划分范围和界定标准不同,城市层面的数据获取后难以直接分析。因此,如何从作者地址信息字段中提取准确的数据也是需要考虑的问题。
在新一轮科技革命和产业变革的浪潮下,开展空间科学计量学研究包括理解科学系统的发展规律、了解地区的科技创新影响因素和科研合作网络形成等规律性和特征性问题,也可以为政策制定部门进行科技政策布局提供支持。一个有价值的方向是充分利用空间科学计量学研究开展时序分析,观察各种表现随着时间推移的变化,对揭示国家科技进步的相对速率具有参考价值。