国内外开放科学主题研究综述

2022-10-17 07:31盛小平毕畅畅唐筠杰
图书情报知识 2022年4期
关键词:科学研究

盛小平 毕畅畅 唐筠杰

(上海大学文化遗产与信息管理学院,上海,200444)

2014年以来,美国、法国、荷兰、日本等发布了开放科学宣言或计划,欧盟、芬兰、法国、加拿大等制定了开放科学路线图。“推动国家科研平台、科技报告、科研数据进一步向企业开放”“积极促进科技开放合作”等政策纲领写入我国“十四五”规划。开放科学运动受到国内外普遍关注,开放科学成为目前国内外研究热点之一,涌现了越来越多的相关研究成果,包括从广义的开放科学视角围绕开放科学领域覆盖的分主题如开放获取、开放数据、科学数据开放共享等进行的综述,但鲜见从狭义的开放科学视角综述开放科学主题研究成果。因此,本文从狭义的开放科学视角,专门解析国内外开放科学主题研究文献观点,以深化国内开放科学理论研究。

1 关于开放科学研究综述的述评

现有的开放科学研究综述主要从两个视角来展开:一是对开放科学领域研究现状进行综述,往往是运用文本分析和文献计量学方法,归纳与分析开放科学领域下的相关研究主题。例如,文献[1]简述了开放科学领域中的5个主题——开放获取、数据共享、成果重用、知识创新、基础设施建设的研究进展,指出目前国际开放科学研究的不足之处和今后的三个研究方向;文献[2]从开放科学的概念内涵与现实意义、国外开放科学实践动态、国内开放科学实践动态、开放科学的未来发展趋势4个方面概述了开放科学研究与实践进展;文献[3]简述了开放科学的基础理论、构成要素、方法技术、实践案例以及开放学术交流系统参与主体5个方面的研究进展。这些综述主要是从广义的开放科学视角来整体性地概述开放科学领域下的主要研究主题,但对专门的开放科学主题研究揭示不足。二是对开放科学范畴中的某个研究主题,如开放数据、开放科学政策或开放科学实践与应用等进行综述。一些文献分别综述了开放数据[4-6]及其评价[7]与计量[8]研究进展、政府开放数据及其质量研究[9-10]、开放科学数据[11]及其平台[12-13]研究、开放同行评议研究[14]、开放科学政策[15]、开放科学实践与应用研究[16]。这些综述聚焦于开放科学的子主题,但未概述开放科学主题文献观点。因此,本文从狭义的开放科学视角,对国内外开放科学主题研究文献进行梳理与分析。

2 数据来源与分析

国外数据来源于Web of Science核心数据集,以“open science”或“openning science”为检索词,检索字段为标题,对期刊论文、会议论文以及研究报告文献进行精确检索,共得到747篇相关文献,在去除重复文献后,得到659篇有效文献。国内数据来源于中国知网的期刊、报纸、学位论文与会议论文数据库,以“开放科学”作为检索词,在篇名字段进行精确检索,去除19篇外文图书和479篇期刊公告后,得到184篇文献。检索时间皆为2022年3月2日。由于659篇外文文献和184篇中文文献覆盖广义的开放科学领域,为获得狭义的开放科学主题文献,笔者通过逐篇文献标题与摘要及内容的文本分析,剔除那些正文没有论述开放科学主题而仅属于开放科学领域中的开放数据、开放出版等分主题文献,仅把论述开放科学主题的文献作为样本数据,从而得到有效的54篇中文文献和137篇外文文献。

为把国内外开放科学主题文献综合起来进行关键词共现分析以揭示整体研究现状,需要将外文文献中的关键词翻译为中文,并对初步得到的所有中文关键词进行预处理,包括同义词与相近词合并以及删除无实际意义的词等,如将“公开同行评审”与“开放同行评审”合并为“开放同行评审”,删除“阿根廷”“中国科学院院士”等关键词,最终得到与开放科学主题相关的关键词114个,运用VOSviewer软件生成的国内外开放科学主题关键词共现网络图谱如图1所示。

图1 国内外开放科学主题关键词共现网络图谱Fig.1 Keyword Co-occurrence Networks of Open Science Theme at Home and Аbroad

图1显示,国内外开放科学主题研究形成3个主要类团。第一个类团(红色部分)主要涉及开放科学基础理论研究;第二个类团(绿色部分)主要覆盖开放科学目标与特征及工具;第三个类团(蓝色部分)主要涉及开放科学政策与实践。各类团包含的研究主题、主要关键词及其频次、关键词数量、总频次等详细信息如表1所示。

表1 国内外开放科学主题关键词类团信息一览Table 1 List of Keyword Groups’Ιnformation of Open Science Theme at Home and Аbroad

综合图1与表1数据可以发现:①目前国内外对开放科学主题的研究主要集中在开放科学基础理论、开放科学目标与特征及工具、开放科学政策与实践三方面,其中开放科学基础理论研究类团的关键词数量和总频次远高于其他类团,说明开放科学基础理论问题引起了广泛关注,是开放科学主题研究重点;②开放科学政策与实践研究成果相对较少,在某种程度上意味着今后应该加强开放科学政策与实践研究,以便推进开放科学运动的进一步发展;③三个类团的关键词分布存在交叉现象,意味着国内外开放科学主题研究热点之间的界限还比较模糊。

3 开放科学主题研究分析

基于关键词共现与聚类分析,下面从国内外开放科学基础理论、开放科学目标与特征及工具、开放科学政策与实践三方面进行综述。

3.1 开放科学基础理论的研究

目前,许多研究成果论述了开放科学的概念与定义、基本理念、范畴、优势、历史演进、发展动因、障碍、挑战与路径等基础理论问题。

3.1.1 开放科学的概念与定义

学界对开放科学概念尚未形成共识,涌现了多种不同视角的定义。①活动论:开放科学是指开放数据、开放获取和开放可重复研究等一些系列活动的总称[17]。②方法论:开放科学是一种基于合作研究的科学实践新方法,是一种利用数字技术和新的协作工具促进共同努力、尽早和尽可能广泛地分享成果和新知识的新方法[18]。③方式论:开放科学是关于通过数字工具和网络开展、传播、部署和转变研究的方式[19]。 ④过程论:开放科学是一种以合作科研为基础,利用先进技术和协作工具,通过网络进行信息流通的科学过程[18]。⑤文化论:开放科学是一种协作文化,这种文化通过技术实现,使科学界和更广泛的公众能够开放地共享数据、信息和知识,从而加速科学研究和理解[20]。⑥实践论:开放科学是一套通过强调整个研究过程的开放性和透明度使科学更值得信赖、更有效和更有影响力的原则和实践[21];或者说,开放科学是一个集各种运动和实践于一体的包容性架构,旨在让多语言科学知识对每个人开放、可获取和可重用,增加科学合作和信息共享,造福科学和社会,并向传统科学界以外的社会行动者开放科学知识创造、评估和交流的过程[22]。⑦知识生产论:开放科学可视为一种累积知识生产机制,科学家由此可以汲取先前研究人员获得的知识,并将其发现提供给未来的研究人员[23]。总之,开放科学是一个庞大的概念,涵盖了科学传播和研究的诸多方面。开放科学是人们在开放环境下充分利用各种开放资源、技术、平台与其他人进行交流、学习、研究、合作的一种新方式与方法。

3.1.2 开放科学的基本理念

开放科学坚守所有的理论都应该经得起批评、结论可重复或可验证的基本信条,秉持“开放、透明、自由、合作、共享”的基本理念[24-25]。所谓“开放”,是指开放科学中科学研究成果可以通过互联网公开发布,任何用户都可免费获取和合理使用。开放性成为开放科学的首要特征与基本要素,也是开放科学不同于传统科学的主要标志。开放科学将开放原则扩展到整个研究周期——从设计问题和方法,到收集和分析数据,再到交流和传播发现,尽早促进共享和协作,从而对科学和研究的方式产生系统性的改变。所谓“透明”,是指开放科学要求知识发现、知识交流过程透明化,包括实现实验方法、观察、数据收集的透明化,实现科学交流的公共参与和透明化,使各种科学知识,如数据、观察和实验设计与方法、分析与建模代码及其结果和解释,对任何人来说都是透明且可免费获取的[24]。所谓“自由”,是指开放科学中任何个人或机构可以根据自身的需求,自主决定何时、何地、以何种方式、对何种内容或标的进行开放获取、交流、共享、研究、评议等活动。当然,这种“自由”是在遵守相关知识共享协议、知识产权、隐私保护的前提下进行的。所谓“合作”,是指开放科学促使同一领域的研究人员或对同一研究主题感兴趣的利益相关者通过某个或某些网络平台,就研究问题进行咨询、协商、协作,分享各自的观点,共同完成研究任务。所谓“共享”,是指开放科学充分利用各种开放技术、工具与方法,实现科学数据、信息与知识在全球范围内的广泛共享与利用。目前,大量在线工具或平台可用来交流知识,合作撰写论文或著作,分享各种资料(如知识库中的论文、数据或代码),传播中间研究见解或更新博客/微博、开放试验室笔记中的当前研究。总而言之,开放科学的基本理念是所有种类的科学知识都应该在发现过程中尽早开放共享[26]。

3.1.3 开放科学的优势

开放科学将对政府、研究机构、研究资助者、公共部门(如图书馆)、公共卫生机构、企业、研究人员和整个创新系统产生巨大影响。对研究人员来说,开放科学提高了他们工作的可见性、个人认可度和可信度,也提高了建立网络和寻找新合作者的能力,还提高了获得资助、公众阅读其研究成果的可能性,以及提高被引次数和媒体关注度。对于学术界来说,开放科学降低了学术研究成本,可以增强科学合作研究,联合多方力量开展国家重大项目或技术的攻关。对于资助机构来说,开放科学有助于更好地分配资源,防止在同样的调查或类似实验中重复投资。对于社会大众来说,开放科学可提升公众获取知识的民主权利,增强公众参与未来的科学行动[27]。由此看来,开放科学对组织、机构、群体与个人都可产生积极作用。

开放科学与传统科学相比,具有一些显著优势,这包括如下8个方面[28-29]:①扩大科学出版物和数据的开放获取与开放出版,扩展获取知识途径;②提高研究效率,加速科学发现与进步;③提高科学研究的透明度和质量,允许其他人对研究数据、研究方法、研究方案、研究结论进行重复实验或验证,有助于确保已发表研究成果的可靠性和质量;④确保知识的可靠性和促进研究结果的重现性;⑤加速知识转移,促进开放创新与知识发现;⑥提高科学研究的溢出效应,使学术界以外的个人和组织能够利用更多的研究资源和资料,提高研究的经济和社会影响以及公共投资的回报;⑦促进市民参与科学研究,促进市民对科学的认识和信任,实现知识民主化;⑧使研究人员能够提出和解决全新问题,更有效处理全球挑战。正因为存在上述种种优势,开放科学在国内外得到了越来越多的重视与推广。

3.1.4 开放科学的范畴

开放科学范围很广,涵盖了科学研究的诸多维度和过程[30]23-24,包含开放科学政策、开放研究基础设施、开放科学工具、开放许可与知识产权、开放数据、开放源代码、开放笔记本、开放教育资源、开放获取、开放出版、开放同行评议、开放存储、科学博客、e-science、科学2.0、开放研究、开放创作、开放合作、开放创新、众包、开放注释、公众科学等要素[31]。在这些要素中,开放获取与开放数据是现代开放科学运动的两大支柱[32]。2012年后,开放科学领域的研究焦点由开放获取、开放数据向开放科学转变。从开放获取到开放科学,既是一场推动学术信息共享不断纵深发展的开放运动,也是一种使科学开放从点到面的升华,从开放获取迈向开放科学已经成为全球共识[33]。不过,开放获取与开放科学在学科分布、国际合作研究网络、机构合作研究网络、作者合作研究网络、研究内容聚类以及引文突发性影响等多个方面存在着显著的差异,开放科学比开放获取具有更广泛的适应性,拥有更多的内容和参与主体[17]。不同科研资助机构在开放程度及推进开放科学具体实践方面存在一些差异[34]。开放数据是开放科学的一种关键要素[35],是进行开放科学交流与研究的基础[36]。然而,与开放科学一样,目前开放数据也面临着科研诚信与学术道德[37]、数据安全等问题,这需要加强科研人员的开放数据培训,以树立正确的开放科学数据价值观[38]。作为开放科学的分支,公众科学通过让公民参与研究,开放创造新知识的过程,为开放科学做出贡献[39],并为开放科学的可持续发展提供广泛的驱动力[40]。此外,开放出版、开放教育、开放仓储、开放合作都是开放科学的重要元素[41]。总之,开放科学是开放获取、开放出版、开放数据、科学2.0、开放研究、公众科学等的上位类概念。

3.1.5 开放科学的历史演进与发展动因

严格意义上讲,自第一次科学革命开始,科学就已经开放[42]。开放科学的发展并非一直处于加速状态,其经历了如下三个阶段[43]:①开放科学的启蒙时期(从16世纪晚期到17世纪60年代)。保罗·大卫(Paul А. David)认为,开放科学是“西欧历史上脆弱的文化遗产”[44],可以追溯到16世纪晚期和17世纪早期以及文艺复兴晚期欧洲的宫廷赞助系统[45]。开放科学出现的基础是西欧封建主义和贵族赞助人在机会和需求方面的变化[46]。极少数科学家(如伽利略、牛顿等)之间“秘而不宣”交流开启了科学开放的大门,尽管科学开放程度非常有限。②开放科学的缓慢发展时期(从17世纪60年代到20世纪末期)。1660年,第一个科学协会——“伦敦皇家自然知识促进学会”(The Royal Society of London for Ιmproving of Natural Knowledge,简称“英国皇家学会”)成立;1665年,英国皇家学会创办了世界上的第一本学术期刊——《皇家学会哲学汇刊》(Philosophical Transactions of the Royal Society),随后一批学术期刊相继创刊,1699年达到30种、1790年达到1,052种[47]。这时科学家们不再有兴趣在小范围内保守大自然的秘密(就像炼金术一样),而是发表他们的科学见解。这种从封闭、神秘的发现文化到更开放的现代科学文化转变的原因是,17世纪伟大的科学进步促使富有的赞助人开始将资助科学作为一种职业。这种动机部分来自于科学发现带来的公共利益,部分来自于与这些发现有关的领导人(如美第奇)所授予的声望。如果发现能通过科学期刊等媒介广泛分享,这两种动机都能得到很好的实现。因此,赞助人要求向共享发现可以为发现者带来工作机会和声望的科学文化转变[30]18。③开放科学运动时期(20世纪末至今)。20世纪,科学不断发展,学科数量也不断增加,形成了专门的研究、科学团体和理论。随着20世纪90年代互联网的普及,开放科学运动获得了动力[48]。一个重要的早期里程碑是1991年推出的高能物理领域的预印本知识库arXiv。2002年,开放科学的势头随着“布达佩斯开放获取倡议”和2003年“关于科学和人文知识开放获取的柏林宣言”而日益增强,开放科学时代正式到来。这时,科学研究范式正式由封闭科学向开放、透明、可重复的科学研究范式转变。

开放科学运动之所以在21世纪迅速崛起,其发展动因可归纳为如下五方面:①应对全球性问题的挑战。这是开放科学崛起的内在原因。针对当前制约全球发展的问题,特别是不得不共同面对日益紧迫的来自于全球气候、资源、健康、环境、能源、安全等方面的难题,需要全球科技界积极倡导无国界、无障碍、无歧视的开放科学精神和理念,加强科学知识交流和技术创新合作,以高水平开放合作的有效行动,提供系统性、高质量的解决方案,以有效回应全世界各国人民的共同关切。②应对日益增长的科研成本与严重的学术危机。在因学术期刊价格上涨造成期刊危机、图书馆危机和学术危机的情况下,开放获取在20世纪90年代初应运而生。随后开放数据运动在全球迅速兴起。开放获取和开放数据不仅有效降低了科研成本,缓解了学术危机,而且是驱动开放科学发展的两大核心力量。③提高科研质量与科研诚信。正是出于对科学领域大规模不可复制性危机的担忧,激发了一场开放科学运动的兴起,以鼓励研究人员公布他们的原始数据和分析代码。通过开放共享研究数据和采用开放同行评审弥补当前同行评议缺乏透明度的问题[49],推广预注册研究和已注册研究报告来提供明确的研究时间与记录,可以防止各种形式的可疑研究实践,提高科学研究的可靠性[50],也有助于提高科研诚信,创造一个促进负责任行为的环境,维护公众对科学的信任,确保科学的卓越性。 ④实现广域范围内的共享与合作。一些科学研究活动,如GLOBE(全球领导力和组织行为有效性)项目,需要进行大时空跨度的野外观察与调查,单个项目组或少数科研人员很难完成巨大的科研观察任务。这时需要广泛招募有兴趣的其他科研人员或社会公众,委托他们在广阔的空间范围和时间范围内进行观察,收集和处理与项目研究相关的数据。⑤信息通信技术、数字技术的快速发展与广泛应用。各种信息通信技术、数字技术,如区块链、大数据、云计算、人工智能、移动互联网、物联网、开源软件等的快速发展及其在科学交流与研究中的广泛应用,使开放科学由理念变为现实,促进了科学范式由封闭科学向开放科学的转变[51]。

3.1.6 开放科学的障碍、挑战与路径

开放科学虽然发展迅速,但是还面临许多障碍,包括:①个人障碍,如担心搭便车,没有发表否定结果的动力[25];担心原始数据会被误读、方法会被误用或者数据会被过早发布[52];缺乏开放科学的知识技能[53];社会大众的开放共享观念淡薄;个人不具备实施开放科学所要求的信息素养[54]等。②管理障碍,如缺乏知识产权等法律保障[53],存在开放科学理念与现行知识产权制度矛盾的问题[54],缺少共享研究资料的标准[25],缺乏开放科学激励和培训机制[55],存在数据安全与个人隐私问题[29]2-3,存在数据和方法所有权的不确定性[52],我国尚无推动开放科学发展的上层政策、中层发展体系与底层实践路径[56]等。③基础设施障碍,如缺乏支持开放的基础设施,科研数据平台开放程度不一[57]等。④成本障碍,如存在开放成本,需要投入额外的时间和精力[25]等。⑤学术研究障碍,如现有学术评价标准阻碍开放性,现有的学术认可制度未能充分激励开放科学实践,开放科学的衡量指标并未纳入学术评价体系[58],存在科学数据开放共享伦理道德问题[59]等。

在推进开放科学发展过程中,还面临多种挑战,包括:①在开放科学政策方面,区域、国家、行业等细分领域政策的关联性较弱。②在数据安全方面,科学数据外流现象对数据跨境安全管理提出挑战。③在伦理道德方面,开放科学需要明确开放内容的边界、解决完全自由与部分限制之间的博弈、把控国际竞争环境下的开放程度。④在知识产权方面,“非法”资源库的广泛使用、学术社交平台的版权争议、学术图书馆与科技出版商的价格博弈问题等依然严峻[54]。⑤在学术激励方面,开放科学的激励措施还不足,激励机制尚未到位[50]。⑥在开放科学成果质量方面,由于一些开放期刊的审稿机制较为宽松,且开放同行评审的质量可能会低于传统同行评审,开放数据与开放期刊透明度不足,导致社会对开放获取论文与数据质量十分担忧。⑦在开放科学实践方面,由于预注册的响应与时间表不够灵活,可能会对开放学术研究带来一定的困扰,并对开放科学实施产生一定的阻碍[50];由于开放获取利益相关者的关系难以协调,以及受开放获取成本、版权、隐私保护等因素的影响,开放获取难以付诸实践[38]。⑧在开放科学合作方面,国际合作研究有限、开放科学的机构合作不均衡。⑨在开放科学学科影响力方面,目前开放科学未形成较为完整的学科研究体系,学科影响力有待进一步提升[60]。

针对上述开放科学问题与挑战,学者们从不同角度探讨了开放科学建设路径,包括:①增强科学界与社会对开放科学的了解[59];②加快开放科学的前瞻性制度设计,加强学术认可与激励制度建设,完善开放科学法律规制,加大国家资金扶持力度[55];③加强开放科学基础设施建设,促进开放获取和支持开放数据倡议[61];④加速培育开放科学模式下的社会共享文化,增进科学的社会参与[59];⑤开发与应用先进的数字技术,建立健全开放科学的标准规范;⑥加强开放科学技能培训,提升研究者的负责任研究理念与个体的伦理道德水平[59];⑦改进学术成果的度量与评估,革新科学计量体系[54];⑧加强开放科学发展状况的追踪监测[62-63];⑨与全球网络和其他科学机构进行合作,建立世界范围的互操作数据中心[64];⑩把开放科学作为欧洲研究区战略优先发展事项和驱动欧洲数字单一市场发展的战略行动以及未来欧洲研究和创新战略的核心目标之一[56]。总之,开放科学的发展需要从宏观层次的开放科学整体规划和法律法规建设、中观层次的开放科学标注规范建设和微观层次的开放科学评估监测与技能培训等多层次、多角度采取有效对策。

3.2 开放科学目标、特征与工具的研究

开放科学的目标主要是提高研究成果的可靠性和对科学研究的信任[30]21-22;通过数字工具和网络改变科学,使研究更加开放、全球化、协作、创新和更贴近社会[65];使研究人员能够提出和解决当今主要科学问题[66],更有效地应对全球挑战[18]。

与传统科学(即封闭科学)相比,开放科学具有名副其实的透明性、开放性、可重复性三个本质特征。透明性覆盖科学研究过程中引用、数据、分析方法(代码)、研究资料、设计和分析、预先登记研究、预注册分析计划、复制8个方面的公开透明。开放性是指开放科学过程、方式与方法、结果与数据的公开与利用,以及开放科学参与者的开放和不受限制。可重复性表明研究结果的稳健性和可复制性,意味着不同研究者在不同时间或场所,根据产生研究结论的原有条件、方法或参数,可以重复进行类似的研究,并得到相同的结果,从而验证研究结果的真伪[30]22。上述3个特征也是实现开放科学目标的基石。

为实现开放科学的目标,目前已经涌现了一些实用的开放科学平台与工具。其中,开放科学平台主要包括开放科学创新平台[67]、开放科学共享空间(Open Science Commons)[68]、欧盟公众科学平台(EU-Citizen. Science)[69]、开放科学观测台(Open Science Observatory)[70]、知识驱动智能调查系统(Knowledge-Driven Ιntelligent Survey Systems)[71]、D4Science[72]、Wiki4R[73]、DataLab[74]、myExperiment[75]、EGΙ DataHub[76]、Onedata[77]、FOSTER[78]、HubZero、Zenodo、Dataverse、Dryad、Jupyter[79]等。这些平台显著促进了开放研究与开放创新。

同时,一批支持开放科学工作流的工具也被开发出来(见表2),其中包括开放实验室笔记本、协同写作工具、开放工作流、合作书目等。这些工具促使科学家的研究过程透明化,从共享某种方法的详细原理到发布数据和代码。

表2 开放科学过程在线工具列表[24]Table 2 List of Online Tools for the Open Science Process

3.3 开放科学政策与实践的研究

目前国内外文献对开放科学政策与实践的研究集中于制定开放科学政策与计划、制定开放科学实施路线图、实施开放科学项目与开放科学影响因素四方面。如今,许多国际组织、国家或地区已经将开放科学上升到战略层面[54],通过制定开放科学政策、发布开放科学路线图、资助开放科学项目、推行预注册式研究[80]和注册式研究报告[81-82]等多种方式,促进开放科学的实施。早在2012年,欧盟委员会就鼓励所有成员国确保开放获取公共资助的研究成果,以改善科学研究和加强知识经济[83]。2016年,欧洲委员会提出“欧洲云计划”(European Cloud Ιnitiative),发布《开放创新、开放科学、向世界开放——欧洲的展望》报告,预测到2030年,开放科学将成为科学工作的基础,为世界各地不同科学领域的研究提供一系列无限的机会[84];而后,又发布“欧洲开放科学云实施路线图”,提出在全球范围内实施“S计划”,计划到2030年建立一个超越开放科学的、共享的研究知识体系[13]。2019年、2021年相继举行了第一届和第二届联合国开放科学会议。2021年11月9-24日,联合国教科文组织审议通过《开放科学建议书》,标志着开放科学迈入全球共识的新阶段[85]。

与此同时,许多国家纷纷制定开放科学路线图,或出台开放科学计划。早在2014年,荷兰发布《开放科学和研究路线图(2014-2017)》,成立“知识社会开放科学国家协调联盟”,后于2017年正式提出《开放科学国家计划》,发布《荷兰开放科学宣言》,启动“开放科学国家平台”,从国家层面向开放科学系统转变[53]。美国于2015年成立开放科学中心(Center for Open Science,COS),2018年7月17日美国国家科学院发布《开放科学设计:实现21世纪科研愿景》报告[86]。2018年4月,法国高等教育研究与创新部发布《国家开放科学计划》,同年11月,法国国家科学研究中心(CNRS)发布《CNRS开放科学路线图》。2019年,芬兰发布《开放科学与研究宣言2020—2025》。2020年2月,加拿大首席科学顾问办公室发布《开放科学路线图》。这些开放科学计划或路线图促使开放科学从理念走向现实。由此,人们开始关注开放科学政策的调查。在2017至2021年,欧洲学术出版与学术资源联盟(SPАRC Europe)和英国数字保存中心(DCC)连续发布了第1版本到第7版本的《欧洲的开放科学政策》[87],这些调查报告概述了欧洲成员国的开放科学政策,但没有说明相关政策的内容与执行情况。不过,赵艳和叶钰铭发现,欧洲形成了包含战略引导层、环境保障层、具体运作层三级结构的欧洲开放科学云(EOSC)政策体系[88]。

此外,许多国家和国际组织资助了一系列开放科学实践项目的实施。例如,欧盟资助了大量开放科学项目,包括欧洲开放科学云、FOSTER项目、FOSTER+项目、开放科学监测仪项目、“地平线欧洲”(Horizon Europe)以及其他众多项目,如“促进向负责任的研究和创新系统的过渡”(Fostering a Transition Towards Responsible Research and Ιnnovation Systems)、“实践中的负责任研究和创新”(Responsible Research and Ιnnovation in Practice)、“推动开放学术”(Аdvancing Open Scholarship)、“社会科学与人文开放云”(Social Sciences & Humanities Open Cloud)、“开放数据:提高科学的透明度、可重复性和协作”(Open Data:Ιmproving Transparency, Reproducibility and Collaboration in Science)、“畅想未来”(Ιmagine Future)、“建立参与研究和创新的生态系统”(Building Engaged Research and Ιnnovation Ecosystems)等。这些开放科学项目有效推进了欧洲开放科学运动的发展,取得了显著成效,包括提高了开放获取参与度,增强了开放研究数据互操作性,迅速发展了公众科学,推进了开放科学云建设,变革了评价和奖励机制[56]。

影响开放科学实践的因素有如下几类:①背景或外部因素,如开放科学的全球化、经济发展水平、政府开放水平、科学的竞争、学术领域的竞争力、数字鸿沟、应急管理经验、政府与公众之间的合作关系等。②制度和监管因素,如开放科学政策、监管制度和领导、知识产权模式和指南、研究社区规范等。③资源因素,如开放共享的数据库与知识库、信息通信技术基础设施、财政和人力资源等。④个人和动机因素,如感知到的个人努力、感知负面后果风险、感知的外在和内在利益、与伙伴的合作关系、与开放科学实践相关的信任等[19]。⑤学术研究因素,如学术研究中的信用体系、学术研究中的职业结构、研究的数字化与数据化、跨学科和跨部门伙伴关系[89]、新型合作方式、有效的科学需求[21]等。⑥经济因素,如开放科学的成本与收益。⑦技术因素,如数字技术的兴起与应用、成熟的数字工具等[27]。这些因素将会对组织或个人的开放科学活动产生直接或间接影响。

4 结语

目前,开放科学无疑是学术界、科学领域的热门话题之一,产生了日益增多的研究文献。单从狭义的开放科学主题研究来看,现有成果广泛探讨了开放科学的概念与定义、基本理念、范畴、优势、历史演进、发展动因、障碍、挑战与路径、目标、特征、工具、政策与实践等,这些主题研究显著地促进了开放科学理论与实践的发展。

不过,已有研究还存在如下不足之处:①缺少国内开放科学政策的系统化研究。国内学者虽然关注了开放科学数据政策[90]、开放科学技术政策[91]、开放科学数据与个人数据保护的政策协同[92]、开放科学发展的政策环境建设[58]等主题,发现欧洲、美国、日本等国家形成了区域联盟、政府、行业协会、科研机构、高等院校等不同层级的开放科学政策体系[93],但是缺少国内开放科学政策的系统化研究,特别是对我国现有的开放科学政策体系与面向未来的开放科学政策体系的研究,亟需加强多层次开放科学政策体系的顶层设计。②缺少国内开放科学实践的调查分析。虽然,国外学者发表了一些本地区开放科学实践调查的研究报告[13]和学术论文[94-97],国内学者初步调查分析了欧洲[59,88,98]、日本[99]的开放科学实践,但笔者未发现已出版的国内开放科学实践调研成果。③缺少我国开放科学发展模式与实施路径的研究。虽然吕昕等探讨了欧美国家开放科学发展模式[100]、张伶等解析了欧洲开放科学实践路径[56]、付少雄等归纳了欧盟开放科学云计划实施路径[101],但是没有总结归纳国内开放科学发展模式,也没有从整体上规划我国开放科学的实施路径。④缺少国内开放科学发展水平的评价。开放科学对传统科学评价产生了重大影响。尽管网络计量、替代计量、不同类型的影响因子和H指数可用来评估开放科学影响力[18],但是开放科学评价不仅仅是科学影响力评价,还涉及众多领域。开放科学监测仪(Open Science Monitor)从开放存取、开放科研数据、开放合作3个维度评估开放科学活动[102],但同样没有覆盖开放科学整个领域;“开放科学职业评估矩阵”(Open Science Career Evaluation Matrix)被用来评估开放科学职业人员的研究成果、研究过程、服务与领导力、研究影响、教学和监督、工作经验[103],然而,这种评估仅仅是开放科学评估的一个方面。Forsström等构建了基于战略指导、政策与原则、支持开放、能力建设4维的开放科学成熟度评价模型,被用来评估芬兰开放科学水平[16],然而,该模型的4个维度并不能覆盖开放科学的重要领域,比如开放科学资源与效用。如何评价国内开放科学发展水平是亟须解决的问题。

因此,基于国内外开放科学主题研究进展与发展趋势,今后我们可以从如下几个方面深化开放科学研究:①加强国内开放科学政策体系研究。在现行开放科学政策多由相关部委出台,各类政策覆盖面较窄、时效性较弱、指导性不强,开放科学政策体系尚不甚完备的情况下[93],我国应该建立健全覆盖宏观、中观与微观多层次的开放科学政策体系,以规范与引领开放科学实践的发展;②加强开放科学生态系统研究。开放科学涵盖诸多科学学科和学术实践方面,包括基础和应用科学、自然和社会科学以及人文科学,是建立在开放的科学知识、开放的科学基础设施、科学交流、社会行动者的开放参与以及与其他知识系统的开放对话等关键支柱之上[22]。开放科学将影响科学生态系统的不同利益相关者以及他们之间的相互作用[27]。例如,欧盟通过制定开放科学战略与政策规划、部署一系列开放科学项目,致力于打造一个覆盖全欧洲的开放科学生态系统,以此大力支持欧洲的开放科学发展[102]。我国非常重视科学数据共享,2019年科技部和财政部联合资助建设“国家高能物理科学数据中心”等20个国家科学数据中心、“国家重要野生植物种质资源库”等30个国家生物种质与实验材料资源库。如今这些国家平台获得了长足发展,但是大部分平台拥有的科学数据仍未实现开放共享。我们需要进一步加强国内开放科学生态系统研究与建设,使尽可能多的科学数据和其他科学资源得到更广泛的共享利用。③加强我国开放科学发展模式与实施路径研究。我们不仅要积极推进中国开放科学发展的政策环境建设[58],而且要深入研究我国开放科学发展模式。武学超总结了3种开放科学发展模式——慈善模式(即免费共享模式)、扩胀模式(即成果发表前开放获取模式)和建构主义模式(即知识协同生产模式)[104],然而目前的开放科学实践远不止上述3种模式,以开放研究基础设施、开放科学工具、开放许可、开放数据与源代码、开放教育资源、开放获取、开放出版、开放同行评议、开放注释、开放存储、开放创作、开放创新、公众科学等方式中的一种或多种行为为核心的开放科学模式不断涌现。因此,我们需要研究并选择合适的开放科学发展模式,同时构建合理、有效的开放科学实施路径。④加强国内开放科学评价研究。虽然开放科学评价已经引起了人们的关注,但是目前缺少公认的开放科学评价工具与方法。我们需要综合考虑开放科学的本质特征、关键支柱、主要行为与发展水平,从多维度、多层次构建国内开放科学数据评价模型与评价指标体系,以便有效评估国内开放科学实践,助力我国开放科学的进一步发展。

作者贡献说明

盛小平:提出研究思路,设计研究方案,论文修订;

毕畅畅:采集、清洗和分析数据,撰写论文初稿;

唐筠杰:参与论文修订。

支撑数据

支撑数据由作者自存储,E-mail:bicc2211@126.com。

1.毕畅畅.wos.xlsx;cnki.xlsx.用户搜索数据.

2.毕畅畅.7.2.3.9net.net.关键词数据.

猜你喜欢
科学研究
FMS与YBT相关性的实证研究
2020年国内翻译研究述评
辽代千人邑研究述论
视错觉在平面设计中的应用与研究
点击科学
点击科学
点击科学
科学大爆炸
EMA伺服控制系统研究
新版C-NCAP侧面碰撞假人损伤研究