彭导琦,江 洪
(1.中国科学院武汉文献情报中心,湖北武汉 430071;2.中国科学院大学经济与管理学院信息资源管理系,北京 100190)
信息与通信技术推动开放科学的发展,同时也扩大了开放的范围和好处。开放性提高了科学的透明度、可靠性和可重复性,促进了更有效的合作,推动了更广泛、更公平、更便捷地获取科学知识和科学研究过程本身,从而加快科学发现与知识创新的步伐。随着科学研究范式进入以数据驱动科学发现与科技创新的4.0 阶段,开放科学将使科学更高效、更可靠、更能应对社会挑战[1]。开放科学成为当下改变封闭的科学研究生产过程和成果传播途径,推动科研范式变革背景下科学发展的重要手段与必然选择[2]。随着开放科学理念成为普遍共识,国际上开放科学运动运动的推进如火如荼。
国家科研机构(也称国立科研机构)担负着服务国家目标、保障公共利益和国家安全的重要使命,是国家战略科技和创新体系的重要骨干力量[3],也是实施开放科学最为重要的推动者和监测对象[4]。2021 年发布的《联合国教科文组织开放科学建议书(UNSECO Recommendation on Open Science)》中特别指出鼓励研究机构,特别是接受公共资金的机构,实施开放科学政策和战略[5]。在法国,截至2021年有大约20所大学和研究机构拥有开放科学政策[6]。2022 年荷兰发布的《荷兰开放科学2030》中也提到,研究界(包括研究人员、教师、专业人士、研究机构和资助组织等)的多样性、公平性和包容性对开放科学的成功至关重要[7]。2023 年,美国白宫科学和技术政策办公室(OSTP)启动的开放科学年(Year of Open Science),指示包括NASA 在内的13 个联邦部门和科研机构推进开放和公平研究的新行动,新的拨款、改善研究基础设施、扩大新兴学者研究参与,以及扩大公众参与的机会[8]。
美国国家航空航天局(NASA)是美国政府系统中主要的航空航天科研机构,在太空科研领域处于全球领先地位,是国际上具有重要学术影响力的科研机构[3]。一方面,NASA 既是美国科学数据的重要来源机构之一,也是美国航空航天科学研究的重要资助机构,被美国国会授权为数据基础设施建设的主导者和国家级的科学数据中心[9],是推动开放科学的重要科学行动者(science actors);另一方面,尽管“开放科学”这一术语的提出相对较晚,但是由于空间任务获取的数据总量、数据类型、数据分析和处理需求远多于其他科学领域,航天领域对于科学数据的存档、管理、分析、开放共享实践已经有相当长一段历史了[10],20 世纪90 年代NASA 已不受限制地向所有用户开放其地球科学数据。
他山之石,可以攻玉。NASA 从科学数据开放获取到推动机构向开放科学转型方面有着丰富的发展历史和实践经验。本文以NASA 为研究对象,深入梳理和探讨其开放科学进程的动因和主要实践,从单一实践经验扩大到政策引导的系列行为,以期为我国国家科研机构推进开放科学提供决策参考,发挥国家科研机构在开放科学和科技创新中的主导作用。
NASA 开放科学发展包含3 个内在因素:技术的快速进步、数据量和数据种类的快速增长,以及待解决的呈跨学科性质的科学问题快速增多[11]。(1)技术的快速进步从根本上改变了科学开展的方式,改变了科学家交流和获取信息的方式,实现了新的工作流程,提高了科研效率,加速了开放科学原则的采纳[12]。NASA 推出的行星数据系统(PDS)提供了几十年来NASA 行星科学任务采集的行星科学数据,保证对全球行星研究人员、教育工作者、学生和公众的有用性和可用性,打破科学的封闭。(2)技术进步同时改善了观测和收集数据的装置、模拟的数据模型和有效分析和处理数据的能力,增加了数据的数量和种类。目前NASA 每日处理的数据超过24 TB 数据,其科学任务委员会(SMD)存储的观测数据和模型结果超过100 PB,未来SMD 内的部门将生成、分析和存档更多的数据;再者,根据咨询委员会调查的结果,目前依赖存档数据的科学论文比例超过了基于新任务数据的比例,即科学成果的一半来自于NASA 的存档数据,利用存档的数据资源对科学发展也具有显著意义。(3)技术发展使得数据可及性和可用性不断提升,为解决跨学科科学问题提供机会。NASA 空间任务所采集的关于行星科学、太阳物理学、天体物理学、地球科学和生命科学等多领域的科学数据,未来待解决的科学问题是多种学科领域的交叉,解决这些问题需要鼓励不同学科领域科学团体之间进行合作。
现实环境也要求NASA 作为国家科研机构,需要向公众公开由纳税投入所产生的研究成果,体现投资价值,同时使社会可以通过科学研究信息受益。因此NASA 做出一项长期承诺,旨在未来十年(2020—2029 年)建立一个包容的开放科学社区,通过降低进入科学探索的障碍,扩大科学研究的参与并促进更广泛的合作,从而加速重大科学发现并使科学成果产生更大的影响和更多的引用,保持NASA 的领先地位。
总体来看,NASA 开放科学发展进程可以分为3个阶段:
(1)开放、透明和协作原则的确定(1958—1993 年)。在法律层面上,60 多年前随NASA 成立的原始法律《国家航空航天法》诞生,法律中特别指示NASA:应提供最广泛、切实可行、适当地传播有关其活动及其结果的信息[13]。此后,透明和开放的原则一直影响着NASA 的科学任务实践。1966年美国颁布《信息自由法(Freedom of Information Act,FOIA)》,首次确立了获取政府信息的有效法定权利,保障公民对政府信息和服务的访问,为美国科学数据管理和开放政策制定奠定法律基础,后续补充规定电子信息也同样适用该法律。对此,NASA 也在内部推出FOIA 计划,以继续站在回应收到的个人请求和提供公众通过网络要求的文件的最前沿。NASA 作为联邦科研机构的开放、透明和协作原则得到法律认定。
(2)逐渐推动科学数据开放获取阶段(1994—2018 年)。1994 年,NASA 制定“科普与教育战略计划”,与公众分享空间科学发现的乐趣,鼓励公众参与NASA 空间科学研究以促进公众理解[14]。同年,NASA 开放地球科学数据无限制地向所有用户开放。1995 年NASA 空间数据系统咨询委员会应国际标准化组织(ISO)的要求,定制数字信息长期保存标准,推出了开放档案信息系统模型(OAIS)。该模型于2003 年成为ISO 正式标准得以发布。2009年,奥巴马总统签署了具有标志性意义的《透明和开放政府备忘录》并推动了《开放政府指令》,要求包括NASA 在内的联邦政府和科研资助机构立即采取具体步骤,构建一个透明开放、公众参与和共同协作的创新体制。为响应联邦政府的指令,NASA提出Open NASA,构建并开放了一系列创新数据平台,在开放、透明和协作的工作原则的基础上,提高NASA 科学数据持有量的质量、可访问性和可用性,供科学家、教育工作者和公众使用。2013 年2 月,白宫科技政策办公室(OSTP)发布《促进联邦资助科研成果获取备忘录》,以改善公众对联邦资助的研究成果的获取。为此,NASA 颁布“NASA 提高获取科学研究成果的计划”[15],扩大NASA 开放文化的范围,包括机构赞助的所有科学研究的数据和出版物。2017年,NASA制定数字化转型3年规划《NASA信息技术战略计划》,通过构建开放与安全的访问,向不同的人员共享NASA 的数据与科学成果[16]。上述倡议和举措为NASA 提供了一个新的视角,将NASA 整体的政策、技术和文化创造提升到新的开放的水平,标志着NASA 与公众互动和进行资源管理的方式发生了变化。
(3)全面推动开放科学体系建设阶段(2019年之后)。SMD 的任务和研究活动旨在增加对星球、太阳系和宇宙的了解,其核心能力是为科学家、国际合作伙伴、所有年龄段学习者、决策者和有关行业收集、存储、管理、分析和分发数据和信息,以促进科学发展、改进建模、增加知识和刺激经济创新。为了确保所有人能够访问NASA 的科学数据并为社会带来实际利益,NASA 将SMD 作为推进开放科学的领导部门(lead office),从投资以下几个方面推动开放科学发展:1)数字与计算项目;2)机器学习和人工智能技术;3)战略和商业伙伴关系;4)公众科学参与。NASA 利用数据和计算项目来设计开放软件系统,以支持和分享NASA 科学任务产生的大量数据,利用机器学习和人工智能技术、合作伙伴和公众参与加快数据分析和模型的计算性能,利用伙伴关系和公众参与推动技术创新。
NASA 开放科学的内涵、重要性和战略地位在这一阶段得到反复论证。NASA 相信开放科学是对协作文化的承诺,这种文化由技术支持,能够在科学界和更广泛的公众中公开共享数据、信息和知识,以加速科学研究和理解。2020 年NASA 发布开源科学倡议(open-source science initiative,OSSI),通过政策调整、开源软件和网络基础设施,支持和推进所有SMD 的科学走向开放,建设开放科学文化。开源科学是开放科学的最新范式,建立在开源软件的概念之上,扩大了对开发代码的参与,并将其应用于科学过程,通过从项目启动到实施的公开进行科学来加速发现。NASA 开源科学实践将使得该机构更接近于完全开放的系统(如图1 右侧所示)。2021 年10 月,NASA 推出《向开放科学转型计划(Transform to Open Science,TOPS)》,作为OSSI的首要任务,以加速重大科学发现、扩大历史上被排斥的社区参与、增加对开放科学原则和技术的理解和应用为目标,通过扩大参与、能力共享、奖项激励和认识开放等措施,以加速开放科学实践。2023 年1 月,响应联邦政府指令,NASA 将2023 年认定为开放科学年,通过与科学界的12 个专业协会合作,以推动开放科学的采用。
图1 开源科学的持续发展
NASA 推进开放科学的主要举措围绕战略和实践两个层面:战略层面,NASA 将开放科学纳入科学数据管理和计算战略、应用地球科学战略和NASA未来发展战略规划等大政方针之中,以实现突破性科学发现;实践层面,NASA 在过去开放政府、数字化转型建设的基础上,为开放科学发展提供政策、基础设施平台、数据计算技术、培训、报告和教育等服务与辅助措施,积极推动科学文化、科学规范和机构体系向开放科学转变。
2.1.1 开放科学作为NASA 科学数据管理和计算的战略愿景
2019 年NASA 在《开创性科学数据管理和计算战略(Strategy for Data Management and Computing for Groundbreaking Science)》(以下简称《战略》)中提出通过不断进化SMD 的科学数据和计算系统,实现变革性的开放科学的愿景[17],标志着NASA 首次从战略高度正式提出开放科学。NASA 对SMD 科学数据系统(包括高端计算)采取了战略性的观点,通过制定和实施统一的开放数据和软件政策、升级现有档案馆、开发和实施SMD 数据目录、推行免费开放的统一期刊服务器和投资商业云环境等策略,以支持和保障NASA 科学信息的开放获取和科学信息使用的透明度。该战略指明了NASA 开放科学的工作目标、工作重点、建设路径,为NASA 后续一系列推进开放科学的举措提供了指导依据。
2.1.2 开放科学作为NASA 应用地球科学战略的价值主张
应用科学的基本作用是推动全球对地球科学的有效扩展和应用的知识,并为决策和行动提供信息。科学通过应用跨越基础研究,两者的交互可以创造更多的灵感和好处。《NASA 应用地球科学战略规划》(Earth Applied Sciences Strategic Plan 2021—2026)旨在实现更大的影响,应用地球科学的见解使全球经济、健康、生活品质和环境受益[18]。为此,NASA 提出了降低使用地球科学信息的技术和制度障碍,加快开放数据和开放科学回报的价值主张,以弥合科学发现和实际应用之间的差距。NASA 希望通过促进开源科学的努力,扩大地球科学研究和应用的交互,以寻求加快科学发现和使用,创建新的研究和应用线,并加速回报。
2.1.3 开放科学作为未来NASA 战略计划的主要目标之一
根据2010 年政府绩效和结果法案现代化法案(GPRAMA),NASA 每四年制定一次战略规划,以概述NASA 对未来的愿景,并为NASA 的活动提供明确、统一和长期的方向。NASA《2022 战略规划》将开放科学作为其通过新的科学发现拓展人类知识的战略目标之一,提出通过投资以下3 个方面的内容加速用户对SMD 数据的访问和使用:1)实现开源科学的能力;2)数据和计算系统的不断演进;3)创新社区和战略合作伙伴关系。NASA《科学卓越愿景2020—2024》也将开放科学作为创新的重要战略目标之一,确保NASA 科学数据对所有人开放并对社会产生实际效益。NASA 认为在开放数据和开放科学方面的持续领导地位有助于支持免费和开放地访问科学数据,从而使知识体系为全人类的利益增长服务。
2.2.1 推进科学知识开放获取
2021 年最新修订的NASA 研究数据和出版物访问政策指令提出:NASA 开放获取的目标在于确保公众获得NASA 资助的科学研究成果、开发和技术(RD&T)项目产生的科学同行评审出版物和非保密的数字科技开发数据集,除非美国法律、法规或机构政策另有限制[19]。2021 年8 月,在《战略》的指导下,SMD 制定并发布了《SPD-41:科学任务委员会的科学信息政策(SMD Policy Document SPD-41:Scientific Information Policy for the Science Mission Directorate)》(以下简称《SPD-41》)[20]。该政策对政策的适用范围、覆盖范围、外部要求、执行力度、保存规范、数据访问原则、数据获取原则、政策有效时间等进行系统且全面地阐述。政策规定由SMD 资助的飞行任务、科学调查、其他科学活动产生的科学信息应公开共享,该政策将开放获取内容从单一的开放数据,拓展到开源软件、开放科学出版物等。值得注意的是,SMD 科学信息政策不适用于受联邦法律、法规或机构政策约束而不能公开的信息(NASA 开放科学适用范围如表1 所示)。2022 年9 月,NASA 发布《SPD-41 a》,对《SPD-41》内容进行了完善和补充,整合了联邦政府和NASA关于科学信息共享的现有政策[21]。上述政策代表了NASA 使信息可访问的最低要求和实施《战略》的第一步,为NASA 推动SMD 范围内科学信息的开放共享提供政策依据。
表1 NASA 开放科学适用范围
2.2.2 建设开放科学基础设施
NASA 一直以来将科学数据产品的存档和开放访问视作一项长期政策和实践,并确保其长期可用性。从20 世纪90 年代至今,NASA 在地球科学、天体物理学、行星科学、太阳物理学、生命和物理科学等领域设立了多个数据存档系统、数字门户网站、和数据分析应用中心等基础设施(如表2 所示)。2010 年,openNASA 推动构建汇总整个机构的代码(code.nasa.gov)、数据集(data.nasa.gov)、软件(software.nasa.gov)和应用程序接口(api.nasa.gov)的网站等,以吸引科学家、教育工作者和其他公众的参与和使用。这些数据软件系统为NASA 科学任务获取的大规模数据提供支持。数据密集型科学范式使得建立新的和更好的计算基础设施对大规模的科学研究十分重要[22]。对此,NASA 提出“高端计算(high-end computing,HEC)”“数据和计算架构研究”“人工智能倡议”等计划,利用数据和计算能力、机器学习与人工智能技术提升高端计算设施与服务,加快科学发现和科学进步的速度。为进一步实现更容易、更有效、更经济的大规模数据分析计算平台,NASA 和欧洲航空局(ESA)联合推出多任务算法和分析平台(MAAP),提供访问、共享、分析和处理数据的新方法[23]。未来发展人工智能和机器学习技术、投资商业云环境建设将是NASA 进一步提升开放科学数据和计算基础设施建设的重点。
表2 NASA 主要科学数据基础设施
期刊出版物是广大社区分享科学成果的一个关键机制[12],2016 年NASA 推出PubSpace 平台,汇集由NASA 资助的研究产生的原始科学期刊文章档案(不包含专利、包含个人隐私、出口管制、专有限制或国家安全法律/法规管辖的材料的出版物),在指定的出版商禁运期后,可在网上免费获取。2022 年NASA 与出版集团——美国开放研究信息交换所(CHORUS)进一步达成一项深度合作协议[24],该协议规定受NASA 资助作者在CHORUS 的出版商成员上发表的研究成果,公众可通过PubSpace 实现对其的访问。
2.2.3 吸引公众参与NASA 开放科学实践
NASA 的创始立法、“开放政府倡议”“开源科学倡议”等政策文本中都明确地指出,公众参与有助于NASA 完成开放政府和开放数据的联邦任务和要求,是NASA 的重要价值观,鼓励NASA 呼吁公众参与并为公众提供机会。早期,NASA 通过“百年挑战计划”发起各种主题的开放式挑战赛(例如血管组织挑战赛和太空机器人挑战赛/虚拟竞赛等),以及各种开放式创新平台(InnoCentive、Yet2.com 和TopCoder 等)与外部高校、企业、科研院所等合作伙伴及社会公众互动。到2011 年,NASA 开始运用众包的形式吸引公众参与到科学研究的过程中来,让公众以自愿的方式参与部分数据密集型的基础科学任务,通过这些合作取得重要科学发现。2015 年,NASA 公众科学工作组成立,以分享和协调NASA 的10 个航天中心的公众科学活动;2018 年,NASA 颁布《SMD Policy Document SPD-33》[25],旨在指导NASA 内部公众科学项目开展,并着重平等参与的原则。目前,NASA 官方网站中展示的公众科学项目共计30 个(见表3),这些项目面向世界各地开放,不限于美国公民或居民,涉及内容包括行星、太阳系、地球、太空实验等多个领域。这些项目中的志愿者(即公众科学家)帮助NASA 取得了数千项重要的科学发现,并有超过410 名来自各行各业的公众科学家被添加为科学出版物的共同作者。
表3 NASA 的部分公众科学项目
2.2.4 推动开放科学利益主体协同合作
开放科学是一个涵盖众多利益主体的生态系统[26],各利益主体之间的协同与合作能够更有效地利用资源、提升实践效率[27]。NASA 积极协同科学界、学术机构、民营企业、其他政府机构、专业协会、公众和国际合作伙伴等各利益攸关方参与到NASA 开放科学实践活动中去。2018 年8 月至10 月,NASA 连续召开档案处理和数据利用会议[28]、最大化NASA 数据的科学回报研讨会[29],分别集合来自学术界、工业界和政府的思想领袖,为SMD 制定围绕科学数据和计算的战略提供想法并收集社区意见。2018 年9 月至2018 年11 月,NASA 实施“信息请求(RFI):科学数据和计算战略计划”,征求主要利益相关者的建议以制定战略计划,另外还发布一项信息请求以获取对政策实施的反馈[30]。2021年10 月召开的开源科学数据处理与档案开源科学研讨会为科学数据提供者、管理者和合作伙伴提供了一个论坛,以了解有关开源科学倡议的信息。另外,2022 年5 月,NASA 在GitHub 上创建tops 社区论坛,论坛大约每月举办一次,每次邀请不同专业领域的嘉宾反馈其参与的开放科学活动,论坛鼓励公众参与。NASA 一直通过会议、研讨会和论坛等多种形式,组织开放科学实践过程中的各利益相关方展开交流、讨论与问题反馈,确定开放科学实践过程中的驱动因素、激励因素和制约因素等,就当前开放科学实践过程中的遇到的障碍和问题提出解决方案,以期提升NASA 开放科学实践的成效。
2.2.5 开放科学教育培训等辅助服务
NASA 开放科学教育培训主要包含两个方面,一是培养推进开放科学建设所需要的具备相关素养的人才,从而在NASA 内部营造信息管理和开放共享的文化;二是通过科学激活(SciAct)计划,旨在将NASA 的科学与各年龄段的学习者联系起来,以激活公众,特别是学生群体的思维[31]。前者主要是提升NASA 内部研究人员的开放科学素养,后者主要是提升全民科学素养并加速突破性科学发现。
为了最大限度地减轻NASA 科研人员的负担,同时推动科学走向开放,NASA 提供相应的指导、培训和服务,以支持研究人员完成科学信息政策的要求。2022 年12 月NASA 推出面向SMD 资助研究人员的开源科学指南(open-source science guidance)[32],提供开源科学的指导方针、最佳做法和实例,以支持SMD 执行《SPD-41 a》的要求,实现OSSI 的广泛目标,使科学走向开放化;其次NASA 提供了科学信息政策常见问题(scientific information policy frequently asked questions(FAQs)),从基本信息、开放数据、开源软件和开放出版物的角度为研究人员在实施《SPD-41a》过程中遇到的常见问题提供解答;最后,NASA也借由TOPS计划进行开放科学培训,通过在GitHub 上发布在线、免费、开放的科学课程,举办研讨会、活动、科学团队会议、黑客马拉松等活动,通过系统性活动培养数据管理和开放共享的文化,助力于培养开放科学运作所需要的人力资源。
2020 年,NASA 推出科学激活计划(Science Activation),该计划构建了一个STEM1)学习生态系统,为不同年龄阶段的学习者制定满足其终身学习需求的不同学习场合,通过与全美各地社区合作,在博物馆、图书馆、俱乐部、学校和网络等场景与学习者接触,旨在加强全美STEM 教育、提升全美科学素养、推进国家教育目标、通过合作伙伴关系发挥努力[33]。截至2021 年,科学激活计划覆盖了全美50个州、华盛顿特区和波多黎各以及89 个国家的学习者,推动NASA 内部745 名科学家参与幕后工作,完成了2 000 万次与学习者的互动,发表93 篇论文并共计被引用超过575 次。该计划充分发挥了NASA作为一个科学研究机构在国家科学普及方面的作用,并有效地推动各个年龄段学习者参与科学研究的积极性,对培养STEM 领域的人才、推动科学走向开放、加快突破性科学发现具有积极作用。
中国作为具有重要影响力的科技大国,世界各国对中国的开放科学充满期待。以具有一定代表性的综合性国家科研机构——中国科学院为例,目前中国科学院也颁布了开放获取政策、支持开放出版资助并鼓励科研人员将公共资助产生的论文成果开放存储,推动构架了大量机构知识库和科学数据中心,设立“公众科学日”鼓励公众了解科学研究。我国国家科研机构在开放获取、开放数据和开放基础设施等方面取得一定实践进展,但是整体仍在摸索尝试的过程中。尽管中美科技体制不同,不可能完全复制NASA 开放科学推进模式。但是NASA 作为特定领域内的具有代表性的国家科研机构不断推动机构内科学研究走向开放,借鉴NASA 开放科学实践经验仍具有重要意义。以下是借鉴NASA 开放科学经验时值得关注的几个方面。
NASA 为科学信息管理、分析、共享设立了长远的、系统的、全方位的战略部署和政策规划,自上而下营造开放科学的文化氛围,从而逐步向开放科学文化社区转型。只有开放科学的意识深入人心,科研人员愿意主动开放科研资源和过程,才能实现开放科学的目的。首先,加强机构内开放科学宣传培训的力度和广度,通过政策宣讲、圆桌讨论、知识论坛和竞赛活动等形式,营造开放科学的文化、培育开放科学的价值观;其次,加大对开放科学相关教学培训课程的投入,树立研究人员开放科学观念、提升研究人员开放科学素养、培育科学数据管理专员,为机构开发科学发展提供人才支持,同时也推动机构整体向更具包容性、透明性和协作性转变,将开放科学意识融入组织文化中;最后,应该建立开放科学的奖励机制,完善科研基金资助机制,引导和鼓励受资助的科研人员开展开放科学实践,通过提供有力度、广度和持续性的财政支持,对富有成效的开放科学实践活动作出实质性认可,提高相关人员的积极性和能动性。
纵观NASA 开放科学管理体系,NASA 开放科学布局从联邦法律、NASA 政策、NASA 下属机构3个层级展开,形成符合信息安全保密、同时尽可能满足开放需求的自上而下的严密政策逻辑。首先,应该完善相关法律法规,在时机成熟时考虑将开放科学规定为一种法定权利。目前我国印发的《科学数据管理办法》法律效力较低,应制定相关的科学数据法律,支持科学数据开放获取,规范数据安全、数据公开、数据权益、个人隐私、数据伦理和法律豁免等相关内容。其次,在相关法律的规范、引导和约束下,建议尚未发布政策的科研机构尽快出台适合本机构的开放政策指南和长远战略规划,已经发布政策的机构应进一步推进政策落地,通过政策明确开放科学的适用范围、执行力度、行为规范等,为开放科学实践提供参考依据和实践指南;最后,应该明确机构中科学数据管理的责任主体,最好设立专门的数据管理、共享、利用的主管机构,明确机构的职责范围,方便实施统一的管理。
科学数据作为国家的重要资产,是科学创新的基础性资源。以NASA 为代表的国家科研机构承担和资助相当一部分涉及国家安全的科学研究,所产生的科学数据涉及国家安全利益,需要保密。因此需要协调科学数据开放共享与安全保密之间的矛盾。首先,相关科研机构颁布的开放科学或开放获取的政策需要明确开放的范围,对于例外的受相关法律或国家政策约束而不能公开的科学数据需要说明不能共享的原因;其次,需要根据时代发展的现实背景和实际需求进一步完善和修订现有的国家保密制度和相关法律法规,制定科学数据安全分级分类管理办法,对于涉及国家安全的科学数据依据重要程度进行分级管理,科学区分不同等级科学数据管理情况,对于涉密科学数据严格执行审批制度;最后,制定完善科学数据解密制度,对于已经过了数据保密期的科学数据应及时启动解密程序,建立健全科学数据脱密、脱敏机制,对涉密、敏感数据进行去隐私化、去背景化处理后方可公开。
新的协作技术使分享想法、数据、算法、软件和实验变得更加容易[34],改变科学家交流和获取信息的方式,并使得公众参与成为可能[35]。NASA 非常重视可扩展、可协作、包容的开放科学基础设施建设,在提升现有基础设施能力的同时,高度重视人工智能、机器学习、数据和计算架构等技术的研究,通过技术创新对长期维护、开发、运营和分析数据的部门产生普遍和根本的影响。首先,我国目前大部分科研机构建立和维护的科学数据基础设施相对较少,开放科学数据平台与开放获取渠道有限,缺乏具有国际影响力的科学数据中心,应该尽快完善和拓宽科学数据开放获取的平台与渠道;其次,现有的科学数据管理与共享平台和系统之间相互孤立,存在“知识孤岛”“数据鸿沟”等问题,应该加强平台之间的互联互通,整合多源异构的科学数据资源,为各类主体合作创新提供有效框架,从用户需求的角度出发,提升现有平台提供的数据访问、共享、分析和处理服务的品质,发挥开放科学数据对科学创新和科学发现的驱动作用;最后,通过与学术界、工业界和其他领域数据专业人员等的协调与合作,在保障数据安全的同时,加强数据管理与计算能力建设,重点利用和发展将数据与计算相结合的、协作的、开放的云计算基础设施平台以及人工智能和机器学习技术,实现对过去获取的和未来将获取科学数据更全面的利用和重复利用。
NASA 在开放科学的构思、推进和实践过程中充分利用了跨国界、跨机构、跨领域、多主体之间的合作,协调多方利益主体并建立了相应的反馈机制,从而提高开放科学实践的效率和效益。尽管目前国际关系对我国科学研究开展对外合作不友好,但是在这种情况下,更应该争取和团结友好的国际合作伙伴,以互惠共赢的合作方式积极推动科学发展,加大科技对外开放,通过支持外籍科学家参与国家科技计划、设立面向全球的科学研究资助基金、鼓励各国科学家围绕重大问题开展研究等方式,吸引全球科技人才共同参与科学发现,营造良好的开放创新生态;其次,在推动开放科学政策制定、落地和结果反馈的过程中,尽可能通过学术研讨会议、论坛、商业合作等多样化方式,以团结、支持和鼓励各利益相关方参与到开放科学实践过程中,形成广泛的合作网络,以更好地解决开放科学实践过程中遇到的障碍和问题;最后,重视公众参与科学,借助公众的力量实现更高效率的科学发现,既是对公众知识权的保障,也能够有效推动科学普及、提升公众科学素养,通过公众科学项目等创新的方式鼓励公众参与到新的科学知识发现过程中去。
注释:
1)STEM 指代科学(science)、技术(technology)、工程(engineering)、数学(mathematics),是这四门学科英文首字母的缩写。