开放科学能力框架构建和培养路径研究

2022-11-28 13:05黄金霞
农业图书情报学刊 2022年9期
关键词:数据管理技能科学

肖 曼,汪 煊,3,王 昉,黄金霞,3*

(1.中国科学院文献情报中心,北京 100190;2.中国科学院文献情报中心智能情报重点实验室,北京 100190;3.中国科学院大学经济管理学院图书情报与档案学系,北京 100190)

1 引言

开放是科学的本质属性和内在要求。当前,新一轮科技革命和产业变革突飞猛进,科学研究范式正在发生深刻变革。以 “自由、开放、合作、共享” 为理念的开放科学运动在国内外蔓延,呼吁打开知识之门。2021 年中关村论坛上,13 家国内外知名机构牵头成立“开放科学国际创新联盟”,并发出 “开放科学实践北京倡议”。第四届世界顶尖科学家论坛(World Laureates Association Forum)开幕式上,国内外科学家联合发布《开放科学:构建开放创新生态》倡议。联合国教科文组织(United Nations Educational,Scientific and Cultural Organization,UNESCO)大会第41 届会议审议通过《开放科学建议书》(以下简称《建议书》),标志着开放科学迈入全球共识的新阶段。中国将开放科学列入法律条文,于2021 年底修订《中华人民共和国科学技术进步法》,明确提出 “推动开放科学的发展,促进科学技术交流和传播”。从 “开放获取” 迈向“开放科学”,构建中国开放科学创新生态[1],推进开放科学范式的变革,正当其时。

要推进科研范式真正变革培养科研行为主体具备开放科学素养和实践能力至关重要。联合国教科文组织《开放科学建议书》提出7 个主要目标和行动领域,其中包括投资于开放科学的人力资源、培训、教育、数字素养和能力建设。要转变科学实践以适应21 世纪数字时代的变化、挑战、机遇和风险,需要就新技术所需的技能以及开放科学的理念和实践开展有针对性的研究、教育和培训。《建议书》鼓励会员国考虑就开放科学的概念和实践开展系统和持续的能力建设;商定一个与具体学科相匹配的开放科学能力框架,并制定公认技能与培训计划,以助获得这些能力;投资并促进数据科学和数据管理领域的高等教育与职能专业化等[2]。欧洲六大科研组织(G6)联合发布开放科学声明,强调支持向开放科学过渡并促进卓越研究的6个优先事项,其中之一为促进必要的技能培训,即研究人员和支持人员必须学习开放科学所需的知识和技能,必须在研究与发展组织的工作人员中引入新的角色,如数据管理人、数据工程师和数据基础设施管理人员[3]。2022 年1 月,法国大学图书馆馆长协会(Association des Directeurs de Bibliotheques Universitaires,ADBU)和欧洲研究型图书馆协会(Association of European Research Libraries,LIBER)表示将共同开展题为 “开放科学和知识——探索学术界需要具备的开放科学技能和能力” 的研究,以探究开放科学范式下科研人员所需要具备的技能和能力[4]。

当前科研人员和相关行为主体对开放科学的理念和知识有所了解,但由于普遍缺乏适当的培训和指导,开放科学范式在科研实践活动中并未成为常态。本文旨在通过研究,鉴别开放科学范式下科研行为主体所需要具备的理念、知识和技能,构建开放科学能力体系框架,探究开放科学能力培养路径,以促进科研人员和相关行为主体拥抱并参与开放科学,从广度和深度上推进开放科学实践,使开放科学理念深入人心、开放科学成为新的行为规范。

2 国内外相关研究及动态

2.1 开放科学概念相关研究

“开放科学” 一词由美国斯坦福大学经济学教授DAVID 首次提出[5],其内涵和要素随着开放科学的发展不断演进和丰富。欧盟委员会[6]认为开放科学是一种协作科研的新方法和通过数字技术和新型合作工具传播知识的新方式。世界经济合作组织(Organization for Economic Co-operation and Development,OECD)[7]认为开放科学是努力使公共资助的科研成果(出版物和科研数据)以数字形式最大程度地提供给科学群体、商业部门或更广泛的社会公众。欧洲开放科学云(European Open Science Cloud,EOSC)强调开放科学是信息、通信和技术(Information Communications Technology,ICT)工具和传统科学事业间的交互,并基于ICT 框架提出开放科学框架,旨在通过社会、创新和政策3 个要素,驱动研究开放存取、新研究方法、社会参与和科研合作[8]。FOSTER(Facilitate Open Science Training for European Research)提出开放科学分类体系,包括开放获取、开放数据、开放可重复性研究、开放科学定义、开放科学评估、开放科学指南、开放科学政策、开放科学项目和工具[9]。LIBER 提出开放科学的3 个核心标准分别是透明度、可持续性和协作性,七大核心领域为学术发表、FAIR 数据、科研基础设施和欧洲开放科学云、衡量指标与奖励、开放科学技能素养、研究诚信度和公民科学[10]。欧盟开放科学监测器(Open Science Monitor)提出开放科学的特征及其影响因素包括开放科研数据、开放出版和开放学术交流。

盛小平等[11]指出开放科学、开放共享、开放数据存在三位一体的逻辑关系,即开放数据是开放共享和开放科学的物质基础,开放共享是开放数据与开放科学之间的桥梁,开放科学是开放数据和开放共享的最终目标。刘桂锋等[12]认为狭义的开放科学是指最大程度地开放实验过程、实验方法、实验数据和实验结果,及时、自由、免费地供他人获取使用,形成交流与合作的新局面,而广义的开放科学则上升到理论高度,体现一种开放式的科学文化与学术氛围,同时指出开放科学体系包括开放科学政策、开放获取、开放数据、开放资源、开放同行评审和开放教育资源。温亮明等[13]提出,开放科学内容体系可以分为开放科学内容、开放科学形式、开放科学效果3 个层次,即开放科学政策、开放资源、开放科学数据、开放笔记本、开源软件、开放实验室、开放科学会议属于开放科学的内容层次,开放同行评议、开放获取、众包、公民科学属于开放科学的形式层次,科学2.0 属于开放科学的效果层次。根据联合国《开放科学建议书》[2],开放科学被定义为一个集各种运动和实践于一体的包容性架构,开放科学框架包括开放式科学知识、开放科学基础设施、科学传播、社会行为者的开放式参与以及与其他知识体系的开放式对话。

2.2 开放科学能力建设相关研究

建设开放科学能力框架是推进开放科学的重要议程。2017 年7 月,欧盟开放科学教育和技能工作组提出开放科学能力框架,包括开放获取出版技能、数据管理和开放数据技能、专业研究技能和公民科学技能[14]。欧盟委员会于2019 年发布 “开放科学的8 个目标”,指出 “欧洲的所有科学家都应具备应用开放科学研究日常和实践所需的技能和支持”[15]。EOSC 技能和培训工作组于2020 年成立,旨在建立EOSC 能力和技能框架[16]。LIBER 提出,研究图书馆员和研究人员的开放科学技能是所有向 “开放” 发展的关键。2017 年11月,LIBER 发布了《2018—2022LIBER 发展战略:研究型图书馆在数字化时代推动知识可持续发展》[17],提出三大战略方向:“创新性学术交流” “数字技能和服务” 和 “研究领域基础设施建设”。2018 年7 月,LIBER 发布《开放科学路线图》,提出开放科学的七大核心领域,其中包括开放科学技能素养[10]。2019 年,LIBER 图书馆工作人员和研究人员数字技能工作组启动项目研究,旨在鉴别实践开放科学所需要的真正能力。该研究通过文献综述,以及对开放科学现有能力框架和已有培训资源如DigComp 2.0、FOSTER+以及LIBER 开放科学路线图重点领域等进行研究,绘制开放科学能力可视化结构图,设计学术出版、科研诚信、公民科学、FAIRE Data 和计量奖励5 个维度和34 个指标[18]。黄金霞通过对国际开放科学路线图的发布、内容、效果评估等特征进行分析,构建基于路线图的国家开放科学进程决策模型,覆盖开放科学实施前、实施、实施后不同阶段的决策内容,设计开放科学道路决策的 “三步法”,并提出中国可以进一步部署的工作,其中包括支持国家层面的开放科学教育与培训计划,以推进开放科学的崭新局面[19]。

数字技能被视为开放科学能力框架的核心组成部分。OECD 提出要为数据密集型科学建立数字劳动力能力和技能,指出数字技能包括专业技能和基础技能。专业数字技能需求因科学领域而异,并随着时间推移而变化以响应学科发展以及新技术和政策要求。基础技能更为通用,且变化较慢,理想情况下应该嵌入本科科学教育,并包含有关开放科学和科研社会责任的更宽泛的理念和过程[20]。欧盟认为,数字技能包括数据科学技能和数据管理技能:数据科学技能可以理解为通过采集、处理和分析数据并从中汲取见解的能力,可能包括来自计算机科学、软件开发、统计、可视化和机器学习等领域的知识,此外还涵盖计算基础设施以及信息建模和算法知识;数据管理是确保数据在整个研究生命周期和后续存储中得到妥善管理、共享和保存的技能,可能涉及数据清理以消除数据不一致、组织和结构化数据、添加或检查元数据以及解决数据管理问题,还可能包括为其团体或更广泛的社区定义标准、最佳实践和互操作性框架[21]。吴建中指出,开放数据和开放科学能否顺利开展在很大程度上有赖于专业队伍的支持,当务之急是加强专业队伍建设,加大人才培养力度,培育一批既懂得数字技术、又善于数据管理的人才,为推进开放数据、促进开放科学、助力开放创新打下坚实基础[22]。胡卉等通过剖析国内外代表性的数据素养核心能力体系,梳理了嵌入科研工作流和数据生命周期的数据素养核心内容体系,绘制了研究人员应具备的数据素养能力框架[23]。余维杰则构建出基于双生命周期下的研究生数据素养评价体系[24]。

作为开放科学的关键行动者,图书馆员数据能力框架建设备受关注。2016 年6 月,北美研究图书馆协会(ARL)、欧洲研究图书馆协会(LIBER)、加拿大研究图书馆协会(CARL)和开放获取知识库联盟(COAR)共同颁布《研究数据馆员能力框架》,指出研究数据馆员职业核心能力包括具备提供对数据的访问能力,具备数据管理的倡导和支持能力,和具备管理数据集能力3 个方面[25]。LISA 等认为,图书馆数据服务能力框架包括数据技能,编程、软件和技术技能,科学技能,图书馆管理员技能和人际交往能力五大类和41 项技能[26]。

2.3 胜任力模型理论研究

美国哈佛大学教授戴维·麦克利兰(David·McClelland)于1973 年首次提出 “胜任力”(Competency)概念,并建立了胜任力模型(Competence Model)——冰山模型。他认为,胜任力是指能将某一工作中有卓越成就者与普通者区分开来的个人深层次特征,它可以是动机、特质、自我形象、态度或价值观、某领域知识、认知或行为技能等任何可以被可靠测量或计数的并且能显著区分优秀与一般绩效的个体特征[27]。冰山模型将人员个体素质的不同表现形式划分为表面的“冰山以上部分” 和深藏的 “冰山以下部分”。“冰山以上部分” 包括基本知识、基本技能,是外在表现,是容易了解与测量的部分,而 “冰山以下部分” 包括社会角色、自我形象、特质和动机,是内在的、难以测量的部分(图1)。R.博亚特兹(Richard Boyatzis)基于麦克利兰的理论,提出了 “洋葱模型”。洋葱模型,是把胜任素质由内到外概括为层层包裹的结构,最核心的是动机,向外依次展开为个性、自我形象与价值观、社会角色、态度、知识和技能(图2)。

图1 冰山模型Fig.1 Iceberg model

图2 洋葱模型Fig.2 Onion model

柏雪基于胜任力模型将数据馆员职业能力分为知识、技能和个人综合素质3 个维度[28],构建了由专业知识、专业技能、沟通与协调、领导与管理、工作态度、认知能力、个人特质7 个维度31 个胜任特征指标组成的数据馆员胜任力模型[29]。杨利超从基本能力、应用能力、意识态度3 个层面构建了图书馆员科学数据素养能力的描述框架[30]。调研发现,目前暂时未有基于胜任力模型的开放科学能力框架相关研究。

综上所述,开放科学运动促进开放科学内涵不断丰富,要素组成不断拓展。国内外目前关于开放科学能力框架构建的理论研究尚在起步阶段,开放科学能力、数据科学能力和数据馆员能力均有所关注,但尚未形成统一的框架和准则。本文通过全面梳理开放科学构成要素,并基于于此构建开放科学能力框架、推进开放科学能力建设,以促进中国开放科学范式变革,建设开放科学创新生态。

3 开放科学能力框架构建

本文基于胜任力洋葱模型对开放科学能力框架进行设计,将开放科学能力由内到外概括为层层包裹的结构,其中最核心的是拥抱开放科学价值观和科学理念,向外依次展开为基于开放科学要素组成的开放科学知识习得,嵌入科研生命周期和数据生命周期的开放科学技能建设,具体如图3 所示。从拥抱理念到具体技能习得,越向内层越难以评价和习得,越向外层越易于培养和评价。

图3 开放科学能力框架Fig.3 Open science capability framework

3.1 拥抱开放科学价值观和理念

开放科学能力深层次内容主要包括科研行为主体的价值观,对开放科学的态度和动机,是否拥抱开放科学的理念,是否具备开放科学思维[31],是否愿意将开放科学范式贯穿科学研究始终,从首次提出研究想法的起始阶段到研究成果出版或传播的完成阶段。根据联合国《开放科学建议书》,开放科学的核心价值观应包括:质量和诚信,即开放科学应接受严格的审查检验并有透明的评估程序;集体利益,即开放科学理应为人类所共有并造福全人类,科学知识及成果应普世共享;公平公正,即开放科学应确保知识生产者和消费者能够平等地获取科学知识;多样性和包容性,即开放科学应接受知识体系的多元化,支持知识的多元化表示。《开放科学建议书》认为开放科学实践应遵循的指导原则包括:透明度、审查、批判和可证伪性,即应在科研工作的各个阶段提升开放性;机会均等,即所有开放科学利益攸关方皆均等享有参与、助推和受益于开放科学的机会;责任、尊重和问责,即开放程度越高,所有开放科学行为者肩负的责任就越重;协作、参与和包容,即经常在科学研究进程的各个层面开展协作,边缘化社群应充分参与;灵活性,即鼓励采取不同途径向开放科学过渡和践行开放科学;可持续性,即开放科学基础设施的组织和供资应立足于不以营利为目的的愿景。核心价值观和指导原则为科研行为主体践行开放科学提供理念指南[32]。

3.2 基于开放科学要素组成的开放科学知识习得

根据UNESCO《开放科学建议书》对开放科学的定义[2],FOSTER 开放科学定义和分类体系[9],以及欧盟开放科学监测器(Open Science Monitor)中的对Open Science “Wheel” 的定义,本文研究确定开放科学的基本组成要素,并将需要习得的开放科学知识分为3 类。

(1)开放科学基本知识:包括开放科学定义、倡议、最佳实践、意义。

(2)开放科学主要组成要素:包括开放获取,开放数据(科研数据、政府数据、产业数据)、开放科技报告、开放教育资源、开放科学基础设施(虚拟和物理)、开放源代码、开放可重复性研究、开放同行评议、开放科学评价、公民科学[33]。

(3)开放科学政策:在推进开放科学的过程中,政策自上而下宏观调控发挥积极推进作用。按照政策发布机构划分主要包括国家和地方政府政策、资助机构政策、科研机构/高校政策、出版机构政策、非政府组织政策和协会社区政策;按照政策主题划分可包括数字包容政策、开放科技合作政策和开放科学知识政策,具体如图4 所示。

图4 开放科学政策体系Fig.4 Open science policy system

3.3 嵌入科研生命周期和数据生命周期的开放科学技能建设

目前,科研生命周期和数据生命周期得到业界广泛重视,许多机构和学者开展相关研究。英国联合信息系统委员会(JISC)提出的科研生命周期包括研究灵感、组建研究团队、撰写项目书、研究过程和研究成果发表5 个阶段;数据生命周期嵌入科研过程,包括数据产生、数据管理、数据分析和数据共享4 个阶段[34]。美国弗吉尼亚大学图书馆将数据生命周期分为数据计划、数据采集、数据描述、数据处理和分析、数据发布和共享以及数据保存6 个阶段[35]。李文文则将科研生命周期分为4 个阶段,分别是科研启动阶段、科研计划阶段、科研实施阶段、成果发表阶段[36]。综合国内外学者研究,本文将科研生命周期分为4 个阶段,分别是项目启动阶段、项目进展阶段、成果发表阶段和共享传播阶段,数据生命周期与科研生命周期同步,包容数据产生、数据管理、数据分析、数据共享和数据存储5 个阶段。开放科学的技能建设嵌入科研生命周期和数据生命周期的各个阶段(图5),详细如下。

图5 嵌入科研生命周期和数据生命周期的开放科学能力体系Fig.5 Core competencies of open science embedded in research lifecycle and data lifecycle

(1)开放学术交流技能。开放学术交流技能贯穿科研活动整个生命周期,从项目启动到成果共享传播。项目启动阶段,进行" 预注册式研究设计" 和制定数据管理计划;项目进展阶段,掌握开放数据和开放实验室/笔记本相关技能,以实现可重复性研究;成果发表阶段,需要了解科研机构和资助机构的资助政策,选择合适的期刊(期刊质量如何、APC 是否合规),与出版商谈判技能,以及选择预印本、金色OA 或绿色OA 形式发表。此外,科研人员还可参与开放同行评议。共享传播阶段,选择论文存储方式比如机构知识库等,选择何种开放共享协议共享论文和数据等。开放学术交流技能主要涉及科研人员和科研支持人员(图书馆员)。

(2)数据科学技能。开放科学环境下数据密集型科研范式广泛建立,数据成为科学发现的核心和科研活动的驱动力。研究数据的管理和开放需要新的技能,并催生了新的职业。按照科研数据生命周期理论,各个环节涉及数据科学技能主要包括:数据管理规划(DMP),是开放科学实践中的重要组成部分,从研究开始制定周密的数据管理规划,确保数据的安全性和完整性。对科研机构/资助基金/国家的数据政策以及Fair Data 原则有相关知识储备,在确保参与研究者的权利、保护知识产权的同时促进数据的共享和重用。数据管理能力:包括对数字馆藏和数据集的元数据、永久唯一标识符(ORCID、ISNI、URN、ISBN)、大数据集等的管理能力。数据分析能力:数据处理软件、模型和算法的能力,数据分析与可视化、数据和文本挖掘、关联数据(Linked Data)和数据互操作的处理能力。数据共享能力:数据管理与发布、数据再现和重复使用等相关能力。数据存储能力:数据的存储、保存和归档能力。数据科学技能涉及的对象包括两类,一类是各学科的科研人员,另一类是专注于数据科学的有计算机、数学、统计、软件知识背景的计算机科学家/ 数据科学家/ 数据分析人员/ 数据管理人员/ 数据软件工程师等。

(3)科研素养技能。开放科学涉及众多利益相关者,科研成果、科研数据和科研过程的开放共享带来科学治理领域的挑战和风险。作为应对之策,应帮助科研人员培养开放科学环境下的科研素养技能。科研管理技能指科研人员的领导力、管理能力、创新能力和沟通能力等。在开放科学环境下,科学家具备领导力,引领和推进科研范式的变革;具备管理能力和创新能力,推进开放科学范式下科研活动规范进行,促进科研创新;具备与科研社区以及社会上其他利益相关者沟通协调的技能。科研诚信和道德素养主要是指如何面对开放科学所倡导的开放共享给科研人员带来诚信和伦理方面的挑战。信息和数据便利获取会增加剽窃和造假的风险,科研人员在引用前人研究成果时需予以引用和正确说明,对共享的敏感数据(如患者信息)应进行合适处理。法律知识和技能主要是指知识产权和版权相关的法律知识,如开放共享时使用何种开放许可协议、如何在保护知识产权的同时进行共享数据,使用其他科研人员共享的数据和用户数据(如患者)时需要遵守的知识产权原则和规避的风险。科研素养技能涉及的对象包括科研共同体中所有科研行为主体。

(4)公众科学技能。随着开放科学的推进,公众科学成为开放科学不可或缺的重要组成部分。公众科学技能不仅包括科研人员促进公众参与科研的能力,还包括公众参与科研的兴趣和技能。科研人员在科研设计和开发过程中充分考虑公众,并能以通俗易懂的方式与公众交流、解释和讨论研究成果;进行科普宣传,向公众宣传普及科技进展和研究成果,让公众获得知识和技能;在重大公共事件中及时回应公众期待、为公众解答疑惑,正向引导舆论、解决公共危机,与社会建立信任关系。提高公民的科学素养,包括参与科研的兴趣和热情以及具体参与过程中研究数据收集和分析能力。公众科学技能涉及的对象包括科研人员和公众科学家。

4 开放科学能力培养路径

FOSTER 发布《科研机构实施开放科学培训实践的路线图》,路线图概括了科研生命周期中各利益相关者可以影响和支持向开放科学实践过渡的3 个重要途径:通过提倡技能获取和学习来促进变革;通过获取培训材料和课程来支持变革;通过提供相关认可和奖励来激励变革[37]。OECD 提出建立具有数字化技能的研究队伍的5 个关键行动领域,包括定义技能需求、提供培训、建设社区、职业规划和激励机制、提升数字化劳动力能力的更广阔助力,确定国家和地区政府、研究资助机构、专业科学协会、研究机构和基础设施以及大学5 个关键参与者并分别提出行动建议[20]。综合以上分析研究,对开放科学生态系统中的领导者和决策者、科研人员和科研支持人员的开放科学能力培养路径可从以下几个方面着手。

4.1 制定政策法规和战略规划

发布国家层面的政策法规和战略规划,制定国家、地区和机构开放科学路线图对于推进开放科学实践至关重要。将开放科学能力建设的要求和内容纳入国家开放科学政策体系以及科研机构和高校教育机构的教育培养目标。2021 年月,法国发布的第二个《国家开放科学计划》提出在法国普及开放科学,使开放科学成为默认原则。要转变日常科研实践,应将开放科学培训贯穿科研人员所有研究培训计划中,从学士、硕士阶段到高级研究人员。尤其是博士阶段应作为战略重点,为博士生定义开放科学培训的参考框架,设立开放科学论文奖,以及提供《开放科学护照》的专题小册子。提出考虑将数据素养作为关键技能纳入学位课程范围,强调重视与管理数据生命周期和开发源代码相关的技能和职业。将开放科学相关能力纳入研究人员、教师研究人员、研究工程师和技术人员的能力框架[38]。

中国已将推进开放科学写进相关法律,但暂未出台开放科学战略规划和路线图。国务院于2021 年6 月发布《全民科学素质行动规划纲要(2021—2035 年)》,指出中国公民科学素质水平大幅提升,2020 年具备科学素质的比例达到10.56%,并提出中国公民具备科学素质的比例2025 年超过15%的近期目标和2035 年达到25%的远景目标[39]。2021 年11 月,中共中央网络安全和信息化委员会办公室发布《提升全民数字素养与技能行动纲要》[40],提出要顺应数字时代要求,提升全民数字素养与技能,2025 年全民数字素养与技能达到发达国家水平,2035 年基本建成数字人才强国。国家现有相关政策暂未明确对开放科学能力培养的具体要求,建议呼吁相关决策者和政策制定者将开放科学能力建设和要求纳入日程。与此同时,科研机构和高校的博士生教育、新从业研究人员入职教育的培养原则和目标以及各级研究人员晋升发展的职业能力框架,都应明确开放科学技能和能力的相关要求。

4.2 加强开放科学宣传和培训

要实现开放科学范式转变,需加强对科研人员、科研工作管理者以及科研支撑人员的宣传培训,促使科研人员行为真正持久地转变。欧盟是开放科学理念与实践的积极推动者与践行者,2014 年启动了FOSTER 项目,在欧洲28 个国家开展了100 多场培训活动,覆盖开放存取、开放数据、开放可重复研究以及开放科学定义、政策、工具、评估等诸多内容。2017 年,在前期项目基础上启动了FOSTER Plus 项目,与生命科学、社会人文等学科专家合作开发针对特定学科的指南和培训内容,便于各学科的科研人员直接应用于其日常科研实践中。FOSTER 项目事实上极大促进了欧洲科研人员对开放科学的认知和理解,以及欧洲研究区(European Research Area,ERA)参与者对开放存取的采用[41]。美国开放科学中心(Center for Open Science,COS)通过开放科学培训提升研究人员开放科学实践技能,培训内容包括可重复性、工作透明度、OSF 工具使用方法等[42]。英国围绕科学数据生命周期设计科学数据管理培训体系,开发内容丰富的科学数据管理(RDM)培训课程,研究机构和研究支持机构协同合作联合开展培训[43]。在中国,复旦大学从2007 年起开设数据科学讨论班,2010 年开始招收数据科学博士研究生,并从2013 年起开设研究生课程《数据科学》,2014 年开始举办数据科学家训练营,2015 年开始正式招收数据科学专业研究生以及本科第二专业学位[44]。2021 年6 月,上海外国语大学俄罗斯东欧中亚学院与国际工商管理学院在上外 “人工智能与数据科学应用实验室” 联合举办“数据科学家训练营”[45]。

4.3 提供贯穿科研全流程的全面支持

围绕科研全流程提供全面支持,推进各科研行为主体通过开放科学实践活动提升开放科学能力。对重大科学问题开展集智攻关,统筹跨领域学科专家、计算机科学家和数据科学家等专家力量攻克人类面临的难题,在学术社区中发挥引领示范作用。为研究人员提供来自数据管理员、IT 技术人员、数据科学家、法律专家、特定学科的数据管理员和图书馆员的专业支持。提供开放科学基础设施[46],包括高速数据中心、数据存储库和虚拟平台等;提供用于数据创建、存储和共享的软件等技术工具帮助研究人员进行开放科学活动;在所有研究项目中促进和推动数据管理计划的使用。设置奖励和激励机制,让研究人员意识到开放科学实践的价值,包括个人层面的职业机会和职业发展,和社会层面的开放科学对整个社会的价值。

5 图书馆与开放科学能力建设

5.1 图书馆是实施开放科学能力建设的关键行动者

图书馆是信息素养教育的主要阵地,开展开放科学能力培训和素养教育是其基本的职能和责任。2017年,COX 等在《大学图书馆研究资料管理的发展:对研究资料服务成熟度的理解》中提出:“由于培训对于学术图书管理员来说是一个已经建立的、成熟的服务类别(在信息素养等领域),并被视为现有的工作人员联络角色的关键组成部分,因此图书馆也许能相对容易地将数字化技能培训与现有的培训活动结合起来”[47]。同时,图书馆作为海量资源的聚集地和学术信息的交流平台,在服务科研一线的过程中积累了丰富经验,使之成为开展开放科学素养教育的不二人选。LIBER认为,开放科学属于图书馆的专业领域,图书馆员被认为是开放科学技能培训者、开放获取出版支持服务提供者、FAIR 数据管理员和公民科学协调者。LIBER对欧洲21 个图书馆案例分析表明,图书馆是开放科学技能培训专家和协调者。图书馆与专业人士(研究支持服务、版权服务、IT 服务)合作形成 “知识中心”,开放科学技能和实践培训是图书馆的明确职责。其中15 个图书馆的开放科学培训通过图书馆团队管理和协调,图书馆负责与数据专家、研究管理人员和教学团队合作推进开放科学培训服务。也有少量案例显示由研究人员和图书馆员合作推进培训。分析表明,图书馆参与机构或国家科学决策过程,并积极推进对员工和科研人员的培训,能有效促进相关科研主主体开放科学能力提升[48]。

5.2 中国图书馆积极参与开放科学能力建设和素养教育

中国高校图书馆在开放科学能力素养教育中具有天然优势。清华大学图书馆的 “十四五” 规划中明确提出开放科学支持计划,该计划的4 项主要任务之一是开放科学素养教育,该计划也将作为 “促进科技开放合作” 的子计划列入清华大学2030 创新行动计划。北京大学连续举办3 届 “全国高校数据驱动创新研究大赛”,提升学生数据素养和技能,培养学者开放科学素养[49]。复旦大学图书馆、北京大学图书馆等9 所高校图书馆于2014 年共同成立中国高校研究数据管理推进工作组,以每年一次学术会议的方式搭建专家学者与业界同行的交流平台,探讨图书馆科研数据管理与服务的问题和策略。

中国科学院文献情报中心(以下简称 “文献中心”)在开放获取和开放科学的实践和推进中发挥引领作用。自2013 年起至今,文献中心年度举办中国机构知识库培训班、中科院开放资源建设实务研讨会、数据馆员培训班[50]等多项培训,提升科研成果仓储、开放资源建设、数据管理实务的建设和应用能力。2020年,文献中心发布《中国科学院作者发表OA 论文指南》,介绍如何发表OA 论文、可享受哪些APC 减免优惠、发表OA 论文注意事项等内容。2020 年和2021年分别举办开放获取专员培训,向中国图书馆界、科研人员介绍开放获取政策、开放出版转换实施机制分析、中国开放出版转换实践、开放存储与预印本的有效实施和可持续运营,培训旨在进一步加强开放获取的研究与实践,培养中国开放获取人才。举办中国FAIR 原则与数据管理工具与方法培训,以迎接数据管理与服务的挑战,提供数据跨学科和跨仓储的交流平台,促进科学数据服务于科学研究和科技创新,提高相关研究和从业人员在数据管理、分析、应用和服务方面的能力,实现数据管理的FAIR 原则目标。2021年,文献中心在其 “十四五” 规划中提出 “设立数据馆员”,从数据管理的能力、数据伦理的交流、数据增值的业务3 个方面着手,助力中国科技创新。与此同时,建立开放科学研究室,着力研究开放科学理论和政策,构建中国科学院高端学术交流平台[51],设计开放科学素养及技能培训课程,参与培养适应开放科学的人才,征集开放科学实践的典型案例,推进开放科学范式转变。

5.3 中国图书馆应积极主导设计科学合理的开放科学培训体系

当前开放科学培训面临诸多问题,培训活动缺乏系统框架和整体规划,培训内容分散或重复。在推进开放科学进程中,针对科研人员、教育者、公众、政府管理人员等开放科学知识和技能不足的现状,基于开放获取、开放数据、开放科学治理等开放科学基本要素设计科学合理的培训体系,研发开放科学技能培训课程内容,培育具备理论和实践能力的新型开放科学人才。在培训体系设计策略上,深刻理解当前国家对人才的方针政策和新需求,把握开放科学对人才能力要求的内涵;在培训过程中,确定先立后补的策略,先搭建培训框架和体系,已有成熟课程或研究成果的内容可先行进行培训,其他内容可后续不间断补充;建设培训内容持续更新机制,根据培训评估效果、专家意见和用户反馈进一步更新完善。同时,加强提供开放科学技能培训的利益相关者之间的协调合作,以解决开放科学培训的分散和重复问题。

6 结语

要推进开放科学范式的真正变革,需切实提高科研生态系统中利益相关者和参与者的开放科学能力,以助在各学科领域推进开放科学实践。在开放科学运动的推动下,更好地了解开放科学所必需的能力素质并进行能力建设培养已成为许多科研机构和高校日程上的重要事项。本文通过研究尝试对开放科学能力框架和培养路径进行探讨,但由于当前开放科学能力相关研究仍处于探索阶段,受条件限制本研究尚存诸多不足之处。后续将继续对开放科学能力进行深入研究,细化能力指标,为中国图书馆设计开放科学培训体系、推进开放科学培训提供理论依据和借鉴。

猜你喜欢
数据管理技能科学
企业级BOM数据管理概要
定制化汽车制造的数据管理分析
航发叶片工艺文件数据管理技术研究
女生总有一些神奇的技能
点击科学
科学大爆炸
劳动技能up up!
数据挖掘在学生成绩数据管理中的应用研究
数据挖掘在学生成绩数据管理中的应用研究
拼技能,享丰收