档案管理视角下科学数据管理存在的问题及启示

2022-11-14 10:46中国科学院档案馆李洁
办公室业务 2022年3期
关键词:原始数据科研活动数据管理

文/中国科学院档案馆 李洁

随着信息技术的深度渗透以及科研活动模式转型升级,越来越多的科研活动基于信息化平台开展,产生了大量的科学数据等电子文件。目前,科学数据已经成为我国重要的战略资源。现阶段,科学数据中心、档案馆、图书馆等多种类型的管理机构都对科学数据有所关注,且不同机构在科学数据管理方面存在标准不统一等现象。2020年11月1日起施行的《科学技术研究档案管理规定》(国家档案局、中华人民共和国科学技术部令第15号)中明确规定,科研档案包含图表、数据等各种形式和载体的文件材料。鉴于此,本文从档案管理视角详细分析了目前科学数据管理活动中存在的问题并展开思考。

一、科学数据与科研档案的关系

(一)科学数据是科研档案的重要组成部分。科研档案是指科研项目在立项论证、研究实施及过程管理、结题验收及绩效评价、成果管理等过程中形成的,具有保存价值的文字、图表、数据、图像、音频、视频等各种形式和载体的文件材料以及标本、样本等实物;而科学数据是指在科技活动(实验、观测、探测、调查等)中或通过其他方式所获取的反映客观世界的本质、特征、变化规律等原始基本数据,以及根据不同科技活动需要,进行系统加工整理的各类数据集。首先,科研档案与科学数据都是科技活动中形成的记录;其次,科研档案中包含具有保存价值的图表、数据等文件材料,这里的数据显然是指科研活动过程中形成的科学数据指等。由此可见,科学数据是科研档案的重要组成部分。

(二)科学数据管理与科研档案管理“异曲同工”。科研档案一经形成,要从真实性、完整性、可用性、安全性(以下简称“四性”)4个方面进行维护。科学数据的管理与之具有较高的契合度,科技部办公厅发布的《科技计划项目科学数据汇交工作方案(试行)》指出科学数据的汇交要遵循及时充分、真实可靠、科学规范三大原则,其中及时充分确保科学数据的及时汇交,保证科学数据的完整性;真实可靠确保科学数据汇交的质量,保证其内容的真实性、可靠性;科学规范要求科学数据要经过加工处理,保证科学数据可发现、可获取、互操作和可重复利用。

二、档案管理视角下科学数据管理存在的问题

(一)科学数据管理制度体系不健全。我国探索科学数据管理已经有20年的发展历程,目前已初步形成以《科学数据管理办法》《国家科技资源共享服务平台管理办法》为根本依据的宏观政策体系,但是从微观制度出发还需不断完善。比如,经对我国国家科学数据中心等科学数据管理机构官方网站展开调研后发现,关于科学数据的大部分制度的内容侧重于数据汇交,主要包括数据汇交目的、汇交意义、汇交范围、汇交原则、汇交流程、汇交时间等内容。但从管理环节上看,科学数据管理与科研档案的“收、管、存、用”极为相似,基本包括数据汇交、数据分类组织、数据保存、数据共享利用等环节,覆盖科学数据的全流程管理,而数据汇交只是科学数据管理的其中一个环节,关于科学数据的“管”“存”“用”的相关制度缺失,对科学数据的质量检测、长期保存、开发利用等方面非常不利。

(二)科学数据价值鉴定过程缺失。数据汇交是科学数据管理的首要环节,是将数据生产者生成的原始数据、加工数据及其元数据等内容汇聚到科学数据中心、档案馆或其他科学数据管理机构的过程,然而数据汇交环节与文件归档环节有明显的区别。文件归档前必须经过鉴定,这里的鉴定是指文件保存价值的鉴定以及保管期限的鉴定,经鉴定有必要归档保存的文件才会进行归档保存,而科学数据的汇交环节并未对科学数据的价值展开判定。但随着信息技术的深度渗透,越来越多的科研项目特别是科技项目基于信息化平台展开,产生了海量的科学数据,来源范围广,若不对其进行价值鉴定,未来将会给科学数据的存储带来很大的成本压力。

(三)科学数据分类与科研档案分类存在明显差异。科学数据分类是按照一定的分类方案对科学数据进行加工、整理、归类的过程,通过分类可以方便用户快速查找和利用科学数据。经调研发现,目前我国科学数据中心或其他科学数据管理机构对科学数据的分类主要依据学科分类法。首先,按照科学数据的开放范围将其分为一级数据、二级数据、三级数据;其次,按数据加工程度将其分为原始数据、衍生数据、加工数据、辅助数据等。而科研档案的分类方法与之有较大的不同,成套性是科研档案的重要特点,保持一个科技项目档案材料的齐全成套是对科研档案分类整理工作的基本要求。显然,科学数据的分类与科研档案的分类存在本质差异,导致科研项目档案难以集中管理,同时难以确保科研档案的齐全完整。比如,目前我国重大科技项目“跨学科、跨领域、跨机构”的特点非常突出,科学数据的分类依据显然会将其产生的项目档案与科学数据剥离开来,非常不利于科研项目档案的归档保存和开发利用。

三、档案管理视角下对科学数据管理的几点启示

(一)强化科学数据管理政策制度体系建设。宏观上,国家相关管理部门在制定相关政策时,要提高对科学数据归档、数据质量检测、长期保存、共享利用的要求,同时根据具体情况制定相应政策来加强科学数据管理机构与档案部门的协同,有效避免科研档案齐全完整、系统成套的难题。微观上,各个科学数据管理机构应从“收、管、存、用”4个方面不断完善科学数据管理制度体系。第一,明确科学数据的汇交范围及保管期限,“收”哪些,不“收”哪些,其保管期限怎么界定等内容需在制度中予以明确;第二,强化质量控制,应从真实性、完整性、可用性、安全性4个方面制定元数据方案以及“四性”检测机制来保证科学数据的可发现、可获取、互操作和可重复利用;第三,为保证科学数据的长期有效可用,应制定与科学数据的长期保存策略。

(二)完善科学数据管理流程,有效阻止科学数据“泛滥”。数据级增长的科学数据不仅给数据存储带来了很大的“冲击”,令科学数据的质量控制也将面临极大的挑战。对于科研档案而言,鉴定工作为优化质量、方便保管和有效利用的重要过程,科学数据管理也应借鉴科研档案的鉴定工作,主要涉及3个方面的内容:第一,对科学数据的保存价值展开鉴定,鉴定其是否有必要归档,对不具备保存价值的科学数据剔除,可适当降低管理成本和存储压力;第二,对具有保存价值的科学数据进行保管期限鉴定工作,对于需要永久保存的科学数据必须采取长期保存措施来保证科学数据的长期可获得;第三,科学数据的开放鉴定是确保科学数据开放共享的重要过程,科学数据管理机构应从共享利用角度,协同数据生产者、档案部门等机构开展科学数据的开放鉴定工作,确保科学数据能及时、有效地发挥其科技价值。

(三)加强与档案部门的协同管理,确保原始数据的集中归档保存。科学数据中有大量数据是科研活动中直接形成的原始数据,是科研档案的重要组成部分。2018年,《中共中央办公厅国务院办公厅印发〈关于进一步加强科研诚信建设的若干意见〉的通知》中指出,要明确科研活动记录、科研档案保存等相关制度,确保原始记录的有效、完整。可见原始数据的重要性;另外,大量科学数据是科研项目的过程产物,是依托于科研项目产生的科研活动原始记录,基于此产生的科学数据是科研档案的重要组成部分。因此,科学数据管理机构应加强与档案部门的协同,一方面,要根据档案部门的要求明确科学数据归档范围表及保管期限;另一方面,着重强调科学数据中具有保存价值的原始数据的归档,科学数据管理机构应按照档案部门的要求,将原始数据与相关科研项目管理活动所形成的科研档案集中保存归档,确保科研项目中所形成的科研活动原始记录的齐全完整。

四、结语

综上所述,科学数据管理与科研档案的管理同源同根,但在管理实践上还将面临更大的挑战,比如,如何确保科学数据与科研档案的同步归档及科学管理科学数据等问题是未来值得关注的问题,仍需进一步展开研究。

猜你喜欢
原始数据科研活动数据管理
企业级BOM数据管理概要
定制化汽车制造的数据管理分析
数据挖掘在学生成绩数据管理中的应用研究
数据挖掘在学生成绩数据管理中的应用研究
论航空情报原始数据提交与应用
科技评估在科技管理中的分析与认识
机械卓越工程师教育培养计划学科竞赛和科研活动体系建设研究
依托科研实践促进大学生创新精神及实践能力的培养
对物理实验测量仪器读数的思考
浅谈畜牧专业大学本科生参与科研的重要性