李旭光 王 丹 肖斯佳 刘子杰 朱学坤
(1.南开大学商学院 天津 300071;2.南京大学信息管理学院 南京 210023;3.中国人民大学信息资源管理学院 北京 100080)
科学数据是指在科技活动(实验、观测、探测、调查等)中或通过其他方式所获取的反映客观世界的本质、特征、变化规律等的原始基本数据及其衍生数据[1]。科学数据是科学研究活动的产物,更是支持科学研究以及科技创新的重要资源。当今时代,科学研究已进入第四范式,即数据密集型范式,科学数据呈现出“井喷式”增长,其在科研活动中的地位也进一步得到凸显。
有效、完善的科学数据管理能充分发挥科学数据的价值,推动学科发展与进步。而高效的管理政策则是科学数据有效获取、管理、利用、存储、共享和再利用的前提和保障。不同的学科因其学科特征与内容的不同,造成数据的性质、管理方法、共享利用的可能性等均会有所差异[2],科学数据管理政策也需要针对不同的学科特征相应地体现不同特点。
不同学科的融合加速发展推动了学科交叉性增长[3-4]。在此态势下衍生的交叉学科,是由自然、人文、社会、数学等大门类科学之间的外部交叉和本门类科学内部学科之间的内部交叉共同形成的综合性、系统性的知识体系。许海云[5]等人认为交叉学科是两门或两门以上学科间的研究内容和研究方法产生横向联系后形成的具有独立性质的一类学科或学科群体,以及据此建立的组织体系和知识结构。越来越多交叉学科的出现并在认识世界和改造世界中发挥作用,充分证明了交叉学科在科学领域中的学术性、生命力、可持续性[6]。许多复杂的重大社会问题、科学问题的解决需要多学科力量的“会聚”,即多学科知识的综合运用与科研人员的交流协作[7],推动学科交叉、促进交叉科学研究发展逐渐成为各国科技政策和基金管理部门所关注的重要战略问题[8]。美国的学科专业目录(Classification of Instructional Program)把交叉学科划分为与人文科学、社会科学、自然科学、技术科学并列的学科。我国也在2020年全国研究生教育会议上决定新增交叉学科作为新的学科门类,交叉学科成为我国第14个学科门类[9]。在迅速发展的同时,传统基于单一学科的科学数据管理方法和策略不再完全适用,交叉学科中的科学数据管理及相关政策制定成为学科发展的一个重要问题。
地理学作为其中发展较成熟的一门重要学科,是研究地球表层空间的自然要素和人文要素的相互关系和时空规律的科学[10],因此也被看作是具有天然交叉学科属性的代表学科[11]。它包括自然地理、人文地理以及地理信息系统三个分支,其中自然地理属于Becher(1987)学科文化矩阵的“Hard”面,而人文地理则属于矩阵的“Soft”面[12]。同时,地理学涉及人类活动的方方面面,包括文化、社会和经济[13]。此外,地理学不仅有学科内部的融合发展(如地理信息系统),同时与其他学科也进行了深入的交叉融合,产生了经济地理学、旅游地理学等新兴交叉子学科[13]。在其科研活动中产生的数据与国家安全、环境、民生等密切相关,具有数据量大、专业性强、数据类型丰富、收集成本高、保密要求高等显著特点。
总体来看,地理学是一门向内不断融合,对外不断联系的学科,反映了交叉学科综合性发展的趋势[14],其发展的广度和深度具有一定的学科代表性。目前国内外关于交叉学科领域中的科学数据管理研究尚不充分,还未形成从数据创建、保存到利用的完整数据生命周期管理政策[15]。因此本研究拟系统分析中、英、美、澳四个国家地理学领域的科学数据管理政策文本,提取出其中科学数据管理内容要素,并且基于英国数据管护中心(Data Curation Center,DCC)创立的数据管护生命周期模型,构建贯穿数据全生命周期的科学数据管理指导框架,为指导交叉学科领域的科学数据管理活动及政策制定提供参考。
1.1科学数据管理政策科学数据作为一种重要的国家资源,具有类型多、传播速度快、影响范围广、开发潜力大、应用价值高等特点[16]。对科学数据进行有效管理,促进数据的共享,是发挥其效用并实现增值的重要手段。科学数据管理政策是指在一定的社会背景和科学技术条件下制定的有关科学数据的组织、存储、管理和共享的一系列原则、标准和规定[17]。相关研究表明,科学数据管理政策为开展科学数据管理活动提供了重要的推动力和保障[18]。科学数据管理政策可以明确科学数据的管理、组织、存储和共享过程中的所有权、伦理和安全问题,帮助政策制定主体表明自身立场,划分利益相关者的权责,进而确保科学数据能被有效管理和共享[19]。英国林肯大学指出,科学数据管理政策应该是基于科学数据的整个生命周期实施最高管理标准的文件[20]。
如何制定并改善数据管理政策,是该领域学者关注的重要话题。DCC数据管护生命周期模型是目前在数据管护领域应用最为广泛的概念模型之一,它以科学数据生命周期为基础,包括概念化、创建或接收、鉴定或选择、采集、保存、存储、获取和利用、保存计划等活动[21],作为一个较为科学和完善的模型,对科学数据管理研究有较大的参考和借鉴意义。Wilkinson[22]为科学数据管理所有利益相关者提出了FAIR数据原则,强调数据管理要使数据具有可查找性(Findable)、可获取性(Accessible)、互操作性(Interoperable)和重复利用性(Reusable),进而对管理过程中不同利益主体的实践作出了要求,并强调所有活动包括政策的制定都应该围绕FAIR原则开展。Ahn和Park[23]通过对荷兰、美国、英国、加拿大和澳大利亚等国的科学数据管理实践和政策内容的研究,提出了一个以数据生命周期模型为基础的本土化科学数据管理政策框架,内容涉及管理计划、收集、评价和选择、存储和管理、获取、分享和再利用、转化以及支持管理共14个模块。
国内学术界已有的相关研究主要集中在对英国、美国、澳大利亚等发达国家的科学数据管理政策内容的研究以及获得对我国的启示上。司莉[1]选取美国、英国、澳大利亚三个国家作为对象,调查了其科研管理机构、高校以及政府制定的科学数据管理和科学数据公开政策的制定情况与特点。何青芳[24]除了关注这三个国家科学数据管理政策的制定情况,还对这些政策的主要内容元素进行了分析。邢文明[25]通过研究国外30余所教育机构的科学数据政策,发现国外教育机构的科学数据政策大纲主要从数据生命周期、利益相关者和两者相结合等3个角度展开。而黄如花和温芳芳[26]采用内容分析法对我国国家层面的政府数据开放共享政策文本进行分析,从宏观上揭示了这些政策的内容框架主要包含以下部分:数据创建与汇交、数据组织与描述、数据归档与保存、数据发布、数据共享、数据获取与利用、数据监管、数据质量、数据安全与隐私、知识产权、基础设施建设以及政府协调管理。上述研究成果为我们后续政策框架的制定提供了与借鉴。
随着传统学科的发展与新学科的产生,科学数据管理政策的研究需要深入到具体学科领域,揭示具体学科的科学数据管理服务的具体过程[27]。王琼[16]等人经过调研发现,英国高校科学数据保存政策虽然涵盖的内容较广,但大多都未考虑到学科之间科学数据的差异性。不仅仅是英国高校,目前针对某个专门学科领域或是考虑到学科背景的科学数据管理政策的研究仍相对较少,仅有刘莉[28]以及刘珊杉[29]等人在医学以及遥感学领域形成的研究成果。
1.2交叉学科的科学数据管理在交叉学科的科学数据管理方面,现有研究多集中在“高校交叉学科建设”“人才培养”“设备共享平台建设”“交叉学科文献计量研究”等方面,其科学数据管理及其政策制定问题并未得到较多关注。
交叉学科作为一个复杂的学科系统,具有特定的学科发展模式和学科体系[30]。Klein[31]等人认为不能以过去对待单一学科的视角看待交叉学科,要以综合和全面的学科视角审视并解决其带来的诸多科研领域问题。Petri[32]表示交叉学科成功与否取决于合作性、人际沟通、角色意识、相同的知识体系、合作支持几方面。目前交叉学科科学数据管理具有多学科知识交融、多学科合作和数据类型多样等特征,这和单一学科的科学数据管理存在很大差异。部分学者针对交叉学科自身独特性提出了相关建议,如曹勇[33]等人指出交叉学科的科学研究具有不同于一般学科科研的显著特点,包括跨学科性、综合创造性、自组织协作性以及相对独立性,交叉学科的科研管理应当从组织管理、课题管理、成果管理三个方面入手。Bronstein[34]从单一交叉学科出发归纳出交叉学科独特的学科结构,即合作性,创新性活动,灵活性,集体目标和对过程的反思五个方面。一些学者通过研究科研活动的不同主体来解释学科交叉的复杂性,如Poter[35]等人从不同的主体出发,提出了一系列有关大学、资助组织、专业协会和科学媒体(包括期刊编辑)等影响交叉学科科研活动的研究问题。Klein[31]认为交叉学科需要明确界定各个主体的责任和义务,才能有序开展各类学科活动。此外,部分学者认为交叉学科科研管理需要把握学科的分类体系,如张雪[36]提出把握学科之间交叉分类方法,分类体系有助于明晰交叉学科的本质,有利于交叉学科的科研管理。
这些研究成果虽然没有直接面向交叉学科的科学数据管理问题,但能够帮助我们认识到交叉学科的科学数据管理具有以下特点:a.学科维度多、结构复杂;b.知识交流广、学科范围界定模糊[37];c.涉及利益主体多、权责划定难;d.科学数据杂、分类要求高;e.合作性和协调性要求高;f.集体目标明确,管理过程灵活。
综合上述分析,目前针对某个具体学科的科学数据管理政策的研究较少,专门针对类似地理学这种交叉学科领域的科学数据管理政策进行全面化、体系化的研究更是缺少,交叉学科中的科学数据管理问题也并未引起重视。如今交叉学科研究在科学研究中的重要性不断提高,促使这一领域的相关研究活动更顺畅进行的相关政策和管理方法也越发重要[38]。基于此,本研究对中、英、美、澳四个国家在地理学领域的科学数据管理政策进行了全面调研和深入分析,在此基础上进一步探讨交叉学科科学数据管理内容和相关政策制定。
2.1数据收集英国、美国和澳大利亚是世界上开展科学数据管理研究和实践相对较早的国家,这些国家的有关政府部门以及研究机构制定了许多比较成熟和完善的地理学科科学数据管理政策,这些科学数据管理政策实例有着较高的研究价值和参考价值。近年来,我国也陆续制定了地理学领域的科学数据管理政策,并取得一定成效。基于此,本研究选择英国、美国、澳大利亚以及中国这四个国家在地理学领域的科学数据管理政策作为研究对象。
在筛选相关政策时,为保证所选政策的权威性和代表性,笔者首先通过网络调研,从英、美、澳、中四个国家中筛选出工作内容与地理学科相关的管理机构和政府部门;随后对其官网发布的科学数据管理政策进行浏览与筛选,政策筛选遵循以下标准:与地理学科相关、正在施行、省级以上国家级为主单位(英、美、澳为政府部门或知名科研机构)发布的政策,并将符合研究要求的完整的科学数据管理政策全文下载。最终获得符合标准的完整的27份科学数据管理政策全文,其中中国16份,英国2份,美国4份,澳大利亚3份,资料概况如表1所示。这些政策的数据对象涵盖了《中国图书馆分类法》地球科学目录下的地质学、海洋学、 测绘学、地球物理学、气象学和自然地理学等绝大多数领域。
表1 研究政策列表
2.2数据分析笔者主要采用定性内容分析法对收集的政策文本进行分析。定性内容分析是一种通过编码和识别主题或模式的系统分类过程对文本数据内容进行主观解释的研究方法[40-41]。它可以根据数据和上下文语义进行有效推断和揭示文本信息,强调对文本内容意义的解释,而不是简单地概括总结[42]。分析过程主要遵循Shannon等人[43]提出的定性内容分析步骤对政策文本进行人工分析。首先对全部政策文本进行多次通读熟悉内容,形成对政策的整体认识。然后对政策文本内容进行分析,将政策按章节分割成不同部分,使用Excel对其进行编码,对各章节里的政策内容进行逐条归纳总结,得出主题词。为确保编码质量,两位编码者共同参与编码过程,当出现编码不一致的情况时由二者协商解决。
在定性内容分析结果的基础上,本研究构建了一个适用于地理学等交叉学科领域的科学数据管理政策的内容框架(见图1与表2)。主体内容模块参考DCC数据管护生命周期模型,包括从数据产生到利用的所有重要环节:数据计划、数据收集与汇交、数据描述、数据存储与保管以及数据共享与利用。同时,结合政策实例,我们在主体模块之外还设置了政策介绍性信息、责任与分工、监督与保障以及其他信息等四个模块对政策主体内容进行补充与完善,以便其能够得到更好的解读和落实。其中,“政策介绍性信息”和“其他信息”是对政策基本情况的介绍,“责任与分工”和“监督与保障”则是分别从内部管理主体和外部干涉主体两类责任主体的行为界定上对科学数据管理工作进行保障。这样有助于形成以数据生命周期为经、以责任相关者为纬的科学数据管理体系。
表2 交叉学科科学数据管理政策内容框架模块
图1 交叉学科数据管理政策内容框架
3.1政策模块详细内容
3.1.1 政策介绍性信息 首先,科学数据管理政策应在政策前言中对科学数据管理背景和政策相关信息进行简要说明,以便政策受众能够对政策形成总体认知。该介绍应在把握多学科综合发展方向的同时,涵盖交叉学科特征(见表3)。
3.1.2 责任与分工 责任与分工是政策内容中重要的要素,是科学数据管理能够落实的保障(见表4)。交叉科研对成员的协作关系提出了更高的要求,清晰与合理的责任界定有利于各主体在保存和管理科学数据中明确自身的职责和角色,避免由于权责不明、利益纠纷和管理不善等问题造成的不良后果。尤其像地理数据这类涉及国家安全和民生的重要数据,更应该在管理工作中明确权责。
表4 交叉学科科学数据管理政策内容框架:责任与分工模块
3.1.3 数据计划 数据计划在交叉学科科学数据管理过程中具有不可忽视的重要性,通过对科学数据管理的具体操作进行预先规划,能够有效避免实践过程中重复和低效的操作。交叉学科数据来源广泛、收集渠道复杂、收集成本较高,合理有效的数据计划能够强化对科学数据的统一规划和管理,协调不同领域的研究人员之间的合作。
表5 交叉学科数据管理政策内容框架:数据计划模块
3.1.4 数据收集与汇交 作为处理数据的第一步,数据收集与汇交的工作质量决定着数据最终共享和再利用的水平。地理信息数据与国家安全、经济发展以及人民生活密切相关,需要相关管理部门集中统一收集管理。因此,政策应该对数据收集与汇交的流程及要求等进行明确的规定,保证流程的清晰规范,并注意从源头阶段把关数据质量(见表6)。
表6 交叉学科科学数据管理政策内容框架:数据收集与汇交模块
3.1.5 数据描述 交叉学科的数据类型数量庞大,类型多样。为了便于保存与检索利用以及交叉学科内的知识交流,需要对数据有准确全面的描述。因此,科学数据管理政策应当强调元数据的重要性,同时对具体的数据描述标准和描述方式作出规定,即制定一套交叉学科通用的、统一的元数据标准,从而保证多学科对科学数据的精准描述和高效利用(见表7)。
表7 交叉学科科学数据管理政策内容框架:数据收集与汇交模块
3.1.6 数据存储与保管 科学数据管理政策应该对数据存储与保管这一阶段的操作进行详细具体的解释与说明(见表8)。地理信息数据的存储与保管是一个相当漫长的过程,需要详细说明该过程中涉及到的数据日常维护方式,以及可能出现的威胁数据安全的情况。同时,对于上述情况,政策内容应该提出一定的解决措施以供相关责任主体参考。
表8 交叉学科科学数据管理政策内容框架:数据存储与保管模块
3.1.7 数据共享与利用 共享利用是科学数据管理的最终目的。由于交叉学科的跨学科性质,使得数据交流共享在交叉学科中更加普遍。在此过程中很可能因为利用不当而产生与知识产权相关的法律问题或者数据安全问题(见表9),因此,更应该注重数据开放与保护的平衡共重。
表9 交叉学科科学数据管理政策内容框架:数据共享与利用模块
3.1.8 监督与保障 有效的监督与保障是确保科学数据管理活动顺利进行的必要外部手段,也是体现政策完善性和有效性的一个重要方面。交叉学科的发展程度不一,需要政策划定学科发展的监管主体,主动承担起促进交叉学科发展的任务。该模块强调了权威机构在交叉学科科学数据管理过程中的监督和保障作用[26](见表10)。它主要对科学数据管理过程中可能产生的违规行为及其处罚方式、值得表彰的行为和奖励方式进行说明,可供政策受众和相关利益主体参考。国家通常对关系到国民发展的交叉学科领域提供一定的政策扶持,例如英国UKRI理事会(UK Research and Innovation)设立多种基金激励交叉特色的资助项目,这一点在本框架中也得到了体现[39]。另外为检查政策具体落实情况,应对定期的检查评估机制进行要求和说明。
表10 交叉学科科学数据管理政策内容框架:监督与保障模块
3.1.9 其他信息 由于交叉学科发展演进较快,需要对政策生效、更新等基本情况进行有效的规范。其他信息即是对政策基本情况的一个补充,包括解释权、政策生效和更新时间以及相关政策法规等(见表11)。
表11 交叉学科科学数据管理政策内容框架:其他信息模块
本文所构建的针对交叉学科的科学数据管理政策框架不仅包含了黄如花和温芳芳[24]提出的政府层面数据开放共享政策的主要内容,而且对这些内容进行了进一步的概括、提炼和分类,体现了以地理学为代表的交叉学科科学数据管理的特色。如新的政策框架强调了交叉学科科学数据管理政策应明确适用数据对象、学科范围和专业术语含义,便于学者了解该新兴交叉学科以及学科下科学数据管理的基本情况,还指明不同主体的角色及责任,以便更好地协调分散领域中科研人员间的数据共享与合作。同时,本框架特别增加了数据计划模块,强调应根据交叉学科涉及的多领域学科的特点制定科学数据管理计划,避免由于学科较新、科研经验不足,科研人员存在知识壁垒、沟通不畅等问题。此外,本框架凸显了元数据的选择和使用,在交叉学科科研活动中,很有可能会产生新类型的数据,其描述方式可能需要重新定义。
3.2四国科学数据管理政策内容比较分析依据本研究建立的科学数据管理政策内容框架,笔者对中、英、美、澳四个国家的地理科学数据管理政策中不同内容和环节进行了如下分析(见表12)。
表12 各国地理学科科学数据管理政策内容模块比较
在我国18份地理学科科学数据管理政策文件中,除了政策5、7、13、17之外,其余14份均有清晰的环节划分,通常基于数据生命周期视角逐章介绍科学数据管理主要环节的具体要求,一致性和规范性较高。我国政策主要包含以下几个方面的内容:a.政策介绍性信息,如目的、依据、适用范围、数据范围、相关责任主体等;b.数据收集与汇交,如汇交范围、汇交时间、汇交流程等;c.数据存储与保管,如管理方式等;d.数据共享与利用,如使用申请流程、知识产权等;e.监督与保障,如罚则、保密等;f.其他信息,如相关政策法规、政策施行时间等。
与我国政策相比,英、美、澳三个国家的9份科学数据管理政策所含内容则各不相同,主要包含以下模块:a.政策介绍性信息;b.数据计划,三个国家的政策均对研究项目开始之前,研究者在数据生产、使用以及再利用方面的计划制定和提交作出了要求;c.数据收集与汇交;d.数据描述,规定了元数据和著录格式的使用;e.数据共享和利用,注重开放数据的获取途径以及获取权限的说明和解释,并列举了数据共享和利用过程中可能产生的具体问题实例和解决方案。
可以发现政策介绍性信息模块、数据收集与汇交模块以及数据共享与利用模块在四国政策中均得以体现,但具体内容的侧重点有所不同。我国的政策重点关注数据汇交、数据保管以及数据共享与利用三个环节,这在半数以上的政策中都有所体现,但普遍缺少了数据计划和数据描述的内容模块。数据计划不仅有利于对交叉学科中包含的多个学科的多种类数据进行统一规划和管理,还可以协调不同领域的研究人员之间的协作,统一的元数据则是实现数据能够跨越学科开放和共享的必要条件,因此这两部分内容在交叉学科领域的科学数据管理中亟待补充。此外,与我国注重强调权责明确以及对违规行为的处罚相比,英、美、澳三国的政策在责任与分工内容模块则略显薄弱。
交叉学科的科学数据管理工作一方面依循科学数据自身发展的普遍规律,如数据生命周期理论,而另一方面由于其自身的独特性,在管理实践方面也体现出了更高要求。因此,基于学科交叉性特征,笔者依据上文构建的内容框架模型进一步提炼出交叉学科科学数据管理的要点,以加强对重点环节的关注(见图2)。
图2 交叉学科科学数据管理及政策制定指导模型
在交叉学科科学数据管理政策内容框架的基础上,从数据生命周期视角出发,可以将科学数据管理政策需要制定的内容分成“研究计划与方案、数据创建与收集,数据描述,数据存储与保管,数据共享与利用,数据归档,数据共享与再利用”7个重要阶段,并进一步明确各个阶段以及其他环节的工作侧重点,从而形成科学数据管理及政策制定指导模型。与内容框架不同,政策指导模型是在科学数据管理内容的基础上进一步明确各数据管理阶段的工作重心,强调数据管理以及政策制定各环节的难点和关键任务,意在促进科学数据管理政策的有效制定并落实。
根据交叉学科科学数据管理及政策制定指导模型,结合数据生命周期视角笔者提出以下建议:
a.具体的交叉学科科学数据管理政策制定和实施前,需要对涉及的交叉学科及其子学科进行权威的调研划定。如规划出初步的学科范围和学科边界,并在合理科学的条件下,对交叉学科未来的走向进行预测。其目的是确保交叉学科的认定具有学界承认的认同效力,有助于保证政策推行的公信力。其次,合理划归交叉学科的范畴,能够明确交叉学科发展的广度和深度,有利于确认政策制定,颁行的必要性以及权责划分。
b.交叉学科科学数据管理需要围绕数据生命周期,关注数据管理核心流程,从整体上对参与行为主体进行科学规范和指导。以数据生命周期为视角管理科学数据流的方法已应用于多个领域[44]。无论是传统学科还是新兴交叉学科,科学数据管理政策的制定都关注整个科学数据流,从宏观角度分析科学数据管理的关键活动节点,包括从数据产生、收集、管理、分享到利用等各个方面;并且重视以上各活动的前后衔接关系,以确保科学数据管理的一致性和连贯性。根据政策指导模型,数据生命周期视角的科学数据管理流程包括:研究计划与方案、数据创建与收集、数据描述、数据存储与保管、数据共享与利用、数据归档、数据共享与再利用7个阶段。针对我国目前政策现状,科学数据管理政策制定过程中需要树立科学数据管理全局观念,认识这7个阶段的实践现状,了解各阶段政策制定的核心任务,并做出针对性改进。
c.交叉学科科学数据管理早期需要重视数据计划的制定。根据我国与英、美、澳三国地理学科科学数据管理政策内容的对比分析,我国地理科学数据管理政策普遍缺乏完整的数据计划板块。制定完善、合理、有效的数据计划对整个科学数据管理工作具有全局指导意义,因此要置于首要地位。在我国政策制定前,需要相关人员进行合理规划,有效界定和辨识需要收集的数据及数据产品的范围和特征,并需要各个主体根据规划对自身和彼此之间的科研进度进行实时反馈和调整。在我国政策制定与执行过程中,还需要不断与数据计划进行对比,确保政策方向不变,符合最初规划目标。
d.交叉学科科学数据管理需要重视“源头”工作,即数据创建与收集工作。英美澳中四国的科学数据管理政策文本都极其重视数据收集与汇交工作,尤其是国内政策将数据汇交视为科学数据管理工作的核心环节。在科学数据生命周期中,数据收集任务是重要的起点。政策制定需要明确数据收集的流程,确保数据格式一致性和内容完整性,尽可能采用统一规范化的收集方法和工具。一些收集工作数据量大、收集流程繁琐,这就需要寻找最优收集方法,提高收集效率。此外,在此过程中需要注意把控数据质量。政策应当对收集范围、收集流程、收集行为规范等做出明确质量控制要求。
e.交叉科学科学数据管理在数据描述阶段需要加强对元数据方案设计、选择和使用的规范。根据上文分析,目前国内地理学科科学数据管理部分政策缺乏数据描述要求,这影响了科学数据的互操作性、规范性和通用性,增加了管理难度。从政策指导模型来看,数据描述阶段的重点任务是元数据标准制定的选择与使用。元数据作为描述数据的重要工具,对于数据存储、数据检索和数据利用等有着重要的意义和作用[45-46]。交叉学科科学数据类型多样、意义复杂、专业化程度较高,有时因为学科知识体系差异而造成数据格式、计量标准不统一问题。因此,在我国政策制定过程中需要选择合适的元数据标准规范,它既要尽可能与当前普遍采用的元数据标准相统一,又要考虑交叉学科的现实需要,着重提高多学科的数据通用性。在政策具体落实过程中,也要确保元数据格式统一,标准一致,切实提升科学数据规范性。
f.交叉学科需要分类管理,科学数据管理同样需要对数据类型进行详细的划分和解释,即重视数据的分类管理。在科学数据政策制定指导模型中,数据存储与保管核心任务之一是对数据类型进行细分。对比中外科学数据管理政策内容,英美澳等国家政策中数据保管方面涉及较少,而国内则对数据的保管期限、保管类型、数据安全责任进行明确界定,这有助于提高数据的逻辑性与规范性,确保数据质量和安全。交叉学科研究过程中往往会产生许多不同的数据类型,例如在地理学科中按数据格式可以划分为数字、图像、音频和视频等类型,按照学科来源可以划分为气象数据、海洋数据、地质数据和人文数据等。为了使生产、管理与使用数据的主体更加充分地了解不同类型数据的属性及管理方法,我国制定政策时应解释不同类型数据的特点和差异化管理思路,以便数据得到更好的管理和利用。
g.交叉学科科学数据管理对各参与主体的管理能力培训提出了更高要求。交叉学科往往意味着新学科的产生以及老学科的碰撞融合,会引发科研人员或者数据管理人员一定程度的陌生感和无助感。研究者在保存、提供科学数据的过程中缺乏充分的指导和支持是交叉学科科学数据管理所面临的重要问题之一[47]。英、美、澳三国的地理学科数据管理政策尽管内容上各有侧重,但都包含了与科学数据管理技能培训相关的内容,在这方面,我国的政策规定仍有所欠缺。因此,我国未来交叉学科的数据管理政策需要规范科学数据管理的基本知识和技能培训工作,指出管理培训的目标与重点任务。科学数据管理政策指导模型为培训体系构建提供了思路,数据生命周期视角贯穿科学数据流的全过程,每一过程都有不同的工作任务,这些任务对于相关工作人员提出专业要求,而这些专业要求正是管理培训的方向与重心。
h.交叉学科科学数据管理的全过程均需要明确各方的权责划分。英美澳等国家的政策在责任与分工模块略显薄弱,相比之下,我国更加强调权责分明以及违规必罚。政策整体落实的有效性相对较好。根据交叉学科科学数据管理政策内容框架和指导模型,在政策制定方面,每一个环节和模块都有侧重点和核心工作要务。这些工作通常需要不同专业人员负责,不同专业人员的工作内容经常交叉,给科学数据管理带来不便。为避免因主体众多而导致的权责不清、责任推诿、效率低下等问题,我国政策制定过程中需要明确各主体权责,建立良好的协作关系。譬如邀请第三方对项目各个阶段的科学数据管理行为进行公证和监督,或要求科研团队有专门的成员负责整个流程中涉及科学数据管理的相关事宜。此外,也可以通过培训增进工作人员的责任意识。
近年来,科学数据管理政策这一话题受到了越来越多学者的关注,相关理论和实践也在不断走向成熟。与前人所做研究相比,本研究基于具体学科背景下科学数据自身性质与特点,立足地理学这一重要交叉学科,深入分析中、英、美、澳四个国家的科学数据管理政策内容,并从数据生命周期的视角出发,吸收国外政策优势并结合国内政策特点,构建了相对全面和完善的交叉学科科学数据管理政策内容框架模型以及交叉学科科学数据管理指导模型。以上两个模型充分考虑了交叉学科的学科特点和数据特点,对交叉学科的科学数据管理及相关政策的制定和完善具有较为普适的指导意义,以期借此可以启发学界突破科学数据管理政策中的单一学科限制,充分应对交叉学科这一未来科学发展趋势的挑战。