嵌入生命周期理论的科学数据管理体系构建研究

2020-10-20 05:57储节旺夏莉
现代情报 2020年10期
关键词:牛津大学生命周期

储节旺 夏莉

摘  要:[目的/意义]通过构建数据生命周期模型,进一步构建科学数据管理体系,为我国科学数据管理提供理论基础。[方法/过程]在总结科学数据特征和分析当前存在挑战的基础上,采用文献调研法和案例分析法,总结科学数据生命周期模型。[结果/结论]构建科学数据管理体系,结合实际提出3点对策:科学数据管理的政策细分、科学数据生命周期的阶段性规划和明确责任主体的数据素养与责任。

关键词:科学数据管理;生命周期;数据管理体系;牛津大学

DOI:10.3969/j.issn.1008-0821.2020.10.004

〔中图分类号〕G203  〔文献标识码〕A  〔文章编号〕1008-0821(2020)10-0034-09

Research on Scientific Dta Management Construction

Based on Life Cycle Theory

Chu Jiewang  Xia Li*

(School of Management,Anhui University,Hefei 230601,China)

Abstract:[Purpose/Significance]By building a data life cycle model,a scientific data management system is further constructed to provide a theoretical basis for scientific data management in China.[Method/Process]On the basis of summarizing the characteristics of scientific data and analyzing the current challenges,the literature survey method and case study method were used to summarize the scientific data life cycle model.[Result/Conclusion]Constructed a scientific data management system and put forward three countermeasures in accordance with the actual situation:Scientific data management policy segmentation,phased planning of scientific data life cycle,and clear data literacy and responsibility of responsible subjects.

Key words:scientific data management;life cycle;data management system;university of Oxford

伴随互联网和信息化技术的发展,社会信息呈指数形式增长,数据成为科学研究活动的新型基础要素。随着科学研究范式的演进,传统的假设驱动转为向基于科学数据进行探索的科学方法,即数据密集型科学——第四范式[1]。科学活动不再以科研结果为唯一目标,对科学数据的整合分析、存储传播和共享利用能够产生新的学术价值,为科学人员的探索研究提供新方法和新思路。

2018年3月,国务院发布《科学数据管理办法》,明确提出我国科学数据管理在数据采集、数据保存、数据共享和数据保密安全等方面的主要内容与相关要求。当前的科學数据管理研究主题集中在国内外科学数据管理实践调研、管理过程中的影响因素研究和相关政策解读三大方面。在科学数据管理实践调研与分析中,主要是通过对比国内外科学数据管理平台建设[2]及其实践经验[3]为我国科学数据管理提供借鉴。科学数据管理效率受数据文化、数据素养的影响[4],在提高科学数据管理知识的普及率和安全意识的同时增强科学数据管理技能,能够有效实现数据素养与数据服务共同驱动[5]。在进行优化科学数据管理流程时,要将管理成本[6]、数据评价[7]、需求识别[8]等要素作为主要考虑因素。对《科学数据管理办法》及其相关政策的解读是一大研究热点,邢文明等从科学数据管理体系的二维视角出发,分别从管理的角度和生命周期的角度明确科学数据管理中的主要任务责任主体的分工[9],张洋等[10]、魏悦等[11]从生命周期理论出发,对《科学数据管理办法》和图书馆服务创新进行研究。尽管近年来国内学者对科学数据管理的研究已经有了进一步深入和泛化,但从系统性的角度出发,当前科研中的成果较为分散,研究视角较窄,对于科学数据管理的可持续发展缺乏全局推动力。数据生命周期理论作为数据管理的重要理论,强调数据的流动性和生命性,对科学数据管理意义极大。因此,本文以生命周期理论为支撑,构建完善系统的科学数据管理体系,充分考虑数据流动的各个环节,力求在科学管理上发挥战略性的引领作用。

1  数据生命周期理论模型

科学数据的生命周期管理以数据的生命周期理论为基础,通过细化数据流动中的各个环节及各环节之间的关系形成循环进化的系统[12],为科学数据的采集、增值、长期保存以及共享利用等多个方面提供选择评价和优化策略。

但从经济的角度上看,科学数据是有限的,科学数据管理目标就是实现科学数据资源价值的最大化,减少数据在生命周期各个环节的管理成本消耗。通过数据生命周期管理,可以对科学数据实行规范有效的整合和利用,协助管理者做好数据规划,以处理数据流动各环节的问题[13]。

对科学数据生命周期的研究,是我国处于科学数据管理探索阶段的重点内容。通过文献调研和网络检索发现,国际上比较典型的科学数据生命周期模型主要有DCC(Digital Curation Center)模型、DataONE(DataONE Date Lifecycle)模型、UKDA(UK Date Archive)模型、DDI(Date Documentation Initiative)模型、USGS(US Geological Survey)模型、ICPSR(Inter-University Consortium for Political and Social Research)模型等。这些模型能够为不同类型的科学数据服务,如社会经济研究数据、环境科学数据、社会科学数据等。通过研究不同生命周期理论,能够有效综合构建符合我国发展现状的科学数据管理模型,实现数据管理的本土化。国外科学数据生命周期大部分由科学数据管理机构提出,如ICPSR(美国高校校际政治与社会研究联盟)由密歇根大学1962年创建、由埃塞克斯大学于1967年成立的UKDAE(英国国家数据档案中心)等(见表1)。在我国也成立了一些科学数据管理机构,用于执行高校社科数据管理功能。如北京大学2006年建立的ISSS(中国社会科学调查中心)、清华大学和国家统计局合作建立的CDC(中国经济社会数据研究中心)以及同年在中国人民大学创建的NSRC(中国调查与数据中心)等。此外,还有部分学者以不同的学科领域数据为对象提出的数据生命周期模型(如表1所示)。

通过对国内外部分典型数据生命周期的对比,可以发现多个生命周期模型均包含数据收集、数据处理、数据利用等核心环节,而针对不同数据类型各个模型存在差异。例如:DCC数据生命周期模型和DDI生命周期模型相比增加了数据描述表示和社区观察的环节,DDI模型主要多出数据分配、数据发现、数据再利用等环节。基于核心环节和科学数据所呈现出的创建过程系统性、组织过程生命周期性、数据资源的积累性[20]等特征,笔者将科学数据生命周期模型划分为数据收集、数据处理、数据保存、数据共享、数据分析、数据再利用几个环节,构造一个封闭的科学数据生命周期模型,并确定每个阶段的子阶段,以科学数据利用的主体为对象循环,有效收集与数据共享是整个生命周期中最重要的环节,如图1所示。

2  科学数据生命周期管理特征与挑战

科学数据本身所具有的继承性和长期性凸显出对其进行管理的重要性。随着大数据技术的发展,科学数据共享利用的可行性得到提高,但科学数据的跨度宽、数量大、深度广,对这些数据进行收集组织、整合存储、传播再利用是社会科学机构亟需学习的内容。

21  科学数据的生命周期特征

1)科学数据收集的目的性

数据收集过程具有显著的目的性特征,即为数据利用而服务。基于科学数据收集所立足的目的性视角,要精准获取识别科研人员的需求,为不同领域不同学科的用户收集不同类型的科学数据。作为数据生命周期管理的第一个环节,收集目标能为后续的数据流动提供足够的指导。

2)科学数据处理的专业性

科研机构和科研人员是科学数据处理的责任主体,在整个生命周期循环中起着重要作用。科学数据相对而言具有更高的价值性、复杂性,数据读取、数据转换、数据挖掘、数据存档等处理过程要求具备高素质的科研主体参与。因此,在科学数据生命周期的第二个环节呈现出一定的专业技术性。

3)科学数据存储的继承性和变革性

数据始终处于“生老病死”的轮回之中,但在其由“生”到“死”的过程,数据本身所含的价值被不断占用和再生。在科学数据生命周期中,数据以流动的形式经过各个阶段,将数据以某种形式存储在某一载体上,就形成了静态的数据流。但这一静态是相对的,它既会随着数据共享利用而流动,又会随着数據存储的增加或删改而变动。在科学技术飞速发展和学科领域不断扩展的时代背景下,科学数据存储不仅表现在量上的变化,还包括数据的质上的积累,当这种积累的量达到一定程度时,就会产生质上的突破,即所谓的变革性。科学数据存储的变革性与继承性是相辅相成的,数据在质的突破中继承,在积累中推进质的突破。

4)科学数据共享的风险性与收益性

科学数据的利用价值高,管理效益明显。纵观各个学科领域,从数学、物理等理工科学,到天文、大气等环境科学,再到医学、农业、工程以及人文等学科,每个领域都能产生具有价值的科学数据。这些数据直接利益者为其所属的科研人员,但从间接利益者的角度出发,每个学科领域的研究者都与其他领域的科学数据存在着深浅不一的利益关系。但科学数据的价值并不总是乐观的,科学数据共享意味着将具有价值的信息处于一个流通的环境中,数据的价值性、使用者的目的性、共享环境的稳定性都会产生一定的数据共享风险。从宏观的角度来说,科学数据的风险与收益是并存的,因此要把握好这一生命周期阶段的管理的度。

5)科学数据分析的效率性

通过数据分析能够发现知识价值,并在这个过程中产生新的科学数据,在这个过程中不仅要评估各种数据类型的价值,同时也进行二次筛选,过滤多余信息。科学数据分析的效率性指的是要以最小的数据管理投入获取最大的价值,通过数据分析进一步提高数据的科学性和精准性,避免在流动循环中需要重复投入时间、精力。这是科学数据分析环节的特征,也是整个数据生命周期管理的意义。

6)科学数据再利用的价值性

没有科学数据的再利用,整个生命周期管理无法形成相对封闭的循环,而再利用的价值高低是科学数据管理效果直观体现。在数据的再利用环节就是将数据流动的可用性充分发挥出来,为需求者的科研活动提供快捷精确的参考。价值性是科研数据再利用的本质属性,也是科研数据投入生命周期管理的最终意义。

22  科学数据生命周期管理的挑战

从创建时间的总体趋势上看,我国科学数据管理机构成立较晚,存在涉及的学科领域窄,数据平台服务单一等问题[22]。但现有研究仅对科学数据管理提出挑战,未立足于生命周期视角审视科学数据管理过程,因此,笔者以生命周期理论为基础,提出现阶段科学数据生命周期管理存在的一些挑战。

221  科学数据价值评估自动化程度低

在数据生命周期管理中,首要问题是如何根据用户(科研机构及其相关人员)需求来赋予科学数据的价值,以及如何根据数据的价值规划服务等级目标。科学数据具有一定的大数据特征,即数据规模大、数据种类多。当前科学数据生命周期管理中,数据与其服务对象的价值评估划分大多是基于元数据的策略划分方法来实现的,但不论是基于知识的划分策略还是基于专家的划分策略,最终离不开科研人员的自主评估。对生命周期管理来说,其主要目标是通过科学数据管理以使数据获得更好的可用性,因此,数据划分的高效率是实现有效科学数据生命周期管理必要手段。同时,科学数据的价值是随着时间的变化而变化的,仅依靠人工化的数据价值评估,难以及时更新科学数据的服务对象,从而导致整个生命周期管理产生滞后的循环。

222  科学数据存储尚未实现标准化

基于生命周期实现对科学数据的管理需要建设一个标准化的存储和服务平台,减少应用配置之间的差异性,并对数据存储类型、存储方式进行标准化处理。科学数据存储是为其应用提供便利的,而科学数据生命周期管理的优点也是通过有效的数据共享利用体现出来的,在数据存储阶段的基础结构建设是推动标准化存储服务的重要力量。科学数据在经过有序化处理后,仍呈现出不同的信息形态,当这些形态的信息缺少统一化的存储工具和介质时,会阻碍科学数据公共价值的高效发挥,降低共享应用的效率,进而削弱数据生命周期管理的作用。

223  科學数据流动循环缺乏规范性

从生命周期的角度来看,任何数据都处于从生成到其价值完全丧失的流动过程,在这个循环过程中,数据是活性的,在每个阶段都具有不同的价值属性。对科学数据的管理,不仅是在生命周期的不同阶段对数据进行处理存储利用,更重要的是建立一定的数据管理环境,保障整个生命流程在前后阶段的顺利转换。要使数据流动保持有序性和高效率,必须依据一定的制度规范和技术引导。从现有的关于科学数据管理研究的文献中可以发现,目前,我国关于科学数据管理的相关政策较少,除国务院印发的《科学数据管理办法》之外,针对不同类型科学数据的分治政策尚未提出[23]。在具体的科学数据管理领域,缺乏相应的管理规范引导,会使科学数据在生命周期内产生较差的流动性,影响其转化增值。

3  牛津大学科学数据生命周期管理案例分析

31  牛津大学科学数据管理探索

2008年,牛津大学为了提高该校科学数据利用的效率和价值,在JISC(英国联合信息系统委员会)和DCC(数字管理中心)的政策指导和技术支持下,联合校内不同部门机构,展开了一系列科学数据管理的相关项目,其中包括“Scoping Digital Repository Services for Research Data Management”的跨部门项目研究[24]。该项目主要通过数据审计方法和对不同机构的数据需求调研方法,实现对当前校内科学数据资源的分类整合。在对科学数据进行管理实践的过程中,牛津大学以数据生命周期理论为基础,启动Damaro等相关需求调研项目,将DCC数据生命周期管理模型与已有的数据需求调研结果和管理工具相结合,构建起基础的数据管理服务框架以映射生命周期内不同阶段的数据流动[25]。

牛津大学根据不同职责为其各个部门匹配了不同的科学数据管理网站和科学数据管理基础设施服务,形成了较为完整的科学数据管理体系。在科学数据管理服务框架中,牛津大学设置了包括数据需求调研、数据发展规划和数据管理实施等3个阶段。通过开展需求项目调研科学数据管理的实践状况,收集不同科研群体对科学数据的需求,根据这些多元需求制定相应发展策略,在策略指导下开发数据管理工具,最终构建面向需求的数据供应集成系统。

32  牛津大学科学数据管理深化

牛津大学将数据生命周期理论与工作流程作为其科学数据管理的指导思想,提出从数据创建到数据存储以及再利用的生命周期管理过程,并数据管理政策和管理工具推动科学数据管理基础设施建设,保障科学数据生命周期的全方位管理。如图2所示。

牛津大学使用DMP Online和DMP Tool等网络工具制定数据管理计划(DMP),借此来管理科学数据,对数据创建、数据准备、数据存储、数据发布、数据共享、数据重用等不同的生命周期阶段所要采取的策略进行描述,从宏观上规划整个科学数据生命周期过程[26]。

科学数据主要产生于科研项目发展过程,在对这些数据进行组织处理之前,它们都处于管理的准备阶段。牛津大学开发出Databank、Datafiner等多种数据管理项目对数据存储和数据发现进行规范化管理,如Datafinder项目通过数据管理计划、原生数据管理、数据的发现定位与数据获取再利用4个模块划分,使该校的科学数据在整个生命周期中都能被有效地存储以及被充分利用其价值。在科学数据的存储阶段,牛津大学主要利用的是ORA-Data存储仓库,用来长期保存校内学者和研究生产生的科学数据[27]。同时,向科研机构提供HFS科学数据备份服务,以保证科学数据的安全存储和定期备份工作的顺利进行。牛津大学非常注重数据的长期保存与共享,现阶段正通过Data Flow项目提供两阶段的数据管理基础架构,为研究人员利用、处理和共享科学数据提供技术支持[28]。科学数据管理旨在将作为资源的科学数据二次开发实现增值再利用,对于完成管理目标的数据或是不符合增值条件的数据,牛津大学采取数据销毁手段,并从机密性和安全性的首要要求出发,维护科学数据管理资助者和合作者的相关利益。为了提高科学数据生命周期管理的规范性和条理性,牛津大学明确权责机制,通过专门的PI(Principal Investigator)负责科学数据管理实践,从而使其校内科学数据得到准确专业的管理引导。

经过近年来的发展,在牛津大学的科学数据管理过程中,长期以数据生命周期理论为指导,使得各阶段的科学数据管理设施服务建设具有规范性和条理性。牛津大学在科研工作中嵌入数据生命周期开展科学活动,为科学数据收集和利用的系统性提供基础。

33  牛津大学科学数据生命周期管理经验总结

牛津大学通过数据生命周期管理方法实现对科学数据的有效整合和再利用,通过生命周期的不同阶段使科学数据流动更具有连贯性和有序性,确保科学数据共享再利用的效率。根据牛津大学科学数据生命周期管理实践,能够从中总结出几点借鉴经验:一是完善技术体系;二是数据生命周期管理;三是资源统筹规划。

牛津大学的科学管理基础服务设施建设围绕不同部门展开,为缺乏管理技术的科研人员提供针对性培训和学习,形成系统的专业化管理体系。为提高科学数据管理质量和效率,牛津大学开发多种科学数据管理项目和管理工具,为其管理服务的基础服务框架提供了有力支撑。因此能够以较高的速度对处于生命周期不同阶段的科学数据进行整合处理,减少数据流动的成本,推动科学数据管理建设。

通过生命周期视角下的循环,科学数据在创建、组织、再利用的流动过程中进行规范化的整合,同时与工作流程紧密结合起来,在生命周期的不同阶段映射科学数据管理建设要素,共同协助科研活动的开展。在流动中使数据管理有序准确,实现科学数据增值活动,将科学数据管理建设向健康的可持续发展的方向引导。

牛津大学在政府机构的相关管理政策、管理技术和管理制度等的支持和保障下,形成稳定的科学数据流动环境,通过嵌入科研项目建设支持科学数据存储共享,使科学数据管理中的资源得到充分利用。在这个过程中,牛津大学设置了主导部门和各个分部门,以主导部门的科学数据管理规划策略为指导,将具体的数据管理任务落实到校内的不同部门,通过各阶段的协同管理,最终实现科学数据管理理论与实踐的结合,提高科学数据管理的科学性和层次性。

4  嵌入生命周期理论的科学数据管理体系构建研究

现有研究为科学数据管理提供了不少思路和新方法,但从总体上看,整个管理过程的系统性和关联性仍需加强。基于对科学数据生命周期模型的归纳,笔者试图结合科学数据的特征及当前所面临的挑战,对基本概念和管理环境进行逻辑关系梳理,构建整个管理过程中的体系框架,为科学数据管理提供理论基础,如图3所示。

41  数据收集

数据收集是指决策者或用户根据需求,采取不同渠道不同方式产生或收集数据的过程。数据管理计划是贯彻科学数据生命周期全流程管理的出发点[29],应在充分考虑用户需求的基础上对数据进行分级发布[30]。科学数据来源广泛,涉及工程学科、医学学科、农业学科、人文社科等多个领域,在生命周期的第一个阶段要做好基础工作,才能使科学数据管理健康发展。科学数据收集应遵循全面性、时效性和准确性。全面性是指面对不同角度的科学数据和成果,要尽可能多渠道多方式收集,避免出现收集到的数据单一化、片面化,不利于科学活动的开展。时效性是指任何科学数据的价值会随着时间空间的变化而变化,要保证收集到的数据仍处于寿命周期内,具有可利用的价值。衡量数据的时效性要同时考虑收集的时间及其所反映的物质状态。在科研活动的全过程中,除了一部分科研成果,还会产生大量的数据,这些数据并不完全是有用的,科研成果也并不总是有用的。因此,准确性要求数据收集时要从质量和数量上考虑,同时结合学科属性,使收集工作高效完成。

42  数据处理

数据处理是指在收集阶段结束后,对数据进行转换、重组、增删等工作,包括内容上、载体上和描述方式上的转换。在这一阶段,数据分析技术、挖掘技术、重组技术等数据管理技术最为核心,使用的范围最深最广。在管理过程中对数据的选择评价能够优化数据资源结构[31],科学数据通常具有多源异构的特征,因此需要配备充足的专业人员,以较高的数据素养推动科学数据有效管理[32]。首先要制定处理标准,对数据的有效范围和可允许的偏差做出界定,使处理过程标准化;其次要选择专门的技术人员,为数据的有效处理组织做好人员匹配工作,使处理过程专业化;最后要制定数据处理计划,借鉴国内外其他科学数据的管理,使数据处理过程效率化。

43  数据保存

数据保存的目的是要将处理完的数据以某种形式存放在一定的物质载体上,以便为以后需要时查找利用。数据存储的集合为数据库(信息库),在进行保存工作,科研工作人员要注意对数据按某一标准进行分类,如按内容分类或按存储手段分类。在数据保存阶段,要同时设置容量扩充和维护更新的功能,科学技术和当下社会变迁的速度使得科学数据的更新、增长速度大大提高,及时剔除无用数据,扩充实时数据是非常有必要的。此时的存储是为一定目标服务的,因此必须明确数据保存用以支持何种目的,同时,要权衡经济是否合算,以实现效率最大化。在数据保存中也要充分考虑数据安全问题,包括版权、知识产权和转存许可方面[11]。

44  数据共享

科学数据共享的积极意义在于向不同需求用户开放数据,以供其他科研活动利用并产生新价值,推动学术交流进步。科学数据共享的风险性和收益性从客观上要求明确责任主体和制定细分政策[33],对于科学数据来说,共享的具体内容仍需扩大,如共享方式、共享时间、共享权限等。数据共享是整个科学数据生命周期的核心,也是科学数据管理的直接目的。通过数据共享能够降低科学活动收集数据、处理数据和验证数据的成本,有利于减少科研过程中的成本投入。但数据共享的本质不在于开放获取,而是数据利用,只有被用户有效获取并产生价值的共享才是具有现实意义的[34]。

45  数据分析

数据分析不同于数据处理,但与数据处理目的相同,都是为了提高数据利用的效率。数据分析侧重于对数据的应用层次和应用环境进行划分,从全局性角度为不同科学研究匹配合适数据,以避免共享利用过程中的混乱和误差。数据分析要使用一定的统计方法,从更深层次对数据中的内容信息进行提取研究,帮助科研人员做出判断。在这个阶段,分析的着眼点是梳理出数据的逻辑和层次,最大化地开发数据的潜在价值。数据分析的意义不仅是描述数据特征和发现新价值,还在于为即将要服务的科学活动提供数据验证。通过使用定性和定量分析方法,对不同类型数据进行多维价值分析,有助于提高科学数据利用的质量。

46  数据再利用

科学数据生命周期的最后一个阶段是数据再利用,但从系统性观点来看,数据再利用同时意味着新的数据生命周期的开始,以此循环往复。再利用的过程实际上就是科学数据增值的过程。科学数据本身是已经实现一次服务的数据,数据的共享开放,能够同时为不同对象提供使用。通过再利用,可以最大程度地提高科学数据的利用效率[10]。在提供数据服务时,要对数据再利用阶段的科研人员进行相关培训,以提高对新数据的判断能力和利用效果的评估能力。

在科学数据管理体系中,要以3个保障为基础,即制度保障、安全防护保障和理论保障。处于科学数据生命周期的管理环境,通过制度保障规范和优化管理流程;通过安全防护避免知识产权和成果的污染;通过理论保障为科研人员提供实践依据。

5  结  语

通过科学数据管理体系框架的提出,对于科学数据管理具有重要的启示意义。但理论需要以实践证实,也要通过实践不断探索以完善理论。根据科学数据管理当前面临的挑战和数据生命周期流程,以及牛津大学科学数据生命周期管理实例,可以对3个方面重点关注:科学数据管理的政策细分、科学数据生命周期的阶段性规划和责任主体的数据素养与责任。

《科学数据管理办法》为科学数据管理提供了较为周密的指导意见,但从实践层面看,仍需将宏观制度向中观、微观层面过渡。目前,高校图书馆是进行科学数据管理的主要机构,不同高校和不同科学数据管理平台存在的内外部环境存在差别,《办法》作为战略性政策,在各机构进行实际科学数据管理时提供的动力不足。因此需要依托当地机构需求、资源、技术等制定详细的指导策略。

数据管理计划成为科学数据管理研究领域中新的关注点,通过统筹规划结合数据生命周期管理有助于进一步提高科学数据管理效率和規范。针对数据流动的不同环节,可以考虑制定阶段性的管理计划,同时考虑各部分管理计划之间的关联,力求实现“1+1>2”的管理目标。

科研机构、科研人员在科学数据管理中承担主要责任者的角色,责任主体的数据素养、安全意识、产权意识和技能掌握等各个方面影响科学数据管理的实践发展。在未来应强调责任主体参与数据管理的核心地位,对责任主体的权利、责任、利益进行明确划分和统一,增强其数据管理素质,是推动科学数据管理向规范化、协同化发展的可行措施。

参考文献

[1]邓仲华,李志芳.科学研究范式的演化——大数据时代的科学研究第四范式[J].情报资料工作,2013,(4):19-23.

[2]卫军朝,张春芳.国内外科学数据管理平台比较研究[J].图书情报知识,2017,(5):97-107.

[3]崔旭,赵希梅,王铮,等.我国科学数据管理平台建设成就、缺失、对策及趋势分析——基于国内外比较视角[J].图书情报工作,2019,63(9):21-30.

[4]沈婷婷.数据素养及其对科学数据管理的影响[J].图书馆论坛,2015,(1):68-73.

[5]朱大丽,介风.从科学数据素养角度剖析国内外高校科学数据管理[J].图书馆学研究,2015,(16):53-59.

[6]卫军朝,李思雪.国外主要科学数据管理成本模型调研与分析[J].图书馆学研究,2019,(22):15-27.

[7]崔旭,韩子鹤,王铮,等.科学数据管理中的数据选择与评价关键要素研究[J].情报理论与实践,2018,41(3):78-82,100.

[8]王丹丹.科学数据管理服务需求识别方法研究[J].大学图书馆学报,2018,(1):41-47.

[9]邢文明,洪芳林,李晓妍.科学数据管理体系的二维视角——《科学数据管理办法》解读[J].图书情报工作,2019,63(23):30-37.

[10]张洋,肖燕珠.生命周期视角下《科学数据管理办法》 解读及其启示[J].图书馆学研究,2019,(15):37-43.

[11]魏悦,刘桂锋.基于数据生命周期的国外高校科学数据管理与共享政策分析[J].情报杂志,2017,36(5):153-158.

[12]Carlson J.The Use of Life Cycle Models in Developing and Supporting Data Services[J].Research Data Management:Practical Strategies for Information Professionals,2014:63-86.

[13]Sinaeepourfard A,Garcia J,Masip-Bruin X,et al.A Comprehensive Scenario Agnostic Data LifeCycle Model for an Efficient Data Complexity Management[C]..2016 IEEE 12th International Conference on e-Science(e-Science).IEEE Computer Society,2016.

[14]Higgins S.The DCC Curation Lifecycle Model[J].International Journal of Digital Curation,2008,3(1):134-140.

[15]DataONE.Data Life Cycle[EB/OL].https://www.dataone.org/data-life-cycle,2019-12-25.

[16]Ball A.Review of Data Management Lifecycle Models[DB/OL].https://purehost.bath.ac.uk/ws/portalfiles/portal/206543/redm1rep120110ab10.pdf,2019-12-25.

[17]Guide to Social Science Data Preparation and Archiving:Introduction[EB/OL].https://www.icpsr.umich.edu/icpsrweb/,2019 -12-25.

[18]JISC[EB/OL].https://www.webarchive.org.uk/wayback/en/archive/20130807174415/http://www.webarchive.org.uk/ukwa/alpha/J/page/6,2020-01-03.

[19]章惠民.福建烟草数据中心报表全生命周期管理模型构建[J].中国烟草学报,2018,24(6):104-109.

[20]孟祥保,钱鹏.数据生命周期视角下人文社会科学数据特征研究[J].图书情报知识,2017,(1):76-88.

[21]黎建辉,沈志宏,孟小峰.科学大数据管理:概念、技术与系统[J].计算机研究与发展,2017,54(2):6-18.

[22]徐妹,馮小英.中外高校社会科学数据管理与服务比较研究[J].图书馆工作与研究,2018,(2):28-35.

[23]张洋,肖燕珠.生命周期视角下《科学数据管理办法》解读及其启示[J].图书馆学研究,2019,(15):37-43.

[24]Luis Martinez-Uribe.Finding of the Scoping Study Interviews and the Research Data Management Workshop[EB/OL].www.ict.ox.ac.uk/odit/projects/digitalrepository/,2020-01-03.

[25]武琳,林明春.牛津大学科学数据管理经验与启示[J].图书馆学研究,2015,(24):48-53.

[26]杨云秀,顾立平,张瑶,等.国外科研教育机构数据政策的调研与分析——以英国10所高校为例[J].图书情报工作,2015,59(5):53-59.

[27]The University of Oxford.Tools,Services and Training[EB/OL].http://researchdata.ox.ac.uk/home/tools-and-resources/,2020-01-07.

[28]Oxford E-Research Centre[EB/OL].http://www.oerc.ox.ac.uk/,2020-01-07.

[29]刘琼,刘桂锋.高校图书馆科学数据管理计划服务框架构建与解析[J]国家图书馆学刊,2019,(4):21-31.

[30]赖剑菲,洪正国.对高校科学数据管理平台建设的建议[J].图书情报工作,2013,57(6):23-27.

[31]崔旭,韩子鹤,王铮,等.科学数据管理中的数据选择与评价关键要素研究[J].情报理论与实践,2018,41(3):78-82.

[32]张艳梅.用户数据素养教育视角下的图书馆科学数据管理研究[J].图书与情报,2015,(4):139-142.

[33]刘莉,刘文云,刘建,等.英国科研数据管理与共享政策研究[J].情报资料工作,2019,40(5):46-53.

[34]黄静,周锐.基于信息生命周期管理理论的政府数据治理框架构建研究[J].电子政务,2019,(9):85-95.

(责任编辑:陈  媛)

猜你喜欢
牛津大学生命周期
Don’t Show Off In Public
从生命周期视角看并购保险
民用飞机全生命周期KPI的研究与应用
企业生命周期及其管理
千年等一回!牛津大学女生录取人数首超男生
近代印度学体系中的牛津大学佛教研究
牛津大学为何不办校庆
覆盖整个生命周期的威胁防护解决方案
“以学生为中心”——牛津大学本科生导师制的一个质量保障因素
全方位全生命周期项目管理浅谈