科研项目不同阶段的科学数据监管方法

2013-08-15 00:42沈婷婷卢志国上海大学图书馆上海200444
图书馆建设 2013年3期
关键词:科研项目科研人员监管

沈婷婷 卢志国 (上海大学图书馆 上海 200444)

随着科学技术的迅猛发展,科学数据的管理与共享问题也引起学者越来越多的关注。科技部原部长徐冠华院士曾说过:“科研是群体性的活动,数据是最重要的基础,开展科学数据共享的重要性丝毫不亚于发表学术论文。”[1]然而,目前我国对于高校科研项目产生的科学数据缺乏管理,这些数据往往由科研人员自行保存,大部分数据资料无法共享,长期处于闲置状态。

数据监管( Data Curation )是近年来国外高校对本机构的科学数据提出的管理方法,它是对科学数据收集、组织、查证和保存,并使科研人员在以后的研究中发现这些数据的新价值[2]。英国联合信息系统委员会( Joint Information Systems Committee,简称JISC )对其的解释是:为确保数据当前使用目的,并能用于未来再发现及再利用,从数据产生伊始即对其进行管理和完善的活动[3-4]。对于动态数据集而言,这意味着需要进行持续性补充和更新,以使数据符合用户需求[3-4]。

科学研究是不断创新、不断进步的过程,科学数据也随研究的进展而不断更新。因而,与一般的数据保存相比,科学数据监管更强调动态性,它不仅简单地保存数据,更需要不断完善数据,使其能供以后的科研人员使用。

笔者曾对我国高校开展的科学数据监管服务进行了讨论[5],并初步探讨其服务模式,提出了基于科研项目的数据监管模式[6]。本文将对此模式进一步研究,分析科研项目不同阶段的科学数据监管方法。笔者建议,图书馆员应深入科研过程,为科研人员提供个性化的数据监管服务。本文介绍了国内外科学数据的监管情况,分析了当前高校科学数据具有的多学科化、多样化和大量化等特点,提出了科研项目在立项前、项目进行中、结项后3个不同阶段的高校科学数据监管方法,探讨了科学数据收集方法及公开方式。

1 国内外数据监管研究现状

近些年,国外对数据监管采取了一系列的措施,包括政府投入大量资金支持科学数据的长期积累、高效流动和低成本使用,并颁布了一系列有关科学数据共享的政策法规,从法律、政策等多方面保障科学数据的管理与共享服务。美国国家科学基金会(National Science Foundation,简称NSF)要求研究人员对由资助项目所产生的数据需要提交数据管理计划[7]。澳大利亚政府成立了澳大利亚国家数据服务(Australian National Data Service,简称ANDS)合作中心,为科学数据的管理提供专业服务[8]。JISC资助建立了数字监管中心(Digital Curation Centre,简称DCC),以促进数字资源的管理工作[9]。

国际上很多著名的高校图书馆已经开始关注高校科学数据监管的问题,并为高校科研人员开展了相关服务。例如,约翰·霍普金斯大学图书馆、康奈尔大学图书馆、加利福尼亚大学图书馆等加入了由美国国家科学基金会DataNet计划资助的相关项目,以实现高校科学数据的监管;普渡大学图书馆和伊利诺伊大学图书馆与信息科学研究生院共同主持的数据监管项目(Data Curation Profiles)旨在研究科学数据的具体监管内容和方式[10];康奈尔大学图书馆开展的数据仓库项目(DataStaR)支持本机构的科学数据共享,为科研工作提供协作[11]。

此外,一些国外学者对高校科学数据监管也进行了研究。Loenen等总结了科学数据的开放原则[12];Walters以佐治亚理工学院为例,通过介绍该校数据监管计划,建立了数据监管模型[13];康奈尔大学图书馆数字工作小组的研究报告论述了全球数据监管的发展环境,为该馆开展相关服务提出了5个方面的建议[14]。

对于由中国科学院等单位负责的一些超大型研究项目,我国也非常注重数据监管。1994年,中国科学院地学部以咨询建议的方式呼吁打破地球科学和资源环境科学数据壁垒,实现数据共享,得到了时任国务委员的宋健院士和原国家科学技术委员会的重视。黄鼎成[15]、孙九林[16]、刘闯[17]等学者也分别发文,探讨我国的科学数据共享的理论机制等问题。

虽然我国高校尚未系统开展科学数据监管服务,但一些学者已经开始关注,其理论研究处于起步阶段。2012年,在第六届上海国际图书馆论坛上,上海图书馆副馆长刘炜在“大数据时代的图书馆”的报告中指出,科学数据管理的研究将会成为大数据时代的重要研究方向之一。其他相关的文献主要有,师荣华和刘细文推演出e-Science环境下图书馆可以尝试开展的科学数据服务方式,并分析了相关案例[18];杨鹤林介绍了美国高校图书馆对科学数据监护的研究和实践情况[4];钱鹏和郑建明探讨了高校科学数据的采集、管理,提出与科学文献整合的学科服务[19];程莲娟介绍了美国高校图书馆的数据监护规划和发展策略以及其协作与教育情况,并提出培养人才,完善高校图书馆数字资源长期保存机制等启示[20]。

2 高校科学数据的特点

本文所讨论的数据是指任何以数字化形式存储的内容,包括文本、数字、图像、视频、音频、软件、算法、动画、模型等。在科学活动中,这些数据可以通过观察、计算或者实验等方式获得。

首先,由于高校学科类别繁多,涉及文、理、工、商、法等学科,每个学科千差万别,各学科产生的数据内容也有天壤之别。而且,由于学科、专业的交叉越来越频繁,新学科不断出现,数据间的逻辑关系非常复杂,增加了数据分类的难度。

其次,由于各学科的科学数据有很大差异,数据形式和储存方法多种多样。其形式除了常见的数字、文字、图像外,还包括语音、影像等各种多媒体形式,储存方式包括不同的数据库格式、不同的电子文件格式及不同的科学仪器产生的专有格式等。

第三,由于人力、物力、财力资源的限制,高校科学研究往往无法达到庞大的研究规模,每个学科产生的科学数据量也相对较少。但是由于高校学科种类繁多,各学科的数据总量仍很大。因而与大型项目科学数据共享相比,更需要考虑哪些数据需要保存、如何保存等问题。

3 高校数据监管的服务模式

根据高校科学数据的特点,本文将探讨基于科研项目的高校数据监管计划,即以科研项目为单位,按项目名称存储科学数据,在原有机构库的基础上搭建科学数据平台。按项目分类可以很好地处理多学科数据的存储问题。

近年来,高校图书馆对数字资源的管理、共享等方面的实践使其有能力为高校科研人员提供数据监管服务。图书馆员从科研项目立项之初就主动进入项目组,从科研项目的调研、开展具体研究到结题,提供全程的科学数据跟踪式服务,这样不仅能节约科研人员管理数据的时间,而且还能收集到高质量的科学数据,为以后的科学数据再利用奠定基础。

此外,本文所讨论的科研项目不包含保密项目,对涉及国家安全、具有重要军事应用价值或者国家重要战略资源的数据不在本文的讨论范围内。

在科研项目立项前,高校图书馆可以提供数据搜索分析服务,增强现有数据的使用价值,促进学术交流。图书馆平时要密切留意重要的学科数据库的发展动态。例如,高校图书馆加强对学科数据库的收集,整理、分析和跟踪学科数据库,并对学科数据库进行评估、推介、导航服务[21]。对于科研人员的数据需求,图书馆可以通过现有数据库帮助他们搜索,并对相关的科学数据进行评价、分类和整理,使他们能够方便、快速地查找到所需的数据资源。图书馆员可以借助数据挖掘工具对收集到的数据进行分析,为科研人员提供加工提炼的信息。科研人员收到数据后,可以对数据内容进行评价,并判断数据是否符合自己的使用要求。图书馆可以根据反馈建议,不断调整数据存储内容,评估哪些数据需要长期保存并优化长期保存计划。而对于数据提供者,图书馆可以定期通知其数据的下载数量,让他们了解自己提供的数据在什么时候、多大程度上被利用。同时将用户对数据的评价反馈给数据提供者,以促进数据提供者与用户之间的学术交流,活跃学术氛围。

科研项目研究过程产生的需要不断更新且未发表的科学数据不易完全公布。高校图书馆可以先提供数据存储服务,指定学科馆员帮助科研人员存储研究过程中产生的数据,并及时更新。或者图书馆允许科研人员自行存储数据,图书馆员可以指导他们规范地存储并定期提醒其更新平台上的数据。这就要求科研人员对提交的数据标注名称、类型,并进行简单描述(包括获取数据的时间、地点、方式等信息),对于部分数据,还需要提交实验设备和实验过程简述。对于已存储的科学数据,图书馆要界定数据的保密范围,合理划分密级。对于平台上的数据,图书馆应允许用户查询其标题、作者、摘要等信息,但不开放数据的具体内容。如果已存储的数据需要在课题组成员或本校人员之间共享,那么由数据提交者向图书馆提供共享者名单,图书馆根据名单开放数据查阅权限。至于已存储的数据是否需要长期保存,则要根据不同学科数据的使用情况而定。例如,康奈尔大学图书馆提供的DataStaR服务就允许研究人员自行上传数据,对初始数据可以调整甚至删除,并自行设定他人访问数据权限,而图书馆员则帮助他们创建元数据并整理数据,与他们一起商讨需要公开的数据等[22]。

科研人员在项目结题时通常会创造大量有价值的科学数据,此时高校图书馆主要提供数据共享服务。图书馆可以先公开已发表的学术论文涉及的各类相关科学数据。学科馆员应与科研人员交流,确定最终的数据版本,帮助他们完成相关数据的提交,包括数据整理、格式转换等。如果这些数据已保存在数据库里,则只需要调整相应的访问权限。如果该学科拥有使用范围更广的学科数据库,那么图书馆员可以协助科研人员把整理好的数据提交到学科数据库中。对于未发表的数据,图书馆根据不同学科,可以在数据保存一定年限后予以公开。对于科研项目结题后产生的、与该科研项目相关的数据,图书馆也要保存。图书馆员要定期与科研项目负责人联系,确保及时更新数据库中的数据,并与科研人员协商,确定数据开放范围。对于这些数据的长期保存问题,需要通过后期的专业评估而定。

每位科学家都有权利享用国有科学数据资源,更有义务提供由国家投入而产生的科学数据和成果并为社会共享。当然,由于我国目前尚未规定对高校科学数据进行管理,以上方案的实施还需要得到科研人员的大力支持。因此,高校图书馆可以先与对数据监管服务感兴趣的院系或者科研人员开展合作。

4 结 语

高校图书馆一直都是高校文献保障体系的主体,是科研人员获得信息服务和知识服务的重要场所。因而,图书馆有必要、有能力、也有义务为高校科学数据监管服务做出贡献。高校图书馆应根据科研人员的数据需求,组织专业化的服务团队,深入到科研人员的科研项目中去,满足科研人员对数据服务的个性化需求。

[1]科学数据共享工作应该受到尊重和支持 :徐冠华院士访问地球系统科学信息共享中心[EB/OL]. [2012-10-09]. http://www.cws.net.cn/CWSNews_View.asp?CWSNewsID=32356.

[2]Choudury S.Data Curation:An Ecological Perspective.College &Research Libraries News[J].2010,71(4):194-196.

[3]Lord P,Macdonald A,Lyon L,et al.From Data Deluge to Data Curation[C].Proceedings of the 3rd U.K.E-Science All Hands Meeting,EPSRC:Swidon,2004:371-375.

[4]杨鹤林.数据监护:美国高校图书馆的新探索[J].大学图书馆学报,2011(2):18-21,41.

[5]沈婷婷,卢志国.数据监管在我国高校图书馆的应用展望[J].图书情报工作,2012,56(7):54-57,87.

[6]沈婷婷,卢志国.基于科研项目的高校科学数据监管[G]//智慧城市与图书馆服务.第六届上海国际图书馆论坛论文集.上海:上海科学技术文献出版社,2012:114-117.

[7]Cyberinfrastructure Vision for 21st Century Discovery[EB/OL].[2012-03-08].http://www.nsf.gov/pubs/2007/nsf0728/index.jsp.

[8]Towards the Australian Data Commons[EB/OL].[2012-03-08].http://www.pfc.org.au/pub/Main/Data/TowardstheAustralian DataCommons.pdf.

[9]Digital Curation Centre[EB/OL].[2012-03-08].http://www.dcc.ac.uk/.[10]Data Curation Profiles[EB/OL].[2011-10-09].http://www4.lib.purdue.edu/dcp/overview.

[11]Gold A. Data Curation and Libraries:Short-Term Developments,Long-Term Prospects[EB/OL].[2011-10-06].http://works.bepress.com/agold01/9/.

[12]Loenen B V, Onsrud H J. Geographic Data for Academic Research:Assessing Access Policies[J].Cartography and geographic information science,2004,30(1): 3-17.

[13]Walters T O. Data Curation Program Development in U.S.Universities:The Georgia Institute of Technology Example[J].The International Journal of Digital Curation,2009,4(3): 83-92.

[14]Steinhart G,Saylor J,McCue J,et al.Digital Research Data Curation:Overview of Issues,Current Activities,and Opportunities for the Cornell University Library[R].New York,The CUL Data Working Group,2008:1-49.

[15]黄鼎成.科学数据共享的理论基础与共享机制[J].中国基础科学,2003(2):22-27.

[16]刘润达,孙九林,廖顺宝.科学数据共享中数据授权问题初探[J].情报杂志,2010,29(12):15-18.

[17]王正兴,刘 闯.科学数据可持续共享:关键是利益的均衡[J].中国科技论坛,2005 (6):92- 96.

[18]师荣华,刘细文.基于数据生命周期的图书馆科学数据服务研究[J].图书情报工作,2011,55(1):39-42.

[19]钱 鹏,郑建明.高校科学数据组织与服务初探[J].情报理论与实践,2011,34(2):27-29.

[20]程莲娟.美国高校图书馆数据监护的实践及其启示[J].图书馆杂志,2012,31(1):76-78.

[21]王学勤,Stout A,Silver H.建立数据驱动的E-Science图书馆服务:机遇和挑战[J].图书情报工作,2011,55(13): 80-83.

[22]Steinhart G. DataStaR:An Institutional Approach to Research Data Curation[J].IASSIST Quarterly,2007(3-4): 34-39.

猜你喜欢
科研项目科研人员监管
科技部等五部门联合发文开展减轻青年科研人员负担专项行动
我校横向科研项目再创佳绩
科研人员揭示油桃果实表皮不长毛的奥秘
科研人员破译黑猪肉特征风味物质
围绕科研项目建立定密管理框架的探讨
航天科研项目评审工作的思考与探索实践
综合监管=兜底的网?
企业科研人员激励问题及对策研究
监管和扶持并行
放开价格后的监管