黄如花 王 斌 周志峰
(1.武汉大学信息资源研究中心 湖北武汉 430072;2.武汉大学信息管理学院 湖北武汉 430072)
在数字化科研和大数据背景下,全球科学研究将越来越依赖于海量数据的共享与利用,科学数据已成为重要的科学资产和公共信息资源。科学数据也是联合国教科文组织(The United Nations Educational, Scientific and Cultural Organization,简称UNESCO)界定的三种开放存取信息资源(科学出版物、教育资源、科学数据)之一,〔1〕近年来国际上对其关注热度已超过另外两种。
为加快数据驱动的创新与发现,2013年3月全球研究数据联盟(Research Data Alliance, 简称 RDA)得以组建;〔2〕9 月在意大利阿纳尼召开科学数据共享的跨学科研讨会(Scientific Data Sharing: An Interdisciplinary Workshop)。〔3〕美、英等国相继启动了有关倡议与计划。进入新世纪以来,我国在国家和地方层面开展了一系列科学数据共享的项目建设,但尚存在诸多亟待解决的问题。鉴于此,本文拟提出有关对策,祈能促进我国科学数据共享及其增值利用。
科学数据是一种重要的战略性资源,是支持国家科技长期可持续创新发展的重要信息保障,在建设创新型国家过程中发挥着至关重要的作用。科学数据不仅是科技创新、经济发展和国家安全的重要战略资源,也是政府部门制定政策、进行科学决策的重要依据。实施科学数据共享工程,对于增强我国科技创新能力,提高科技整体水平,促进社会和经济发展具有十分重要的意义。
科学数据管理在我国科技发展中的基础性和引导性的战略地位不容忽视。可以说,科学数据管理是我国参与国际科技竞争的重要支撑条件和基础保障,只有将科学数据管理工作上升和融合到国家战略中去,资金投入、政策法规完善、技术标准建立、专业人才队伍建设、组织保障等各个方面才能在国家层面获得系统安排、统筹规划。
我国几个综合性的战略规划已经把科学数据作为科技基础性资源,如:《国家中长期科技发展规划纲要(2006-2020)》〔4〕、《国家“十二五”科学和技术发展规划》〔5〕提出要加强科学数据开放、整合与共享,构建集中与分散相结合的国家科学数据中心群,形成国家科学数据分级分类共享服务体系;启动了科学数据共享工程,并将其作为国家科技创新体系建设的重要内容和科技发展基础条件大平台的重要组成部分。但是,与科学数据直接相关的专门性战略规划仍是空白。2012年12月30日,中国科学院院长白春礼院士在“中国科学与人文论坛”上呼吁制定国家大数据战略,希望能通过国家顶层规划,整合创新资源,制定支持政策和行业标准,构建大数据良性生态环境。〔6〕2013年12月12日,在第十届国家信息化专家论坛上,专家委副主任、中国互联网协会理事长邬贺铨院士提出需要制定国家大数据发展战略。〔7〕因此,科学数据管理与共享还有待于国家最高决策层从国家发展的战略高度进行规划和组织,协同多部门、多学科、多单位推进。
在整个科研和学术交流体系中,科研人员既是科学数据管理的实施主体,也是科学数据的接收和利用者。只有科研人员在科研过程中形成了科学数据管理的意识,才能真正树立科学数据管理与共享的战略地位。
美国多个国家级研究机构对科研人员的科学数据管理提出了要求。2009年,NAS(美国国家科学院)指出科学数据监护是科研人员必须面对的长期任务,同时,数据驱动的科研也提升了科研人员自身对数据管理和利用的能力。〔8〕欧美等发达国家通过政策法规或科研资助机构,要求科研人员将研究数据进行开放共享,科研人员也受益于开放的数据。在这种良性的发展中,科研人员普遍具有较好的科学数据管理与共享的意识和素质。
根据武汉大学图书馆的调查,我国高校科学数据管理已起步,科研人员具备了一定的科学数据素养,但仍需增强科学数据管理意识。〔9〕当然,科研人员科学数据管理意识的形成,并不是单纯靠其对科学数据重要性的认识,还需要相关法规、科研资助机构的政策约束,在科研共同体中形成科学数据管理与共享的氛围。
科学数据的管理与共享需要加强国际协调与交流,目前世界上已有一些国际性的科学数据合作组织和计划,如:国际科技数据委员会(The Committee on Data for Science and Technology, 简称CODATA)、国际科学理事会世界数据系统(ICSU-WDS)等。长期以来,我国中科院等机构积极参与CODATA行动,成立了CODATA中国委员会,为整合推介国内科技数据共享成果,提供战略性、政策性咨询起到了重要作用。〔10〕
CODATA参与主体一般处于国家和机构层面,国际研究数据联盟(RDA)则利用社会化网络技术为个人参与科学数据管理与共享的交流提供了平台。2013年3月18-20日,RDA在瑞典哥德堡召开了第一次全会,并正式成立。RDA旨在通过基础设施、政策、实践、标准和其他成果的发展和采用来促进研究数据的分享和交流、使用和复用、标准协调和可发现性,进而加快国际范围数据驱动的创新和发现。〔11〕RDA 通过成立工作组(Working Groups)、兴趣组(Interest Groups)和协调组(Coordination Groups)实现自身的职能和目标。截至2013年12月底,RDA已经和将要成立9个工作组、22个兴趣组和8个协调组,全球的科研机构和研究人员都可以通过在RDA的网站上注册账户,参与工作组、兴趣组的交流。因此,我国的科研机构和研究人员应该重视对RDA的参与和应用,提升我国科学家在科学数据管理与共享领域的国际形象和地位。
科学数据管理与共享不仅要服务于科学研究,还应加强对社会经济发展、企业创新、人才培养的服务。通过推进各个掌握和拥有科学数据的主体加快开放和共享的步伐,探索跨部门、跨学科、跨领域数据资源整合和共享,可以达到数据的增值利用的目的。
政府掌握和控制着大量科学数据,应主动将这些科学数据开放共享。发达国家通常将政府所掌握的科学数据纳入信息公开的范围,制定完善的法律法规促进政府信息的公开,美英等国已开通政府开放数据门户网站,并提供“一站式”数据服务。
2008年5月1日,我国开始实施《中华人民共和国政府信息公开条例》,一定程度上增强了政府所掌握科学数据的透明度、提高了利用效率,但是仍存在较大的不足。一方面,由于该条例仅是行政法规,约束力低于法律,同时又缺少相关法律法规与制度的协同配合,使得该条例的实施效果并不理想。我国各级政府的绝大多数机构和部门都已经在网站上设置了信息公开的目录,但通过对政府网站的调查发现,信息公开没有全面深入到数据层面。另一方面,信息公开条例主要针对的是政务信息,关于如何公开科学数据尚无明确的规定。
我国应借鉴欧美等发达国家政府信息公开的经验,逐步完善政府信息公开的相关法律法规,对科学数据的公开与共享做出具体的规定,使政府掌握的科学数据能够实现透明化;政府可推出“一站式”数据集成服务网站,开放可供数据二次开发的标准应用程序接口(API),将数据发布成可供信息系统理解和互操作处理的格式(如:XML、CSV/Text、RSS、ESRI Shapefile、KML/KMZ等);鼓励企业、个人利用政府开放的数据开发网络应用(APPS),创造出科学数据新的应用价值,并且可以成为政府部门开放与共享科学数据的动力。
科学团体、科研机构和数据中心等公共部门也是掌握和拥有科学数据的重要主体。由于学科、行业、区域等的条块分割,科学数据的共享存在一些壁垒,妨碍了科学数据的增值利用,如一些部门出于本位主义或者自身技术能力有限等原因,产生了信息交流障碍。尽管2001年科技部就启动了科学数据共享工程,在农业、人口与健康等领域共24个部门开展了数据共享工作,但一些机构在共享实践中仍通过数据延迟发布、技术性控制、身份控制等方式限制科学数据的开放与共享,如:“国家农业科学数据共享中心”共享数据的方法包括通过元数据查询和该网站的导航发现数据,元数据有近30个元素,笔者点击其主页的“元数据”,输入“转基因”检索时,得到记录的更详细的元数据,发现其元数据元素“数据集访问限制”的赋值为“数据集的使用或访问受限制”,说明其数据集的开放与共享尚有待提高。
科学数据开放与共享的壁垒是其增值利用的重要障碍。要打破存在的壁垒,首先是通过立法扫清科学数据共享的制度性障碍,使得科学数据共享工作有法可依,建议尽快正式公布实施酝酿已久的《科学数据共享的管理条例》。其次,需要推行有利于数据共享、再利用和互操作的数据标准,“科学数据共享工程”曾制定过《科学数据共享工程技术标准标准体系及参考模型》、《科学数据共享工程技术标准元数据的XML/XSD 置标规则》以及20余项具体标准等,建议在修改的基础上上升为国家标准。再次,按照学科、行业等建设国家层面的科学数据资料库,目前国内一批院士和专家正在起草一份报告,建议国家借鉴美国、欧洲、日本等的做法,建立一个类似美国国家生物技术信息中心(National Center for Biotechnology Information, 简称NCBI)的国家级生命科学数据库,以打破科学数据共享瓶颈。〔12〕此外,还应该鼓励非政府组织和非盈利机构建立科学数据资料库,为科研人员和科研机构提供科学数据管理的服务,如:Dryad、DataStaR、Dataverse Network等,为科学数据集提供登记、描述、发布、保存和公共获取等服务。
科学数据具有巨大的增值潜力,其增值利用在国际上早有探索,如加拿大的“空间地理数据基础设施”支持每年产业增长率和就业增长率分别达到20%和12%的 。〔13〕欧盟研究报告《欧洲公共信息部门开发潜力》显示,数据增值服务主要集中在气象、地理和交通三个领域。〔14〕关于科学数据增值利用的模式,美国主要采取了市场机制下的商业模式,欧盟国家则大部分采用“公私竞争式”模式。
目前,我国政府部门、数据中心等公共部门的科学数据主要集中在国土、地理、气象、交通、公共卫生、农业等领域,这些数据一般都是国家投资产生的,因此,在满足他们自身业务需要的同时,应大力发展增值利用服务,并且必须坚持公益性为首要原则,保障公共部门主导涉及全体公民福利的科学数据的增值利用。
为确保公共部门科学数据增值利用的可持续性,探索市场化运行的服务机制非常有必要。我国可借鉴欧美等发达国家科学数据增值利用的成功经验,鼓励私营部门或个人参与增值开发,满足社会需求的多样性。如:福布斯杂志网站利用Data.gov(美国政府数据网络)中由纳税信息而得出的人口流动数据,开发了美国人口迁移可视化网络应用,用户可以借此查看区域人口迁移概况,为自身相关决策提供参考;〔15〕同时,网站也通过用户的大量访问获得了社会和经济效益。
对于盈利机构或者个人投资产生的科学数据,在其增值利用开发中可以实行商业化运行,探索有偿服务模式,培育相关科学数据产品市场和产业。
此外,需要特别提出的是在科学数据增值开发的过程,还需要做好数据的分级分类的工作,处理好数据利用与安全保密之间的关系。〔16〕
欧美等发达国家政府部门都制定了相应的科学数据法律法规,对科学数据的保存与管理确立了明确的规范。如:英国早在1998年就制订颁布了《数据保护法案》(Data Protection Act 1998)〔17〕;信息自由法案(Freedom of Information Act 2000)和环境信息条例(The Environmental Information Regulations)还规定了公众有权访问由英国公共机构产生的科学数据,除非豁免或例外,相应机构必须20个工作日内做出回应。〔18-19〕
我国目前还没有专门对科学数据共享活动加以规范的法律。《中华人民共和国科学技术进步法》、《中华人民共和国促进科技成果转化法》作为科技领域的基本法律,并没有对科学数据共享做出专门性的规定,它们所确立的法律原则只能对科学数据共享活动产生指导作用。从行政法规层面看,《中华人民共和国政府信息公开条例》对科学数据的管理产生了规范作用,但其条文中并没有明确提到科学数据。因此,制定规范科学数据管理与共享的法律法规或在原有相关法律法规中修订加入相关条款,已是科研和社会发展的必然要求。
在科学数据共享实践中,需要有相应的具体规章制度对其操作流程进行规范和引导。进入21世纪以来,我国科技部等职能部门在科学数据管理实践中,先后起草、发布了《国家科技计划项目科学数据汇交办法》、《科学数据共享工程管理办法》、《科学数据共享工程试点遴选和检查评估办法》和《科学数据分类分级共享及其发布策略》等一系列规章制度文件。〔20〕地方政府的职能部门也在科学数据共享领域陆续制定了一些地方性规章等,如《甘肃省气象科学数据共享政策》、《湖北省气象科学数据共享实施办法》等。然而,我国科学数据共享的规章制度还存在诸多不足,主要表现在:规章制度条文不系统、学科领域分布不均衡,笔者检索发现,相关规章制度一般出现在气象、地震、水利、农业、地理空间、交通运输、医药卫生等领域,很少有涉及基础科学和社会科学的;地区发展不平衡,很多省份虽然建设了科学数据共享平台,但相应的管理制度并没有跟进,存在诸多空白;已制定的相关规章有些缺乏操作性。以上不足限制了我国科学数据广泛共享和利用,亟需建设涵盖各个学科领域的科学数据共享规章制度,国家层面的机构需要对地方政府制定相关政策进行引导和指导。
科学数据的共享是一个系统工程,关于其法律法规和政策规章的制定需要一个国家层面机构协调推进。因此,建议我国强化和提升“科学数据共享工程领导小组”的作用和地位,加强其在相关法律法规和政策规章建设中的领导与协调作用。首先,在科学数据共享试点工程实践的基础上,针对出现的法律法规和政策问题,组织有关专家开展调研和分析,引起决策层的重视,推动立法进程。其次,通过跨领域、行业和部门的沟通协作,构建形成适宜于我国的科学数据管理与共享的政策规章制度和法律法规体系,其既包括在数据开放与共享、知识产权与隐私保护、信息安全等方面的法律法规,还应包含科学数据共享实施过程中涉及的财政投入、数据中心建设、资源建设、共享与发布、数据汇交、公益利用等方面的政策等。
公共科研资助机构(如美国的NSF、NIH等,我国的国家自科基金委、全国哲学社会科学规划办公室等)掌握着开展科研活动的经费,他们颁布的政策对项目申请者具有最直接的约束作用。
我国国家层面的国家自然科学基金委员会、全国哲学社会科学规划办公室和科技部国家科技计划项目以及教育部人文社科研究基金等的申请指南里都没有涉及要求申请者提交科学数据管理计划的规定,省部级及以下的基金更没有对科学数据的管理提出要求。因此,建议从国家层面的资助机构开始,在项目申报指南和项目管理规定中要求申请者必须提交相应的数据管理计划,并将科学数据的管理与保存实施情况作为项目考核与结题评价的重要指标,然后纵向向下推行。
美国、加拿大、英国和澳大利亚等国诸多公共科研资助机构以及非政府科研经费资助机构要求项目申请者提交科学数据管理计划,一方面确保科研中产生的数据得到有效的管理,另一方面保证受基金资助而产生的数据得到最大程度的共享。如:美国国家科学基金会(National Science Foundation, 简称NSF)2010年发布项目管理指南,要求从2011年1月18日起所有提交的项目申请必须包含一份不超过两页的数据管理计划;〔21〕2012年又发布项目申请政策和程序指南,对之前的项目管理指南进行了完善和修订,从2013年1月14日开始实施,要求详细描述申请者如何管理和传播研究所产生的数据,包括数据类型、数据标准、数据获取与共享政策、数据再利用政策、数据存档与保存计划等。〔22〕此外,一些学术组织也制定科学数据相关的政策,为科研资助机构提供指南,如:2013年3月20日,学术出版和学术资源联盟(The Scholarly Publishing and Academic Resources Coalition, 简称SPARC)为研究资助者发布了“开放数据实施政策”(Implementing an Open Data Policy)。〔23〕这样的政策使得欧美等发达国家科研人员必须重视对科学数据的管理,并且从被动接受走向自觉履行,在科学界形成良好的数据管理意识,并对科学数据共享价值产生认同。
我国的863、973计划、国家科技支撑计划等已经开始在其管理办法中涉及数据管理的相关规定。如2011年修订后的《国家高技术研究发展计划(863计划)管理办法》第四十四条“建立规范、健全的项目科学数据和科技报告档案,建立项目科技资源的汇交和共享机制。课题承担单位按照国家科技计划信息管理、科学数据共享和成果登记等有关规定,按时报送课题有关数据和成果信息”〔24〕。《国家重点基础研究发展计划(973计划)管理办法》第二十五条、第四十三条,〔25〕《国家科技支撑计划管理办法》第五十一条〔26〕等 。后两者明确提出了信息公开、资源共享。”
以上列举的科研项目管理办法只是对科学数据共享作了原则性规定,具体的操作细节还有待增强。NSF在其项目申请政策和程序指南中,详细的说明了项目申请者提交数据管理计划应该包含的内容;英国最大生物医学资助机构之一的威康信托基金会(The Wellcome Trust)在其项目申请指南中对科学数据共享作了详细的说明,包括:研究将产生哪些数据,哪些数据对其他研究者有价值?什么时间共享数据?在什么地方共享数据?如果让其他研究人员能够访问到数据?数据共享是否需要限制?如何确保关键数据集的长期保存?〔27〕我国科研资助机构可在参照这些成熟的科研项目数据管理计划基础上,完善项目管理和指南的细则。
在科研和学术交流体系中,大学和科研院所是主要的组成部分,他们既是科学数据的生产者和科学数据管理与共享的主体,同时也是科学数据传播的受众。大学和科研院所的科学数据管理功能需要在实践中得到强化。
大学和科研院所在主客观上都有制定科学数据管理政策的需求和动力。客观环境方面,大学和科研院所受到众多国际组织倡议、政府机构政策法规和科研资助机构规定的影响,特别是为响应科研资助机构有关的数据管理政策的要求,帮助本单位科研人员更好地申请科研资助;主观需求方面,在大数据时代,大学和科研院所为应对科学研究范式的根本变革,急切地需要对科研过程中产生的各种成果和数据进行合理的保存与共享,并且以制度的形式固定下来,对单位科研人员和科研活动具有普遍的约束力,这就需要制定本单位的科学数据管理政策。纽约大学制定了《大学数据管理政策》,要求所有学校人员负有保护学校数据资产义务,同时也必须遵守《合理使用纽约大学计算机与数据政策》的相关规定〔28〕。爱丁堡大学颁布的《研究数据管理政策》要求研究者在公开研究成果时,必须签署“知识共享署名许可协议”,公开研究数据时须签署“创作共用许可证”或者“开放数据共用的公共领域贡献与许可”,以促使研究成果与数据能够更好地被利用。〔29〕
经调查发现,我国的一些科研机构已经制定了相应科学数据管理政策,如:中国科学院资源环境科学数据中心已经制定实施了《中国科学院资源环境科学数据中心数据共享管理暂行条例》〔30〕,要求对科学数据和用户进行分类、分级管理,规范对科学数据的利用与保护。我国大学和科研院所的科学数据管理政策,需由机构的决策层协调信息服务部门、科研管理部门,在广泛征求研究人员意见的基础上联合制定,可包括:数据管理计划与程序、数据共享与访问说明、数据的知识产权和隐私保护、数据的保存归档与处置办法、数据管理的角色安排及相关责任说明等。
欧美等发达国家的大学和科研院所进行了科学数据管理服务的实践探索,帮助本机构科研人员满足数据管理的需求。牛津大学的“研究数据管理服务”提供了“数据管理规划清单”(Data Management Planning Checklist),帮助研究人员在项目整个生命周期里对数据进行维护、保存和增值等管理,以此减少数据的丢失、过时等威胁。〔31〕格拉斯哥大学人文先进技术与信息研究所创建了数据资产框架(Data Asset Framework, 简称DAF),提供了一个鉴别、定位、描述和评估如何管理科学数据资产的方法。〔32〕
我国一些大学和科研院所也开始开展科学数据管理服务,如:中科院国家科学图书馆及相关研究所以机构知识库作为存取科学数据的平台;〔33〕武汉大学在建设CALIS预研项目“高校科学数据共享平台”。〔34〕但我国大学和科研院所提供的科学数据管理服务项目单一,仅处于起步阶段,还需要在借鉴欧美国家成功经验在实践中不断完善。
作为基础性、公益性、长期性的科学数据管理与共享工作,需要建设一支稳定的专业技术人才队伍。鉴此,高校图书情报专业教育的课程设置与人才培养方案、图书馆员的职业培训计划需作出修改和调整。
在我国,虽然科学数据相关的主题已经成为学术界的关注热点,但图书情报教育机构还没有设置科学数据管理相关专业,也没有将相关的研究方向纳入人才培养计划中,有些只是在课程中涉及科学数据的专题。建议相关的图书情报教育机构在研究方向的设置和课程中逐步增加科学数据管理的内容;在一些核心课程(如信息检索、信息组织、信息服务)中增加与科学数据相关的章节或者知识点。
美国一些图书情报教育机构已经认识到科学数据管理带来的图书馆角色的“重新定位”,〔35〕判断在未来的科研体系中将需要大量的相关专业人才,推出了关于科学数据管理的教育培训,以满足科研领域对科学数据管理人才的需求。根据伊利诺伊大学香槟分校图书馆与信息科学研究生院科学与学术信息研究中心开发的工具数据监护课程检索(Data Curation Curriculum Search)提供的信息,美国已有54所大学开设了数据监护或者相关的课程,一共包含202个教育计划,涉及的课程有476门;相关教育计划层次分布如下:博士层次的25个,图书馆学专业硕士(Master of Library Science, MLS)层次的75个,文科硕士(Master of Art, MA)层次的23个,高级研究证书计划(Certificate of Advanced Studies, CAS)层次的24个,集中学习(Concentration)层次的41个,其他类型的14个。〔36〕
近年来,在美国的大学和科研院所为科学数据管理提供相关的支撑服务中,图书馆扮演着重要的角色。据调查,美国研究图书馆协会(ARL)将近一半的成员馆已经提供科学数据服务,服务内容一般包括数据管理计划指南、科学数据管理培训、建设和维护科学数据资料库、相关咨询等。〔37〕科学数据服务的开展给图书馆员的知识结构和知识储备带来了挑战,需要经常进行相关的培训。科学数据管理的培训资源较为丰富,包括:网络交流,如北卡罗莱纳大学教堂山分校的图书情报学院开发了数字监护交流网站(Digital Curation Exchange),提供了一种数字社区环境,方便数字监护从业者、研究人员、教育工作者和学生共享资源与信息交流;〔38〕学习科学数据管理最佳实践经验,如地球观测数据网络(Data Observation Network for Earth, 简称DataONE)提供了基于数据生命周期的数据管理最佳业务实践数据库,作为数据管理入门者的指南;〔39〕参加高级研究进修计划,如雪城大学信息学院开设了数据科学高级研究证书计划,培养能够对大数据进行收集、组织、保存、分析和共享的专家;〔40〕参加交流论坛和会议,如国际数据监管教育论坛(International Curation Education Forum)为数据监管相关人员提供了讨论和交流的平台。〔41〕
目前,我国大学和科研机构图书馆还没有开展大范围、系统化、深入的科学数据服务。科学数据服务离不开具备相应知识和技能的人才队伍,并且数据服务是个性化的学科服务,对学科馆员提出了更高的要求。国内大学和研究机构图书馆要认识科研发展的新需求、把握学科服务的发展方向,与所在单位学科发展特色相结合,组织馆员进行相应的科学数据管理培训,培训形式和途径可以参照欧美等发达国家图书馆的实践经验。
美国大学与研究图书馆协会(ACRL)指出,图书馆及馆员需要在新的知识创造与传播模式以及新的学术社区环境中重新定位。〔42〕联机计算机图书馆中心(OCLC)组织专家开展了“数据监护与图书馆角色”主题的调查研究活动,将图书馆员角色定位为“数据管理员”或者“嵌入式馆员”、“数据科学家”等。〔43〕欧美等发达国家诸多图书馆已把科学数据管理作为信息服务的重要内容。在开展科学数据管理与共享服务方面,我国图书馆还处于起步阶段,发达国家图书馆运行模式和实践经验可以为我们提供很有价值的参考。
图书馆可通过建立跨机构协调组织或者内设部门推动科学数据管理与共享。加州大学数字图书馆发起成立了国际DataCite协会,推出DataCite科学数据资料库,其现由20个世界范围内重要的学术和科学信息存储机构组成。〔44〕DataCite提供了一种将期刊论文与相关基础数据相联系的解决方案,还为研究者提供了共享和获取有关数据集的手段,并支持数据存档以允许结果被修正并重新用于未来的研究工作。加州大学数字图书馆还设置了数字监护中心(University of California Curation Center, 简称UC3),提供数字监护服务和工具。〔45〕约翰霍普金斯大学图书馆建立了数字研究与监护中心(Digital Research and Curation Center),强调开发自动化工具、系统软件,重视对大规模原生科研数据的收集和长期保存。〔46〕
马里兰大学图书馆岗位描述表中将研究数据馆员(Research Data Librarian)岗位专门列出,并对其职责进行了描述,要求在知识结构、掌握技能和个人素质方面符合科学数据服务工作的要求。〔47〕美国西北大学图书馆设立了数字管理岗位,主要从事学术交流和数字监护的工作。〔48〕
这些专门机构和岗位的设立,使得科学数据管理从图书馆其他业务中分离,一方面显示其已成为图书馆的重要职能,另一方面也说明了科学数据服务与学科服务存在显著的差异,即科学数据服务不仅要嵌入科学研究过程中,还涉及一系列的制度、管理以及技术开发问题。
在5.2节中,已论述了大学和科研院所开展科学数据服务问题,在实践中,科学数据服务的职能很多是由图书馆承担的。麻省理工学院图书馆开设专门的科学数据管理栏目,介绍相关信息,提供导航服务。〔49〕在数据文件管理计划(Data Documentation Initiative)数据生命周期模型的基础上,提出了数据计划清单,列出了数据管理计划中的17个问题。〔50〕明尼苏达大学图书馆介绍了如何制定数据管理计划、数据的长期保存和归档、如何分享和引用科学研究数据、“开放研究数据的十大方法”等。〔51〕
图书馆开展关于科学数据管理培训服务。截至2013年8月,北卡罗来纳大学教堂山分校图书馆已经开设数据管理相关课程9次,主题包括数据管理计划的撰写、数据管理计划工具(Data Management Plan Tool, 简称DMPTool)的使用等。〔52〕
图书馆还可以与其他部门联合提供科学数据服务。威斯康星—麦迪逊大学认为数字数据监管是学校的信息技术战略性计划,图书馆联合CIO办公室、研究生院与图书情报学院提供了研究数据服务,以协助研究人员满足数据监护的需求。〔53〕
图书馆在在推动科学数据管理与共享中,拥有平台和专业技术优势,可以为科研人员提供支撑。康奈尔大学图书馆针对本校研究人员开发了数据阶段型存储库(Data Staging Repository, 简称DataStaR)。〔54〕DataStaR是以机构库为基础,扮演学术界共享数据集暂时、过渡性的存储节点,其设想是建设成为一个拥有完整服务方案的数据监护平台,具有可产生多种格式的高质量元数据的工具,主要由图书馆员负责操作,通过协助研究人员完善数据和元数据来促进共享,最终积极帮助他们向各自领域的学科库发布数据成果,供长期使用和保存。加州大学数字图书馆在开展科学数据管理与共享服务中,提供了数字资源长期保存知识库服务Merritt、数字资源长期保存标识符服务EZID、Web存档服务和DMPTool等。
图书馆行业组织具有开展学术与业务研究交流、加强馆际联系与合作、提供政策咨询的职能。在科学数据管理与共享领域,我国图书馆行业组织应该引导学界和业界加强相关研究和交流,如:中国图书馆学会图书馆法律与知识产权研究专业委员会、资源建设与共享专业委员会、信息组织专业委员会、高等学校图书馆分会等应该有针对性地开展科学数据管理与共享业务调研,组织学术与业务交流,为政策和标准制定提供参考意见。
欧美图书馆行业组织在科学数据管理与共享领域进行了诸多的研究和探索,为我国的实践提供了经验参考。ARL为应对NSF所颁布的数据管理政策,发布了《研究图书馆转变》(Guide for Research Libraries: The NSF Data Sharing Policy)报告,研究了图书馆在数据管理计划中的角色,为图书馆员理解NSF的新要求制定了指南。〔55〕近10年来,英国研究型图书馆协会(R RLUK)在其战略计划中持续关注科学数据管理问题。《RLUK战略主题(2006-2008)提出发展新的图书馆服务模式,以适应e-research数据管理的要求〔56〕;《RLUK战略计划——知识的力量(2008—2011)》提出图书馆应关注学术交流模式的可持续性,促进研究机构的数据监管和保存;〔57〕《RLUK战略计划:知识的力量(2011—2014)》提出重新定义图书馆在研究数据管理中的角色,帮助图书馆员发展相关技能。〔58〕欧洲研究图书馆协会(Ligue des Bibliothèques Européennes de Recherche,简称LIBER)在其年会主题中连续涉及科学数据管理相关主题。2010年年会分主题包括数字监护、数据选择标准、图书馆为数据生产者提供支持服务等;〔59〕2011年会分主题包括科学数据传播创新业务模式、数字保存等;〔60〕2012年年会也将科学研究数据管理作为关注的重点,《学术期刊的数据管理和图书馆可能发挥到的作用》(Data Management in Scholarly Journals and Possible Roles for Libraries - Some Insights from EDaWaX)被颁发图书馆创新奖,鼓励图书馆开展与科学数据管理相关的研究与实践探索;〔61〕2013年年会分主题包括开放数据、科研机构研究数据管理的战略与政策等。〔62〕
1.Open Access policy concerning UNESCO publications.〔2014-01-07〕.http://www.unesco.org/new/fileadmin/MULTIMEDIA/HQ/ERI/pdf/oa_policy_rev2.pdf
2.Research Data Alliance Launch and First Plenary.〔2014-01-07〕. https://rd-alliance.org/first-plenary.html
3.Scientific Data Sharing: An Interdisciplinary Workshop. 〔2014-01-07〕. http://www.globaleventslist.elsevier.com/events/2013/09/scientific-data-sharing-an-interdisciplinary-workshop
4.国家中长期科技发展规划纲要(2006-2020).〔2014-01-07〕.http://www.most.gov.cn/kjgh/kjghzcq
5.国家“十二五”科学和技术发展规划.〔2014-01-07〕.http://www.most.gov.cn/kjgh/sewkjfzgh
6.中科院院长白春礼呼吁制定国家大数据战略.〔2014-01-07〕. http://www.chinadaily.com.cn/hqgj/jryw/2012-12-30/content_7902453.html
7.邬贺铨:我们需要国家大数据战略.〔2014-01-07〕. http://www.ciia.org.cn/xwzx/zjlt/zxld/201312/t20131216_47333.html
8.Ensuring the Integrity, Accessibility, and Stewardship of Research Data in the Digital Age.〔2014-01-07〕. http://ethics.iit.edu/eelibrary/node/4540
9.高校科学数据管理与服务(刘霞).〔2014-01-07〕.http://yantao.wanfangdata.com.cn/download/bj/lx.pdf
10.国际科学数据委员会中国全国委员会.〔2014-01-07〕.http://www.codata.cn
11. The Research Data Alliance.〔2014-01-07〕. https://rdalliance.org
12.张懿. 莫让数据封闭“锁”住创新. 文汇报,2013.7.13(1)
13.杨健. 让科学数据造福全民. 人民日报,2005.8.11(14)
14. Europe’s public sector information.〔2014-01-07〕.http://ec.europa.eu/information_society/policy/psi/docs/pdfs/brochure/psi_brochure_en.pdf
15. American Migration 〔Interactive Map〕.〔2014-01-07〕.http://www.forbes.com/special-report/2011/migration.html
16.夏姚璜. 面向公益目标的科学数据增值利用对策研究. 情报资料工作,2011(1):20-23
17.Data Protection Act 1998.〔2014-01-07〕.http://www.legislation.gov.uk/ukpga/1998/29/introduction
18.Freedom of Information Act 2000.〔2014-01-07〕. http://www.legislation.gov.uk/ukpga/2000/36/contents
19.The Environmental Information Regulations 2004.〔2014-01-07〕.http://www.legislation.gov.uk/uksi/2004/3391/contents/made
20.周文能. 科学数据共享工程“十一五”建设规划. 太原科技,2006(6):1-3
21. A guide for preparation and submission of NSF applications via grants.gov.〔2014-01-07〕. http://www.nsf.gov/pubs/policydocs/grantsgovguide0111.pdf
22. Proposal and Award Policies and Procedures Guide.〔2014-01-07〕.http://www.nsf.gov/pubs/policydocs/pappguide/nsf13001/nsf13_1.pdf
23. Implementing an Open Data Policy.〔2014-01-08〕.http://www.sparc.arl.org/sites/default/files/sparc-open-dataprimer-final.pdf
24.关于印发《国家高技术研究发展计划(863计划)管理办法》的通知.〔2014-01-08〕. http://www.most.gov.cn/fggw/zfwj/zfwj2011/20 1109/ t20110906_89492.htm
25.关于印发国家重点基础研究发展计划管理办法的通知.〔2014-01-08〕. http://www.most.gov.cn/tztg/201112/t20111209_91296.htm
26.国家科技支撑计划管理办法.〔2014-01-08〕. http://kjzc.jhgl.org/showinfo.aspx?id=4163&classid=6
27. Guidance for researchers: Developing a data management and sharing plan.〔2014-01-08〕.http://www.wellcome.ac.uk/About-us/Policy/Spotlight-issues/Data-sharing/Guidance-for-researchers/index.htm#_C._What_should_a data management an
28. University data management policy.〔2014-01-08〕.https://www.nyu.edu/its/policies/datamgmt.html
29. Policy for management of research data.〔2014-01-08〕.http://www.docs.is.ed.ac.uk/docs/data-library/rdm-policy.pdf
30.中国科学院资源环境科学数据中心数据共享管理暂行条例 .〔2014-01-08〕. http://www.lreis.ac.cn/sc/subsite/details.aspx?cid=212&v=7
31. Data Management Planning Checklist.〔2014-01-08〕.http://www.admin.ox.ac.uk/rdm/dmp/checklist
32. Four steps to effective data management.〔2014-01-08〕.http://www.data-audit.eu
33.研究所机构知识库.〔2014-01-08〕.http://nsl.ac.cn/others/institute_ir.jsp
34.高校科学数据共享平台.〔2014-01-08〕.http://sdm.lib.whu.edu.cn/jspui
35, 42. Changing Roles of Academic and Research Libraries.〔2014-01-08〕. http://www.ala.org/acrl/issues/value/changingroles
36. Data Curation Curriculum Search.〔2014-01-08〕.http://cirssweb.lis.illinois.edu/DCCourseScan1/StartSearch.php
37. E-Science and Data Support Services.〔2014-01-08〕. http://www.arl.org/storage/documents/publications/escience-report-2010.pdf
38. Digital Curation Exchange.〔2014-01-08〕. http://digitalcurationexchange.org
39. Best Practices.〔2014-01-08〕. http://www.dataone.org/bestpractices
40. CAS in Data Science.〔2014-01-08〕. http://ischool.syr.edu/academics/graduate/datascience/index.aspx
41. International Curation Education (ICE) Forum. 〔2014-01-08〕.http://www.jisc.ac.uk/whatwedo/programmes/preservation/iceforum.aspx
43. Role of Libraries in Data Curation.〔2014-01-08〕. http://www.oclc.org/research/activities/datacuration/default.htm
44. UC’s California Digital Library Launches DataCite Archive for Research Data.〔2014-01-08〕.http://newsbreaks.infotoday.com/Digest/UCs-California-Digital-Library-Launches-DataCite-Archive-for-Research-Data-66196.asp
45. Data Management Plan Tool.〔2014-01-08〕. https://dmp.cdlib.org
46. Digital Research and Curation Center.〔2014-01-08〕.http://ldp.library.jhu.edu/vhost-base/dkc
47. University of Maryland Libraries Position Description Form.〔2014-01-08〕.http://www.lib.umd.edu/binaries/content/assets/public/humanresources/job-announcement/staff-faculty/agnrlibn2013pd.pdf
48. Digital Scholarship Librarian at Northwestern University Named Rick Peterson Fellow.〔2014-01-08〕. http://www.clir.org/about/news/pressrelease/2012peterson-fellow
49. Data Management and Publishing.〔2014-01-08〕. http://libraries.mit.edu/guides/subjects/data-management/guides.html
50. A Data Planning Checklist.〔2014-01-08〕. http://libraries.mit.edu/guides/subjects/data-management/checklist.html
51. Managing Your Data.〔2014-01-08〕. http://www.lib.umn.edu/datamanagement
52. Research Data Toolkit.〔2014-01-08〕. http://guides.lib.unc.edu/content.php?pid=294213
53. Research Data Services.〔2014-01-08〕. http://researchdata.wisc.edu
54. DataStaR, a Data Staging Repository for Digital Research Data.〔2014-01-08〕. http://ecommons.cornell.edu/handle/1813/13008
55. Guide for Research Libraries: The NSF Data Sharing Policy.〔2014-01-08〕. http://www.arl.org/focus-areas/e-research/data-accessmanagement-and-sharing/nsf-data-sharing-policy
56. Strategic Themes 2006-2008.〔2014-01-08〕. http://www.rluk.ac.uk/node/48.
57. The Power of Knowledge - The RLUK Strategic Plan 2008 -2011.〔2014-01-08〕. http://www.rluk.ac.uk/node/480
58. RLUK Strategic Plan: The Power of Knowledge, Phase Two,2011-2014.〔2014-01-08〕.http://www.rluk.ac.uk/content/rlukstrategic-plan-power-knowledge-phase-two-2011-2014-0
59. 39th LIBER Annual Conference - Re-Inventing the Library.〔2014-01-08〕. http://www.libereurope.eu/event/39th-liber-annualconference-re-inventing-the-library
60. LIBER 40th Annual Conference.〔2014-01-08〕. http://bibliotecnica.upc.edu/LIBER2011
61. LIBER 41st Annual Conference. 〔2014-01-08〕. http://www.utlib.ee/liber2012/index.php
62. LIBER 42nd Annual Conference.〔2014-01-08〕. http://www.liber2013.de