国外科学数据管理政策的调查与分析

2016-04-12 00:05何青芳同济大学图书馆上海200092
上海高校图书情报工作研究 2016年2期
关键词:数据管理资助机构

何青芳(同济大学图书馆 上海 200092)



国外科学数据管理政策的调查与分析

何青芳(同济大学图书馆 上海 200092)

采用文献调研、网站调查和内容分析法,从类型及内容两个方面对英国、美国和澳大利亚三个国家的科学数据管理政策的发展历程和核心要素进行了分析,研究各层级政策之间的相互关系和内容要素。英、美、澳三个国家已经建立在内容上相互支撑的比较完善的科学数据管理与共享政策,为科学数据管理提供保障。我国要加速对科学数据的管理与共享进程,关键是自上而下建立完善的科学数据管理政策体系。

科学数据 科研数据 数据管理 数据共享 数据政策

科学数据(science data 或research data)的产生和积累正在呈指数级增长,数据密集型、数据驱动的科研成为新型的科研方式,科学研究和科技创新越来越依赖于对海量数据的管理、分析和再利用。学术界对科学数据共享重要性认识不断提高,数据开放共享的需求日益强烈,国际组织、各国政府等发布宣言、出台政策,积极推动数据的开放与共享,以增加数据资源的可获得性与可用性。科研资助机构、高校、出版机构等各个利益相关者陆续制定数据管理政策来保障和促进数据共享。然而在研究数据管理领域,国内高校与科研机构仍处于起步阶段。为推动国内高校研究数据管理的政策、数据规范、系统平台与服务支撑等方面的发展,2014年10月23日,北京大学、清华大学、北京理工大学、浙江大学、武汉大学、上海交通大学、上海外国语大学、同济大学、复旦大学九所高校图书馆的代表汇聚复旦大学,召开了“中国高校图书馆科学数据研究与实践联盟研讨会”,共同就科研数据在高校图书馆中的研究和实践进行深入交流与探讨,发起成立了“中国高校研究数据管理推进工作组”(China Academic Library Research Data Management Implementation Group),致力于推进国内高校研究数据管理的事业发展。并在本次会议上,确定了“推进研究数据管理措施和政策的制订和施行”等八项工作目标,形成了《中国高校图书馆研究数据管理推进工作组备忘录》。同济大学图书馆承担了“制定研究数据管理的措施和政策”的任务。受此任务驱动,笔者通过文献与网站调查的方法,对科学数据管理与共享政策实践较早的美国、英国、澳大利亚3个国家的科研数据管理政策进行了较为全面的调研与分析。这些国家的相关机构均制定了明确和完善的数据管理政策,能够为我国制定与完善科学数据管理政策,推进科学数据共享实践提供借鉴。

1 科学数据管理政策的类型

目前英、美、澳三国的数据管理政策主要有政府部门为推动信息公开制定的信息公开和共享政策;科研资助机构支持政府信息公开,针对受资助者制定的科学数据管理政策;高校为了帮助研究人员获得更多的项目资助,在科研资助机构政策的框架下制订的高校科研数据管理政策以及出版机构的科学数据共享政策。

1.1政府部门的科学数据公开与共享政策

科学数据管理政策是数据公开和共享的法规与保障。美国、英国、澳大利亚政府非常重视政府信息公开,为完善信息公开制度,陆续颁布了一系列法令、法案,以促进信息公开与共享。

美国自1967年开始,陆续颁布了《信息自由法》、《电子信息自由法》、《隐私权法》、《阳光下的政府法案》、《美国联邦信息资源管理政策》等政策、法令。美国能源部、航空航天局、国立卫生研究院、教育部等政府部门在这一系列法令、政策的框架下制订了本部门的信息公开政策。2009年,美国颁布《开放政府指令》,要求通过政府网站发布更多数据,促进公共对话。同年5月,美国政府建立Data.gov网站进行数据开放,在此网站上,公众可以获取各个机构的公共数据。

英国政府于20世纪70年代开始政府信息公开的进程,所颁布的《地方政府法》、《数据保护法案》、《个人资料获得法案》等法律中,都有信息公开的分散规定。进入20世纪90年代后,在民众的强烈呼吁下,先后出台了《开放政府》、《公民宪章》白皮书,2000年11月正式通过了《信息公开法》。《信息公开法》规定:任何人,不管是否拥有英国国籍,也不管是否居住在英国,都有权利了解包括中央和地方各级政府机构、警察、国家医疗保健系统和教育机构在内的约10万个英国公共机构的信息。英国各级政府部门均按照该法案颁布实施了本部门的信息公布目录和指南。2010年英国政府建立了Data.gov.uk网站,保证公共领域数据集的更新和维护。2013年6月八国峰会之后,英国首先提出《八国集团开放数据宪章2013年英国行动计划》,做出了有关“开放数据”的六项承诺:开放、发布和加强依据八国开放数据宪章认定的14个领域重要和较高价值的数据集;确保所有的开放数据集都发布在官方数据门户网站data.gov.uk上;与民间团体组织合作研究最应优先开放的数据集;支持国内外开放数据创新者共享实践经验和方法;明确英国开放数据工作的目标;建立政府开放数据的国家信息基础设施,从公众需求角度的出发,根据公众意见逐步开放有价值的数据集。

澳大利亚的政府信息公开起步也比较早,1982年颁布了《信息自由法》。除此之外,澳大利亚政府还颁布了《档案法》、《隐私法》。从2009年开始,澳大利亚政府积极推广开放数据的理念和行动,发布了《开放政府声明》,专门建立数据门户网站data.gov.au,公众可以便捷地访问和获取政府和地区的公共数据集。2013年8月,澳大利亚政府信息管理办公室发布了《公共服务大数据战略》,该战略以“数据属于国有资产,从设计着手保护隐私,数据完整性与程序透明度,技巧、资源共享,与业界和学界合作,强化开放数据”等六大原则为支撑,旨在推动公共行业利用大数据分析进行服务改革,制定更好的公共政策。

1.2科研资助机构的科学数据管理政策

在政府信息公开和共享政策的推动下,越来越多的科研资助机构制订了科研数据管理政策,要求受资助者在申请科研资助时提交相应的数据管理计划,阐明研究者将如何对科研过程中产生的科学数据进行管理与使用。

美国高校的科研资助基金主要来自于美国国家基金委(NSF)、卫生与人类服务部(HHS)、能源部(DOC)、航空航天局(NASA)等机构。美国科研资助机构政策制定的高峰期主要集中在2010-2011年。英国的科研资助主要来自高等教育拨款委员会(HEFCE)和英国研究理事会(RCUK),RCUK是艺术与人文研究委员会(AHRC)、生物技术和生物科学研究委员会(BBSRC)、工程与物理科学研究理事会(EPSRC)等7个研究理事会的联合会。英国主要科研资助机构的数据管理政策发布时间主要集中在2005-2007年及2010-2011年两个阶段。英、美的主要科研资助机构都制定了各自的科研数据管理政策,要求研究项目申请和完成时提交一份详细的数据管理计划说明,甚至将其作为申请拨款的一个重要依据。

澳大利亚高校的科研资助主要来自联邦教育部、科学与培训部(DEST)、国防科学技术组织(DSTO)、国家健康与医学研究理事会(NHMRC)、澳大利亚研究理事会(ARC)等政府部门和机构。从可获得的文献资料中,只有ARC和NHMRC两个主要资助机构发布了研究成果共享政策,两个机构的政策基本上类似,只要求受资助者提交与开放共享研究成果,没有提交数据管理计划的相关规定。

1.3高校的科学数据管理政策

英、美的一些高校非常重视科研数据保存和管理,1994年,杜克大学就出台了科研数据保存和获取政策。斯坦福大学1997年发布了大学科研数据材料保留政策,要求大学相关部门以及研究项目主管最少保留研究原始数据三年。肯塔基大学在1999年也公开了该校的科研数据保留政策。但各国高校数据管理政策制订的高峰期,都是在科研资助机构出台数据共享政策之后。

美国高校科研数据管理政策制订的高峰期是2008-2012年,典型代表有莱斯大学、霍普金斯大学、西北大学、田纳西州州立大学、纽约大学、新罕布什尔大学、弗吉尼亚联邦大学等。美国高校制定的数据政策名称各不相同,大多数名称中含有“数据保存”,政策内容注重保护数据作者的权益。

英国大学科研数据管理政策主要在2011-2013年制定,在此期间,有爱丁堡大学、牛津大学、南安普顿大学、北安普顿大学、伦敦大学国王学院、利兹大学、东伦敦大学、谢菲尔德大学等27所高校制订了科研数据管理政策。尽管英国大学科研数据管理政策的制定晚于美国与澳大利亚,但其发展非常迅速。根据英国DCC(Digital Curation Centre,DCC)网站的统计,目前已有37所大学出台科研数据管理政策,5所高校制订了政策草案。与美国高校相比,英国高校的数据政策名称相对统一,名称中都含有“数据管理”,内容上比较重视政策的实施效果。

澳大利亚高校科研数据管理政策的制定集中在2008-2012年。不同于英、美,推动澳大利亚高校制定科研数据管理政策的外力是2007年澳大利亚国家卫生和医学研究理事会(NH & MRC)和澳大利亚研究理事会(ARC)以及澳大利亚大学共同发布的“澳大利亚研究行为负责代码”(Australian Code for Responsible Conduct of Research(CODE))指南文件和澳大利亚国家数据服务(ANDS)在CODE基础上提出的一个大学数据管理政策指导性文件,CODE明确指出希望每一个研究机构拥有自己的科研数据和材料的保存政策。在CODE、ANDS影响下,2008年底开始,莫纳什大学、纽卡斯尔大学、昆士兰科技大学、墨尔本大学、南澳大利亚大学、詹姆斯·库克大学、新南威尔士大学、卧龙岗大学等纷纷出台科研数据管理准则或政策。根据澳大利亚ANDS网站统计,截至目前,已有40所澳大利亚大学制订了科研数据管理政策。澳大利亚大学的科研数据管理政策,多数直接以“科研数据管理政策”命名,政策大多对相关责任方的权利与义务进行了明确规定,以保证政策的顺利执行。

高校图书馆在高校科研成果保存上发挥着重要作用,遵从科研资助机构和本校科研数据管理政策的要求,剑桥大学、麻省理工学院、耶鲁大学等高校图书馆也制订了具有自身特色的数据管理政策。

1.4出版机构的数据管理政策与数据期刊政策

随着科学数据共享和可获取呼声的高涨,国际上越来越多的期刊开始重视科学数据的存缴和出版,有很多期刊都制定了“科学数据共享政策”。这些期刊要求作者在投稿时必须向期刊编辑和同行评审专家提供相关的科学数据或者提供可以获得该研究所涉及科学数据的第三方数据存储库的存取号,如果不能提供,则必须进行说明。目前期刊界的科研数据的存储要求主要分为两种。①存储到数据仓储。作为出版的条件,要求科研人员发表论文时,将论文中相关的科研数据提交到合适的仓储中,如Nature、BioMed Central等,Nature要求作者将期刊论文的数据或附加信息存储在可公开访问的数据库中。②伴随论文发表。研究人员在发表论文时,需要同时提交附加的科研数据,如PLOS One、BMC Evolutionary Biology、F1000 Research等,PLOS One在 2008年发布了数据共享政策,建议作者将数据作为所发表论文的支持材料进行提交。

随着科技期刊数据共享政策的推进,继而出现了数据期刊和数据论文,并制定了相应的数据期刊政策。

2 数据管理政策的主要内容

政府机构的信息公开与共享政策主要是以法令法案的条款对信息公开与共享做出规定,本节主要对与科研人员有密切关系的科研资助机构和高校的科学数据管理政策以及出版机构的科学数据共享政策与数据期刊政策的主要内容元素进行分析。

2.1科研资助机构的科学数据管理政策

对于科研资助机构数据管理政策的内容,我国学者已经有比较全面的研究。张瑶等对英、美12个主要科研资助机构制定的科研数据政策的内容进行分析,将政策包含的具体内容总结归纳为3个内容元素:(1)科研数据存储,包括类型、标准、位置、期限。(2)科研数据质量监管,包括管理计划、权责机制、监督机制、奖惩机制。(3)科研数据传播,包括隐私保护、知识产权界定、开放程度等。陈大庆对英国科研资助机构的数据管理与共享政策调研后得出结论,英国的科研资助机构数据管理政策中提及最多的内容是数据访问、数据保存、数据共享,亟需完善的内容包括数据管理计划时间表、数据管理政策执行情况的监督、数据标准、元数据标准、数据版权与隐私、机构库、数据中心。

在科研资助机构的数据管理政策中,基本上都有对科研人员申请项目时必须提交科研数据管理计划的要求,并将数据管理计划纳入了同行评审的范畴。数据管理计划(Data Management Plan,DMP)是简要描述数据处理方式的正式文档,其中列出了在项目进展中以及在项目结题之后数据收集、数据创建、数据组织、数据处理、数据存储、数据共享和数据复用的全过程,数据管理计划帮助科研人员识别和列出在整个科研过程中与科研数据管理相关的风险。由于学科背景以及科研资助机构数据政策的差异,不同资助机构对数据管理计划的要求不同。虽然不同资助机构要求的计划内容要素看似不同,但计划政策的本质是相同的。总地来说,国外DMP的内容主要包含:(1)数据选择与标识,包括数据描述、数据版权、元数据标准、数据监管、数据检索;(2)数据存储与保存,包括存储格式、存储地点、存储期限、数据备份、数据安全;(3)数据共享与传播,包括数据共享、权限管理、伦理与隐私等方面。

2.2高校科研数据数据管理政策

分别考察英、美、澳10所高校的科研数据管理政策,发现不同国家、不同高校的数据政策内容虽然详简不一,各有特点,但基本包含三个方面的内容元素:(1)基础内容,包括政策目的与原则、政策适用范围、术语定义、角色与责任、数据范围、数据管理计划、资金支持、相关法律、历史版本;(2)数据管理,包括元数据标准、数据保存、数据销毁、数据访问、数据转移、数据审查和数据共享;(3)数据安全与所有权,包括数据隐私与知识产权。基础内容单元是政策的通用性内容,在绝大部分大学的科研数据管理政策中均有提及,但只有2所大学的政策涉及资金支持方面的内容。数据管理内容单元是政策的核心部分,绝大多数学校对于数据保存、数据访问、数据转移都有比较详细的说明和规定,也提出了数据审查与数据共享的要求。在数据安全方面,澳大利亚的大学科研数据管理政策基本都包含了此方面的内容,英国与美国只有部分大学的政策包含此方面的内容。

2.3出版机构的数据管理政策

吴蓉,顾立平等对国外学术期刊数据政策进行调研与分析后得出结论:学术期刊应制定的数据管理政策包含以下几个方面:(1)数据提交政策,包括类型、格式和方式;(2)数据审查政策,包括数据可评审、可查验的位置、对学术论文的支持作用;(3)数据权益政策,包含署名规则、使用许可、作者的科学道德声明等。陈全平对Web of Science、ScienceDirect、Wiley Online Library、Google Scholar和中国知网、万方数据平台、维普期刊等中外文资源中的有关学术期刊数据政策方面的研究论文、学术报告和网络文章进行了系统检索,梳理、分析、归纳和总结了期刊数据政策的内容,目前国际权威出版商和学术期刊大多制定的数据政策的内容主要包括:要求数据开放共享和对数据提交方式、内容、范围、时间点的规定。

3 结语

完善的政策是科学数据管理与共享的保障,国外的科学数据管理政策从政府层面的宏观政策到高校的微观政策,已经形成一套在内容上相互补充、相互支撑的比较完善的政策体系。从政策体系发展历程和各类政策制定的背景可以看出,下层政策的制定基本是在上层政策的推动下迅速发展的,下层政策的发布支持着上层政策的顺利实施,完善的政策保障了科研数据的管理和利用。虽然我国学者一直在对数据管理领域的研究与实践持续关注和跟进,少数科研机构和高校也开展了一些实践活动。如:复旦大学图书馆与复旦大学社会科学数据研究中心合作,已经在科学数据平台的系统选型、平台建设、元数据标准规范、共享政策和措施、科研数据提交等方面进行了有益的探索实践,建立了复旦大学社会科学数据管理平台,并制定了数据管理政策,平台已经对外开放。北京大学图书馆把推动研究数据管理与服务建设列为图书馆工作的重要内容之一,对教师在教学与科研过程中产生的研究数据提供管理和存储服务。目前平台上已经建立了15个数据空间,200多个数据集,对外开放以来短短半年时间,来自国内外的用户已经达到440多人。武汉大学图书馆在CALIS三期项目建设中,尝试开展了研究数据管理服务,但是,由于缺乏强制性的政策要求,工作推进中遇到许多障碍,因此,加快我国科研数据管理与共享进程的关键是政策体系的建立。

在国外科研数据管理政策制定与实施过程中,高校图书馆积极参与其中,开展科研数据素养教育、协助科研人员编写数据管理计划、培训科研人员对数据管理计划编写工具的使用、开展数据保存等服务,发挥了积极的作用。我国高校图书馆应积极借鉴英、美、澳高校图书馆的实践经验,为开展数据管理工作做好准备。

[1] 陈大庆.国外高校数据管理服务实施框架体系研究[J].大学图书馆学报,2013,31(06):10-17.

[2] 陈大庆.英国科研资助机构的数据管理与共享政策调查及启示[J].图书情报工作,2013 (08):5-11.

[3] 张瑶,顾立平,杨云秀,等.国外科研资助机构数据政策的调研与分析——以英美研究理事会为例[J]. 图书情报工作,2015(06):53-60.

[4] 丁培.国外大学科研数据管理政策研究[J].图书馆论坛,2014(05):99-106.

[5] 郭春霞.科研机构数据管理与共享政策研究 [J].情报杂志,2015,34(08):147-151.

[6] 许丽丽.英国高校科研数据管理研究[J].图书与情报,2015(04):123-127.

[7] 完颜邓邓.澳大利亚高校科学数据管理与共享政策研究[J].信息资源管理学报,2016(01):30-37.

[8] 司莉,李月婷.国外科学数据保存政策的分析与启示[J].信息资源管理学报,2014(2):45-50.

[9] 黄如花,王斌,周志峰.促进我国科学数据共享的对策[J].图书馆,2014(03):7-13.

[10] 孟祥保,李爱国.国外高校图书馆科学数据素养教育研究[J].大学图书馆学报,2014,32 (03):11-16.

[11] 邢文明,吴方枝,司莉.高校图书馆开展科研数据管理与共享服务调查分析[J].图书馆论坛,2013,33(06):19-25,61.

[12] [EB/OL]. [2015-05-02].http://www.dcc.ac.uk/ resources/policy-and-legal/policy-tools-andguidance.

[13] FAQ on data management plans[EB/OL]. [2015-05-02].http://www.dcc.ac.uk/resources/data -management-plans/faq-dmps.

[14] Data management plan——Guidance for peer reviewers[EB/OL]. [2015-05-06].http://www. vesr.ac.uk/_images.

[15] 雷秋雨,马建玲.学术期刊数据出版政策研究综述——以JCR中进化生物学领域期刊为例[J].图书馆理论与实践,2016(01):30-34.

[16] 吴蓉,顾立平,刘晶晶.国外学术期刊数据政的调研与分析[J].图书情报工作,2015(7):99-105.

[17] 司莉,邢文明.国外科学数据管理与共享政策调查及对我国的启示[J].情报资料工作,2013(1):61-66.

[18] 张闪闪,顾立平,盖晓良.国外信息服务机构的数据管理政策调研与分析[J].图书情报知识,2015(5):99-109.

[19] 杨云秀,顾立平,张瑶,等.国外科研教育构数据政策的调研与分析:以英国10所高校为例[J].图书情报工作,2015(5):53-59.

[20] Mark A. Pitt, Yun Tang. What Should Be the Data Sharing Policy of Cognitive Science?[J]. Topics in Cognitive Science, 2013(1):214-221.

[21] Michael Jubb. UK Research Funders’ Policies for the Management of Information Outputs[J]. The International Journal of Digital Curation, 2007 (2):29-48.

[22] Sarah Jones. Developments in Research Funder Data Policy [J]. The International Journal of Digital Curation,2012(7):114-125.

[23] Dianne Dietrich,Trisha Adamus,Alison Miner,etc. De- Mystifying the Data Management Requirements of Research Funders [EB/OL]. [2014-02-25]. http://www.istl.org/12-summer/ refereed1.html.

[24] Mauthner Natasha Susan,Dette Parry. Open access digital data sharing: principles, policies and practices [J]. Social Epistemology: A Journal of Knowledge, Culture and Policy, 2013,27(1):47-67.

何青芳 副研究馆员,同济大学图书馆副馆长。

猜你喜欢
数据管理资助机构
企业级BOM数据管理概要
定制化汽车制造的数据管理分析
海洋环境数据管理优化与实践
高校资助育人成效的提升路径分析
“隐形资助”低调又暖心
CTCS-2级报文数据管理需求分析和实现
一周机构净增(减)仓股前20名
一周机构净增(减)仓股前20名
一周机构净增仓股前20名
一周机构净减仓股前20名