夏姚璜(广州中医药大学图书馆)
在数据驱动型研究的背景下,众多学科领域纷纷建立大规模的科学数据服务机制,如医学与生物领域的美国国家医学图书馆NCBI、社会科学领域的美国高校ICPSR、生物多样性领域的BHL、地球与环境科学领域的Pangaea、原子分子物理领域的VAMDC 等。这些都属于data curation 这个新兴的研究范畴,综观近年来的相关研究,对应的中文译名有多个,笔者在此采用“数据监护”一词。
研究表明,在数据计划,技术标准,数据编目,元数据标准和工艺以及保存管理等方面,科研人员都缺乏有效指导,也就是数据监护的教育和培训显得尤为重要。基于目前科研人员少有良好的数据管理技能,如今已有不少针对数据监护和数据管理的教育和培训,加拿大研究数据策略工作小组(CRDSWG)开发了一门研究数据课程,用于对科研人员进行培训,通过科研人员的协助,图书馆可以填补在培训资源获取方面的不足。美国麻省理工学院图书馆开发了一个综合网站,为科研人员提供数据管理方面的指导。另外,编写使用指南,开发教育网页,培训教程以及数据管理课程等都是行之有效的措施。
英国联合信息系统委员会JISC 和国家数据监护中心DCC 是欧洲数据监护领域最为活跃的主角,DCC 已经举办多次论坛,设立了多个工作组,针对不同的战略性议题进行探讨,研究数据管理论坛RDMF 正是DCC 为了应对快速更新换代的数字化环境所面临的挑战而专门设立的。DCC 对教育和培训也予以大力支持。
IDEA Working Group 全称为International Digital Curation Education and Action Working Group,它诞生于工作组的学术讨论,由DCC 主办,主题是数据监护教育。2008年5月27-28日,DCC 在华盛顿举办了IDEA Working Group首届研讨会,“开发一个国际数据监护和保存的培训教育路线图”成为会议主题,共有来自美国和英国的12 个数据监护教育者和资助者参加了研讨会。很快,在同年的12月5日,IDEA Working Group 在爱丁堡召开了第二次研讨会,由DCC、IMLS、北卡罗来纳大学教堂山分校联合举办,来自加拿大、美国、英国和德国大学、研究中心和资助机构的将近40名代表参会。关于数据监护教育的问题受到更大范围和更深程度的关注。
国际数字资源长期保存教育ICE 论坛,即International Curation Education Forun,由JISC 主办,于2011年6月29日在英国伦敦大学举行,汇集了来自数字资源长期保存不同领域的大学和专业教育工作者和培训人员约70 人。会议共安排了9 个主题演讲,如表1 所示。
表1 2011年ICE 论坛会议演讲主题
研究数据管理培训项目MANTRA,全称为Research Data Management Training Course,由JISC 资助,是2010年9月至2011年8月在爱丁堡大学发布的一项免费无学分的课程,主要针对硕士研究生和刚刚起步的从事数据相关研究工作并且希望了解数据有效管理的科研人员,该课程内容主要面向社会科学、临床心理学、地球科学,但是课程中所包含的诸多问题,同时在其他学科中也具有实用性和通用性。该课程是一个完全开放的教育资源,任何人都可以免费使用,通过开放式许可的方式对课程资源进行调整、更名和重复利用。
2011年10月,欧盟DigCurV(Digital Curator Vocational Education Europe)由欧洲委员会达芬奇计划资助,其任务是建立数字资源长期保存职业培训课程的框架体系,为图书馆、档案馆、博物馆和文化遗产部门的数字资源保存人员提供其所需的职业教育和培训。DigCurV 聚集了来自欧洲、加拿大和美国的,在数字图书馆和数字资源长期保存领域有重大业绩的组织机构。项目持续30 个月,主要识别、分析并描绘现存的培训机会,调研文化机构部门的培训需求,以便分析从业人员所需的核心技能和综合能力。2013年5月6-7日将在佛罗伦萨召开“制定DC 课程”的会议。目前共有21个培训机会,如表2 所示。
2011年9月,为了建立起数字保存的培训网络,美国国会图书馆成立了数字保存的宣传和教育项目DPOE,即Digital Preservation Outreach and Education Program,其成员大部分为国会图书馆职员,其主要的工作有6 个方面:明确教育需求;评审现有课程;定义核心原则;建立一个培训者的基础;评估交付方式选项;制定宣传材料。DPOE 举办了一个基础研讨会,来测试一个全国培训者研讨会的模型,为其它人讲授保存数字资源的基本原则和工作实践。它提供的培训机会很多,课程形式有培训工作组、在线研讨会、学术报告会、协会、年会,呈现出多样化和灵活性。自从2011年9月开展第一次研讨会以来,DPOE 在全国共举办了超过20 次培训活动(包括12 个即将进行的),来自不同机构的共计900 多名工作人员接受了数字保存原理的培训。
表2 DigCurV 项目提供的培训机会
美国高校图书馆中具有代表性的教育项目是DCEP,全称为Data Curation Education Program,它是伊利诺伊大学图书馆和信息科学研究生院的数据监护教育计划,采取在成熟课程基础上添加数据监护新内容的建设方法,辅以针对性的实践、研究和学习数据保存、数据监护和数据标准等方面的内容,侧重信息收集与管理、知识表述、电子归档和保存、数据标准与相关规则。DCEP 的成果之一便是设立了第一个正式的数据监护方向的理学硕士学位。DCEP 课程体系如表3 所示。
表3 DCEP 项目课程体系
北卡罗来纳大学教堂山分校的数字化监护课程项目DigCCurr 也极为著名,全称为Digital Curation Curriculum,其中,DigCCurrI 受IMLS 资助,于2006年7月1日启动,2009年12月31日结束,目标是开发可开放获取的硕士研究生层次的数据监护课程,目前已完成《数据监护应用于挑战》和《数字藏品管理信息技术》等课程的设计。其主要组成部分是课程和两个国际研讨会。DigCCurrI 的成功实践带了更多的课程项目,主要包括:DigCCurr II 在DigCCurrI 的基础上延伸为博士研究生和从业人员设置,项目时间为2008年至2012年,包括持续一周的课程、在线交流和支撑以及于2011年1月5日至6日举行的后续实践模块。主要活动有:PhD-6,数据监护交流(DCE),夏季研究院;ESOPI-21,与美国国家档案与文件署合作的项目,项目时间为2009-2012,是双学位课程项目;消除数据监护鸿沟,CDCG,项目时间为2009-2011,与JISC、IMLS、DCC 合作。总体来说,DigCCurr 的课程体系比较独特:首先,参与者要参加为期一周的summer session,包括讲课、分组讨论以及和他们长期保存特殊需求相关的亲身实践练习。之后,参与者们需要设计在未来六个月内他们想要实施的技术、程序和活动。六个月后,参与者再次回来参加为期两天的后续winter session,讨论他们的实践经历并共享工作成果。
数据监护对应的是data curation,从事这一行业的人则称为data curator,更有称为数据科学家的,美国的部分高校即设立了数据科学家这类职位。从国外2011年的一项职业调查来看,身为data curator 需要四个方面的条件:正规的科学训练;所从事领域的理论知识;优秀的写作和语言沟通能力;作为实验科研人员的经历。《新时代新角色:数字资源长期保存》报告探索了研究型图书馆如何尝试在新的研究知识和信息产生链中增加自身价值的问题。研究型图书馆员需要承担七种不同的新角色:内容采集和权限授予者;学习领域的教学合作者;观察者/人类学家(关注于信息生产者和消费者);系统构建者;内容的生产者和传播者;组织设计者;合作网络的创建者和参与者。可见,这一职业主要是面对海量科学数据提供增值服务,它需要具备比学科馆员更加专深的能力。
从以上欧美国家的数据监护教育和培训实践来看,首先他们对教育和培训十分重视,认为受到培训的人可以成为培训者,例如美国的DPOE 项目就设置了Train-the-Trainer 工作组,即对培训者进行培训,国会图书馆规定参与Trainthe-Trainer 课程的人获得颁发的证书和授权后,承诺在6 个月内传授课程中至少一个模块的内容。这种培训的方式建立了一个良性循环,也是比较高效的。
作为数据监护的重要主体,高校图书馆要认识到之前的学科化服务中人才队伍构成与学科馆员素质要求存在差距的经验,在制度上,要建立创新的人才选拔与培养机制,在管理上,采取更加科学有效的绩效管理与评价机制,在业务上,重视培养馆员从事数据监护工作的能力,参考国外对于data curator 的一些基本要求,借鉴他们具体的课程计划,大力开展教育和培训,进行课程改革,采取联合培养的模式,考虑设立数据监护相关方向的学位。
匹兹堡大学图书馆馆长Rush Miller 在《超越生存》中写道:维护现状和仅仅推广过去的成功是在准备灾难。从欧美的数据监护教育和培训实践中,我们可以在学科馆员模式的基础之上进行一些创新,更好地适应当前形势,更高效地为数据驱动型研究服务。
1 Research Data Strategy Working Group[EB/OL].http://rdssdr.cisti-icist.nrc-cnrc.gc.ca/eng/news/gap_analysis.html,2013-03-05.
2 刘雄洲,王菲.国外数据存管实施现状及其对国内高校图书馆的启示[J].图书馆,2012(5):81~83
3 A Report from the Second Workshop of the IDEA[EB/OL].http://www.dlib.org/dlib/march09/hank/03hank.html,2013-03-06.
4 William Kilbride(DPC),Laura Molloy(HATII)[EB/OL].http://www.dcc.ac.uk/news/jisc-ice-forum-2011-report,2013-03-06.
5 Research Data MANTRA course[EB/OL].datalib.edina.ac.uk/mantra,2013-03-07.
6 Training opportunities[EB/OL].http://www.digcur-education.org/eng/Training-opportunities,2013-03-08.
7 About DPOE [EB/OL].http://www.digitalpreservation.gov/education/index.html,2013-03-08.
8 DCEP[EB/OL].http://cirss.lis.illinois.edu/collmeta/deep.html,2013-03-08.
9 李菁. 科学数据工作与文献情报工作的碰撞与融合[EB/OL].http://www.igroup.com.cn/doc/D1-5_QingLi-Demo%20 Version_CHN.pdf,2013-03-09.
10 DigCCurr final report Cover Sheet[EB/OL].http://ils.unc.edu/digccurr/digccurr_I_final_report_031810.pdf,2013-03-10.
11 DPOE Train-the-Trainer Workshops[EB/OL].http://www.digitalpreservation.gov/education/ttt.html,2013-03-11.