赵梅
(南京师范大学图书馆,江苏南京210046)
关于高校图书馆实施数据监护的探索
赵梅
(南京师范大学图书馆,江苏南京210046)
通过问卷调研获悉高校科研工作者大量科学数据处于闲置状态,缺乏二次利用及共享的平台,图书馆非常有必要实施数据监护工作。在调研问卷的基础上,对图书馆后期实施数据监护管理工作所面临的发展策略、合作模式、服务模型、人员培训4个方面进行探索,对实施数据监护管理工作所能产生的社会效益与经济效益进行分析,以为高校图书馆实施数据监护工作提供参考。
图书馆数据监护问卷调查实施路径效益分析
高校科研机构在科研过程产生了海量的科学数据,这些科研数据被直接利用后一般都将独立、零散地保留于科研学者的个人电脑中,由于缺乏共享与再利用机制,其二次利用的可能性微乎极微。据统计,我国近20年来国家级科技经费投入接近2000亿元中大约30%~50%用于科学数据的采集或整理[2],大量科学数据的闲置,其价值无法得到深度挖掘,对国家来说无疑是一种巨大的浪费。图书馆作为高校科研信息服务窗口,有责任、有能力、有必要开展科学数据的管理与共享工作,通过自己专业化、定制化的服务,提升科研院系的服务满意度,也为图书馆提供转型发展的方向与机会。
2002年,计算机科学图灵奖获得者Jim Gray在《Online science Data Curation,Publication,and Archiving》一文中首次提出Data Curation,自此数据监护在国内外受到了广泛而深入的研究与实践。目前国外主要对数据监护的战略实施、发展策略、合作模式、内容、教育与培训等方面开展了研究[3-5];国内对于数据监护的研究主要基于生命周期理论,并对参与人员[6]、相关政策[6]、实施主体[7-9]、服务模型[9-10]、实施时机[8]、教育与培训[11]进行了研究,项英等[12]以武汉大学图书馆在社会科学数据管理方面的实践为例,对如何开展科学数据管理服务进行了相关思考。笔者在问卷调查的基础上,发现科学数据缺乏二次利用及共享的平台,科研工作者希望图书馆尽快启动数据监护工作,释放科研工作者的精力,协助与推进院系科研的发展。结合前人的研究及图书馆现状,对后期实施数据监护管理工作所面临的发展策略、合作模式、服务模型、人员培训方面进行探索,并提出了数据监护的发展建议与结论。
笔者于2015年3月至4月,针对数据监护有关问题设计了调查问卷,通过邮件的形式对江苏省11所211大学120名科研工作者进行了问卷调查,成功回收了87份,有效率达72.5%,调查结果详见表1。
调查显示,所有科研工作者认为数据监护是有意义的,且93.1%的科研工作者愿意共享与推动数据监护的发展,并且需要建立一个数据监护系统。科学数据全部是以电子文档辅以纸质文档来存储和管理他们的数据,由于缺乏有效的管理系统,数据无共享平台,造成科学数据二次利用的概率非常低,调查样本显示复用概率仅为9.2%。由于图书馆在数据资源建设方面经验丰富与专业人员、可靠的硬件条件、现实的需求及意愿,被调查者认为是数据监护最佳实施主体。此外,科研工作者对建立数据监护系统提出,院系与图书馆需加强沟通与交流,共享数据应注意保密以维护知识产权,登录人员应设定不同权限等。
表1 问卷调查结果
从外部环境来说,随着网络技术、信息存储技术的发展,信息服务机构纷纷抢占服务地盘,使图书馆失去了原先固有优势[8],传统的服务模式受到冲击,图书馆需要提供新的服务来实现其价值,这样才能避免被边缘化[6]。从内部环境来说,图书馆虽然在传统服务、文献资源保障服务等方面表现尚可,但是距离图书馆科研专业化服务差距尚远,图书馆必须将注意力聚焦到服务好科研工作者的定位上。从科学数据现状来说,经调查发现,仅一所大学单体学院每年有数十TB科学数据的产生,且呈现指数增长,每年有数百名硕士及博士研究生毕业离校,研究生的离校意味着大量科学数据的流失,发展数据监护每滞后一年开展数据监护的难度将增加一份,每滞后一年科学数据将流失一部分。
3.1发展策略
科学数据监护需要存储在专用的服务器上,需要专业人员组织实施,并负责日常维护,这些都需要投入大量的资金,建设资金由图书馆承担?还是院系承担?后续管理与维护费用的保障在何方?这些都是数据监护启动与发展的前首先要探讨的问题。
发展初期——培育期。作为希望借助数据监护转型发展的图书馆,应积极主动地推进数据监护的发展,坚持公益性为首要原则,发展初期资金来源主要依靠学校及院系,应加强与学校及院系领导的汇报与交流,最大程度地获取政策与经费支持,顺势启动数据监护工作。由于数据监护涉及数据库建设,高校图书馆应以点带面,试点先行,整合图书馆数据管理经验与院系科研人员数据库开发能力,以开放性、兼容性、可二次开发为原则,建立数据监护信息管理平台。此外,发展初期,百废待兴,大量资金将投入到服务器建立与数据库研发中,收录的监护数据主要以无偿提供为主。
发展中期——成长期。科学数据作为科研中间成果,是高校及院系的重要资产。科学数据具有巨大的增值潜力,其增值利用在国际上早有探索,如加拿大的空间地理数据基础设施支持每年产业增长率和就业增长率分别达到20%和12%[8]。发展中期,可通过数据监护有偿服务、增值获利共享、二次利用的有偿服务,同时可借鉴欧美等发达国家科学数据增值利用的成功经验,鼓励私营部门或个人参与增值开发[8],以实现数据监护内循环与自身造血功能,逐渐摆脱图书馆及院系资金持续投入。
发展后期——成熟期。目前国内仅武汉大学图书馆对数据监护进行了试点与探索,其他国内大学尚未启动数据监护工作,随着数据监护研究持续深入,数据监护增值的潜力将得到深度挖掘,国内高校将掀起数据监护热潮,届时图书馆将可推出科技数据监护一体化解决方案,通过数据监护有偿建设,实现数据监护增值的最大化。同时,建立的数据监护管理平台可以串联各学科上下游的商业合作体,通过用户的大量访问获得社会效益和经济效益。
3.2合作模式
数据监护是对科学数据的产生、收集、处理、发布及利用的整个生命周期的管理与维护,这项工作不仅需要图书情报知识,更需要相关学科的专业知识[9],这就决定了图书馆无法仅通过一人或一个部门独立实施,图书馆需要在技术、学科等方面谋求与其他组织的合作,这就需要对合作模式进行研究。陈定权等[13]总结了国外实施案例,提出数据监护的合作模式主要有3种,分别为协助研究者完成元数据的创建、与专业学者合作完成专业数据库以及元数据等建设、为研究者提供数据共享平台。
针对国内数据监护管理工作尚无成功案例可循,在数据监护合作模式方面,笔者认为应建立以图书馆为主体、专业人员过程嵌入、多部门参与联动的合作模式。即,在科学数据呈现指数增长的时代,高校图书馆擅长科学数据的管理,有利于科学数据的整合与共享,对元数据规范的熟悉程度高,有利于配合各领域专家建立元数据标准[13],在发挥科学数据保存和服务上具有不可替代的地位和作用。此外,高校图书馆作为高校的职能机构,应该承担数据监护管理工作的主体责任。图书馆数据监护专业人员积极主动地嵌入数据监护生命周期的全过程,科学数据产生之前,数据监护工作人员就需要参与到项目研究中去,和研究人员一起对项目中将会产生的数据类型、数据量等进行评估,帮助他们拟定和提交项目数据管理计划,确定合适的元数据方案、数据筛选机制等,量身打造数据保存策略。数据监护是一项跨组织的工作,图书馆要与院系、科技管理、资产管理等部门保持定期会商制度与联动机制,共同制定数据提交政策、数据管理方案、数据长期保存规划等,明确机构的阶段和长期的科学数据管理计划,构建数据管理架构和基础设施,执行过程中按计划、执行、检查、调整的PDCA循环质量管理体系推进数据监护工作健康可持续发展。
3.3服务模型
结合数据监护整个生命周期,笔者认为数据监护服务模型应有数据汇交模块、数据存储模块、数据处理模块、数据利用模块组成,详见图1。
图1 数据监护服务模型数据汇交模块[14]
科学数据作为数据监护的基础性数据,在共享数据汇交体系中,汇交的数据文档一般要包括数据实体、元数据和数据字典文件、数据报告、以及简单的技术文档说明,形成对数据的完整说明体系。数据汇交模块主要解决不同科研人员产生的科学数据规范性问题,要求科研工作者上传的科学数据详细完整,具有可读性。如果科学数据管理人员及学科专家对上传的数据有异议,可与科研工作者进行沟通,指导科研工作者修改完善,以便后续研究者共享与复用。
数据存储模块:数据存储模块主要负责数据的筛选与存储,是数据复用和共享的基础。当某项科研完成后,通过学科专家把关的形式对进行数据筛选,合格则由出示数据汇交证明,涉及到用户捐赠数据的,则颁发数据捐赠证书,以确定数据的产权、使用范围等,对不合格的数据应及时修改和删除,以解决那些数据需要保护的问题,保障存储数据的质量。
数据处理模块:由于科学数据涉及到版权及权益问题,一般数据创造者在数据所支持的论文发表前是不愿意将数据公布出去的,为了充分保障数据创造者的权益,存储与上传数据时需对科学数据进行处理,设置数据的访问权限。
数据利用模块:数据利用模块通过对系统管理人员、科研工作者、访问用户设置访问权限,对于普通用户,可提供在线数据检索与浏览服务,查看数据目录或者查看相关数据的具体描述。如果有需要可通过特定渠道提供下载完整数据服务,对于特殊用户,可联合进行二次深层开发,提供定制服务与推送服务。
3.4人员培训
为了顺应数据监护工作的启动与平稳发展,图书馆需组建一支稳定的专业团队,同时需对数据监护人员及科研人员进行教育与培训。当前图书馆面临缺少具备专业技能的人员来提供数据管理服务,结合实际情况,图书馆的学科馆员作为图书馆与对口院系的纽带,初步了解与掌握对口院系的研究方向与基础成果,具备成为一名合格数据馆员的潜力,应作为重点培养对象,开展监护职能教育与培训,提升数据监护技能,培训形式和途径可以参照欧美等发达国家图书馆的实施经验,如开展网络交流、学习科学数据管理最佳义务实践经验、参加高级研究进修计划、参加交流论坛等[15],同时,对于科研人员,图书馆应积极与院系交流,为科研人员提供课程培训,并编写数据监护工作指南,提高科研人员的数据意识,增强其收集数据、管理数据、分析数据的能力[7]。
4.1社会效益
数据监护致力于使得大量科学数据能得到有效管理,促使科学数据充分发挥自身价值,借助数据监护管理平台,解决科研工作者数据长期保存的后顾之忧,提高科研工作者的效率,实现科学数据的二次利用。图书馆实施数据监护要以科研工作者和科学数据质量为中心,服务于科研工作者,让科研工作者满意,同时要注意数据监护形象策划,品牌塑造,不断扩大数据监护的社会影响力,形成数据监护品牌效应,最大限度地储存科学数据无形资产,促进数据监护社会效益最大化,实现图书馆与科研工作者的双赢。
4.2经济效益
数据监护储蓄的科学数据具有学术性、知识性、可重复利用性,是数据监护的根本经济属性,在查阅、利用、创新过程不仅节省了科学数据重复获取的资金投入,同时,数据监护平台又是一个学术交流平台,可通过多元化经营,激活无形资产潜能,显示出经济价值,实现数据监护的经济效益最优化。
数据监护管理工作是当前国内外图书馆研究的热点,也是图书馆今后转型发展的方向,结合对江苏省11所211大学数据监护现状的调查分析,提出图书馆是最佳实施主体,从实施路径及效益分析来看,图书馆初步具有实施这项工作的基础条件,且未来可带来经济与社会效益。图书馆在实施数据监护时,需自动加强沟通与协调,理顺各自的定位与职能,发挥各自优势,争取学校给予政策、资金上的支持,同时,图书馆需制定数据监护的战略发展规划,并在组织体系、资金投入、人才队伍建设上做好持续保障。
[1]赵梅.高校专业图书馆建设中学课馆员角色的定位——以南京师范大学为例[J].科技情报开发与经济,2010(25):36-39.
[2]王萍,赵丹阳,王玉超.基于网络技术的科学数据存储与共享[J].图书情报工作,2011(13):63-66.
[3]杨鹤林.数据监护:美国高校图书馆的新探索[J].大学图书馆学报,2011(2).
[4]NSF.Sustainable Digital Data Preservation and Access Net⁃work[EB/OL].[2012-12-22].http://ww.nsf.gov/pubs/2008 /nsf08021/nsf08021.jsp.
[5]数据监护范例分析——以DataCite、DCP和IDEAWork⁃ing Group为例[J].大家,2012(9).
[6]张秋彦.高校科学数据监护研究[J].情报科学,2013(5): 42-46.
[7]樊俊豪.图书馆在科学数据管理中的角色定位研究[J].图书情报工作,2014(3):37-41.
[8]裴玉香.高校图书馆数据监护工作初探[J].图书馆理论与实践,2013(8):79-93.
[9]徐坤,曹锦丹.高校图书馆参与科学数据管理研究[J].图书馆论坛,2014(5):92-98.
[10]邓仲华,宋秀芬.信息资源云的数据监护研究[J].图书馆学研究,2014(17):45-52.
[11]宋秀芬,邓仲华.数据监护的知识技能与教育研究[J].图书馆学研究,2014(21):5-11.
[12]项英,赖剑菲,丁宁.高校图书馆科技数据管理服务实践探索——以武汉大学社会科学数据管理为例[J].情报理论与实践,2013(12):89-93.
[13]陈定权,诸葛列炜.数据监护发展现状及对国内高校图书馆的思考[J].图书馆论坛,2014(3):97-102.
[14]蔡佳男,耿庆斋.水利科学数据共享汇交体系探索与构建[J].中国水利水电科学研究院学报,2006(3):31-35.
[15]黄如花,王斌,周志峰.促进我国科学数据共享的对策[J].图书馆,2014(3):7-13.
赵梅女,1981年生,硕士。
G258.6
(2016-09-08;责编:王天泥。)