●张 群
(江南大学 江苏无锡 214122)
李爱国
(东南大学 南京 210096)
高校图书馆科学数据服务的现状调研与对策研究*
●张群
(江南大学江苏无锡214122)
李爱国
(东南大学南京210096)
文章对我国高校图书馆科学数据服务的现状进行了调查与分析,在此基础上提出了高校图书馆开展科学数据服务的具体措施,包括:设计全面系统的教育培训体系;建设交互集成数据服务平台;采取多方协同发展的管理机制;加强人员队伍和组织机构建设。最后指出科学数据服务是E-Science环境下高校图书馆发展的新契机。参考文献11。
高校图书馆科学数据服务现状对策
E-Science环境下,科学研究开始向数据密集型转变,“科学就是数据,数据就是科学”[1],科学数据逐渐成为学术交流的基本元素,即科学研究建立在对既有数据的重新组织、整合、集成、分析和利用的基础上,通过内容分析和数据挖掘实现“知识发现”。科研人员的信息需求从传统的文献信息服务向科学数据服务转变,具体表现为科学数据的组织管理、存储共享、传播利用等。这给高校图书馆的服务带来了全新的机遇和挑战。
2015年1~2月,笔者网络调查了112所“211工程”高校图书馆的主页,重点浏览了教育/培训、资源、服务、读者指南、通知公告等栏目,以了解科学数据服务现状。其中,第四军医大学、河北工业大学图书馆的相关栏目无法访问。另外,笔者通过搜索引擎、CNKI数据库的文献调查了解部分图书馆科学数据服务现状,如武汉大学图书馆、复旦大学图书馆等。
在所调查的图书馆中有3个图书馆表明具有数字加工服务,为北京大学、北京理工大学、上海交通大学,其服务内容主要包括:数字化加工/转换、元数据标引加工、资源共享(发布利用)、个人数字图书馆服务、OCR文字识别等。
目前图书馆教学培训主要采取教学课程、讲座培训、新生教育等方式。有39个图书馆教育/培训栏目中涉及科学数据素养教育,大部分是通过讲座形式介绍统计数据类数据库(Infobank、EPS全球统计数据分析平台、国泰安数据库等)的检索与利用,以及数据统计分析软件(SPSS)使用方法等,如北京大学、清华大学、北京师范大学、南开大学、复旦大学等;有些是在《信息检索与利用》课中介绍有关“事实和数值型数据”的检索,如东北大学、中国石油大学等。科学数据素养教育做得比较好的高校是北京大学和武汉大学。北京大学图书馆以讲座形式对数据素养与统计数据资源进行了系统的介绍,主要包括:关于数据的基本知识,并通过实例展示如何正确解读数据和统计分析结果、如何进行数据清理、怎样开展数据分析、如何科学地管理数据等内容;对图书馆购买的经济统计类数据库进行全面概览性介绍,并举例讲解BvD、OECD、IMF、中经网等数据库的具体使用方法;分门别类地对网络上的开放获取统计资源进行介绍;数据统计分析软件SPSS入门及体验(交互式)。北京大学图书馆还提供统计数据分析服务及SPSS网络版升级。武汉大学图书馆2014年下半年90分钟专题讲座包括:科研活动中数据的存储与共享(结合馆科学数据管理平台,就如何合理运用科学数据,促进建立在现有信息基础上的创新性研究;如何对科研成果的可靠性进行验证;提高科学数据的价值和利用效益等问题进行探讨和研究)、教你玩转统计数据库(着重介绍统计类数据库收录内容、数据库结构、数据来源、检索方式,并通过实例介绍国内外GDP、人口、汇率、短期利率等宏观数据的查找)、利用EXCEL进行数据分析和图表展示。另外,上海交通大学信息素养之工具篇中介绍了统计分析软件SPSS应用方法、Matlab使用技巧与提高。
调查发现,8个图书馆的电子资源(包括试用数据库)缺乏统计数据类资源,它们是:中国农业大学、北京体育大学、中央音乐学院、中国政法大学、吉林大学、华东师范大学、上海外国语大学、河海大学,这可能是由这些学校的学科专业设置所决定的。
62个馆建有特色数据库,其中12个图书馆明确标示建有机构知识库,分别是:北京大学、清华大学、中国人民大学、北京航空航天大学、北京科技大学、北京邮电大学、中国农业大学、厦门大学、大连海事大学、山东大学、云南大学、兰州大学。
74个图书馆建立了学科馆员制,提供学科服务,其中33家具有学科服务平台,除了华中科技大学图书馆具有两个学科服务平台:LibGuides版学科服务平台、纬度学科服务平台(法学),西北大学图书馆试用纬度学科服务平台(理论经济学学科),其余的均采用学科服务平台LibGuides。LibGuides平台由CALIS三期参考咨询项目子项目——学科服务子项目引进,旨在促进国内高校图书馆深化学科服务。该平台提供学科的最新资讯和动态,资源导航与检索,学术热点追踪与个性化服务,是一个为学科用户提供专业资源与服务的互动交流平台。武汉大学图书馆在学科服务平台上嵌入了科研数据管理模块,并以开源软件Dspace为平台基础,建设高校科学数据管理平台;复旦大学图书馆与复旦大学社会科学数据研究中心合作,利用哈佛大学的Dataverse Network,构建了复旦大学社会科学数据平台。
值得一题的是,有2家图书馆在通知公告栏内公布了有关图书馆的服务数据,分别是:“燕圕年话2014——北大图书馆微数据数秀服务开启”、“数据说·浙江大学图书馆读者服务年度统计”,令人耳目一新。宣传科学数据,首先让大家了解科学数据下的图书馆,这种方式更具有亲和力和说服力。
在所调查的图书馆中仅有3个图书馆明确表明提供数字加工服务。技术是科学数据服务的重要支撑,如数据描述、数据管理工具或软件的开发、数据存储、数据安全维护等都需要有专业的技术团队。国外高校图书馆大多具有雄厚的技术力量,如约翰霍普金斯大学的Sheridan图书馆,建有数字研究和监管中心 (DRCC),重视开发数据管理软件,注重监管原始科研数据,如建立大规模科学数据集[2];多伦多大学的地图数据服务平台(Map & Data Library)包括统计、微数据等内容,由多伦多大学图书馆独立开发维护[3]。但对于国内绝大部分高校图书馆来说,技术是服务中的薄弱点。在科学数据服务中如何充实技术力量,或者如何扬长避短,是图书馆亟待解决的问题。
开设《文献检索与利用》/《信息素养》课程、专题讲座、新生培训是国内高校图书馆进行信息素养教育的主要手段,重点在于培养学生的信息检索能力,对于科学数据素养的教育仅处于起步阶段。调研发现,尽管有39个图书馆教育/培训栏目中涉及科学数据素养教育,但大部分是以讲座形式仅仅涉及科学数据素养教育的某个方面:数据资源的获取方式或数据分析软件的使用方法。对于科学数据素养、科学数据管理的基本知识缺乏介绍,对于数据管理技术、数据实践规范、数据安全、数据伦理等内容更未涉及。总体而言,国内高校图书馆科学数据素养教育内容设计系统性和整体性欠缺,尚未形成明确的数据素养教育模式。这是我国对科学数据素养教育缺乏足够的认识和重视,缺乏相应的政策支持和课程设计造成的。
机构库可以成为容纳数据的仓储,可成为整个数据监护战略的一个重要部分[4]。在所调查的图书馆中仅有12个图书馆明确标示建有机构知识库,这说明我国高校图书馆开展科学数据服务任重而道远。武汉大学图书馆在学科服务平台上嵌入了科研数据管理模块,在全国高校图书馆起到了实践示范的作用。从经济、实用的角度出发,高校图书馆利用机构知识库对自身的特色文献资源进行深度揭示,或者利用学科服务平台开展学科服务的同时,能否以现有的机构知识库或学科服务平台为基础,拓展相应的功能,开展科学数据服务,这是值得探讨的。
调研发现,仅仅北京大学图书馆和浙江大学图书馆在通知公告栏内公布了有关图书馆的服务数据,这说明图书馆对科学数据的重要性和迫切性认识不够,对于科学数据服务、科学数据素养的基本概念、基本内容尚未开展相关的宣传推广。图书馆一直都通过服务来展现自己的价值,在 E-Science环境下,图书馆应及时改变服务职能,加大科研数据的宣传力度,将培养数据意识作为首要任务,将提供数据服务作为主要服务。Carol Tenopir对美国100家以上的大学图书馆访调发现,已有近20%的大学开展了数据管理服务[5]。服务未起,意识先行,这一点国内图书馆做得远远不够,只能说才刚刚起步。
3.1设计全面系统的教育培训体系
图书馆是科学数据素养教育的主要承担者之一,国外诸多高校图书馆已开始对相关人员进行科研数据管理意识、知识和技能方面的教育与培训。我国高校图书馆亟需设计系统、全面的科学数据素养教育培训体系,根据用户的不同层次提供相应的科学数据素养教育,主要包括:面向大多数读者的科学数据通识教育模式;面向高层次读者(教师、硕、博士生等)的学科数据素养教育模式;面向特定读者的个性化科学数据教育模式。笔者认为,图书馆的科学数据素养教育不是孤立的,而是应该以图书馆现有的信息服务、知识服务模式(如信息素质教育、科研诚信教育、学科服务等)为载体,嵌合科学数据教育,协同作用,构建全方位嵌合式科学数据教育模式,服务于高校科学研究、学科发展和学术交流。例如,在信息素质教育课程设计中,主要针对本科生进行科学数据通识教育,介绍数据管理的基本理论与方法,使学习者整体把握数据管理的基本知识;在科研诚信教育中嵌合科学数据素养教育,针对科研人员重点介绍科学数据对于科学研究的重要性,从源头上避免可能因数据作假而造成的学术不端,增强科学研究的可靠性,开辟学术规范的新领域,完善科研诚信体系建设;在学科服务中,科学数据素养教育主要针对特定学科重点对象提供专业的培训,专指性更强,如理工科的数据素养强调数据分析工具的使用,而文科类的则重视数据收集、分析与处理过程。
3.2建设交互集成数据服务平台
数据服务平台是开展科学数据服务的必要工具。它为研究人员提供数据存储、管理、共享、传播等功能,具有便捷、集成、交互、拓展性好、安全性高等特点。国外众多的高校图书馆都依托各自的数据管理平台开展数据服务,如康奈尔大学DataStaR、哈佛麻省数据中心HMDC、约翰霍普金斯大学Data Conservancy等。其中DataStaR平台定位于以机构库的形式,实现学科库的功能——以一个可靠的机构数据服务伙伴和短期的、过渡性质的数据集存储点角色,完成其促进机构数据向长期存储库(如学科库)流动的主要任务[6]。笔者认为,国内高校图书馆可以借鉴DataStaR的规划理念,以现有的机构知识库或学科服务平台为基础,拓展其科学数据服务功能。该平台除了提供科学数据的上传、共享、查询、下载、权限管理、用户管理等基本功能外,根据实际情况,还可拓展以下功能模块:第一,数据素养教育:提供面向不同层次、不同学科、体系化的数据素养在线课程,并加强网上题库、案例的建设,为用户自助学习提供便利;第二,数据交互:通过分析科研工作流和数据交互方式,建立数据中转平台,可供内部的相关部门、关联单位进行统一数据交互;第三,资源整合:整合机构知识库、特色资源库、学科导航库、专家库、科研项目数据等为一体,并为科学研究提供研究方法、统计分析、数据处理、数据库管理以及编程、计算与存储等方面的技术支持;第四,数据挖掘:应用智能数据挖掘软件系统协助进行差异化精准服务——通过全面即时采集用户信息数据、科研项目数据、需求数据等精准信息数据,建设精准用户信息数据库,帮助图书馆即时掌握精准用户需求信息的同时筛选出目标用户和重点用户,实现图书馆和用户服务精准无缝链接。
3.3采取多方协同发展的管理机制
高校的科学数据服务应从高校内部教学、科研工作流出发,以图书馆为主导,联合相关部门及群体,采取多方合作、协同发展的管理机制。英国牛津大学嵌入式机构数据监管服务(EIDCSR)由牛津大学校内的几家科研机构包括大学计算中心(项目主持、负责调研和顾问)、研究服务办公室(负责政策研究)、波德林图书馆(负责元数据管理)和科研项目团队(参与调研)共同合作完成[7]。Ingrid Dillo关注了档案馆和图书馆的联合数据管理培训活动,建立了FrontOffice-BackOffice模型,并讨论其在荷兰的实践经验[8]。McEwen L.研究了化学信息学领域学术图书馆员的化学研究数据管理案例,其由化学家、图书馆员、化学信息专家和其他化学专业人士协作完成[9]。在进行科学数据管理平台建设时,图书馆应协同学校信息中心,构建数据管理架构,提供强大的网络基础设施,并积极联合科研管理部门、研究生院、教务处、档案馆等,制定本校的数据提交政策、科学数据管理计划等,完善平台的功能模块,尽量达到便捷、交互;在设计数据素养教学方案时,图书馆可与课题组科研人员、学科专业教师等深度合作,共同探讨数据素养的教学内容,根据自身特长分担教学任务,开展学科嵌入式科学数据教育。
3.4加强人员队伍和组织机构建设
人员队伍和组织机构建设是图书馆开展科研数据服务的基本保障。国外不少大学图书馆不仅成立了专门的数据管理机构,还设置了新的数据管理相关岗位:普渡大学设立了分布式数据监管中心,与学科馆员及专业学者密切配合,共同研究数据存储库建设,开发元数据搜索和数据监护流程,设置有研究副主任、数据服务专家、跨学科研究馆员等4个岗位;纽约大学图书馆成立了数据服务工作室,设置了5个岗位:数据服务协调员、数据服务与公共政策馆员、数据服务助理馆员、数据服务高级专员、数据服务馆员[10];约翰霍普金斯大学的Sheridan图书馆的数字研究和监管中心设置有7个岗位,包括:高级数据教育专家、学术沟通专家等[11]。数据管理相关岗位根据其职责和服务侧重点的不同,名称各不相同,如数据主管(Data Manager)、数据馆员(Data Librarian)、数据专家(Data Scientist)、数据人文专家(Data Humanist)、高级数据教育专家(Senior Digital Pedagogy Specialist)、数据研究科学家(Data Research Scientist)等。而在调查的高校中,并未设置专门的岗位来进行数据服务工作,这就不利于统一调度和深入开展工作。因此,我国高校图书馆应该博采国外经验之长,当务之急是加强数据服务的人员队伍和组织机构建设,培养和造就一支业务素质高、专业能力强的数据馆员队伍。另外,数据管理发展战略、政策法规、元数据标准规范等的建设也势在必行。
科学数据服务是E-Science环境下高校图书馆发展的新契机,高校图书馆应该充分认识科学数据的重要性,明确自身在科学数据管理中的角色定位,在科学数据服务的架构设计、组织管理、服务模式等方面大胆突破,积极探索图书馆嵌入科研流程的科学数据服务机制与模式,构建高校图书馆科学数据服务体系,为科学研究提供数据源和数据保障,提升数据资源在科研创新中的价值,实现高校图书馆服务模式的创新发展。
[1]Hanson B, Sugden A, Alberts B. Making Data Maximally Available[J]. Science, 2011,331(6018):649.
[2][11]Digital Research and Curation Center [EB/OL]. http://ldp.library.jhu.edu/dkc.[2015-02-10].
[3]University of Toronto Map & Data Library [EB/OL]. http://data.library.utoronto.ca/.[2015-02-13].
[4][6]杨鹤林.从数据监护看美国高校图书馆的机构库建设新思路——来自DataStaR的启示[J]. 大学图书馆学报,2012(2):23-28.
[5]吴建中.数据中心—图书馆下一轮发展的重心[EB/OL]. http://www.wujianzhong.name/?p=2537.[2014 -05 -23].
[7]赖剑菲,洪正国.对高校科学数据管理平台建设的建议[J].图书情报工作,2013(6):23-27.
[8]Ingrid Dillo, Rene van Horik, Andrea Scharnhorst. Training in Data Curation as Service in a Federated Data Infrastructure - The FrontOffice-BackOffice Model [J]. Communications in Computer and Information Science,2014(7): 205-215.
[9]McEwen L. Academic librarians at play in the field of cheminformatics: building the case for chemistry research data management [J]. Journal Of Computer-Aided Molecular Design, 2014 (10): 975-88.
[10]叶兰.国外图书馆数据监护岗位的设置与需求分析[J].大学图书馆学报,2013(5): 5-12.
(宋小华编发)
Study on the Status and Countermeasures of University libraries' Scientific Data Service
Zhang Qun
(Jiangnan University, Wuxi, Jiangsu 214122, China)
Li Aiguo
(Southeast University, Nanjing, Jiangsu 210096, China)
This paper makes a statistic analysis of the status of scientific data service in university libraries, then puts forward some proposals to develop scientific data service in university libraries: design of a comprehensive education and training system, establishment of integrated interaction data service platform, adoption of collaborative development management mechanism and strengthening of the staff team and organization construction. Finally, it points out that the scientific data service is the new opportunity for the university libraries under the E-Science environment. 11 refs.
University libraries. Scientific data service. Status. Countermeasures.
2015-09-29
G252
A
1003-7845(2016)04-0042-04
张群,副研究馆员,现在江南大学图书馆工作;李爱国,研究馆员,现在东南大学图书馆工作。
*本文系国家社会科学基金一般项目“大数据时代图书馆用户信息的资源化研究” (13BTQ025)、江苏省教育科学“十二五”规划2015年度课题“高校图书馆科学数据素养教育体系研究”(D/2015/01/03)研究成果之一。
【用户·服务】