张艳梅
(内蒙古农业大学图书馆 内蒙古呼和浩特 010018)
大数据时代的到来,使得我们的工作、生活、学习等均与“数据”密不分离,一方面,社会因数据而产生新的工作、学习和生活范式,使我们不得不去适应并力争在新的范式环境下有所创新和发展,如2007年,JimGrey在美国国家研究理事会计算机科学和远程通讯委员会 (NRC-CSTB)的演讲报告中首次提出了以数据密集型计算为基础的科学研究 “第四范式”概念,并将其作为与实验科学、理论推演、计算机仿真三种科研范式平行的科学研究。这就要求科研工作者不但需注重所从事实验、分析的最终结果产生,还需注重在最终结果产生过程中数据的积累、应用和二次、乃至多次开发,这也隐性的要求科研工作者不但需具备在所从事科研领域的仪器、工具应用能力,还需具备基于数据处理平台的数据存储、辩识、分析和挖掘能力,具备传统的基本信息素养已经不适应数据社会的发展和需要,数据素养应运而生并受到社会的重视;另一方面,图书馆不但通过其专业的信息与数据处理,如分类、分析、借阅、组织与呈现等行为,使其馆藏资源得到最大化利用,并使其地位总是被人们和社会所接受与认可,同时,图书馆也总是能在社会的发展中起到文化传承、文明传播与社会教育的功能,使其用户通过享受图书馆的资源推送等服务而提高了资源获取与利用、信息搜索与分析等技能。图书馆在大数据时代也扮演着同样的角色,并通过为读者用户提供科学数据保存、分析与挖掘等数据监管服务而实现了从信息到数据的业务对象转换,使图书馆继续成为社会的信息中心机构。那么,在现实中,这些数据管理服务是否被大多数用户所接受,是否在实践过程中考虑到了用户的数据素养,如何在未来将普遍开展的数据服务上升到一个新的高度,等等问题,都是已有的学术研究所不涉及的,这也就是本文的立论与创新之处。
科学数据是产生于实验等科研过程中、蕴含有用价值的数据总称。最早的科学数据定义是1958年,世界经济合作与发展组织(OECD)在“OECD关于公共资助科学数据获取的原则和方针”中认为“科学数据作为科学研究基本来源的事实记录(数值、文本记录、图像和声音),被科学团体所共同接受的对研究结果有用的数据。但不包括实验室笔记、初步分析、科学论文的草稿、未来的研究计划、同行评论以及个人和同行的交流,以及实物(例如实验样本、细菌和测试的动物)等”。之后,不同国家、不同机构对其进行了不同的定义,但均都提到了科学数据的价值与本质:反映客观世界、含有科学价值。笔者认为:科学数据就是指收集了科研结果产生或科学发展过程的多形态数据集或材料,而这种数据集或材料的存在形态可能是多样化的。
目前,因信息素养难以满足数据社会环境下的数据处理需求素养,业界提出的旨在补充信息素养内涵在数据社会所缺失的数据素养如元素养、媒介素养、数字素养、信息通信技术素养、视觉素养一样都还没有一个权威的定义概念,但业界特别是信息管理科学界及教育界还是针对数据社会的数据行为主体所需的数据技能与知识要求,在数据工程专业课程体系、最新版的信息素养教育规划等文件中有所体现。根据美国学校图书馆员协会(AASL)制定的《共同核心州立标准》、美国大学与研究图书馆协会(ACRL)制定的《美国高等教育信息素养能力标准》(Information Literacy Competency Standards for Higher Education,ILSHE)及美国高校开设的数据监护课程体系,笔者认为:数据素养就是数据行为主体符合社会伦理和道德伦理的基础上,能对所面对的数据进行辩证、科学、正确的认识、操作和管理,进而使数据为我所用,以挖掘其蕴含巨大价值的能力。
尽管自2011年美国自然科学基金委员会(NSF)对所资助的科研项目所产生的数据提出管理计划以后,图书馆特别是高校图书馆便积极的参与到了对科学数据的管理实践活动之中。据基础研究出版公司(Primary Research Group)在 2013年 7月发布的一项科学数据管理调查报告中发现,美国约有72.22%的高校图书馆提供科学数据管理服务。从实践的发展规模和图书馆类型来看,高校图书馆是主流,据笔者通过网站浏览和文献查阅发现,截止到2015年6月20日,美国US News&World Report排名前20名的大学图书馆都提供基本的科学数据管理计划制定、科学数据管理工具下载、科学数据评估等服务,这说明经过两年时间的发展,美国的著名高校图书馆基本都认识到了科学数据管理服务的重要性和不可或缺,并提供越来越多的相关服务。此外,通过相关文献可以发现澳大利亚和英国的一些高校图书馆也加入到了科学数据的管理实践之中。国内图书馆中则主要有北京大学图书馆、东南大学图书馆和中科院文献情报中心(国家科学图书馆)等为数不多的图书馆,服务主要是通过向用户提供相关讲座、科学数据检索、科学数据咨询等内容,国外图书馆主要提供的服务定制、数据保存等还没有在国内图书馆中开展。
国内图情界对科学数据管理的研究主要包括对国外关于数字化科研和科学数据共享等相关研究的引介以及近年来逐渐展开的科学数据服务研究。如李娟、陈传夫、王巧玲、杨鹤林、张晓林等人对美国、英国及相关组织,如CODATA、OECD的科学数据共享政策、保障体系、实践进展、发现与关联、利用与再利用等情况进行了介绍;彭洁、黄筱瑾、魏东原、刘细文、李晓辉、杨文等从科技信息机构科学数据研究与服务的可行性、科学数据共享服务、图书馆科学数据服务的实现保障、科学数据的生命周期及服务、图书馆科学数据的管理与服务模式、科学数据与科学文献的关联、整合及聚合等方面研究了科学数据的服务。
国外图情界的科学数据管理研究则主要从科学数据管理概念、科学数据作为信息管理对象的分析以及科学数据管理活动中的一些非技术因素等角度进行。如:Elizabeth Yakel对NSF等机构关于科学数据管理报告的解读与分析;Andrew Trdoar对科学数据不同研究阶段领域的划分、JaneGreenberg对科学元数据如何满足即时共享数据以及长期保存数据的双重需求分析、GailSteinhart和Love对科学数据管理障碍等非技术因素梳理。
大数据时代的用户数据素养,不但与用户的个人因素息息相关,如文化教育程度、从事职业因素等,也与用户在享受图书馆的服务过程中所受到的教育相关,如图书馆所提供的服务是否具有对用户的数据操作技能培养元素、是否为用户提供诸如数据保存和数据获取的讲座与培训等。国外高校图书馆界的科学数据管理实践和国内部分图书馆的有益探索,不但可以清晰的显示出我国图书馆界的科学数据管理差距,也为我国未来图书馆的数据管理之路提供了借鉴模板。
从国内J据管理进展来看,数据素养教育视角下的科学数据管理存在的问题一方面体现在对科学数据管理与用户数据素养教育之间的关系缺乏认识与理解。虽然欧美的图书馆等均在用户服务中有所体现,但更多的图书馆并没有真正立足于用户的需求与教育视角,而是根据科学数据的生命周期等内在规律与图书馆服务需求等去设计所提供的服务。这一点在国内体现的也更为充分,如在2013年东南大学图书馆孟祥保、李爱国进行了相关的数据管理与数据素养研究后的快两年时间里再未有相关新成果出现,也从另一个角度说明对该问题的认识在这段时间里没有出现积极的变化;差距的另一方面则主要体现在科学数据管理缺乏相应的数据素养教育元素设计。由于缺乏统一的规划与设计,一些欧美高校所招收的数据工程等专业学生也没有固定统一的课程体系,以致影响到高校图书馆所提供的数据管理也没有统一的用户培训课程体系,进而影响到了用户的数据素养教育。
基于上述分析,笔者认为数据素养教育视角下的图书馆科学数据管理需从以下两方面进行思考与探索:
第一,了解用户需求,通过服务使其认识数据素养、数据管理及其关系。对图书馆数据管理服务用户的实际需求进行调研,有助于图书馆对其内容的设计与实现,也有助于提高用户的服务粘结度,进而通过满足用户需求的服务来实现用户观念的转换,让用户真正认识到大数据时代用户数据素养的重要性和图书馆数据管理服务所提供的教育培养途径。
第二,注重协作与合作,设计既统一又多样的教育内容。数据管理与用户教育的共同实现,还需要图书馆与业界、教育界、企业、政府的协作合作才能有效完成。基于用户培训教育的课程、服务,也需要在政府、教育部门、业界联合会或联盟的统一规划下进行设计,各个图书馆则在统一范围内根据自身服务特色与用户的个性化特征去完善和补充,使其既具统一性也具多样性。
[1] 周晓英.数据密集型科学研究范式的兴起与情报学的应对[J].情报资料工作,2012(2):5-11.
[2] 梁娜,曾燕.推进数据密集科学发现提升科技创新能力:新模式、新方法、新挑战——《第四范式:数据密集型科学发现》译著出版[J].中国科学院院刊,2013(1):115-121.
[3] Distributed Active Archive Centers[EB/OL].[2012-12-15].http://nasadaacs.eos.nasa.gov/about.html.
[4] 李慧佳,马建玲,王楠,等.国内外科学数据的组织与管理研究进展[J].图书情报工作,2013(23):132-138.
[5] Gary Price.HighlightsFrom:International Survey of Academic Library Data Curation Practices[EB/OL].[2014-10-05].http://www.infodocket.com/2013/07/11/highlights-from-in-lernational-survey-of-academic-library-data-curation-practices/.
[6] 张红亮.澳大利亚科学数据管理实践[J].图书馆学研究,2014(1):46-49.
[7] 李娟.国际科学数据共享原则和政策研究[J].图书情报工作,2008(12):77-80.
[8] 陈传夫.科学数据完全与公开获取政策及其借鉴意义[J].图书馆论坛,2006(2):1-5.
[9] 王巧玲.英国科学数据共享政策法规研究[J].图书馆杂志,2010(3):63-66.
[10] 杨鹤林.数据监护:美国高校图书馆的新探索[J].大学图书馆学报,2011(2):18-21,41.
[11] 张晓林.颠覆数字图书馆的大趋势[J].中国图书馆学报,2011(9):4-12.
[12] 彭洁.科技信息机构从事科学数据研究的趋势和可行性分析[J].图书情报工作,2009(20):47-50.
[13] 黄筱瑾.研究型图书馆参与科学数据共享服务研究[J].图书馆论坛,2009(6):177-193.
[14] 魏东原.专业图书馆如何实现科学数据共享[J].图书馆论坛,2007(6):253-255.
[15] 师荣华,刘细文.基于数据生命周期的图书馆科学数据服务研究[J].图书情报工作,2011(1):39-42.
[16] 李晓辉.图书馆科研数据管理与服务模式探讨[J].中国图书馆学报,2011(9):46-52.
[17] 杨文等.生物信息学序列库与文献库的整合模式浅析[J].情报理论与实践,2008(1):112-115.
[18] Elizabeth Yakel.Archives and manuscripts[J].Digital curation,2007(4):335-340.
[19] Andrew Treloar et al.The Data Curation Continuum Managing Data Objects in Institutional Repositories[J/OL].[2014-10-05].http://www.dlib.org/dlib/septeniber07/treloar/09treloar.html.
[20] Jane Greenberg.Introduction Metadata for Scientific Data:Historical Considerations,Current Practice'andProspects[J].Journal of Library Metadata,2010(10):75-78.
[21] Gail Steinhart.Academic Libraries and Data Curation:Mega-opp? [EB/OL].[2014-10-12].http://ecommons.comell.edu/handle/1813/15034.
[22] Making Sense of All Your Data[EB/OL].[2015-06-05].http://www.nassp.Org/portals/0/content/54342.pdf.
[23] 孟祥保,李爱国.国外高校图书馆科学数据素养教育研究[J].大学图书馆学报,2014(3):11-16.
[24] 何海地.美国大数据专业硕士研究生教育的背景、现状、特色与启示——全美23所知名大学数据分析硕士课程网站及相关信息分析研究[J].图书与情报,2014(2):48-56.