高淑莲
(中共承德市委党校,河北 承德 067000)
随着信息技术和数字信息资源的快速发展,科学研究活动正发生改变,第四科研范式——数据密集型科研时代已经来临,科学研究数据呈现几何级增长的态势,人类整个科研活动所产生的数据总量已经达到每年数百EB(1EB=1ExaByte=1024PB=1024*1024*1024*1024MB)的规模。由此可见,一个数据类型多样、数量庞大、价值巨大的数据时代已悄然来临。“数据驱动科学发展,科学就是数据,数据就是科学”[1],对数据的获取、分析和利用能力成为人们必备的技能素养之一。2010年在哥德堡召开的第76届国际图联大会上,数据素养被作为一个重要的议题予以讨论[2],2012年美国博物馆与图书馆服务协会 (Institute Of Museum And Library Services,IMLS)资助了美国的数据素养项目,以探索培养科研人员数据搜集、整理及运用的能力[3],这说明数据素养问题已引起国外图书馆界的普遍关注。本文在阐释数据素养概念内涵的基础上,通过对国外数据素养教育实践的分析,以期探寻国内数据素养教育的模式和对策。
数据素养的出现是大数据时代的必然要求,“大数据由巨型数据集组成,这些数据集大小常超出人类在可接受时间下的收集、管理和处理能力,大数据必须借由计算机对数据进行统计、比对、解析方能得出客观结果”[4]。2008年《自然》杂志出版的大数据专刊,全面探讨了科学领域大数据的应用问题,2011年《科学》杂志针对大数据的搜集、整理、利用刊载了系列文章。在大数据时代,数据作为一种信息资源,其作用和影响力越来越大,数据是创新的前提,个人生活、科学研究乃至社会管理都需要依靠数据进行决策,数据素养的重要意义和价值日益凸显,并迅速引起学界关注。
数据素养是由数据和素养两个词语组合而成,素养指通过训练和实践而获得的技巧或能力,数据的字面理解是数值或数量,但并不只有各种统计数字才是数据,从形式上说,数据包括各种数字、文字、影像视频形式的文本或信息甚至信号,因此数据可以是相当广义的指称。国内外学者从不同的角度,对数据素养概念有不同的表述。国外关于数据素养代表性的概念有:美国的秦健博士认为数据素养是能够理解、使用和管理科学数据的能力[5];瓦伊等人认为数据背景、数据表征、数据分析和数据说理是数据素养的重要内容,核心是进行数据转换和根据数据进行说理;卡尔森提出数据素养不仅要从数据使用者的角度考虑,也要从数据生产者的角度去思考,包括一些更深层的能力:数据发现与采集、数据管理与利用、数据分析与增值等等[6]。国内关于数据素养概念代表性的观点有:张静波认为数据素养通常指的是研究者在工作中对科学数据的采集、组织管理、处理分析、共享等过程中应具备的能力,还应包括研究者在数据生命周期中普遍遵循的道德与行为规范[7];金兼斌从新闻记者的角度出发,认为数据素养包括数据意识、数据获取能力、分析和理解数据的能力、运用数据进行决策的能力、批判和反思精神等五个方面[8];孟祥保认为数据素养包括三个层次:数据意识、数据基本知识与技能、数据利用能力等。
综合已有研究,可以将数据素养表述为:公众应具备的基本素质、学者的研究素养以及专业人员的分析技能,它由数据检索、分析、整理、使用等技能组成,是多种有关数据的能力的统一体。
1.3.1 数据素养与量化素养、统计素养
数据素养作为新出现的概念,人们正在逐渐接受和认识它,本质上,数据素养和量化素养及统计素养有密切的关联,也正是这些概念为今日数据素养的发展奠定了理论基础。欧美等国家的量化素养教育起源于20世纪80年代末,统计素养是量化素养的一个重要组成部分。学者斯蒂尔、沃尔曼认为数据素养等同于量化素养、统计素养,这几个概念的共同点都是批判性思维,但学者希尔德认为数据素养主要涉及对数据访问、评估、处理、总结和表达的能力,而统计素养则强调批判性地解读统计结果的能力[9]。
1.3.2 数据素养与信息素养
在美国高校与研究图书馆协会(ACRL)的高等教育信息素养标准中,信息素养被定义为个体识别信息需求并发现、评价、有效利用信息的能力集合,数据信息素养更加注重从数据和信息的生产与消费即数据活动的多元利益相关者的视角界定成功完成数据活动所需技能、知识和习惯。2011年10月英国研究信息网在《科研管理者在信息素养中的角色》报告中指出,数据是特殊的信息,对信息素养的理解要相应地予以扩展,以便适应大数据环境下的需要。英国高校与国家图书馆协会(SCONUL)对信息素养赋予了新的含义,指出“信息素养是一个总称,它包括数字化、可视化和媒体素养以及学术素养、信息处理、信息技术、数据监护和数据管理这些概念”。由此可见,数据素养与信息素养概念密切相关。目前数据素养研究主要建立在信息素养模型基础之上,或言之,数据信息素养是信息素养的深化与拓展。
目前,在欧美有20多所大学图书馆开展各具特色的数据素养教育,国外开展数据素养教育的理念和实践,对我国开展数据素养教育具有启发和借鉴意义。
2014年美国麻省理工学院学者迪赫尔从社会和文化的角度阐释了对数据素养的理解,她指出:大数据背景下应该关注和提高青年人的数据素养,数据素养能够激发民主参与和公民权利意识,培养终身学习能力,同时还能为知识经济、竞争力和选择能力提供支持。她主张,数据素养教育应该从青年人抓起,应该鼓励广大青少年和教育者参与到数据素养教育中来。2013年纽约公立中学开展了名为“数字城市中的彩票调查”项目[10],在该项目实施过程中,分别对彩票销售人员和彩票购买人员进行采访,调查了各彩票站的销售量、彩民的购买习惯及社区居民态度等数据,通过对相关数据的统计分析,得出的结论为:低收入社区的居民具有较高的彩票购买意愿。在该项目中,学生们充分利用网上资源、调查数据进行分析,通过项目的开展,提高了他们的数据意识。2014年美国开展的“青少年形象重塑计划之编码”项目[11]是另一项受到广泛关注的数据素养教育计划,该项目是针对18岁以下青少年的全球性项目,利用免费开放的数据,让青少年进行网站、手机应用和解决方案等数字制作,通过开发基本的数据素养,激发青少年的自信与创新能力。2014年11月,纽约丹顿大道小学开始为10岁的学生开发基础的数据素养能力,主持这项工作的教师帕里西利用图瓦实验室提供的数据开展教学。与此同时,莫里小学的教师福特组织学生观察记录日照时间、温度变化与食物腐烂的关系,通过对数据的收集和分析、理解并实现可视化,改变了学生对数学学习的畏难情绪。图瓦实验室收集纽约地区的真实数据并提供图表分析结果导出给使用者,大约有55个国家的2 800所学校免费使用该实验室提供的数据,福特还考虑将学生收集完成的数据上传到图瓦实验室供大家使用。
美国高校数据素养教育起步较早,高校图书馆一直走在数据素养研究与教育的前列。雪城大学信息科学学院从2007年5月到2009年5月开展了科学数据素养项目(SDL),旨在培养学生的科学数据素养。该项目对数据素养定义进行了界定,提出了数据管理课程大纲。2008~2009年,项目组提供了面向科学和技术专业的本科生和研究生的“科学数据管理”课程,研究和评价了教师对数据管理的认知、课程结构对数据素养教育的影响、学生认知和能力的变化。加利福尼亚大学伯克利分校图书馆使用网络软件SDA提升本科生数据素养[12],从2008年开始为学生开设经济人口学统计学课程,学生已经超过300人。课程将SDA作为伯克利大学计算机辅助调查方法,强调学生对原始数据进行创新性的定量分析,而非参考他人的研究以完成人口统计学方面的课题,SDA软件非常方便学生在线获取和分析数据,开展课题研究。2010年,马萨诸塞大学阿默斯特分校图书馆成立数据工作小组,负责建立数据管理资源,提供数据管理相关咨询以及开发数据管理课程。这些课程为学生提供了数据储存选择、共享和再利用政策、元数据、理论和合法注意事项以及数据的长期保存等数据管理核心技能的培训。为了回应国家科学基金会2010年的数据管理计划的强制要求,美国许多大学图书馆都提供了在线网页指南并配以不同学科的数据馆员咨询服务,如麻省理工学院图书馆提供数据管理在线指南,介绍了数据管理技巧。
相比于国外的数据素养教育,国内的相关研究与实践还比较薄弱,借鉴国外数据素养教育发展,国内数据素养教育应注重如下方面。
数据素养研究尚未引起国内学者的更多关注,对其重要价值和意义缺乏足够的认识。因此,国内数据素养教育应从宣传数据素养理念入手,只有研究者和社会大众都充分认识到数据素养对科学研究和日常工作产生的价值,才能形成数据素养教育的源动力。国外图书馆在开展数据素养教育之前都非常重视用户需求的调查,通过调查了解科研人员对数据的基本态度和观点,掌握其数据获取、使用的基本情况。国内图书馆在开展数据素养教育时也要加强与研究人员的沟通,积极宣传数据管理与共享理念。
数据素养的内涵非常丰富,做好数据素养教育既需要讲究一定的方式、方法,也需要一定的载体和平台。将数据素养教育融入图书馆工作实践及信息学相关课程之中,能够起到事半功倍的教育成效。首先,图书馆应该抓住课题这一有效载体,将数据意识、数据素养渗透到《信息检索》的相关课程中,使学生逐步认识到数据的价值与作用;其次,图书馆在向读者提供服务时,如在日常的知识咨询、学科服务工作,就可以用数据向用户提供数据的检索、管理服务,使用户受到启发,逐步养成查询数据、使用数据的能力和素养。
数据素养和信息素养关联密切,数据素养是信息素养的拓展与升华,信息素养教育研究已开展多年,积累了丰富的研究成果,信息素养教育的经验比较成熟。因此,笔者认为可以借鉴信息素养教育的手段、方式、方法,在信息素养教育基础上,探寻开展数据素养教育的新方法,争取做到既有别于信息素养教育,又体现大数据时代数据素养的特征。北京大学图书馆开展的“一小时讲座”就涉及“数据素养与统计数据资源介绍[13]”,为图书馆开展数据素养教育提供了很好的内容方面的参考,内容分为三个单元,包括通过实际案例为学生展示如何正确解读数据和统计分析结果、如何进行数据清理、怎样开展数据分析、如何科学地管理数据等内容。经济统计类信息中有介绍并举例讲解了全球金融与企业资信分析数据库(BvD)、世界经合组织(OECD)、国际货币基金组织(IMF)、中国经济网等数据库的具体使用方法。分门别类地对网络上的开放获取的统计资源进行介绍,包括:世界主要国家和经济组织等官方网站的资源,学术团体、研究机构提供的统计资源,民间权威调查机构发布的统计数据以及利用搜索引擎查找统计资源的技巧等。
[1]HABSON B,Sugden A,Alberts B.Making Data Maximally Available[J].Science,2011,331(6018):649.
[2]Session74—Information Literacy with Reference and Information Services[EB/OL].[2015-04-20].http://www.ifla.org/node/6271.
[3]孟祥保,李爱国.国外高校图书馆科学数据素养教育研究[J].大学图书馆学报,2014(3):11-16.
[4]大数据[EB/OL].[2015-9-21].http://baike.baidu.com/linkur l=oCMFozTSjcDJHEN8tS4suVVkvXFwueQq_XJR9HU--xU1YnjNoQgVDkGC_6QRYKjBsRbZhZQYP9gVrudr4NOE2TlRb8ssG-L8EZ1ee7Y86a.
[5]Jian Qin and John D’Ignazio.Lessons learned from a twoyear experience in science data literacy education”[EB/OL].[2015-03-17].http://works.bepress.com/jian_qin/1/.
[6]CARLSON J,FOSMIRE M,MILLER C C,et al.Determining Data Information Literacy Needs:A Study of Students and Research Faculty[J].Portal-libraries and the academy,2011(2):629-657.
[7]张静波.大数据时代的数据素养教育[J].科学,2013(4):29-32+4.
[8]金兼斌.财经记者与数据素养[J].新闻与写作,2013(10):5-9.
[9]SCHIELD M.Information Literacy,Statistical Literacy and Data Literacy[J].IASSIST Quarterly,2004,28(2/3):6-11.
[10]City Digits[EB/OL].[2015-03-28].http://www.citydigits.org/.
[11]Young Rewired State[EB/OL].[2015-03-30].http://www.yrs.io/.
[12]DEKKER H.Using Web-based Software to Promote Data Literacy in a Large Enrollment Undergraduate Course[C].Goteborg:World Library And Information Congress:76th IFLA General Conference And Assembly.2010.
[13]北京大学图书馆.1小时讲座[EB/OL].[2015-04-03].http://www.lib.pku.edu.cn/portal/fw/yixiaoshijiangzuo/ziyuanchazhao.