面向学科的数据素养现状及需求调查
——以《信息检索》MOOC学生为例*

2016-06-22 08:50黄如花王春迎
图书馆论坛 2016年6期
关键词:信息检索数据管理维度

黄如花,王春迎



面向学科的数据素养现状及需求调查
——以《信息检索》MOOC学生为例*

黄如花,王春迎

摘要以《信息检索》MOOC课程学生为调查对象,从数据基本意识、数据获取、数据管理(狭义)、数据分析、数据存储与安全、数据伦理六个维度调查其数据素养,并分析其数据素养课程学习情况、数据素养需求情况以及学科背景与数据素养需求之间的差异。

关键词学科数据素养信息素养MOOC需求

引用本文格式黄如花,王春迎.面向学科的数据素养现状及需求调查——以《信息检索》MOOC学生为例[J]. 图书馆论坛,2016(6):99-105.

*本文系教育部人文社科规划基金项目“MOOC背景下图书馆嵌入教学服务的对策与实证研究”(项目编号:15YJA870006)和湖北省教改项目“‘慕课’背景下信息素质教育课程的变革研究”(项目编号:2015009)研究成果之一

0 引言

近年来数据素养逐渐受到重视,越来越多行业开始要求从业人员拥有相应的数据素养。英国国家美术馆(The National Gallery)开始招聘数据业务分析师[1];新闻行业要求从业者有数据素养做好数据新闻[2],哥伦比亚大学数字新闻学塔尔中心对“数据新闻记者”这一职位提出了包括收集与统计、用户分析、数据分析等在内的六项数据素养要求[3]。然而英国的一项调查显示,虽然不同学科的研究者在数据管理上存在差异,但普遍缺乏数据能力[4]。由此可见,现在及未来相关行业的从业者拥有与学科背景或行业需求相适应的数据素养的必要性。

目前国内外已有许多与数据素养相关的研究,但针对不同学科数据素养现状及需求的研究却相对缺乏。不同学科领域的知识结构、科研环境、研究内容不同,对数据需求也不同[5]。数据素养具体到学科领域有其专指性和差异性,如社会学强调数据的收集和统计,经济学强调数据分析和建模[6]。本文以《信息检索》MOOC课程学生为研究对象,通过问卷调查的形式获取了不同学科背景学员的数据素养情况,在此基础上进行分析,并对数据素养教育提出了一些建议。

1 研究设计

本文采用基于问卷调查的研究方法,调查对象为笔者开设的《信息检索》MOOC课程学生,利用问卷星平台设计问卷,通过邮件和社交媒体发放问卷。MOOC作为一种新的学习方式,在我国各个高校发展迅速,笔者开设的《信息检索》MOOC在国家教育部主办的爱课程网旗下的中国大学MOOC平台上开课,第三期课程学生人数有20040名,学生人数众多,来自全国多个省份,地域分布广泛,覆盖各种学科。《信息检索》课程是国家教育部要求各高校开设的素质教育类课程之一,参加本次《信息检索》MOOC课程的学生多数对数据、信息检索等数据素养技能有一定的需求。因此,以该课程学生为调查对象,具有一定的代表性和针对性。

在设计问卷前,笔者进行了广泛的文献调研,参考了孟祥保和李爱国[7]、张静波[8]、隆茜[9]、吴碧薇[10]等学者对数据素养的研究及问卷调查项目,初步设计出本研究的问卷调查项目。随后,征集相关专家的意见和建议,并据此修改问卷,删除重复内容,增添欠缺的项目,以保证问卷的全面性和简洁性。然后,随机将问卷发放给20名《信息检索》MOOC学生进行测试,根据其反馈意见,在专家的指导下进一步修改及完善问卷,最终确定本次调查问卷的内容。

问卷分为三大部分。第一部分是被调查对象的基本信息,包括性别、年龄、学历、学科等信息。为了更好地调查学生的学科信息,笔者按照2011年国务院学位委员会、教育部颁布的《学位授予和人才培养学科目录(2011年)》中设置的13大学科门类[11],对被调查者的学科大类进行调查,并设置了文本题目,请被调查者写下自己的具体专业,以便进一步分析各专业的具体情况。第二部分是学生数据素养能力自评,从数据基本意识、数据获取、数据管理、数据分析、数据存储与安全和数据伦理6个维度展开调查:(1)数据基本意识主要调查学生对自己的数据需求以及满足数据需求基本途径的掌握和了解情况;(2)数据获取调查学生利用数据库获取数据、制定检索策略、检验数据准确性和评价数据质量的能力;(3)对于数据管理,笔者在问卷中设计了能否有效管理和组织数据,制定数据分类标准,能否根据元数据规范描述、组织和存储数据,能否判断有用与无用信息并及时删除无用信息,能否及时更新数据存储,跟进学科进展等内容,以期了解学生数据管理素养的情况;(4)数据分析调查学生对数据分析工具,对如何获取和创建需分析的数据等的熟悉程度,了解学生可否掌握数据统计和分析的方法,用可视化工具分析、重新表现和解释数据,具备将学科领域的分析转换成数据建模的能力[12];(5)数据存储与安全调查学生对数据存储知识、解决相关问题及数据交互意识的了解情况;(6)数据伦理维度主要调查学生对相关法律、规定的了解程度,以及是否具备规范说明数据来源的能力。第三部分调查学生对数据素养课程的态度,以及对数据素养的需求,其中的13项数据素养能力参考数据信息素养项目组(The Data Information Literacy Project)对研究生定义的12项关键能力[13]。第一、第三部分为选择题,第二部分是量表题,对变量的测量采用李克特五级量表形式(1=完全不同意,2=不同意,3=一般,4=同意,5=完全同意)。

2 调查样本基本情况

本次调查的时间为2015年11月6日到12 月1日,共回收网络发布的有效答卷796份。其中,男性332人,女性464人;年龄上,以19-29岁的居多,占77.39%,18岁及以下占3.64%,30-44岁占13.57%,45-59岁占5.15%,60岁及以上占0.25%,总体来看以中青年为主;在读专科生36人,在读本科生411人,在读硕士、博士研究生126人,研究人员123人,其他从业者100人,多数学生为在校学生或研究人员,以此样本分析数据素养课程的设计是有意义的;学科大类上,哲学类占1.63%,经济学类占4.9%,法学类占4.65%,教育学类占7.66%,文学类占8.42%,历史学类占1.01%,理学类占10.55%,工学类占23.12%,农学类占2.39%,医学类占4.15%,军事学类占0.25%,管理学类占24.62%,艺术学类占6.28%,另有0.38%的人没有选择学科,被调查的学生涉及各个学科,便于后文据此进行分析。

3 数据素养自评情况

数据素养贯穿于科学研究的各个阶段,数据的生命周期融入科学研究生命周期之中[14]。笔者综合了国内外学者专家对数据素养的界定,认为数据素养主要应涉及数据基本意识、数据获取、数据管理(狭义)、数据分析、数据存储与安全以及数据伦理等内容,并对上述每个维度设计具体问题让学生进行自我评估,详见表1。

表1 数据素养自评情况

3.1数据基本意识

调查结果显示,数据基本意识维度得分普遍偏高,在6个维度中排名第一,说明学生具有基本的数据意识,基本了解自己在工作与学习中的数据需求,能够通过搜索引擎和学校(机构)的数据库获取所需数据。但“了解学科数据来源”小项的得分相对较低,只有2.96分,说明学生虽有利用学校所购综合性数据库查找数据的意识,但从专业的学科数据来源查找数据的意识较弱。从学科来看,管理学的学生表现最好,均值最高,其中有三个小项得分在各学科中排名第一。

3.2数据获取

在数据获取维度的6个小题中,获取符合自己需求的数据、对获取的数据进行合理利用这两项的得分相对较高,而在获取数据时制定多种检索策略、对获取的数据进行准确性检验、正确评价数据的质量、权衡获取数据的成本和效益上的得分相对较低,说明学生在这4个方面的能力较为薄弱。与其他维度相比,数据获取维度排名第二,说明学生的数据获取能力相对较好。其中,管理学和理学的学生比其他学科学生有更强的数据获取能力;教育学的学生在正确评价数据质量的选项上得分最高,表现突出。

3.3数据管理

数据管理维度的得分在6个维度中排列第三,均值3.05分,表现尚可。在该维度的4个小项中,及时判断有用与无用信息,对无用信息进行删除的均值最高,为3.46分,说明学生有根据实际情况判断和删除数据的意识和能力。但是本维度得分差异明显,除上述选项外,其余选项得分略低。根据元数据规范描述、组织和存储数据这一项得分最低,平均只有2.74分;有效管理组织数据,制定数据分类管理标准的平均分也只有2.94分,这说明学生的数据管理能力欠缺,不能有效管理和组织数据。在学科上,本维度表现最好的是理学学科;在及时更新数据储备,跟进学科进展这个单项上,管理学的学生的素养最高。

3.4数据分析

本维度在6个维度中平均得分最低,4个选项的平均分都在3分以下,说明学生数据分析能力普遍欠缺,不能熟练使用数据分析工具和软件,没有掌握基本的数据分析方法。数据可视化分析和数据建模的表现最差,平均分只有2.74 和2.32。理学的学生在本维度的表现最好,各个单项的均值都是各学科中最高的,这与理学的学科特点具有一致性。

3.5数据存储与安全

调查结果显示,学生在数据存储与安全维度的能力有所欠缺,除了数据共享意识这一选项得分为3.15外,其余选项得分均在3分以下。说明学生不了解数据操作过程中可能出现的问题,不了解数据保存和安全的相关规定,也不能及时有效处理和解决数据存储的问题。理学的学生的数据存储与安全素养最高,各项得分在学科对比中均是最高的。

3.6数据伦理

本次调查显示,学生的数据伦理素养有待加强。数据所涉及的知识产权及隐私权、了解数据伦理在学习和工作中的原则、对所引数据的出处进行规范说明,三项的平均分依次为2.93、2.79 和2.96,总体偏低。近年来数据伦理问题已逐渐引起人们的关注,但该维度各项平均分偏低,说明学生对数据伦理的认知不足,有必要加强教育,提高学生的数据伦理素养。法学的学生在数据相关权利方面的素养较高,法律意识强;教育学的学生比其他学科的学生更了解数据伦理在学习和工作中的原则;管理学的学生能更好地对所引数据的出处进行规范说明。不同学科学生的表现体现了各学科的特点。

3.7整体情况分析

通过上文不同层面和角度对学生数据素养情况的分析,可得出以下结论:

(1)学生数据素养较差。比较分析整个问卷的量表题,可发现学生的数据素养普遍偏低,平均分没有高于4分的选项,数据管理和数据分析的平均分基本在3分以下;数据建模的平均分最低,只有2.32分;数据保存与安全的平均分仅有2.75。由此可见,学生明显欠缺这些数据素养。

(2)多数学生只注重数据的获取,对数据组织、存储等后续管理以及数据相关权利的重视不够。在得分上,利用元数据描述、组织、存储数据的能力得分比较低,平均分仅有2.75;数据存储与安全维度、数据伦理维度的平均分都仅为2.89。总体来看,数据基本意识和数据获取得分较高,而数据管理、分析、存储和数据伦理得分相对较低,两者之间差距较为明显。

(3)管理学和理学的学生数据素养最好,多项指标的均值在13个学科中均是最高。其中管理学学生在数据基本意识和数据获取维度上表现最好;理学的学生则在数据管理、分析和存储的维度表现出色。

(4)数据素养能力与学科之间有着密切的联系,参与调查的管理学的学生多数是图书情报档案等专业的学生,数据和信息是其平时学习和研究的主要对象,因此具有较高的数据素养,与其他学科学生相比,其数据意识和获取能力的素养尤为出色;理学学科注重定量分析,对数学能力的要求普遍比文史哲等学科高,因此其学生在数据分析、建模等方面的数据素养较高;法学的学生在“了解所研究学科领域的数据所涉及的知识产权、隐私权等问题”的选项上均值最高,在数据伦理上的整体得分也偏高,体现了法学关注法律与规范的学科特点。

4 数据素养课程与数据素养需求分析

本次调查显示,仅有35.3%的学生曾经学习过数据素养相关课程。在“是否希望学校或所在机构根据不同学科开设相关的数据素养课程”这一问题上,有87.19%的学生选择了“希望”,12.19%的学生选择了“无所谓”,仅有0.62%的学生明确表示“不希望开设相关课程”。笔者根据调查结果分析数据素养与课程学习之间的关系、各学科学生对数据素养需求的总体情况以及不同学科在数据素养需求上的差异。

4.1数据能力与数据素养课程的因果关系分析

为了解数据素养课程是否能提高学生的数据素养,笔者以是否学习过“数据素养相关课程”对学生进行分类,将问卷中调查的各项素养分别统计均值,结果如图1所示。

学习过数据素养课程的学生与没有学习过的学生在数据素养各项得分的走向上保持了一致性,但可以明显看出,前者的各项得分都比后者高。尤其在了解自己工作生活中的数据需求,在本校(本机构)购买的数据库中查找自己学科数据,获取符合自己需求的数据,正确评价数据的质量,以及数据伦理等方面,两者得分差距显著。可见,数据素养课程在提高学生数据素养方面发挥了重要作用,开设数据素养课程十分有必要。

图1 数据素养比较注:按照问卷中数据基本意识等6个维度的题目顺序,分别将各小题编号为1~26

4.2数据素养需求的基本情况

不同学科背景的学生对数据素养的需求不同,为了更好地展现差异,笔者首先将统计结果按照选项人数多少依次排序,并以图表展现(见图2)。在数据素养的需求上,数据发现和获取、数据收集和统计的占比最高,分别有676人和645人选择,占84.92%和81.03%。其次是数据检索,有554人选择,占69.60%;有529人选择数据分析和建模这一素养,占66.46%;选择判断数据质量的有523人,数据管理和组织有446人,数据可视化有437人,数据转换和互操作有404人,数据格式有368人,数据的存储和备份有351人,对元数据和数据相关权利两项的需求人数最少,分别有344人和322人。学生各项数据素养需求的差异明显,从需求最高的收集统计选项到需求最低的相关权利选项,人数依次平稳递减,最高值与最低值的差值较大,选择数据收集统计的人数是选择数据相关权利的两倍多。

图2 13项数据素养需求情况

4.3学科背景与数据素养需求的差异性分析

为了更好地了解学科背景与不同数据素养需求间的差异性,笔者将这两个变量进行了交叉分析。由于调查对象是《信息检索》课程的学生,某些学科学习该课程的人员较少,没有采集到充足的样本,为了减少分析上的误差,对哲学、历史学、军事学、农学、医学5个调查样本不太充足的学科不作分析,只分析经济学等8个样本数相对较充足的学科。将8大学科和数据素养13个能力进行交叉分析,详细结果见表2。

表2 不同学科对13项数据素养需求的交叉分析

4.3.1不同学科对数据素养的需求具有差异性

通过交叉分析表可以看出,不同学科对数据素养的需求具有差异性:(1)经济学的学生对数据收集统计、数据分析和建模的需求最高;其次是数据发现和获取、判别数据质量,对元数据和数据存储备份的需求最低,仅有38.46%的学生选择该项。(2)法学的学生对数据发现和获取需求最高,94.59%的学生选择了该项;其次是的数据收集统计,占89.19%,法学的学生选择最少的是数据库和数据格式;虽然数据相关权利这一选项的整体选择意向不高,但法学的学生选择该素养的人较多,占62.16%,在学科排名中位列第一;另外法学的学生对判别数据质量的需求较高,占比达78.38%,在所有学科中排名第一。(3)教育学的学生选择最多的是数据发现和获取;其次是数据收集和统计分析,选择最少的是准确认识数据相关权利。与其他学科的学生相比,教育学的学生对根据元数据规范组织和存储数据的选择比较高,有54.10%的学生选择了该项。(4)文学的学生对数据收集和统计分析的需求最高,对准确认识数据相关权利的需求最低,与其他学科的学生对比,文学的学生对数据检索的需求比其他学科高,占比为76.12%,排名第一。(5)理学的学生选择最多的是数据收集和统计分析这一选项,最少的是准确认识数据相关权利,与其他学科学生相比,理学的学生对数据转换以及数据可视化的需求更高。(6)工学的学生对数据素养的需求比较均衡,最高值与最低值之间的差距较小,各项需求的比例集中分布在50%到70%左右。

4.3.2数据素养教育与学生需求的对接有偏差

目前数据素养教育和学生的数据素养需求在对接上仍有偏差,需进一步完善加强,以满足学生的需求。数据分析和建模、检索工具利用、数据质量判断、数据管理和组织在学生需求排名中十分靠前,但调查显示,这些学生的数据能力得分普遍偏低。例如,数据分析和建模的需求排名第四,有66.46%的人希望拥有这项素养,但学生在数据分析维度的能力均值较低,其中数据建模能力的得分仅为2.34,是所有量表题中平均分最低的一项。学生数据素养欠缺和高度需求之间的关系,值得教育者警醒和注意。

4.3.3学科背景差异导致数据素养需求不同

不同学科的学生对数据素养需求不尽相同,这些差异与其学科特点呈现一致性。例如,经济学的学生对数据收集统计、数据分析以及数据建模的需求偏高,而法学的学生在数据相关权利方面的需求明显高于其他专业的学生。

总体看来,法学的学生对各项数据素养的需求都较高,可能是受访的法学的学生数据素养较差,因此迫切希望提高自己的数据素养。与之相应,在《信息检索》MOOC课程的教师答疑区,经常有法学的学生提问,表现积极。由于大部分艺术类课程对数据的使用不多,艺术类的学生对数据的认识以及数据意识相对薄弱,艺术类的学生对各项数据素养的选择率就比其他学科学生低。本调查中的管理学的学生多数为图书情报档案、会计以及统计等专业,数据是其学习的主要对象,数据素养相对较高,因此对各项数据素养的期望值并不突出。

5 结语

本研究表明,目前学生的数据素养较欠缺,数据素养课程较少,但学生对数据素养有明显的需求,因此开设相关课程十分必要。有关机构应当重视学生的学习需求和能力的培养,在现有数据素养课程的基础上继续深化培训内容,增设系统的、有针对性的、多层次的数据素养教育课程[15]。此外,数据素养课程的开设要与各学科特点和需求相适应,可以根据学科分模块教学。不同学科的学生对数据素养的需求有共性也有差异,对数据获取、分析等共性需求,可以设置通用模块进行统一教学;对数据建模、可视化、数据质量判断等差异性较明显的需求,可以设立弹性模块,提供给有需要的学科,深入开展讲解,对无需求或需求不高的学科仅提供通识教育即可。

参考文献

[1] Data literacy in arts and cultural organisations arts & metrics[EB/OL].[2015-11-07].http://artsmetrics.com/ en/data-literacy-in-arts-and-cultural-organisations/.

[2] 大数据时代如何做好数据新闻:需有数据素[EB/OL]. [2015-11-07].http://tech.sina.com.cn/i/2015-03-27/ doc-ichmifpy2295828.shtml.

[3] Anderson W,Bell E,Shirky C. Post-industrial Journalism:Adapting to the Present[EB/OL].[2015-11-10].http://towcenter . org/wp-center/uploads/2012/11/TOW Center-Post_industrial_journalism.pdf.

[4] 沈婷婷. 数据素养及其对科学数据管理的影响[J]. 图书馆论坛,2015(1):68-73.

[5] 郝媛玲,沈婷婷. 数据素养及其培养机制的构建与策略思考[J]. 情报理论与实践,2016(1):58-63.

[6][7] 孟祥保,李爱国. 国外高校图书馆科学数据素养教育研究[J]. 大学图书馆学报,2014(3):11-12.

[8][12][14] 张静波. 大数据时代的数据素养教育[J]. 科学,2013(7):30-31.

[9][15] 隆茜. 数据素养能力指标体系构建及高校师生数据素养能力现状调查与分析[J]. 图书馆,2015(12):55-56.

[10] 吴碧薇. 基于信息素养的数据素养核心能力基本框架构建[J]. 图书与情报,2015(4):128-131.

[11] 学位授予和人才培养学科目录(2011年)[EB/OL]. [2015-11-07]. http://baike.haosou.com/doc/1470554-1554873.html.

[13] Jake Carlson,Megan Sapp Nelson,Lisa R.Johnston,et al.Developing Data Literacy Programs:Working with Faculty,Graduate Students and Undergraduates[J]. Bulletin of the American Society for Information Science and Technology,2015(6):14-17.

Investigation and Analysis on the Current Situation of Subject-Oriented Data Literacy and Its Demands——A Case Study of Students from MOOC“Information Retrieval”

HUANG Ru-hua,WANG Chun-ying

AbstractThis paper investigates the data literacy of students who attend the MOOC Information Retrieval in the way of basic data awareness,data acquisition,data management(in a narrow sense),data analysis,data storage and security,and data ethics. It analyzes their studies and demands of data literary,as well as the variances in their demands for data literacy in different disciplines.

Keywordsdisciplines;data literacy;information literacy;MOOC;demands

作者简介黄如花,女,教授,博士生导师,武汉大学信息管理学院副院长;王春迎,女,武汉大学信息管理学院硕士研究生。

收稿日期2015-12-28

猜你喜欢
信息检索数据管理维度
企业级BOM数据管理概要
理解“第三次理论飞跃”的三个维度
定制化汽车制造的数据管理分析
海洋环境数据管理优化与实践
认识党性的五个重要维度
高职院校图书馆开设信息检索课的必要性探讨
CTCS-2级报文数据管理需求分析和实现
浅论诗中“史”识的四个维度
网络环境下数字图书馆信息检索发展
基于神经网络的个性化信息检索模型研究