陈 维
我们的社会正走向大数据时代,科学研究范式也进入到一个新的阶段,即科学研究第四范式——数据密集型科学。[1]在此背景下,数据素养的相关研究愈发受到重视,越来越多的行业开始要求从业者拥有与学科背景或行业需求相适应的数据素养。譬如,为适应大数据时代新闻报道的新方式——“数据新闻”,新闻行业对从业者应具备的数据素养提出了明确要求。[2]
目前,国内外已有许多与数据素养相关的研究,但大都集中于数据素养培养机制的构建、培养策略的思考、数据素养教育活动的开展等,而从学科的角度开展数据素养及其教育的差异性研究还比较少见。国内仅有少部分学者开展了此方面的研究,如郝媛玲等以研究生为调查对象做了文理科大学生的数据素养比较研究,[3]黄如花等以MOOC课程学员为调查对象获取不同学科背景行业人员的数据素养情况以及分析学科背景与数据素养需求之间的差异。[4]但此类研究在调查学科信息时分类还比较粗浅,仅以文理科或学科门类划分。
从学科角度来说,数据素养研究以培养与学科内容相关的能力为主,具体到特定学科领域,数据素养水平的衡量方面又是截然不同的。笔者认为,高校大学生作为未来社会的中坚力量,其数据素养水平将关乎整个社会的发展。新闻传播学大学生是未来的新闻工作者,在大数据时代下具备良好的数据素养必不可少。因此,研究新闻传播学大学生数据素养现状、了解他们对数据素养的真实需求、开展学科数据素养教育,对于回应大数据时代对新闻从业者的数据素养要求具有十分重要的意义。
本文以新闻传播学的本、硕士生为研究对象,通过问卷调查的形式获取了新闻传播学大学生的数据素养情况,在此基础上进行分析研究,并对开展大学生数据素养教育提出了一些建议。
按照国务院学位委员会、教育部颁布的《学位授予和人才培养学科目录(2011年)》,[5]本文以一级学科新闻传播学的本科、硕士生为数据素养的调查对象。本研究采用案例研究法和问卷调查法,主要是学生数据素养能力自评,从数据意识、数据能力、数据伦理三大维度进行调查,其中数据能力是指数据获取、管理、分析、存储能力。在设计调查问卷前,参考了孟祥保[6]、黄如花、隆茜[7]等学者的调查问卷项目,初步设计了本文的问卷调查题,随后选择了5名学生进行典型案例调研,对个别问题深入访谈,并根据反馈对问卷题目进行调整,最终确定调查问卷内容。调查题目是量表题,量表采用李克特五级量表形式,1-5分别对应非常不符合、比较不符合、不确定、比较符合、非常符合。
本次调查包括纸质问卷调查和电子问卷调查两种方式,因本次研究是大学生数据素养教育课程体系的前期基础研究,所以调查样本主要是浙江传媒学院新闻与传播学的本科、硕士生以及浙江大学新闻与传播学的硕士生。本次调查共发放问卷820份,回收有效问卷672份,有效回收率为82%,被调查人员中本科生占61.3%,硕士生占38.7%。
本文综合了国内外专家学者对数据素养的界定,认为数据素养主要包含数据意识、数据能力、数据伦理三大方面,其中数据能力是指数据获取、管理、分析、存储能力,是数据素养的核心技能。每个维度分别设计了3-4个具体问题让学生进行自我评分,详细情况如表1所示。
数据意识是指对数据敏锐的感受力,以及对数据价值的洞察力和判断力,它决定了获取、判断和利用数据的自觉度。调查结果显示,数据意识维度分值普遍较高,说明新闻传播学本、硕士生具有较好的数据意识,能认识到数据对生产、生活、科研的重要意义(该选项分值较高,均在4分以上)。良好的数据意识是大数据时代条件下公民数据素养提升的必然结果,反映了数据技术对新闻业、新闻传播学科的全面渗透。
但是,“能够认识到科研数据具有生命周期”本科组的分值反而略高于硕士组,说明新闻传播学大学生对“数据生命周期”的概念模糊,其实数据生命周期是指从数据产生,经数据加工和发布,最终实现数据再利用的一个循环过程,其存在于新闻业务流程的每个阶段。
表1 新闻传播学本、硕士生数据素养自评表
数据能力是贯穿于数据生命周期的各个阶段系列活动所需的技能,掌握一定的数据能力并将其灵活地运用到科学研究中是个人良好数据素养的外在表现。[8]在本次测评中,将数据能力又细分为数据获取、数据管理、数据分析、数据存储四大维度。在数据获取维度的4小题中,“全面、准确地收集所需要的各类数据”和“对获取的各类数据(格式、类型、特点)做准确解读”两项分值较高,“获取数据时,能制定多种检索策略”和“能权衡数据获取的成本和收益”两项分值较低,说明新闻传播学大学生能接触到大量的新闻数据,但数据获取途径可能是自己一手采访来的,或是“团队内部”交流共享的资料,而缺乏获取一些事实型数据的技能,这些事实型数据通常要从学科数据库中获取,因此高校开展提升他们学科数据检索能力的相关培训课程就显得尤为必要。同时,调查显示在同一小题上硕士生组的分值均大于本科组,这可能与硕士生具备了一些数据获取及操作的经历有关,如新闻采访报导的专业实践、导师对学术研究的指导、学术论文撰写等。
在数据管理维度,测评分值尚可,但选项之间分值差异性较大。“组织数据,数据分类管理标准”和“元数据规范”两项的均值在3分以下,说明新闻传播学大学生的数据管理能力缺乏,不能有效管理和组织数据。“判断数据有效性,提取有效的数据”和“更新存档数据,跟进学科进展”两项均值在3分以上,说明新闻传播学大学生有根据实际情况判断和操作数据的基本能力,有学科数据意识。
在数据分析维度,综合看来在数据能力的4个维度中平均得分最低,特别是本科生组的4个选项分值都在3分以下,说明新闻传播学本科学生的数据分析能力普遍欠缺,不能熟练使用数据分析的工具和软件,没有掌握基本的数据分析方法。硕士生组的4个选项分值表现尚可,3个在3分以上仅1个在3分以下,说明在硕士研究生阶段新闻传媒学科的人才培养中开始注重了对学生的相关数据分析工具及能力的训练。进一步研究发现,如果在本科生组剔除一、二年级学生的数据,那么这4个选项的分值有普遍提升,说明本科低年级学生由于尚未完全开始学科的专业教育与新闻实践训练,没有开设数据分析、统计及数据分析软件的相关课程,因此他们的数据分析能力确实非常薄弱,这部分的分值拉低了本科组学生的整体分值。在同一选项上,研究生组分值都高于本科组分值,调查数据进一步印证了上述结论,说明相关数据素养教育课程的开设与学生数据素养能力的提高有显著的正相关性。
在数据存储维度,新闻传播学学生了解基本的数据存储与安全知识,特别是具有较高的数据共享意识,这与他们的学科背景也有密不可分的关系。新闻行业的从业人员,通常会接触到大量的新闻素材、剪辑资料,包括存储容量较大的音频、视频资料,但是从调查结果看,他们又普遍缺乏安全保存数据的技能,这是新闻传播学大学生的重大数据素养缺陷。
数据伦理是进行一切数据活动的准则,是数据素养中不可或缺的部分。本次调查显示新闻传播学本、硕士生的数据伦理有待加强,了解数据所涉及的知识产权、隐私权等选项的分值都在3分以下,“了解数据伦理在学习和工作中的原则”选项本、硕士组的分值均在3.1分上下,且相差不大,说明新闻传播学大学生的数据伦理素养偏低,这与近年来越来越注重并强调新闻从业人员和科研人员遵守职业道德、保护知识产权的要求向左,因此极有必要加强新闻传播学科学生的数据伦理教育。在“对所引数据的出处进行规范说明”选项上,本、硕士生的评测分值较高,说明新闻传播学大学生能够自觉遵守严格的、规范化的学术研究要求。
总体而言,目前新闻传播学大学生数据素养有所欠缺,具有较强的数据意识、遵守数据规范,“重”数据的获取和存储安全,“轻”数据管理、数据分析能力和数据隐私,学生数据素养能力“跛脚”的现状比较明显。
目前,国内的数据素养方面的研究还在起步阶段,尝试开设数据素养教育课程的高校较少。虽然部分图书馆偶有开展数据资源获取、科研管理软件或者数据分析软件的讲座培训,但仅是涉及数据素养一小方面的内容,并未有系统性的、面向学科的数据素养培养课程体系。针对高校大学生数据素养研究和教育实践匮乏的现状,结合本次面向新闻传播学大学生数据素养现状的调查,本文提出以下几点建议。
在新闻传播学鲜明的学科背景下,其本、硕士生应具备较全面的数据素养,基于本文的研究表明新闻传播学大学生数据素养欠缺较多,学生对数据素养课程有明显的需求,因此开始学科数据素养课程、构建学科数据素养课程体系显得十分重要。
近年来虽有少数高校开设了大学生数据素养教育课程,但是课程结构单一、内容单薄,教学手段和方式方法也滞后于大数据技术发展实际,尚未形成明确有效的数据素养课程教育模式。面向学科,开设学科数据素养课程,应与学科特点和需求相适应。针对新闻传播学的专业要求,可开展模块化教学。新闻传播学大一、大二本科生可开展数据素养的通识教育即大数据思维培育下的“理念教育课程模块”,大三、大四本科生开展数据素养的技能教育即大数据技术与应用能力培训的“技能教育课程模块”,而硕士生根据学科培养目标开展数据素养的专业教育即大数据实战水平提升的“实践教育课程模块”,差异化的数据素养教育培训课程体系既满足了同一学科下学生数据素养需求的共性,也能满足同一学科不同层次学生数据素养需求的差异性。
数据素养作为大数据时代大学生综合素质和能力的重要组成部分,必然与学科建设密不可分。可围绕不同学科和专业特点设置课程体系,以突出数据素养教育课程的专业型特色和学科方向特色,注重学生自我发展,将大数据、数据素养知识等有机融入到学科培养框架中去,充分拓展学科建设的育人功能。
实验实训课程是新闻传播学专业的必修课程,目前许多国内高校的新闻与传播学院为适应当代媒体数字化发展的新趋势,秉承引领、开放、共享的理念,创建了与大数据有关的实验实训中心及实验室,如视频制作实验室、媒介融合实验室、公共决策与舆情研究实验室、财新数据可视化实验室等,因此数据素养的相关理论、方法、技能可以有机地嵌入到专业实验实训课程中,让学生在掌握专业知识的同时,也学会与之相关联的数据处理技能及应用数据环境。
学科是大学的基础,助力高校“双一流”建设,推动图书馆服务创新是大学图书馆的重要使命。大学图书馆担当着文献信息、学术记录的保存和管理者的角色,是科学研究重要的文献信息保障体系,在当前国内高校对数据素养教育这一新鲜事物认识不足的情况下,图书馆理应开拓学科化服务内涵、创新图书馆服务,成为数据素养教育的“主力军”,具体可以从以下几个方面着手。
第一是注重与信息素养教育课程相衔接。数据素养是信息素养在大数据背景下的创新性发展,是信息素养的核心组成部分,因此可以在信息素养教育课程中无缝地链接数据素养教育内容。借鉴成熟的信息素养教育课程体系,在信息素养教育课程中嵌入数据素养的内容和方法,利用信息素养教育的长期积累和实践经验,在教学实践中逐步完善教学方案、课程资源,这不仅有利于院校、教师、学生迅速接受数据素养培训,也为后期构建独立的数据素养教育课程体系打下了良好的基础。
第二是依托学习共享空间开展数据素养教育。在“双一流”建设背景下,我国高校正在积极探索与实践创新性教育,尝试创新性学习方式。为适应高校教学模式、学术环境等方面的转变,大学图书馆的信息共享空间开始向学习共享空间模式发展,这为数据素养教育提供了绝佳的教学培训场所。在创新性学习过程中,图书馆的学科馆员、数据馆员可以借助图书馆的学习共享空间充分参与到学生的学习、讨论中去,用自己的专业知识为他们提供信息和数据收集、分析、评价的途径及建议。[9]
第三是整合数据素养资源,搭建学科数据素养教育资源平台。目前,数据知识、数据技能和方法的传播处于零散和无序状态,数据资源发布途径芜杂,造成用户获取数据知识发生严重障碍。大学图书馆既能便利地获取外部数据资源,如专题科学数据库、优秀数据资源网站,又有校内自有资源如自建特色数据库、信息素养教育培训课件、学术研讨会、高端论坛等多媒体资料,依托海量的资源优势和专业的学科馆员,按照高校一流学科的建设目标和要求,大学图书馆可以搭建一站式的数据资源平台,整合各类数据素养教学资源,实现数据资源一站式检索,开展数字协作服务,助力重点学科建设。平台建成后将有利于提高数据资源的利用率,有助于宣传数据文化,形成尊重数据、收集数据、规范使用数据、共享数据的良好氛围。
本研究的调查样本局限于部分高校的新闻传播学科,为构建能够具有指导意义的新闻传播学大学生数据素养标准,需要进一步扩大样本和从更多维度来展开分析研究,使研究成果更能反映新闻传播学大学生的实际,为高校学科数据素养教育提供新的内容、方法与策略,进一步提升人才培养质量。
面向学科开展高校大学生数据素养现状的调查与分析是立足于国内数据素养具体现实的本土化研究之一。本文的研究表明,需重点培养新闻传播学本、硕士生数据素养中的数据实践操作能力,以适应大数据时代下新闻的创作要求,提高新闻工作者的业务能力。本研究不仅有利于厘清我国高校新闻传播学大学生对数据素养的认知水平,也可为面向学科的数据素养研究提供必要的素材与理论支持。
[1]HEY T,TANSLEY S,TOLLE K.第四范式:数据密集型科学发现[M].潘教峰,张晓林译.北京:科学出版社,2012:3-7.
[2]方洁,高璐.数据新闻:一个亟待确立专业规范的领域——基于国内五个数据新闻栏目的定量研究[J].国际新闻界,2015(12):105-124.
[3]郝媛玲,沈婷婷.高校文理科研究生数据素养比较[J].图书馆论坛,2016(8):126-132.
[4]黄如花,王迎春.面向学科的数据素养现状及需求调查分析——以《信息检索》MOOC学员为例[J].图书馆论坛,2016(6):99-105.
[5]学位授予和人才培养学科目录(2011年)[EB/OL].http://yz.chsi.com.cn/kyzx/other/201104/20110411/185103201.html,2017-02-14.
[6]孟祥保,李爱国.国外高校图书馆科学数据素养教育研究[J].大学图书馆学报,2014(3):11-12.
[7]隆茜.数据素养能力指标体系构建及高校师生数据素养能力现状调查与分析[J].图书馆,2015(12):55-56.
[8]沈婷婷.数据素养及其对科学数据管理的影响[J].图书馆论坛,2015(1):68-73.
[9]张晨.大数据时代的图书馆与数据素养教育[J].图书与情报,2014(4):117-119.