大数据环境下高校教师数据素养现状及提升策略探析
——基于上海地区高校的调查分析

2016-02-15 09:00:48郝媛玲沈婷婷
现代情报 2016年1期
关键词:数据服务理工科文科

郝媛玲 沈婷婷

(上海大学图书馆,上海200444)

大数据环境下高校教师数据素养现状及提升策略探析
——基于上海地区高校的调查分析

郝媛玲 沈婷婷

(上海大学图书馆,上海200444)

数据素养已成为影响科研能力的重要因素。通过对上海地区高校教师的问卷调查,从数据态度、数据意识、数据知识、数据技能、对数据服务的需求5个方面,对高校文科和理工科教师数据素养的现状和需求进行对比与分析。目前高校教师的数据态度和数据意识整体上呈现积极乐观趋势,但数据知识和数据技能欠缺,亟待开展嵌入科研的数据服务;同时,文理科教师均对数据服务需求强烈,但同中有异,图书馆要按各自需求侧重不同的服务方面。

大数据;数据素养;高校教师;现状调查;数据服务;高校图书馆;上海

大数据环境下,数据素养已逐渐成为提升科研创新能力的必备因素和核心竞争力。随着数据密集型科研的悄然兴起,研究者遇到越来越多的数据策管、数据出版、数据引用等方面的问题[1]。对数据的获取、使用和评价等技能成为大数据时代高校教师应该具备的基本素养。综合国内外文献研究及发展,数据素养的内涵是指具备数据意识[2],并对数据具有批判性思维[3],能够有效且恰当地获取、分析、处理、利用和展现数据。2010年8月,在瑞典哥德堡召开的第76届IFLA会议的主题之一就是社会科学数据素养[4]。2012年奥巴马推出了一系列的教育创新项目和计划,开设了相关的数据知识和处理技能方面的培训,其核心内容就是数据素养[5]。数据素养正逐步被社会各界越来越多地关注和重视,特别是图书馆界。如何提高高校教师的数据意识,增强数据知识与技能,推进数据集中管理和共享等,诸多数据素养及其教育、配套服务相关问题有待进一步探讨研究。

1 国内外研究现状

国外已经开始重视科研人员数据素养的研究和下一代数据人才的培养。Javier Calzada Prado研究了数据素养概念的发展过程,并提出了其核心能力和内容,为图书馆制定数据素养计划提供了模型支撑[6]。雪城大学信息研究院的秦健教授提出了科学数据素养的概念,并设计了相关的数据管理课程来提升学生E-science环境下的数据素养,该项目受到了美国国家科学基金(National Science Foundation,NSF)的资助[7]。Jacob Carlson等说明了制定数据素养计划的必要性,通过对教师和学生数据素养需求的调查和访谈,参照ACRL的信息素养能力标准,初步制定了数据素养计划[8]。

国内关于数据素养的研究近一两年才开始,目前三大中文期刊数据库中收录的关于数据素养的论文有20余篇,其中和高校教育直接相关的有13篇。代表性的成果和观点有:孟祥保阐述了科学数据素养的内容与特征,通过调研国外高校数据素养教育实践的模式,提出了我国开展数据素养教育的建议[1];张静波说明了数据素养对科研创新的重要性,并围绕数据生命周期介绍了数据素养教育的主要内容[9]。目前发表的文献大多数是关于高校数据素养教育、数据素养的必要性、国外高校实践经验和研究成果的介绍以及数据素养开展模式和策略的研究,基于定量分析的实证研究目前还没有,缺乏数据支撑和现实分析。大量的实际调查是进行数据素养教育和服务实践的依据。基于此,本调查旨在揭示高校教师数据素养的现实状况和实际需求,引起高校教师对数据素养的重视,为图书馆合理分配有限的资源和精力、推动数据素养培养机制的建立提供参考。

2 调查概况

2.1 调查方法

综合国内外对数据素养概念和内涵的研究,结合我国高校科学研究的实际情况,笔者先在部分学生和教师中进行了预调研,最终确定了调查问卷内容。针对用户的数据素养认知和数据观念、数据需求、数据获取和组织、数据处理、数据评价、数据安全意识和数据伦理6个方面设计了27道问题,试图通过从数据生命周期的角度对高校师生数据素养现状、需求和意愿进行考察,了解高校师生数据意识、知识和技能上的主要问题和制约因素,为提高用户的数据素养提供依据和参考方案。

2.2 样本说明

调查以上海地区不同类型的6所高校:上海交通大学、同济大学、上海大学、上海财经大学、上海电力学院、上海应用技术学院为样本框,共发放调查问卷350份,回收问卷297份,有效问卷285份,有效回收率为81.4%。本文将调查对象——高校教师按职称分为4类:正高、副高、中级和初级,各自比例分别是:正高18.0%,副高37.8%,中级41.4%,初级2.7%,人员构成基本符合高校教师的职称结构;在专业分布上,主要涵盖了理工科和人文社会科学两个代表性的大类,其中,理工科背景的教师占69.4%,人文社会学科的教师占30.6%,并将这两种不同学科背景的对象作对比,调查结果基本反映了高校不同类型、不同专业背景人员数据素养的情况。本研究所展现的教师数据素养现状和所揭示的问题,对提高数据密集型科研环境下高校教师的数据素养具有现实意义和价值。

3 高校教师数据素养调查结果

3.1 文理科教师的数据态度状况

积极的数据态度是良好数据素养的前提。对待数据的态度和主观能动性有关,它直接影响着数据的获取、分析、处理、共享和展现的过程和最终结果。大数据环境下,对数据和数据问题正确、积极和严谨的态度,是进行科学研究所必须的。

调查结果表明,在科学数据对科学研究的重要性上,文科和理工科均有超过90%的教师认为重要,仅有3.9%的理工科教师认为不重要。同时,91.2%的文科教师表示愿意花时间和精力来管理数据,理工科的这一比例为83.1%,且持不愿意态度的比例高于文科。这反映了教师对数据管理的态度整体呈现正面积极的倾向,并且文科教师较理工科对数据管理的意愿更强烈,对待数据的态度更积极。

对数据素养培育的态度反映了不同学科人员的数据意识和对科学数据管理的需求程度。调查发现,文科有64.8%的教师表示开展数据素养培育“有必要”,理工科这一比例为58.5%,说明绝大多数教师意识到数据素养的重要性,并对数据知识和数据处理技能有强烈的学习愿望和需求。

3.2 文理科教师的数据意识水平

数据意识的差别影响着数据管理的整个过程,它决定了研究者在数据获取上是否及时有效,在数据处理、利用和共享上是否严谨、高效和安全。调查问卷从数据更新意识和共享意识来具体考察教师的数据意识强弱。

80.5 %的理工科教师注重更新研究中用到的数据,文科教师这一比例为70.6%,且不注重的比例略高于理工科,这和学科研究背景及研究方式有一定关系,理工科教师在研究中更为较多地使用科学数据。

表1说明了教师对于科学数据共享范围的意愿。24.7%的理工科教师愿意国际范围开放科学数据,高出文科近22个百分点;文科教师支持国内或者机构内部共享的比例比理工科高;另外,理工科教师支持一对一直接索取的意愿比文科高出约9%。

表1 愿意共享科学数据的范围

3.3 文理科教师的数据知识情况

良好的数据素养是以广博的数据知识为基础的。数据知识具体包括数据特征、作用效应、搜索转换、传播展示、引用规则等方面的知识,它能帮助科研人员深层次的挖掘数据价值,拓展科学研究内容和方法。本调查从对元数据的认知和使用情况、对本学科主要科学数据平台的了解程度、对引用数据的方法政策的熟悉程度3个方面来考察教师数据知识的认知情况。

元数据是信息共享和交换的基础和前提,对元数据进行有效管理能使数据变得更有价值,科学研究更高效。由表2可见,高达44.1%的文科教师根本没有听说过也不了解什么是元数据,理工科也有22.9%的教师表示不了解元数据;文科和理工科了解并使用过元数据技术组织数据的教师分别占20.6%和14.3%,比例均较低。这反映了元数据管理在目前的科学研究中应用普遍较少,教师对元数据知识比较缺乏,而这一状况在文科中表现更为明显。

表2 对元数据的认知和使用情况

调查发现,64.7%的文科教师和58.5%的理工科教师了解本学科的主要科学数据平台,具备基本的数据获取方法和途径;对于数据引用的方法和法规政策,均有近一半的文科和理工科教师表示“了解”,但仍有23.5%的文科教师和18.2%的理工科教师表示“不了解”,这反映了少部分教师缺乏对数据引用的认知,这将妨碍科学数据再次有效利用和知识产权的保护。

3.4 文理科教师数据技能水平

数据技能是数据素养最重要的构成要素和表现方面,它包括获取、处理、利用、展示、评价、保存以及再创造数据等方面的能力。有些数据技能可以通过技术培训来获得,例如数据获取能力、处理能力和展示能力;而有些技能则需要长期的实践积累来获得,比如数据的运用能力、评价能力。

3.4.1 数据获取技能

在科研活动中,23.5%的文科教师使用的是亲自收集并加工处理的一手数据,58.8%既使用一手数据又利用他人调查或科学实验所得的二手数据;而理工科教师使用一手数据的比例为45.5%,高于文科,使用二手数据的比例相对较少,反映了学科背景对教师的科研数据的特征和属性有决定性的影响。

图1表明了教师使用的二手数据的获取途径。文科和理工科整体上趋同。网络搜索仍是目前最主要的数据获取方式。其次,公开发表的论文中附带的数据源也是超过一半的教师常用的方式。不同的是,文科有50%的教师较常利用专业科学数据库来查找数据,且使用院系内部数据库的比例高出理工科15.7%,而理工科采取联系作者直接获取方式的比例高出文科近20%。数据获取途径和学科领域的数据共享程度、院系提供的数据支持服务有一定关系。

图1 二手数据主要的获取途径

3.4.2 数据处理和评价能力

在收集、处理数据时,17.6%的文科教师是完全自己处理,大部分自己做的比例为73.5%;理工科完全自己处理的比例为31.2%,大部分自己做的情况占61.0%;文科和理工科处理数据时少部分自己做和请他人代劳的比例均较低。这说明部分大教师已经具备基本的数据处理技能,且理工科教师完全依靠自己处理的比例比文科教师更高。

在使用数据前整理数据的方法上,文科和理工科表现出相似的情况,主要使用数据规范化、数据筛选、数据整合这3种方法来整理数据,各自比例均接近50%,而采用仪器校准和不整理数据的情况较少,如图2所示。这反映了教师认识到对数据进行初步处理在整个数据生命周期中的重要性,在使用数据前都有整理数据的需求和习惯。

数据质量的判断和数据的获取方式有一定关系,对数据的筛选和分析离不开数据评价。教师一般从数据的实效性、权威性、准确性、科学性等方面来考察数据的好坏。如表3所示,近一半的文科教师是依靠自身经验来判断数据质量,而理工科教师中超过一半是利用实验来验证。文科和理工科都很少有人选择向专家咨询这一途径。

表3 教师对于数据质量的判断依据

3.4.3 数据保存情况

大数据分析是基于长期的海量数据的保存和积累,才能有效的揭示科学发展规律,数据价值才能被充分地挖掘。研究者往往在科研项目进行中重视数据保存,而在科研项目结束或者论文发表后对原始数据没有明确的保存方式,数据保存处于一种分散自由的状态。目前文科教师主要是依靠自身保存原始数据,比例达到94.1%;理工科教师依靠自己保存的比例是64.9%,另外有26%是采用项目组集中长期保存的方式;文理科教师不保存原始数据的比例均很低(见表4)。

表4 科研项目结束后或论文发表后原始数据的保存方式

对于科研中产生的数据的保存载体,文科和理工科大体呈现相似的状况,主要是保存在个人电脑和U盘、移动硬盘上,存放在纸质文本、实验室的数据库、网络数据库、网盘等载体上的相对较少。不同的是,相对于理工科教师更喜欢把科学数据保存在实验室的数据库上,文科教师更倾向于保存在网络数据库上。

表5表明,23.5%的文科教师对科学数据只进行低于5年以下的中短期保存,理工科这一比例高达51.9%。有超3/4的文科教师认为他们对数据做了长期保存,但这并不是真正意义上的数据永久保存,由前文分析可知,他们的保存方式还是主要依靠自我保存,保存工具也是以个人电脑和移动媒介为主,并未达到永久保存的要求和水平。这将会造成数据的丢失,对科学研究来说无疑是巨大的损失。图书馆要充分重视数据安全意识的培养,并加强和科研人员沟通合作,优化数据存储载体,实现真正意义上的科学数据永久保存。

表5 科学数据的保存期限

3.5 文理科教师对数据服务的需求方面

本调查从数据咨询服务和数据基础设施两个方面考察教师的需求。图3显示了文科和理工科教师对数据咨询服务的需求整体上一致,都对数据查找咨询和数据分析处理咨询需求强烈,而在数据引用和元数据标准方面的需要相对较弱。差别是,文科教师在数据分析处理咨询方面比理工科高出13个百分点。在数据基础设施方面,文理科教师最期望提供数据存储平台和数据分析工具。特别是数据分析工具,文科和理工科均有近3/4的比例,这表明图书馆在数据分析工具的建设上有较大的空间和很好的前景。虽然文理科对数据基础设施的需求大体相同,但仍可以看到文科教师在数据存储平台的需求上比理工科高出近14个百分点,表明文科人员相对更缺乏数据存储的工具和方法。另外,有少部分的教师期望建立虚拟化交流社区。

图3 文理科教师对数据咨询服务的需求

4 文理科教师数据素养现状分析与提升策略

4.1 大数据环境下,教师的数据态度和数据意识呈现积极乐观趋势

随着大数据时代的到来,我国高校研究者已经意识到科学数据的价值和它在科学研究中的关键作用。通过调查发现,绝大多数的文科和理工科教师都认为科学数据对科学研究非常重要,且愿意花时间和精力来管理数据,并对提高自身数据素养有强烈愿望。这一现状得益于大数据的迅速发展,我们不用花太大力气去强调科学数据的重要性。积极正确的数据态度对整个数据生命周期中研究者的反应、倾向和行为起到正面影响。另一方面,从数据的更新意识和共享意识两个方面的调查结果也反映了文理科教师整体上数据意识较强,传统、封闭的数据观念逐渐得以转变,开始注重数据的实效性、共享性、安全性和长期性。

文科和理工科教师在数据态度和意识上虽然整体趋同,但仍存在差异。具体体现在数据更新意识上,理工科教师更注重更新研究中用到的科学数据,比文科高出约10个百分点。这一定程度上与文理科的研究方式相关,理工科更多的是实验性和模拟计算型研究,数据更新频率较快,而文科更多的是实证和理论研究,数据的时效性表现的不是很明显。另外,在科学数据共享范围的意愿上,文科和理工科表现出的不同倾向与其学科背景有关,文科的讨论对象和研究范围通常是我国国内或者一定区域内。

鉴于以上现状,图书馆在强化教师数据态度和数据意识上的任务相对较轻,但仍有少部分教师是用传统的观念和习惯来指导自己的数据管理活动。大数据环境下,教师的数据态度和数据意识还有很大的激发空间,亟待进一步培养和强化。教师的数据态度和数据意识受他们个人的知识结构、思维习惯、价值观、进取的精神等方面的影响,同时又依赖于外部数据环境和数据文化氛围的创造。要建立教师良好的数据态度和数据意识,需要从数据观念和数据文化的宣传着手,为教师提供丰富的数据管理交流和实践的机会,并注重联系实际,使他们在实践活动中潜移默化的转变数据态度,使良好的数据意识成为内在的需求和意愿。

图4 文理科教师对数据基础设施的需求

4.2 数据知识和数据技能欠缺,亟待开展嵌入科研的数据服务

对数据的敏锐洞察力、广博的数据知识、专业的数据技能是从海量的数据中挖掘有用信息的必要条件。在当前的科研领域,传统的数据管理模式和数据保存机制逐渐被淘汰,缺乏对数据进行科学地分类、分析、处理、挖掘的技能和工具,将阻碍获取和创造更大的数据价值和科学财富[10]。从元数据的认知和使用情况的调查中可以发现,目前绝大多数的文理科教师对元数据知识了解较浅,很少利用元数据来管理和组织数据,且这一状况在文科中更为突出。一定程度上反映了目前教师对先进数据管理方法和手段的了解程度相对较低,这可能和学校对数据知识的宣传普及不够、教师获取这方面知识的途径较闭塞有一定关系,将是我们开展数据素养教育和数据服务工作的重点。同时,学校还要注意制定的元数据标准要适应不同的学科背景,方便不同专业的教师来进行组织管理和描述。

通过调查发现,目前绝大多数文科和理工科教师在数据获取、处理和保存方面基本上是依赖自身处理,说明大部分教师具有基本的数据处理技能;另一方面,这种现状也可能和目前高校缺乏帮助教师管理数据的配套服务和数据专员有一定关系,即使遇到数据处理方面的问题,教师所能得到的解决途径较少,更多的是依靠自己个人的力量。虽然调查结果显示了文科和理工科教师在数据管理上的技能和方法都有所欠缺,但进一步分析两者的行为习惯可以发现同中有异。例如,在数据质量判断方法上,文科教师更倾向依靠自身经验来判断数据质量,而理工科教师更多的是利用实验来验证,都少有通过同行间的交流和向专家咨询来评判。这从侧面反映了目前高校数据交流活动和咨询服务进行的很少,院系和图书馆对这方面的服务不够重视。同时,文科和理工科研究对象和思维方法的不同导致数据评判标准和方法不同,说明数据评价技能和指标离不开学科背景。因此,图书馆开展数据评价的培训和咨询服务要考虑不同专业独特和通用两个方面的数据评价标准,要具有学科适用性。

数据服务是图书馆数据素养教育职能的一种具体表现,同时也是提高用户数据素养的重要环节。针对我国目前的情况,提供嵌入科研的数据服务十分必要。图书馆要充分了解教师在科学数据管理上的真实想法和对数据知识、技能的紧迫需求,为教师提供全新的基于科研生命周期的数据服务和指导。嵌入科研项目中开展有效的数据知识和技能的培训、提供数据分析处理工具、构建数据存储平台和数据交互共享社区等,帮助教师管理自己的数据,消除他们的困惑,丰富教师数据知识的同时,激发其原有的专业知识,培养良好的数据意识和技能,训练教师迅速有效地获取、处理、利用数据,创造出更大的数据价值。

4.3 文理科对数据服务需求强烈,同中有异,按各自需求侧重不同的服务方面

充分了解教师对数据服务的迫切需求和意愿才能有针对性地开展数据素养培育实践。整体上,文科和理工科教师都对数据查找和分析处理咨询需求强烈,反映了教师的数据获取和处理的知识、技能、方法和工具使用等方面较薄弱,图书馆可以从开展这方面的数据咨询服务入手,再逐步配套其他方面的指导。另外,教师们对数据平台和工具的需求很强,图书馆要加强数据基础设施建设,改变数据平台创建滞后的现状,提高数据服务水平。

文科和理工科教师虽有上述这些相同的数据服务需求,仍有不同之处。文科对数据分析处理咨询和数据存储平台的需求比例远高于理工科。这是由于不同的学科领域,知识结构、科研环境、研究方向都不相同,对于数据技能和工具就会有不同的要求。文科教师善于数据的收集和积累,但对数据的处理、利用和保存上欠缺科学的方法和技能;理工科教师擅长挖掘事实数据,更注重数据分析工具的使用和客观数据的处理利用。这些关于数据的行为习惯的不同表现是和他们从事的专业领域分不开的,所以在开展数据服务和数据素养教育前应对不同专业背景的人员进行针对性的调查,深入了解每个专业领域的数据类型、数据和元数据格式与内容、数据获取方式、数据处理和利用手段等,了解不同背景科研人员的数据管理需求,以及他们在科研生命周期中管理自己的数据时遇到的问题。

图书馆要充分发挥在培养教师数据素养方面的作用,加强数据文化宣传,积极参与高校数据素养培育政策的制定,在满足教师数据服务需求的同时,加快数据基础设施建设,全面提高教师的数据意识、数据知识、数据技能和数据伦理道德。

[1]孟祥保,李爱国.国外高校图书馆科学数据素养教育研究[J].大学图书馆学报,2014,(3):11-16.

[2]Stephenson,E and Caravello,P S.Incorporating Data Literacy into Undergraduate Information Literacy Programs in the Social Sciences:A Pilot Project[J].Reference Services Review,2007,35(4):525-540.

[3]Schield,M.Statistical literacy:thinking critically about statistics[J].Of Significance:A Topical Journal of the Association of Public Data Users,1999,1(1):15-21.

[4]Session 74-Information Literacy with Reference and information Services[R/OL].http:∥www.ifla.org/node/6271,2015-08-01.

[5]缪其浩.大数据时代:趋势和对策[J].科学,2013,65(4):25-28.

[6]Prado J C,Marzal M A.Incorporating Data Literacy into Information Literacy Programs:Core Competencies and Contents[J].Libri,2013,63(2):123-134.

[7]Qin Jian,D’Ignazio J.Lessons learned from a two-year experience in science data literacy education[R/OL].http:∥docs.lib.purdue.edu/iatul2010/conf/day2/5,2015-08-12.

[8]Carlson J,Fosmire M,Nelson M S,et al.Determining Data Information Literacy Needs:A Study of Students and Research Faculty[J].Libraries and the Academy,2011,11(2):629-657.

[9]张静波.大数据时代的数据素养教育[J].科学,2013,65(4):29-32.

[10]李芸.浅论大数据时代的数据素养培养策略[J].电脑知识与技术,2013,9(36):8199-8200.

(本文责任编辑:马 卓)

An Analysis of the Present Situation and Upgrade Strategies of University Teachers’Data Literacy in the Big Data Era——Based on the Investigation of the Universities in Shanghai

Hao Yuanling Shen Tingting
(Library,Shanghai University,Shanghai 200444,China)

Data Literacy has become the important factors in research.It influences the scientific research ability.Through the questionnaire survey of teachers in universities in Shanghai,the status and needs of data literacy of the liberal arts and science teachers were compared and analyzed from data attitudes,data awareness,data knowledge,data skills and the demand for data services.Now,data attitudes and data awareness of teachers presented the positive trend on the whole,but data knowledge and skills were lacked.Data services embedded into the scientific research need to be carried out.At the same time,the liberal arts and science teachers had strong demand for data services,but they had different requirements.The library should focus on different services according to their needs.

big data;data literacy;university teacher;investigation;data service;university library;Shanghai

10.3969/j.issn.1008-0821.2016.01.018

G252.0

A

1008-0821(2016)01-0102-05

2015-11-16

教育部人文社会科学研究青年基金项目“数据素养对科学数据管理的影响及对策研究”(项目编号:14YJC870017)研究成果之一。

郝媛玲(1983-),女,馆员,硕士,研究方向:科学数据管理、用户行为分析。

猜你喜欢
数据服务理工科文科
地理空间大数据服务自然资源调查监测的方向分析
文科不懂理科的伤悲
求学·文科版2019年6、7期合刊
豆文科作品
艺术家(2018年7期)2018-09-22 02:09:20
理工科优等生WEY VV6
车迷(2018年11期)2018-08-30 03:20:28
如何运用税收大数据服务供给侧结构性改革
中国商论(2016年34期)2017-01-15 14:24:18
孙文科
基于频繁子图挖掘的数据服务Mashup推荐
理工科大学生音乐鉴赏课程教学改革探析
浅析理工科大学生法律素养的培养