孙宏安
(大连教育学院 离退休干部处,辽宁 大连 116021)
数据能力:教师专业发展的一个方向
孙宏安*
(大连教育学院 离退休干部处,辽宁 大连 116021)
数据能力是从具体问题中获取数据,对数据赋予背景得到信息,进而对信息进行研究从中提炼出知识并运用这样得来的知识解决问题的能力;数据能力是数据素养的组成部分。数据能力的结构包括数据认识能力、数据获取能力、数据解释能力、数据分析能力、数据表达能力和数据挖掘能力。在大数据时代,信息技术进入教学过程的一个必然结果是数据能力成为教师专业发展的一个方向。
数据;大数据;数据能力;数据素养;学习诊断系统
大数据时代,数据能力(data capability)成为时代的要求,数据能力是贯穿现代通信和信息技术的主线,数据能力也是核心竞争力。[1]数据能力到底是什么?数据能力对教师专业发展有何意义?
1.数据能力的内涵
数据能力在国内最早见于文献《数据能力:硕士研究生亟需加强的基本功》,该文认为数据能力由数据的获取能力、处理能力、解释能力和防伪能力构成。[2]较新提及的国外文献有英国政府报告Seizing the data opportunity——for UK data capability,其中指出数据能力包括人力资本能力,即对数据的管理、分析、解释和传递能力;分析和存储的工具反映的数据分析和存储能力;还有涉及数据本身的数据转换分享能力。[3]
从当代社会用语的角度看,“大数据时代”“信息社会”“知识经济”是关键词,“数据”“信息”“知识”作为关键词的关键,它们是三个既有密切的联系又有基本的不同点的概念。数据是用统计方法收集起来的数字(或其他数据形式如图形、字母、符号、音响等等)的记录,其本身并没有什么意义;信息是把数据放置到一定背景下,对数据进行解释从而赋予意义,也就是赋予了意义的数据就是信息。[4]例如“355”只是一个数据,而“公元2013-2014年之间的农历癸巳年只有355天”则是一条信息;当从信息中提炼出规律的时候,人们就得到了知识,所以知识是系统化了的信息,如我们从举出的信息进一步提炼(这里是概括)就会得到“一个上一年是双闰年的农历年可能只有355天”这条知识,因此得出了一个规律。也就是说,从具体问题中获取数据,对数据赋予背景(解释)得到信息,进而对信息进行研究从中提炼出知识并运用知识解决问题的能力就是数据能力。
对数据能力的理解可以比较两个与数据能力相关的概念,即数据素养和数据分析能力。数据素养(data Literacy)主要指研究者在数据的采集、组织和管理、处理和分析、共享与协同创新方面的能力,以及研究者在数据的生产、管理和发布过程中的道德与行为规范。[5]本质上说,人在某一方面的素养是由在这个方面的主要能力和必要品格组成的。前一分句说的应该就是数据能力,与我们前面对数据能力的界定是互补的:我们的界定是一种本质界定,表述的是数据能力的内涵;而前一分句说的是数据能力的组成,表述的是数据能力的外延(即指明外延的定义)。后一分句则是人们在涉及数据的行为中的必要品格。
数据分析能力(data analysis capability)是指个体在对形如数字、字母、图形、信号、言语等未进行加工的原始数据通过整理、描述、推断、质疑等分析,以了解其内在的性质、规律和意义的能力。[6]可见数据分析指的是“获取数据”后对数据进行的赋予背景、提炼知识的活动。与我们界定数据能力采用的“数据活动”相比较,缺少“获取数据”和“运用知识解决问题”两个活动环节。因而数据分析就是整个数据活动的一个子活动,数据分析能力就是数据能力的一个组成部分。与前面数据素养论述中提出的数据能力比较,相当于“数据的组织和管理、处理与分析”的能力。
2.数据能力的结构
一般来说,能力是顺利完成某一活动的个性心理特征,因此数据能力就是顺利完成与数据相关的活动(以下简称为“数据活动”)的个性心理特征。数据能力的结构应该与数据活动的结构相一致。先探讨一下数据活动的结构。实际上,数据能力定义的论述已经涉及到数据活动的结构,例如可以从定义数据能力时描述的数据活动的基本过程——从具体问题中获取数据,对数据赋予背景得到信息,进而对信息进行研究从中提炼出知识并运用这样得来的知识解决问题——来分析数据活动的结构。
首先从数据和数据活动之外来认识数据和数据活动,例如什么是数据,数据的分类、特点,数据和数据活动的价值等。许多关于数据和数据分析的文献以至于一些辞典把数据只看作数字,而实际上数据可以有多种表现形式,在《辞海》(2009)中“数据处理”项下,数据“可以是数字、图表、符号、文字和曲线等形式”,根据表现形式,数据包括数字数据和模拟数据,前者就是通常认为的数字,如统计或者测量得到的数,其特点是数据表现为离散的数;后者一般采用某个区间连续变化的物理量表示数据,如声音的高低和温度的变化等的图形、符号、文字、曲线等。这种分类也存在一定问题,例如,文字数据到底是离散的还是连续的?有人认为数据是数值,数值和数字并不等同:数值与量有关,一个量用数目表示出来的多少叫做这个量的数值;数字就是表示数目的文字或者符号。那么究竟什么是数据,或者说我们应该在何种意义上使用“数据”概念还需要研究和进一步认识。数据和数据活动的价值涉及问题就更多,按数据、信息和知识的关系,数据最重要的价值应该就是提供了我们得到信息和知识的基础;而数据活动则有发现问题、引领决策、展望未来的价值。当然在这样的价值的具体表现和实现方面还处于人言言殊的局面。
然后进入数据和数据活动中认识两者。一要“有”数据,于是就需要获取数据,也称为“收集数据”。收集意味着数据是客观存在于某个地方等着我们把它们聚集到一起,在一些情况下,这可能是成立的,例如收集“二手数据”,运用别人现成的数据,需要的是收集(选择)适合于自己需要的数据。但更多时候,数据并不是存在于特定的某地,我们需要运用某种方法来得到它们,就是获取数据(“一手数据”)。这样的数据活动更具主观性,主观性就需要设计,即设计获取数据的方案,包括研究目的、研究内容、研究对象、研究方法、研究投入等。然后实施具体的方案,得到数据。实际上整个“有”数据的活动都应该事先设计——包括哪些数据可以收集二手数据,哪些数据必须获得一手数据,所以整体来说“获取数据”更准确。
二是“清”数据,即判断获取的数据是否符合需要,于是需要解释数据。解释数据就是前面引述数据素养和数据分析能力的文献中指出的数据组织和管理、数据整理和描述的活动,当然这些活动都是指向研究的目的——所谓“需要”就是达到研究目的的需要。具体就是根据数据研究的目的进行数据录入,一般是赋予数据结构和编码;数据清洗,对数据去重、补缺和改错;数据加工,对数据进行抽取、排序和分组;数据描述,进一步求出数据的集中趋势、离散趋势、频数分布和交叉频率。通过数据解释,我们得到了我们需要的或者符合我们需要的数据。
获得数据后即要对数据赋予背景生成信息以及进一步从信息中提炼出知识。这时对数据要进行分析活动,在数据的基础上进行推断质疑,得出关于研究对象的性质、规律和意义的结论。
数据分析的结果需要加以表达才能使人们理解和运用。更直接地说,就是把数据分析的结果呈现出来。呈现数据的关键是可视化——包括数据可视化、信息可视化、知识可视化——努力使从数据获取开始的数据活动,数据、信息和知识可视化。“可视化”一词源于英语visualization,原意是“可看得见的、清楚的呈现,形象化的”,一般的,可视化是指用于创建图形、图像或动画,以便交流沟通信息的技术和方法。实际上就是将数据、信息和知识转换成图形或图像显示出来,并进行交互处理促进知识的交流传播和创新的理论、方法和技术。可视化技术使人能够在三维图形世界中直接对转化为形体的信息进行操作,并以此与计算机直接交流,因此能够把人和计算机的能力以一种非常自然的方式加以统一和叠加,从而提高了人们处理信息和获取知识的能力。可视化赋予人们一种仿真的、三维的并且具有实时交互的信息处理能力,从根本上改变了我们表示和理解大型复杂数据的方式,使我们可以在三维图形世界中用全新的方式获得知识并发挥自己的能动性创造新知识。这种数据信息和知识的呈现方式将直接导致它们的应用,而这正是数据分析得到信息和知识的目的。
数据可视化和数据规模的增大为从大数据(big data或mega data,海量数据或者非常多的数据)中进一步“发现”知识提供了新的可能,那就是可以进一步深入探讨数据,即挖掘数据。数据挖掘(data mining)是数据库知识发现(Knowledge-Discovery in Databases:KDD)中的一个步骤,一般是指通过人工智能算法探索大数据,发现其中的规律和数据间的关系直接形成知识的过程。这就为我们提供了数据应用的新可能,不仅如此,甚至数据挖掘自身都是数据应用的产物和数据应用的方式。在教育领域,学生考试的数据挖掘工作已经得到国内外研究的关注,一般认为,考试数据挖掘对于学生、教师、教育管理人员以及研究人员均有重要价值:例如对于学生而言,考试数据的挖掘可以从学生行为角度了解学习过程的发生机制,并用来优化学习,以基于学习行为数据的分析为学习者推荐学习资源,开展适应性学习;对于教育管理人员来说,借助于考试数据挖掘,决策者才能清楚地了解教育的现状和存在的问题,才能有目的地调整教育决策,才能在人力和财力上更合理地布局。[7]
综上,数据活动的结构包括了认识数据、获取数据、解释数据、分析数据、呈现数据和挖掘数据,那么数据能力的结构就包括数据认识能力、数据获取能力、数据解释能力、数据分析能力、数据表达能力和数据挖掘能力。
1.数据能力是现代教学的需要
当代信息技术迅速、全方位的发展带来了社会各领域前所未有的变革,对于教育领域引起的变革,人们用“突破”(Breakthrough)来形容。按照一本专门探索教育领域的突破的著作《突破》的观点,信息技术在教育领域引起的突破的核心包括个人化教学、精确化和专业学习。
精确化占有重要的特殊地位:个人化教学是教育变革的目标——以人为本,促进每一位学生的发展,促进学生的个性发展和全面发展,最理想的就是个人化教学;个人化教学要求教学精确化,精确到明确指出学生的每一点发展和进步、每一个发展中的问题。而在教学的精确化中精确化的教学评价处于中心的位置,精确化实际上更容易理解的说法是用准确的数据活动驱动教学,包括依据准确的数据活动进行准确的教学评价;为了实现教学精确化,教师的专业水平就必须有极大的提高,所谓提高指的是“在自己的工作环境中做正确的事情”,那么在需要精确化教学的环境中做正确的事情的能力就是教师需要学习的专业能力。教师专业水平的提高将有效促进教学的精确化,从而促进个人化教学的发展。促进学生更好发展。这就是突破的结果。
教学中存在着许多影响教学个人化的问题,其中最为著名的就是“课堂教学的两难问题”。
问题的焦点是课堂教学不可避免的两难选择:一个教师和(比如说)30个学生,每个学生都具有不同学习动机、不同的起点、不同能力和不同阻碍学习的弱点。人们设计发明许多策略以应对这些个体差异,从分流到班内分组。但是,每个策略总体上都是在忽略个体差异的教学基础上进行微调。学生被划分成不同的年级,主要根据是他们的年龄而不是他们的学习状况。每个年级有不同的课程目标和成绩标准,在同一年级里每个学生都受教于同一教师,一年终结后,许多学生升入下一年级,面临新的课程目标、标准和新的教师,无论他们在上一年级知识掌握得如何,不管他们与教师建立起什么样的关系,也不管教师所积累的对学生的了解如何。
年级累进模式是工厂流水线模式在学校的翻版。它假定同龄人具有同等学习基础和学习进度。这个模式持续使用着,尽管大量证据表明,大约三年级学生的学业差距可能多达五年或者更甚。这个模式使得对学生的评估与他们的起点无关,因为起点是课程规定好的,而不是学生自己的准备情况。然而,学生间的差距仍然存在并且成为问题的关键,即多年未解决的老问题——个人化教学。
正是这个两难——教学既要应对个体的需求,又必须顾及一个30人的班集体或者说按年龄划分的集体,但又缺乏清晰的思路去面对学生的个体需求——使得课堂教学问题重重。[8]31-32
这一两难问题一直影响着学校教学,就是在我们倡导的发展性评价也未能解决这一两难问题。教师在实施自己设计的发展性评价方案时,通常不会考虑也无从考虑对学生的发展评价应该从学生自身的认知起点出发而不仅仅是从教学既定的知识起点和在这种既定知识起点的基础上设计的教学活动出发。解决这个问题的一个关键在于深入了解每一个学生的学习起点,对每个学生的学业评价应该与他的学习起点或者认知起点联系起来,这才是真正意义下的发展性评价——评价的是每一个学生从自己的认知起点出发所获得的成就。不过这样一来,我们又面临新的问题:怎样才能确切把握自己所教的每个学生在某一学段某一学科以至于某一单元学习时的认知起点呢?教学的起点怎样在对学生进行的测验评价中起作用?
解决这两个问题也直接指向了教学精确化特别是教学评价的精确化。
《突破》一书也给出了未来的解决方案设计——开发一个具有“四个实际上还不存在的新成分”的系统:
现在,让我们看看当前在实际上不存在什么。我们列出四项全部关联,缺少任何一项都是不够的。它们是:
1.一套有力的评估工具,这套工具与每堂课的学习目的相配套,它使教师每日获得有关每个学生进步的准确的、综合的信息,这套工具的管理使用不会过度干扰正常的课堂秩序。
2.一个不用太多时间而又能捕捉到过程评估数据的方法。自动分析数据,并把数据转换成可有效推动教学的信息,使教师很快即可做出教学方案,而无须等到将来。
3.一种使用每个学生的评估信息来设计并实施个人化教学的措施;为教学而评估成为提高教学精确性的策略。
4.一套嵌入的手段来监测和管理学习,测试那些能有效地系统地提高课堂教学的效果,从而使之更加精确地应对教室中每个学生的学习需求。
有人马上会想到目前的一些教学活动接近实现以上一项或几项,但我们意识到还没有包含以上四项并将之统一起来的教学实践的例子。[8]39-81
这是一个利用信息技术系统的方案,也是一个运用数据活动驱动教学的方案,与前面分析的数据活动相比较,这里的“1”就在于获取数据,特别是对研究的目的、方法(工具)、条件(不过度干扰课堂)等都作了设计;“2”则是解释数据、分析数据、表达数据,使得教师由数据得到信息,又由信息得出知识——做出自己的教学方案;“3”是继续表达数据,进一步运用得到的知识——精确性评估——促进教学的个人化,形成精确化教学的策略;“4”则是数据挖掘,运用从大量学习数据中直接得到的知识监测和管理学习系统提高教学的效果,精确地满足每一个学生的学习需求。
如果说在写作出版《突破》这本书的时候这样的系统还完全是出于理想,那么十年后的今天这样的系统至少是具有某些类似功能的系统已经开始投入应用,例如国内外多种“学习测试评价系统”能获取、解释、分析、表达学生的学习考试测评数据,部分实现了上述系统的功能。有一种“学习诊断系统”在专业使用情况下能够基本实现上述系统的全部功能。这样系统的使用包括数据活动的所有环节,于是专业使用这样的系统就需要具有数据能力。所谓“专业使用”是指学习诊断系统是在教师的通常教学过程中使用的,就是说学习诊断系统是镶嵌于教师的日常教学过程之中的,并不自外于教师的日常教学,因此系统就是直接由教师使用的——当然也就需要教师具有相应的数据能力。于是可以说,在追求教学个人化和精确化的目标之下,教师的专业学习应该指向数据能力提高的方向。
教学的精确化和个人化无疑是教师的教学理想,当已经出现了能实现这种教学理想的工具之后,迅速使用这种工具促进教学上的突破就会成为学校和教师的不二选择。据笔者所知,未尝试或者使用过某种“学习测试评价系统”进行大型考试的数据分析的中学恐怕为数不多,许多学校已经开始使用镶嵌于教师课堂教学过程的学习诊断系统。系统的运作都涉及数据能力,所以为了更专业、更有效、更有创造性数据能力就成为教师的专业能力。
以“学习诊断系统”为例说明教学过程中教师需要进行的活动和因此所需要的能力,具体见图1。
图1 镶嵌学习诊断系统的教学过程示意图
教学活动分为6个步骤,用虚线方形框起来的6个小步组成了“进行教学评价”这一步骤。从“确定教学目标”到“进行教学评价”的前两个小步“测试”和“评分”都属于获取数据的活动。期间最主要的数据活动是“获取数据”确定研究目的——学生对于教学目标(及学习目标)的达成度;确定或者说设计研究的方法-工具——表现教学目标达成度的标准测试题;研究的内容也是由目标+测试题指明的;研究对象对于教学则是固定的已经确定的了。“教学评价”步骤中的“解释数据”就是一般的解释数据的活动,不过具体数据是进行本次标准测试的就教师评分得到的学生测试成绩,需要由教师(在系统操作人员配合下)进行数据的录入清洗和加工。然后的“数据分析”和初步表达是由系统算法自动完成的,接下来教师需要读懂系统表达的数据分析结果,得到自己的数据表达,也就是形成了关于学生学习和自己教学的知识。接下来的“进行反馈、教学调整”就是运用数据表达的结果知识,改进学生的学习和自己的教学。与此同时还可以做进一步的数据挖掘(图中用一个空心箭头表示这一点),例如探讨每一位学生的学习困难和解决方案,探讨学生成绩与学生学习背景的关联,例如与学生的人格发展、学习风格、师生关系等的关联,以期精确地改进每一位学生的学科素养并有针对性地促进每一位学生的全面发展,从而以自己的精确化的个人化的教学促进立德树人教育目标的实现。可见,镶嵌了学习诊断系统的教学过程中,教师必须具有全面的数据能力,数据能力就是教师专业学习的内容,就是教师专业发展的一个方向。
[1]杨巨龙.大数据技术全解:基础、设计、开发与实践[M].北京:电子工业出版社,2014:21.
[2]许胜江.数据能力:硕士研究生亟需加强的基本功[J],学位与研究生教育,2007(9):29-32.
[3]庆斌.紧抓数据机遇——英国数据能力战略[J].情报理论与实践,2014(5):145.
[4]涂子沛.大数据[M].桂林:广西师范大学出版社,2012:35-88.
[5]张静波.大数据时代的数据素养教育[J].科学,2013(7):29-32.
[6]范明明.中小学生数据分析能力的培养研究[D].上海:华东师范大学,2014.
[7]游忠惠.大数据时代:考试到评价的跃升[N].光明日报,2014-01-30(15).
[8]迈克尔·富兰,彼得·希尔.突破[M].北京:教育科学出版社,2009.
[责任编辑:惠人]
Data Capacity:A Direction of Teachers'Professional Development
SUN Hong-an
(Retirement Department,Dalian Education University,Dalian,116021,China)
One person's data capacity means he or she can obtain data from specific problems,give background to data to extract information,study information to distil knowledge and use the knowledge to solve problems.Data capacity is part of data quality.Data capacity includes recognizing data,obtaining data,explaining data,analyzing data,expressing data and digging data.In the era of big data,information technology is integrated into teaching process,one of the results of which is that data capacity has become one direction of teachers'professional development.
data;big data;data capacity;data quality;diagnosis system for learning
G451.1
A
1008-388X(2016)02-0031-05
2016-03-07
孙宏安(1947-),男,辽宁昌图人,教授。