用数据架构未来学校(上)

2018-01-17 13:29杨现民
江苏科技报·E教中国 2018年17期
关键词:教育学生

杨现民 江苏师范大学智慧教育学院副院长,教育部教育信息化专家,中央电教馆培训专家,江苏省教育信息化工程技术研究中心副主任,教授、博士。

一、何为“大数据”

提起大数据时代,我们不得不提近年来一个非常了不起的“发明”——“双十一”。据统计,2017年“双十一”当天的交易额大概是1682亿元,这是一个巨量的数字,相当于新加坡超过一个月的GDP,南苏丹好几年的GDP。这个例子直观地反映出,中国已经进入了一个新的时代——大数据时代。在这个时代,全数字化、移动互联式的生活、工作、学习逐渐普及。那么,何为“大数据”?

在众多的学术化概念中,笔者认为最权威、最有助于理解的“大数据”定义,是国务院在2015年发布的我国首个有关“大数据战略”的文件——《促进大数据发展行动纲要》中所提出的:大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合。笔者对该文件做了一个高频词分析,发现其中出现最多的两个词为:共享(59次)和开放(36次)。这足以说明,我国所走的大数据路线一定是开放、共享的路线,突出跨区域、跨部门、跨行业“三跨”数据的融合,最终用数据构建数据强国,推动大数据治国。

习近平总书记在2017年新一届中央政治局第二次集体学习中,将“大数据战略”作为一个专题进行学习。他指出,大数据是信息化发展的新阶段。随着信息技术和人类生产生活交汇融合,互联网快速普及,全球数据呈现爆发增长、海量集聚的特点,对经济发展、社会治理、国家管理、人民生活都产生了重大影响。在这样一个新的阶段,习近平总书记对领导干部提出了新的要求。他指出,善于获取数据、分析数据、运用数据,是领导干部做好工作的基本功。各级领导干部要加强学习,懂得大数据,用好大数据,增强利用数据推进各项工作的本领,不断提高对大数据发展规律的把握能力,使大数据在各项工作中发挥更大作用。

在这个大数据时代,对我们教育工作者来说,无论是学校校长、普通教师,还是企业研发者,如果没有很好的数据意识、数据思维和数据能力,那么一定做不好工作。

二、大数据的核心思想

在研究过程中,笔者将大数据的核心思想概括为以下五点。

1.大数据强调数据本身的价值远胜过算法技术。当然,互联网界的大咖们各有不同的观点。马云说过,他有大数据,数据为王。李彦宏认为,算法为王。马化腾则认为,场景最重要。但是不管怎样,在这个大数据时代,数据的价值已经被越来越多的人认可。

2.大数据承认数据本身的混杂性和多元性。数据不是单一的,例如我们刻画一个学生,如果仅仅通过成绩去刻画,那一定是不真实、不全面、不客观的,我们必须通过学生生活、学习等多方面的数据,才能够描绘出一个真实的学生。

3.大数据强调要从因果关系转向相关关系,从“抽样”走向“全样本”。以前我们做调查研究,经常是发出50份调查问卷,收回后进行统计。从统计学来说,抽样统计出的数据确实可以在一定程度上推演出全样本,但样本毕竟只是样本。在大数据时代,我们拥有更多更好的技术之后,很多的研究、管理就将走向全样本的研究和管理。

4.大数据强调突出跨领域数据的交叉融合和流动生长。数据的交叉融合强调数据的多元化。数据的流动生长强调数据的价值,因为数据是有时间性的,是随着时间的推移递减、衰减的。例如,我们在淘宝上买东西,淘宝给我们推荐东西时所用的数据一定不是一年前的数据,而是更有价值的近期数据。这个最典型的例子说明,数据本身的价值是随着时间的推移而逐渐衰减的。因此我们要特别强调数据的流动性,也就是数据的更新、生长。

5.大数据强化了即时分析和利用数据预测未来的能力。这一核心思想是我们在小数据时代无法实现的。

三、教育大数据的特征

笔者认为,教育大数据不等同于普通的大数据,它的初心和本源是服务于我们教育教学的发展。在这样的初心和本源下,教育大数据呈现出以下三个典型特征。

首先,从教育数据采集角度看,教育大数据的复杂性远远超过普通的大数据。教育的业务场景是多元化、复杂化的,很多数据的采集难度很大。例如,课堂上教师用平板可以采集到很多数据,但学生回家之后在纸上写作业的相关数据却无法采集;学生在课堂中的成绩、举手次数、提问次数都可以采集到,但学生情绪却是一个复杂化、多样化、个性化的数据……这些都是数据采集的难点。

其次,教育大数据的应用模式更具挑战性。数据挖掘中最典型的案例叫“啤酒和尿布”,“啤酒”和“尿布”两个看上去没有关系的商品摆放在一起进行销售,并获得了很好的收益,这种现象就是卖场中商品之间的关联性。而教育大数据则没有这么简单。教育是一项育人的工程,我们要从管理的维度、教学的维度、生活服务的维度、教研的维度等多个方面,去促进学生的成长。教育数据有很多应用的场景,其本身是很复杂的,不是简单地放在一起就可以见效的。

最后,教育大数据要更加注重因果关系。我们通过复杂的数据确实可以发现其相关性,但还要在相关的基础上,进一步去挖掘、分析、探究因果。因果反映的是一种规律,把握了规律之后,我们才能科学地去做事。

四、教育大数据采集技术体系

教育大数据采集的技术体系包括四大类十三种常见数据采集技术。

第一类叫物联感知技术,包括物联网感知技术、可穿戴设备技术、校园一卡通技术。其中最典型的例子就是校园一卡通,它重点采集了学生在学校里的生活数据以及学生日常管理的数据。

第二类叫视频录制技术,包括视频监控技术、智能录播技术、情感识别技术。在智能录播过程中,采集的是课堂教学数据、校园安全数据。智能录播目前正迈入3.0时代,嵌入了数据分析和诊断评价功能,可以把教师的上课过程录下来,并自动分析出报告,反馈出该节课是以学生为中心的课堂,还是以教师为中心的课堂,提问的有效性怎样。

第三类叫图像识别技术,包括网评网阅技术、点阵数码笔技术、拍照搜题技术。

第四类叫平台采集技术,包括日志搜索分析技术、在线学习与管理平台技术、移动App技术、网络爬虫采集技术。

此外,随着科技的日新月异,人脸识别技术也越来越成熟,这种技术也会改变我们的教育教学。当学生进入校园、课堂签到时,有了计算机视觉技术之后,很多的管理模式都將改变。

五、教育大数据分析与应用

首先,教育数据可以分为四层。基础层,存储国家教育基础数据;状态层,存储教育装备环境与业务的运营状态数据;行为层,存储教育用户的行为数据;资源层,存储各种形态教育资源。

其次,笔者在2016年出版的《互联网+教育:中国基础教育大数据》中,提出了七个数据分析模型,对应七个数据应用的场景,即决策支持模型、校情监测模型、适应性学习模型、学业评价模型、学习预警模型、深度学习行为诊断模型、学生画像模型。

最后,教育大数据有五大应用模式,即驱动教育政策科学化、驱动教育评价体系重构、推动区域教育均衡发展、助推学校教育质量提升、促进师生个性化发展。

六、教育大数据六大发展趋势

笔者参与编写的《中国基础教育大数据发展2016—2017:走向数据驱动的精准教学》于今年4月出版,书中总结了教育大数据的六大发展趋势。(如下图)

猜你喜欢
教育学生
国外教育奇趣
题解教育『三问』
软件工程教育与教学改革
快把我哥带走
什么是“好的教育”?
教育有道——关于闽派教育的一点思考
《李学生》定档8月28日
赶不走的学生
办好人民满意的首都教育
学生写话