赵嘉栋 孙文杰 李浩悰 高洁 卢青霞
(西北工业大学 陕西省西安市 710072)
西北工业大学“阳光工程”青年志愿者服务队亦通过线上直播的方式,为贫困地区的学生进行支教援助。通过人工智能为技术工具,将互联网与大学生支教活动深入融合,探讨以学生体悟为中心的教育模式创新和智能教学代理技术已成为当前社会关注的重点话题。
西北工业大学“阳光工程”青年志愿者服务队成立于1998年,以“教育之光点亮公益梦想”为宗旨,是通过组织义务家教、山村支教活动来实现大学生“爱心献社会,真情暖人心”为目标的学生公益社团。为扩大影响力,服务队通过已有的教育资源、经验、荣誉和骨干成员为基础,以革新的“互联网+”为手段,利用多种自媒体平台等以爆发式的增长扩大阳光工程公益协会的影响力。2017年启动的“互联网+支教”成为团队转型期间重点突出的新时代支教模式。“互联网+支教”采用线上直播教学的方式,向贫困地区的学生们进行在线课程录播。迄今为止,已成功举办了41 期支教活动,有超过15,300 人次的志愿者,志愿时长超过366,000 小时,累计受助人次多达20,000 人次。
2018年,中国教育部发布的《高等学校人工智能创新行动计划》明确了人工智能与教育融合发展,尤其是促进高等教育创新发展的总体规划[1]。目前,在人工智能的风口下,产业界大量投资一线教育领域,尤其是基础教育领域。包括以学科知识模型为核心,基于能力判别的自适应学习服务;以学习者建模为核心,形成对学生学业的预测和表现性评价等。这些有关人工智能在教育行业的应用,实际上是基于学生学习相关领域的大数据聚合,利用机器学习算法模型,为教育教学某个具体场景提供智能化的学习要素测量、评价、预测等服务。
目前为止,人工智能技术对远程线上教育的主要影响表现为[2]远程线上教育人员的增多。并且,出现了越来越多关于远程作业支持系统PSS(Performance Support System)的成功案例,这种系统配合以模式识别技术在教学信息方面的分析处理,逐步成为了人工智能技术对教育行业的重要作用工具。这种应用工具包含了教学信息采集、信息预处理、学术特征提取和分类模式识别等,可以通过选择得到汇聚了各种教学模式的特征参量,随之进行模式分类,从而科学的选择最有利的教学方式。
人工智能技术在当前教育的应用现状主要集中在智能教学代理和机器人教育技术。本文则主要针对智能教学代理技术作为模式创新的突破点进行阐述。
在服务队的线上和线下支教工作过程中,将人工智能在支教行业中所遇到的核心问题归纳为三点:
(1)提高线上教育的服务提供效率和线下响应能力;
图1:技术路线示意图
(2)推动教育教学组织内部的创新;
(3)通过多种方式提升学生的自主学习体验。
通过总结上述的核心问题,如何开发一套更好的智能教学代理技术则成为解决问题的关键办法。为此,我们开发了一种基于目标跟踪与检测的交互授课系统,以视频的形式进行基于人工智能技术背景下的“互联网+支教”模式创新。
我们以人工智能技术为媒介,研究基于目标跟踪与检测算法的交互授课系统,通过以人工智能技术为工程背景,用视频分割算法和多目标跟踪与检测算法实现对传统视频的解析和交互点的添加,并开发相应的网络授课工具。实现该目的的技术步骤主要可以分为四步。如图1 所示,为我们的技术路线图。
3.2.1 实现对传统授课视频的准确分割
使用基于Graph-cut 的半自动视频分割算法实现对网络授课视频的分割。目前主流的视频分割算法大致可分为两种:全自动分割与半自动分割。半自动分割算法相比于全自动分割算法具有可人工干预、GUI(图形界面)用户友好、分割更加精确的特点。Graphcut 算法是图像分割的经典算法,它将单个的视频场景定义为图
G(v,u),图由像素集合v 和相邻像素边的集合u 组成,图像分割就是要对每个 图定义一个能量函数 E(X),能量函数与v和u有关,当能量函数取得最小值时,授课图像分割完成。
3.2.2 实现对授课过程中多学术目标的稳定跟踪和精准检测
(1)使用基于轮廓和 ASIFT 特征匹配的授课学生目标检测与跟踪算法实现多目标稳定 跟踪与检测。通过 Graph-cut 视频分割算法对图像进行初步分割,在对图像预处理之后进行最优二值化阈值处理,降低目标边界噪声。再经过轮廓检测,对目标生成比较明显的轮廓,有效提高目标检测效率与精度;最后利用前后两帧场景图 像间的目标轮廓 ASIFT 特征匹配,实现复杂内容下的精准目标检测与稳定跟踪。
(2)ASIFT 算法模拟了相机运动的经纬角度参数,为在更多的变换下提供更 多的特征点提供前提,是一种完全仿射不变特征提取与匹配方法。另外,ASIFT 算法能够从图像中全方位地提取更为丰富的特征,十分有利于提高授课目标匹配的有效性。
3.2.3 实现对带有交互授课信息的交互视频解析与播放
使用基于 HTML5+Javascript 实现的播放器具有传统播放器必要的功能,但同时具有解析交互视频的能力。交互视频相比于传统视频,多附带一个存储了目标轨迹和交互信息的外置文件,解析视频实际上是对外置文件的解析。而解析外置文件实际上是构造场景的二维矩阵 D 的过程,当学生鼠标移动到播放器区域的时候,根据鼠标所处的坐标,查找平面矩阵 P(x,y)处对应的目标标号 ,再据此标号获取外置文件中对应目标的交互信息,然后根据信息响应用户的交互操作,如网页请求、评论添加、题目回答等。
3.2.4 开发出学生界面友好的交互视频系统
我们利用上述对关键点的算法实现和交互视频解析模型的建立基础,开发学生界面友好的交互视频编辑工具和交互视频播放工具,使学生和老师可利用交互视频系统轻松完成对传统视频的交互添加、视频导出、以及视频播放。
总体而言,人工智能在“互联网+支教”模式应用场景的拓展有两个要求:一是可自动化获取的海量数据,二是清晰明确的概念界定和规则[3]。如今教育领域依然存在大量的未给出规则定义、或者规则定义和范围不清晰的教育目标,使得人工智能在线上教学的应用存在困难。解决困难的根本途径,除需要从技术上探索,挖掘数据采集和分析的可能性外,我们还需要协同教育学和心理学的专家学者,从底层的教学理论进行挖掘和探索,搭建逻辑框架,保证人工智能“有章可循”。
要实现人工智能推动教育体系 的灵活开放,一方面需要认识人工智能在支持学习和挖掘评价潜能方面的发展趋势,评估并调整课程,以促进人工智能与学习方式变革的深度融合。另一方面,需要发掘数据潜能,支持学生综合能力的多维度评价。由此可见,人工智能在各行业的广泛应用已是大势所趋,在这一背景下,我们认为人工智能技术的教育应围绕人的发展展开探索,而非在技术的绑架下追求教育的“智能化”。人工智能技术的教育应用,首先必须具备对学习者发展规律的认识,这种认识需要多学科协同探索,共同构建清晰的评量、匹配、干预的规则[4]。“互联网+支教”是非常复杂的系统,既涉及志愿者教和学过程的 方方面面,又涉及学校、家庭、社会、政府的各个体系。从某种意义上说,利用算法帮助我们在教育场景更好地理解教育本身,可能是人工智能教育应用的另一个重点,也就是“智能增强”。此时,算法和数据都可以用来创建增强我们评价、诊断、预测、干预教育服务和创新教育服务的能力。如何在人机协同的环境下共同增强双方的智能,围绕教育问题给予科学有效的解决,将是个长久的、不断迭代和不断优化的过程。
21 世纪是人工智能的世纪,是“互联网+”的世纪,也更是教育理念和模式变更的世纪,我们需要更好的解决人工智能产业落地的问题,通过“互联网+支教”模式作为参考,让人工智能技术真正的走进教育行业。