人工智能教育应用的实然分析:教学自动化的方法与限度

2019-05-08 03:31张志祯张玲玲罗琼菱子郑葳
中国远程教育 2019年3期

张志祯 张玲玲 罗琼菱子 郑葳

【关键词】  人工智能教育应用;教学自动化;智能教学系统;计算机教育应用;交互主体;媒体工具;

专家系统;机器学习;CognitiveTutor;AutoTutor;Course Signals;WISE+c-Rator

【中图分类号】  G420      【文献标识码】  A      【文章编号】 1009-458x(2019)3-0001-13

一、引言

人工智能与教育系统以人类的知识实践为纽带,两者存在多层次、复杂且密切的相互作用,人工智能应用于教育实践具有逻辑必然性(张志祯, 等, 2019)。人工智能是科学、工程与数学,但是人工智能教育应用是具有社会历史文化属性的人类教育实践,其大范围开展有赖于教育主体(教师、管理者、学生、组织机构)理解人工智能在教育活动中的作用方式、可能与限度。本文的“实然”分析不是对人工智能教育应用情况的大规模现状调查,而是从微观教育过程层面,分析人工智能是“如何”应用于教育的,即其实现教学自动化的方法。

对人工智能教育应用的“实然”分析,主要源于“人工智能+教育”当前备受关注,但是相关探讨过于关注未来、可能与工程技术,而相对轻视甚至忽视历史、局限与教学实践。研究当然需要指向未来,但对于未来的分析预测应有历史与现实根基,计算机、人工智能教育应用的历史是面向未来的起点与基础。人工智能教育应用是为教育的,而非为人工智能的(Baker, 2016),对于教育而言人工智能是实现目的的工具与手段,尽管它是积极能动的,但它本身并不能证明其价值,教育教学的目标、活动、情境复杂多样,难以有普适的工具手段,人工智能要在教育信息化生态中发挥作用,进而带动生态系统进化升级,不但需要明确其优势与资源,还需明确其局限与代价。因此,不仅需要从工程技术角度进行分析,更需要从教育教学过程角度进行分析,而当前从教育教学活动微观过程对于人工智能教育应用进行分析的工作做得还很不够,这不利于广大教育研究者与实践者客观把握人工智能及其教育应用。

人工智能教育应用,在宏观层面上是“智能化领跑教育信息化2.0”(王珠珠, 2018),在微观层面上是计算机教育应用的增强与扩展。因此,本文尝试探索如下问题:第一,人工智能为计算机教育应用带来了什么?第二,人工智能是如何实现教学自动化的?即其实现教学自动化的方法。第三,人工智能教育应用有何局限?限度何在?

本文通过综合分析文献和逻辑思辨回答上述问题,采用文献研究法、历史研究法和案例研究法。“历史研究是寻找事实,然后使用这些信息去描述、分析和解释过去的系统过程”(维尔斯曼, 1997, p. 278)。为更好地理解人工智能教育应用,我们回溯到早期的教学机器研究,梳理關键事件与系统,尝试对计算机教育应用的历史做概括。案例研究是对某一有边界的系统(bounded system)的深度描述与分析;案例是一种分析单位,而非特别的数据收集和分析方法,进行案例研究时通常更在乎“情境中的解释或理解”,而非假设检验(Merriam, 2009, pp.40-42)。本文中的案例研究,旨在通过对典型智能教学系统(Intelligent Instructional System)进行对比分析,回答人工智能是如何实现教学自动化的问题。这里所说的智能教学系统取其广义,即利用人工智能技术干预学习过程的教学或学习支持系统,既包括自身提供特定内容教学信息的系统,也包括在对学习过程和情境进行感知分析的基础上提出教与学反馈和建议的系统。为保证研究信度,研究者选择了4个持续时间长(5年以上)且有系列公开发表物的系统,作为专家系统与机器学习智能教学系统的案例,分析其实现教学自动化的方法。

二、计算机与人工智能教育应用:对教学机器的增强与扩展

利用机器辅助或代替人类个体开展教学活动的实践探索,远早于数字电子计算机与人工智能的发明。“在教学中利用节省劳力的工具是完全可能的,这样做并不会使教育机械化,反而可能使教师摆脱许多繁重的例行工作,进行更多真正的教学工作,……那种能够发展学生的理想、启发他们的思想的教学工作”(普莱西a, 1979),在21世纪第二个10年快结束时这样的表达频繁见于各种教育相关学术会议与论文,但这段话并不是信息技术专家或者教育技术专家在今天说的,而是心理学家普莱西在20世纪前半叶所说。早在1927年,普莱西就设计出了能够开展个性化教学的机械设备(教学机器),希望可以开启一个新产业。

早期教学机器利用机械技术,能够实现(普莱西a, 1979):①将教学内容分为片段呈现,以框面(frame, 也译为“帧”)为单位,一个框面或者用两三句话呈现一小段教学信息,或者呈现一道选择题或填空题;②在呈现题目框面时,学生可以利用机器的交互装置(如按钮)作答,机器即时反馈对错,根据回答情况跳转到下一框面(新的教学信息或者另外一道题目);③机器可以记录学生答题情况(对错、次数),可以自动隐藏已掌握的题目(如连续两次都答对),以防止过量学习。教学机器能够自动为学生学习提供反馈,并可适应性、选择性地呈现教学信息。程序教材是专门用于教学机器的教学资源。

斯金纳在1956年和1957年发表的两篇文章(斯金纳a, 1979; 斯金纳b, 1979)为教学机器奠定了学理基础,在行为主义心理学作为主导理论的情况下,程序教学的理念被广为接受,程序教材的开发和实验被广为关注。尽管如此,教学机器对教学实践的影响远远不及倡导者的预期。主要的原因有两方面:一是教学设计理念,正如普莱西在1963年的文章中所反思的,程序教材编制者似乎忘了教师们都明白的道理,人类个体能够很容易地从大段文本阅读中学习,而且也具有从错误中学习的能力,将知识切成碎片反而可能破坏认知结构的建立(普莱西b, 1979);二是机械教学机器在信息呈现、教育方式以及记录、存储与分析交互过程数据方面有很多局限,适应性很有限。因此,数字电子计算机问世后,教学机器、程序教学研究者立即认识到其巨大潜力,相关研究与实践也迅速转向数字世界(布希涅尔, 1979)。

(一)计算机教育应用回顾:交互主体与媒体工具的嬗变与融合

计算机在教育中的功能与应用方式已讨论得很充分(如, 科利斯, 2011; 沃森, 2011; Smaldino, et al., 2008, p. 159)。为更好地从自动化角度分析计算机教育应用,本文根据计算机在微观教与学活动中学生“感知”到的计算机系统的自治程度将计算机在教学活动中的角色分为交互主体与媒体工具两类①。

交互主体指计算机利用软硬件模拟出一个虚拟主体(如:教学代理, pedagogical agent; 学伴, learning companion)或者交互式环境空间,学习者在与之互动的过程中开展学习活动,学习者感到计算机是具备一定自主性的实体,是教学交互过程中的技术主体。这是教学机器传统的延续。第一个智能辅助教学系统(Intelligent Computer Assisted Instruction, ICAI)SCHOLAR是虚拟主体,它在与学生对话的过程中通过对学生的回答给予指导反馈、回答学生问题等方法教学生南美洲地理知识(Collins & Grignetti, 1975),计算机模拟出能够进行自然语言对话的教师。多数游戏和模拟教学软件可被视为环境空间,如PLATO、BEETLE II、River City等,学习者在与计算机虚拟空间互动的过程中开展有指导的“做中学”或者竞争游戏,在这一过程中学习。

媒体工具强调计算机(包括网络)两方面的功能:一是多媒体数据的输入、存储、传输、再现与加工;二是作为“人际”交流合作的媒介。具体来说,包括传递再现、创作表达、探究发现、交流合作和监控管理功能(见表1)。在利用这些功能开展教学活动时,计算机更像“工具”,而非“主体”,即计算机不具有目的性与能动性,而是作为师生感官的延伸或者中介作用于特定类型的信息,受行动主体控制。更重要的是,在教与学活动的过程中师生始终有参与感与控制感,是大大小小各种类型决策的决策者。当然,工具对于人的思维与行动方式是有反作用的。正如英国谚语所说,“当你有一把锤子,什么东西看起来都像个钉子”。在解决教与学问题的过程中,媒体工具不但是可利用的资源,也是限制框架,在一定程度上框定了行动者的思维与行动。

进一步分析可以发现,交互主体与媒体工具并非泾渭分明,作为连续体的两端更为合适。两者界限模糊的原因有两方面:一是在对某一技术支持的学习活动进行分析解读时,视角可以是多样化的。例如LOGO,可以强调其利用代数、几何知识与计算机编程语言进行可视化呈现,这时它是创作表达的媒体工具;可以强调学习者利用命令行与其互动,这时它是提供探索机会的交互式学习空间,更具交互主体属性。二是教师与学生使用同一技术工具的目的、方式不同,因此计算机在活动中的角色存在差异。例如多媒体创作工具,教师用其制作课件、教学软件等教学材料,对教师而言它是“创作表达”与“传递再现”教学知识与技能的工具;学生通常是教师所创作的作品的使用者,对学生而言作品是交互式学习环境,是教学交互活动的技术主体。从这一角度概括计算机教育应用的历史(见图1),可以发现:

第一,20世纪50年代末,计算机教育应用滥觞于交互主体。以PLATO①(始于1959年)与SCHOLAR(始于20世纪60年代末,Collins & Grignetti, 1975)为代表的早期计算机辅助教学系统,虽然教学方法不同(前者呈现教学内容并在解题交互中评价学生对内容的掌握情况;后者采用基于自然语言的文本对话),但均强调计算机是具有领域知識的主体,可在交互过程中评价学生,为学生提供适应性教学信息。

第二,20世纪80年代中后期,计算机作为媒体工具蓬勃兴起,作为交互主体深入发展,两者协同发展。计算机多媒体技术和网络技术发展普及、计算机硬件性能提高、软件功能逐渐丰富且可用性提升,这些是计算机作为教育媒体工具大行其道的技术基础,而学校信息技术基础设施逐渐完善、教师信息技术素养不断提高以及各国在政策层面加以鼓励,则是其大范围应用的社会条件。这一阶段值得特别注意的有三个方面:一是“媒体”功能通常是借助“工具”使用来实现的;二是Authorware等多媒体教学软件创作工具使非专业编程人员,甚至普通教师,也可以创作出“交互主体”类的教学软件;三是数字视频技术的发展降低了捕获、记录、存储、处理、传输、呈现教学活动的技术门槛,网络教学平台实现了网络资源简易、快速和低成本发布,并使大规模开展各种同步与异步教学活动成为现实。可以说网络教育学院的网络课程、美国麻省理工学院的开放课件(OCW)以及后来的MOOCs课程(尤其是xMOOC)充分利用了计算机网络的“传递再现”和“交流合作”这些媒体功能。

第三,20世纪90年代中后期,媒体工具与交互主体广泛深度融合。这主要表现在,媒体工具类应用(如网络课程)中通常会包含交互主体类应用(如教学游戏或者模拟);反之亦然,虚拟环境空间中也可包含教师的讲解视频。计算机支持的合作学习与MOOC学习中存在更深度的融合。例如MentorChat(Tegos, et al., 2014; Tegos & Demetriadis, 2017),学生利用网络即时通信工具(媒体)开展讨论,而后台的程序以智能体(agent)形式参与讨论,监控讨论过程,根据教师设定的“概念图”判断学生对知识内容的覆盖和掌握程度,并可以在需要时提问学生;Aleven等(2016)探索了如何将Cognitive Tutor整合到edX课程“Big Data in Education”(教育大数据)中,为学生提供处理复杂数据任务的“做中学”经验,缓解MOOC学习中适应性指导不足的问题。

(二)智能教学系统:人工智能提高交互主体的教学适应性

1. 从CAI到ICAI,再到学习分析

即使到了21世纪,多数基于计算机和互联网的教学系统仍然只能交互式呈现事先设置好的多媒体教学信息与固定的练习和测试题目,依然很机械,是所谓特设的专门(ad hoc)程序。其根源在于计算机不能“理解”所教的知识,不会“运用”所教的技能(当然,简单的数学计算、英文单词拼写等认知技能除外)(Park & Seidel, 1987)。

人工智能进入教育领域的初衷是提高计算机辅助教学(Computer Assisted Instruction, CAI)软件的灵活性与适应性(Collins & Grignetti, 1975; 刘清堂, 等, 2016)。1965年第一个专家系统Dendral问世。几年后,智能计算机辅助教学系统(Intelligent Computer Assisted Instruction, ICAI)SCHOLAR的研发拉开了人工智能教育应用的大幕,随后迅速涌现的十几个智能教学系统使ICAI成为一个独立的研究领域(Park & Seidel, 1987)。此后的研究一直围绕如何利用人工智能技术促进学生的学习,即实现“教的自动化”②。

Park等(1987)30多年前对于CAI与ICAI区别的探讨到今天仍然与现实相符,而且仍然非常具有启发性。其主要观点为:就开发目标而言,CAI通常是教育者和培训者利用计算机技术解决教学问题,提高教学效率与质量;ICAI通常是计算机科学家和认知科学家探索人工智能技术在学习与教学中应用的潜力,系统的技术方面通常是研究的焦点。就理论基础而言,CAI多依据学与教的原则、教学开发过程以及关于教学的规定性理论;ICAI多基于学与教的认知过程,利用教学的描述性和诊断性理论。就所教学科而言,CAI几乎涉及所有学科;ICAI主要围绕结构性强的学科,如数学、编程、医学诊断、物理等。就系统开发过程而言,CAI多采用ADDIE(Analysis Design Development Implementation Evaluation,即分析—设计—开发—实施—评价)教学系统设计过程模型,团队通常包括教学设计者、学科专家、计算机开发人员等;不同的ICAI项目的开发过程差异很大,由于多以测试人工智能技术为主要目的,内容则相对更倾向于方便取样。就系统验证与评价而言,CAI主要关注教学效果,通常采用多种评价方法;ICAI多以能够处理特定的教学过程来评价,能够按照最初的设计来运行即算是达到了预期目标。

对人工智能教育应用专门期刊所发表文章的概要内容进行分析,结果表明,本领域的研究从以技术驱动为主转向技术与教育共同驱动。International Journal of Artificial Intelligence in Education(IJAIED,《人工智能教育应用国际期刊》)是专门面向人工智能教育应用领域、采用同行评审的学术期刊。对该刊一组高影响力文章①的内容分析表明,20世纪90年代初到21世纪的前10年,本领域研究聚焦于系统评估、建模方法和研究方法,具有强烈的工程化研究取向。而该刊近年来发表的文章和专刊的选题表明,研究越来越注重教育实践需求和教育实践问题解决。

随着在线学习和混合学习的普及,尤其是MOOCs的大规模采用,学习过程和学习资源使用数据迅速积累,人们开始尝试发掘数据中蕴藏的模式与相关关系,以此促进学习、改进资源、开展学习与教育研究,教育大数据挖掘和学习分析逐渐成为独立的研究领域(魏顺平, 2013)。常规编程与统计分析方法面对大数据捉襟见肘,能够实现“模式发现与识别”的机器学习技术得以广泛采用。在学习分析应用中的人工智能从“台上传道的圣人”变为“后台警觉的老大哥”,是隐形的虚拟主体。

2. 智能教学系统的教学方法:辅导与辅导的不同

从教学方法角度看,操练与练习、辅导、模拟、游戏等是CAI软件与智能教学系统的常用教学方法。對于每种方法,人工智能都能增强计算机的功能,使其具备一定的“理解能力”,从而具备更高的适应性。

辅导(tutoring)这一术语在CAI与智能教学系统中均经常出现,但所指的教学活动不同,是展示CAI与智能教学系统在教学方法上差异的好例子。CAI中的辅导通常指“测试——根据测试情况呈现解释和说明性教学信息”(对于大多数CAI软件而言,教学信息和从前测到教学信息的跳转路径等均为事先设置好的,无法在教学过程中根据学习情况调整)。VanLehn(2006)提出辅导系统应支持两层次的循环,外循环(outer loop)用于选择任务或问题,内循环(inner loop)用于实现对于问题解决过程的逐步(stepwise)反馈、提示与指导。用VanLehn的术语来说,CAI软件只有外循环,无内循环,而且外循环也多是预设的或者固定的,非生成性的。

智能教学系统中的辅导通常指两类教学活动:一是模拟人类教师的辅导行为,即苏格拉底式问答。学生用自然语言与系统“交谈”,系统和学生均可以提出和回答问题,是所谓“混合式主动教学(mixed initiative instruction)”,如SCHOLAR(Collins & Grignetti, 1975)、AutoTutor(Graesser, et al., 2007)。只有计算机“理解”自然语言和特定领域的知识,能够实现这种灵活性。二是“做中学”的交互式学习环境。系统模拟出一个针对特定问题的交互式问题解决环境,向学生提出问题,学生利用环境中的各种工具解决问题,系统监控学生解决问题的步骤,根据需要提供反馈(指导、提示、问题解决演示等),如Cognitive Tutor(Anderson, et al., 1995)、BEETLE II(Dzikovska, et al, 2014)。计算机需要自己“会”解决问题,才能做到检测学生的问题解决状态,推测学生掌握知识、技能的情况,实时给出有针对性的反馈。用VanLehn的术语来说,智能教学系统实现了两层次的适应性循环。

Woolf(2009, p. 30)认为智能教学系统应具备生成性、学生建模、专家建模、混合主动(mixed initiate)、交互學习、教学建模及自改进(self-improving)特性。这一说法仍偏向实现层面。综合上述观点可以概括出,由于人工智能技术能够在一定程度上执行技能、理解内容和感知预测(可感知学习情境、学习活动过程和学习者特征),主要用于提高计算机作为教学交互主体的灵活性与适应性。人工智能对计算机教学系统的增强作用、案例及主要实现技术参见表2。表2最右列呈现了系统实现的核心技术类型。智能教学系统是综合性的(通常包括学科知识模型、学生模型、教学模型和交互界面等模块,不同模块的实现技术通常存在差异),如以专家系统为核心的Cognitive Tutor在学生模型模块利用贝叶斯网络评估学生对特定知识点的掌握情况(Anderson, et al., 1995),这是利用机器学习技术从学习过程数据中推断、挖掘出定性结论。因此,这里只是概要表示其主要技术类型。

三、人工智能实现教学自动化的方法

从核心实现技术的角度看,智能教学系统可以分为专家系统和机器学习两类。本部分选择了4个智能教学系统,分析其实现教学自动化的方法。Cognitive Tutor(始于1983, Anderson, et al., 1995)、AutoTutor(始于1998, Nye, et al., 2014; Graesser, 2016)是典型的基于专家系统的智能辅导系统。前者是交互式学习环境,发展学生的认知技能;后者是虚拟主体,通过自然语言对话促进学生对概念的理解。Course Signals(始于2008, Arnold & Pistilli, 2012)与WISE+c-Rater(c-Rater始于2009年之前,用于WISE的探索始于2014年左右,Liu, et al., 2014)的“智能”模块均采用机器学习技术,但教学功能与外在表现差异很大,前者是针对大学教学的学习分析,利用历史记录与学习过程数据预测学生成功学习课程的可能性;后者用于中小学网络科学探究学习,智能模块对学生有关科学问题的回答自动进行评分,根据评分结果分配反馈指导语,以促进科学知识的整合学习;两者的教学信息由人类教师直接提供或通过多媒体学习材料传递呈现。四者均有实证研究支持其教学的有效性,前两个智能辅导系统已衍生出多种大规模应用的商业产品。

(一)以专家系统为基础的自动辅导

Cognitive Tutor以认知任务分析为基础,实现认知技能的自动辅导。计算机为学生创建一个高度结构化的问题解决环境,能够逐步跟踪、判断学生的问题解决过程,并适时提供反馈、提示与帮助。为支持特定认知技能的学习(如三角形全等证明),需详尽分析完成任务所需的陈述性知识和程序性知识,利用产生式系统表征知识,为学生提供解决问题的认知工具,系统跟踪问题解决过程,将学生表现记录在学生模型中(Anderson, et al., 1995; Aleven, et al., 2009)。Cognitive Tutor成功用于中小学代数、几何等内容的学习(Koedinger & Aleven, 2016)。

AutoTutor基于某一问题(如“在自由落体的电梯里,小明松开手,手里的钥匙将怎样运动?”)与学生开展自然语言(英语,书面或口头)对话,通过分析学生的回答(自我解释)促进学生对概念的深度理解。有些版本的AutoTutor能够感知学习者的情绪和注意状态,据此调整辅导对话的内容与风格(Graesser, 2016)。AutoTutor通过语义分析和语词匹配技术分析学生的回答,结合领域知识库(如自由落体)内容实时为学生生成引导性问题,帮助学生理解。AutoTutor成功用于物理、数学等学科的学习(Nye, et al., 2014)。

对于给定学科内容的教学过程,舒尔曼(Lee S. Shulman)的教学推理与行动模型是个很好的分析框架,与中小学教师的日常教学实践过程高度契合。其基本假设是:“教学是观念交流的活动。教师首先掌握、探索和理解一个观念,把它转换为自己的思想,从多个角度去理解它。然后,这个观点要被重新塑造或修正,直到它能够被学生所掌握。”(Shulman, 1987)即教学远不止是课堂上的几十分钟,完整的教学过程包括理解、转化、教学、评价、反思和新的理解六个阶段。在教学过程中,不但学生对某一主题的理解有变化,教师的理解同样在更新。模型中的具体任务可由人完成,也可由计算机完成,根据Anderson等(1995)与Nye等(2014)的文献的描述,对两个系统的分析结果见表3。

从这两个案例看,专家系统类的人工智能教育系统仅实现了教学知识应用的自动化。可见,就完整教学过程而言,计算机能做的实际上很有限,计算机还无法胜任理解教学内容、转化、反思和形成新的理解等任务,能够自动化(由计算机完成)的是教学与评价。即“理解”了知识且能“施展”技能的计算机系统,能够为学生个体或小组提供动态适应的教学(个别化的速度、学习路径、反馈和练习题目等),并在学习过程中全面评价学生的学习过程与结果(通常是通过更新学生模型来实现)。Cognitive Tutor利用产生式系统(“如果……,那么……”的规则集合)存储人类专家的内容知识,在恰当的时候针对学生的问题解决给出相关知识。对于Cognitive Tutor而言,课程开发成本高昂主要是因为需要手动为系统提供知识,需要进行详尽细致的认知任务分析,将专家的陈述性知识和程序性知识显性化,同时还要转换为产生式规则输入计算机,这一过程费时费力。Cognitive Tutor一个学时的教学通常需要100~1,000个小时的开发时间。解决知识获取难题的途径有两个:一是通过创作工具(authoring tool)提高人类专家输入、管理知识的效率,降低操作的认知难度;二是通过提供范例,简化知识获取与表征(Aleven, et al, 2009)。

(二)以机器学习为基础的自动模式发现与识别

美国普渡大学的Course Signals是学习分析领域的“啤酒和尿布”。该系统2008年左右就已在大学层面部署,基于历史数据生成数据模型,可利用学生的人口学数据和在线学习过程记录等数据,预测学生的课程学业表现。教师可选择在学生学习平台中呈现红绿蓝信号灯、发电子邮件(系统可为教师生成电子邮件草稿,但是否发送邮件内容由教师决定)提示或者约面谈等方法提前干预。(Arnold & Pistilli, 2012)

WISE①+c-Rater利用计算机自动为学生的短文回答评分,为科学探究学习中的简答题提供自动反馈。WISE单元强调通过学生书面回答科学问题促进学生的科学思维发展。在课堂教学中,教师如何及时为学生的回答提供反馈成为课程实施的难题。研究团队将美国教育考试中心(ETS)的c-Rater整合到WISE平台中,利用过去已经评分的针对某些科学问题的学生回答训练c-Rater文本分类系统生成预测模型,为学生的问题回答评分(分类),并根据得分为学生分配研究者事先拟好的反馈指导,以促进知识整合学习(Liu, et al., 2016)。

这两个案例所采用的主要人工智能技术均为机器学习。机器学习不同于人类的学习,它用算法发现样例特征值之间的相关模式,并利用这些相关模式对新样例进行分类。有监督的机器学习(supervised machine learning,即由人来明确告诉计算机每个样例的特征值和类别)的过程如图2(改编自Raschka & Mirjalili, 2017, p. 3)。监督学习的过程依然需要大量的人工,具体包括:①准备训练数据,明确每个样例用哪些属性来表征以及案例所属的类别。②选择机器学习的算法,调整参数。存在大量的机器学习算法,分别适合不同的情境,其选择主要靠工程试验驱动,参数调整也是靠研究者的直觉和经验居多。③准备新的数据。Course Signals高风险学生发现、WISE+c-Rater中的学生回答自动评分都依赖机器学习完成,工作流程类似(见表4),所不同的是样例特征与类别。从基本逻辑看,两者都假定以往的样例(以往学生的学习记录和以往学生的回答)在未來仍保持稳定。若学习者和学习情境有显著变化,则训练出来的模型的预测力就会下降,需要更新训练数据集或者调整参数,甚至换成其他算法。这一过程不仅耗费人力,而且对执行者的专业能力有很高的要求。

机器学习之所以受到重视,根本原因在于其部分解决了知识“分析(生成)”难题,算法可以从案例中自动发现知识(更准确地说应该是发现模式,即pattern,哪些属性经常会一起出现,通过属性之间的相关,在不确定因果的情况下也可以实现具有实用价值的预测)。从根源上看,机器学习所获知识还是来源于人类,它不过是将隐含于案例中的人类知识挖掘出来。在教育领域,高质量的已标注案例数据集不多见。最容易想到的,也许就是高利害考试中已评分的题目。批改作文的人工成本高昂,标注案例数据丰富,人工智能技术很早就大规模应用于ETS的GRE、托福等考试的作文评价也就不足为奇了。但机器学习技术的局限在于:一是需要大量的实例,如要为作文评分,系统需要某一作文题目下不同级别的文章实例,机器运用算法从这些文章中发现不同分值文章的特征;二是分类机制难以解释;三是特征设定还需要人工完成;四是缺乏常识,评分系统实际上并不能理解文字的含义,无法像人一样感知、理解文章。这样造成的后果就是非常新颖且有创造性的作文很可能被判低分。

四、人工智能实现教学自动化的限度

人工智能实现教学自动化的限度取决于人工智能研究的进展和智能教学系统的研发,以及社会所设定的教育教学目标、模式与组织为智能教学系统发挥作用留下的空间。鉴于本文主要围绕智能教学系统开展分析,因此仅关注人工智能与智能教学系统的局限造成的自动化限度。尽管前文提及目前本领域应用研究已不再是单纯技术驱动,但技术还是最活跃的因素,这其中不但包括人工智能自身的发展,更重要的是新技术如同电解铝技术一样能够“解锁”隐藏在数据矿山中的知识,可能带来解决老问题的新途径。例如,WISE+c-Rater在采用新的机器学习方法后,预测模型训练所需的人工干预大幅度降低,性能却有所提升(Liu, et al., 2016)。这是大规模采用人工智能技术为学生科学探究过程提供反馈的很好的起点。

(一)人工智能技术的局限

斯加鲁菲(Scaruffi, 2017, p. 28)认为人工智能近年来取得的进展更多应归功于计算机性能的提升与数据的积累,而非基本思想和方法的突破。当前人工智能技术主要存在如下局限:

第一,常识与符号接地难题。常识指他人能够理解并认为是显而易见的事情(明斯基, 2016, p. 172)。例如,苏珊出门购物时,她的头有没有和她一起去(平克, 2015, p. 199)。由于缺乏常识,即使最常规的工作也无法由计算机完全负责——它会犯人类觉得匪夷所思的错误。专家系统难以捕捉和表征常识(危辉, 等, 1999)。机器学习系统缺乏常识导致性能受数据集影响而不稳定,如Google自动翻译的句子回馈到Google系统后导致机器翻译质量下降(Scarffi, 2017)。符号接地问题或许是计算机不具备常识的重要原因,即对计算机而言语词只是形式系统中的符号,未与现实世界建立关联。作为形式系统,计算机的“理解”只是无意义、无体验的数值计算或符号匹配。松尾丰(2016, pp.78-79)认为将符号与意义连接起来需要“具身化”,如果没有能够与外界进行交互作用的身体则无法掌握事物的概念。无常识与符号不接地导致计算机无法真正理解语义,当前令人印象深刻的机器翻译和语音识别都是借助统计语言模型实现的(吴军, 2014, pp.27-40)。但不仅聊天机器人难以维持多轮次的会话,限定在特定领域的自然语言辅导进展也非常艰难。由于难以恰当地处理学生的主动提问,对话辅导系统中学生主动提问的情况最终几乎消失(Graesser, 2016)。

第二,迁移难题。今天实用的人工智能系统都是所谓“弱人工智能”,即只能完成特定任务,难以迁移到其他情境(Yao & Zhou, 2018, p. 219):下棋的系统听不懂人说话;手写识别的系统不会证明数学定理;同为专家系统,诊断血液病的系统无法为特殊需要儿童制定教学计划。专业问题解决能力难以跨领域,其根源是问题解决所需知识的领域特定性、情境性与主体性。当今社会,人类专家终其一生也只能在有限的一个或数个领域中有专长,这样的跨领域似乎对机器要求太高了。但是,当前深度学习系统的训练过程表明,与人类个体相比,现有技术所存在的问题是在学习过程中缺失抽象概括能力:儿童只需要见过几只猫或者猫的图片就能认出几乎所有的猫,而机器学习系统需要数以万计猫的图片(Le, et al., 2012)。

第三,能耗难题。目前人工智能系统依托冯·诺伊曼体系计算机,在执行对人类大脑而言轻而易举的工作时,它消耗的能量远远高于人类大脑。相比之下,人类的大脑是奇迹:葡萄柚大小的一块物质中,存在仅仅消耗20瓦电能就可以高效运转的220亿个神经元;让一台传统计算机拥有类似的认知能力,需耗费上亿瓦特的电量,以及一个足球场大小的处理器(凯利, 等, 2016, p. 107)。在研究探索试验阶段,高能耗不是大问题,但大规模常态化应用,大规模计算的能耗和环保代价是必须要考虑的。例如有关比特币“挖矿”对于气候可能产生的影响的研究表明,到2033年比特币挖矿产生的碳排放足以让全球溫度升高2℃(Mora, et al., 2018)。

(二)智能教学系统的局限

作为人工智能教育应用载体的智能教学系统受到人工智能与教育教学两方面的制约,目前智能教学系统存在的主要局限为:

第一,设计难题。即使人工智能存在上述局限,但其在支持学与教方面仍有巨大的应用空间。问题在于人类拥有如此强大灵活的学习技术的时间并不长,还未发展出能够充分发挥其作用的理论方法与组织制度,而且人工智能技术本身仍不断有突破,并不稳定,这增大了认识其起作用的条件与方式的难度。设计的难题之一是计算机的角色定位。研究者自然地将人类教师的教学行为迁移到智能环境中,如AutoTutor的设计从研究人类教师和同伴的辅导活动开始(Nye, et al., 2014);Cognitive Tutor开始时采用“教师辅导”隐喻,但后来发现并不合适,作为交互学习环境更为恰当,但木已成舟,不好更改了(Anderson, et al., 1999)。设计的难题之二是“人—机”关系问题。应该给人类教师和学生多大的选择与控制的空间?是增强还是替代教师?早期的系统多是封闭系统,从设计、开发到应用,从目标、内容到功能设定,教师均没有机会参与;有些新一些的系统(如ASSISTments),教师是内容、反馈等的主要决策者和提供者。Baker(2016)认为计算机擅长快速扫描和分析大量数据,缺点是难于改变,而人类教师则相反,人与机器是天然的合作者。Course Signals在这方面已经做出了很有成效的探索。设计的难题之三是具体到特定的智能教学系统,尤其是智能辅导系统,系统需要“自主”做出与教学活动密切相关的决策,甚至需要交代决策的依据和可能的后果,这要求功能与活动设计者深入了解教与学活动的过程,需要开发团队整体上具备一位高效教师所需的全部知识,并将其编码到系统中。对开发团队而言,这些知识分布在不同成员的头脑中,如何将其整合在一起是个挑战。

第二,开发迁移难题。智能教学系统开发的数学与技术门槛很高。人工智能系统是以知识或数据为中心的计算机系统,而当前开发者训练仍以面向过程的事务处理为主。开发范式的转换不但发生在软件开发技术层面,而且发生在背后的数学原理、方法与系统设计思路层面,其难度远高于常规过程处理程序的开发,造成高昂的开发成本。这导致早期ICAI开发者主要是计算机科学和人工智能研究者,而非教育培训领域研究者与实践者(Park & Seidel, 1987),这一局面直到今天似乎也并没有太大改观。智能教学系统的开发费时费力。对于专家系统而言,获取与表征知识的成本很高,在早期Cognitive Tutor中一条产生式规则的识别、表征与编码需要10个小时左右(Anderson, et al., 1995),小型系统的规则数量也数以百计,复杂系统有成千上万条,专门的创作工具对提高效率有帮助,但只是提高了部分操作的速度,并未降低构建专家系统的认知复杂度。机器学习尽管可自动发现与识别模式,但应用到新领域时,发现整理样例、调整算法参数的工作量也是巨大的。人工智能系统的技术与认知复杂性导致其更新升级的难度也更大。尽管人类知识具有稳定性,但在教育领域,变化是常态。就教育内部而言,课程标准、考试要求、教材等几年就要更新一次,智能教学系统也面临更新的压力。定期升级对于产品厂商也许是好事,但是对于社会总体成本而言,不易评估。

第三,生态化应用难题。智能教学系统如何融入现有教育系统,尤其是学校教育?尽管人工智能的教育应用具有逻辑必然性,但对于已运行在“教师、黑板、教科书”生态中的学校教育而言,智能教学系统是“外来物种”。新物种进入已有生态,要想在生态系统中起作用,必然需要打破已有的平衡,建立新的平衡。Cognitive Tutor在匹兹堡学区的实验取得成功的原因之一,是研究者拥有重构课程与教学的权力与资源(Koedinger, et al., 1997),甚至可以说研究者按照Cognitive Tutor的需求,重新设计了数学课程与教学。ASSISTments之所以得到大规模的应用,部分原因是研究者放下身段,以支持与服务者的身份耐心倾听一线数学教师的需求(该研究团队核心成员曾做过中学数学教师, Heffernan, 2014)。但相当数量的开发者做不到这两点,通常只是有个好主意、创造出了可能有用的技术,开发出原型系统后到中小学做做测试。例如,有研究者(Johnson & Lester, 2016)反思当时(2000年左右)觉得动画教学代理(animated pedagogical agents)是个好点子,但到底教学需要不需要,到底教学系统需要不需要,其实并不确定。这样的研究对于领域创新发展而言也是必不可少的,但外加给教育的痕迹明显,形成可持续的产品/项目的难度比较大。另外,即使是“超脱”于课程教学活动之上的学习分析系统,要想起作用,也需要教学方法上的调整,而调整的背后也许是学科内容及其学习过程本质观念上的变化。例如,Course Signals要求有更多线上活动,要求教师在课程中设计阶段性评价任务,这对部分人文艺术课程提出了挑战:这些课程很少有过程性数据(Sclater, et al., 2016)。其隐含的理念是学生学习这类学科需要很长时间的体验和积累,最后形成整体性的理解与作品,这一过程是难以分解的。在这种课程中使用学习分析系统,也许还没有到削足适履的地步,但改变教学活动的设计是必需的。

第四,识别与评价难题。从用户的角度而言,智能教学系统难以识别和评价。首先,人工智能是后台的实现技术,不像多媒体学习资源,很直观,教师和学生能迅速判断。其次,人工智能只是实现适应性教学的方法之一,在有些情况下它还是实现起来很复杂而且实际效果一般的技术。在电子消费品市场,很多标称“人工智能”的产品是名不副实的(松尾丰, 2016, pp.30-33)。对于智能教学系统,若此类事情发生,是否道德?再次,智能教学系统的适应性和学习路径的复杂动态性导致适用于普通教学资源(如多媒体课件、CAI软件、网络课程)的评价方法(如专家评价)难以应用于智能教学系统。在以研究为目的的智能教学系统评价中,多数依然仅关注系统是否实现了所设计的功能、是否能够按照预期运行,而且缺乏对其教学效果的严格实验。需要建立智能产品的评价测试规范,以强调其学习效果和支持适应性学习的合理性与有效性。

第五,伦理难题。这里用“伦理”一词指代技术应用对于人与人之间各种关系的影响。智能教学系统的大范围、长期应用必然涉及伦理问题,诸如版权、责任划分、支持与限制、代价和隐私保护等。隐私保护已受到普遍关注,这里不再赘述。这里所说的版权问题源自智能教学系统自身的特点。印刷教材如同“断了线的风筝”,无法与外界交换信息,拥有了物理實体就独占其内容与功能,但当前的多数智能教学系统却如同“木马”:它与系统所有者(厂商或者服务提供商)的远程数据交换可能比与师生的操作交互更为密切,在师生使用过程中产生的数据和生成性资源都可能被回传到服务器,以优化教学系统的性能。由师生(很可能是付费)的使用行为“喂大”的系统,师生却很可能只有短时间的使用权,而版权却属于智能教学系统的所有者。这是否公道?是否可持续?也许需要新的版权框架。对于学校与智能教学系统提供者的责任划分问题,可以设想,如果学生的大量时间花在通过与智能教学系统互动来学习,那么学生的学业成绩该由谁负责任?目前的人工智能教育应用多以“大规模个性化”和“精准教学”为目标,在班级授课制大规模推行之后,实际上一直有通过分班、分层、教师辅导和同伴辅导等教学组织形式实现教学个性化的努力,尤其是同伴辅导,很多研究证明了其对于辅导者和被辅导者的益处(斯莱文, 2007, pp. 222-223)。过于强调利用技术实现个性化,让学生更多与机器互动,如果长期、大范围实施,那么我们的社会会付出怎样的代价呢?对于那些基于历史数据实现的系统,其适应在多大程度上是“适应”,在多大程度上是限制呢?两者有没有清晰的界限?

五、结语

本文从微观“实现”层面上探讨了人工智能技术如何实现“教”的自动化。“实现”之所以打了引号,是因为这里强调从教育教学过程的视角,而非系统架构和系统开发的视角,分析人工智能教育应用完整过程中的人机分工问题,以呈现人工智能到底“自动化”了什么以及如何“自动化”。

首先,人工智能为计算机教育应用带来了什么?计算机教育应用的历史研究表明:在教学活动层面,总体上表现为计算机作为交互主体与媒体工具的嬗变与融合;人工智能技术主要增强了计算机作为交互主体的灵活性与适应性:智能系统在一定程度上能够“行动”,即在结构化环境中可以施展认知技能解决问题;能够“理解”,用自然语言与学生共同建构解释并提供指导反馈;能够“感知”,从数据中发现、识别模式并做出预测。

其次,人工智能是如何实现教学自动化的?针对典型智能教学系统的案例研究表明:以专家系统为核心实现技术的智能辅导系统(如Cognitive Tutor、AutoTutor)主要实现了人类学科知识和教学知识的自动化应用,知识采集和分析尚需人工完成;以机器学习为核心实现技术的学习分析系统(如Course Signals)与自动指导反馈(如WISE+c-Rater),从历史数据(学习过程与行为记录、已评分学生回答等)中发现模式,用于预测与识别现象(高风险学生、学生回答类别),其自动化的是模式发现与应用,而准备历史数据、选择与调整算法需要人工完成。人工智能在教学“完整”过程中的作用还非常有限,灵活性与适应性还比较差,代替人类教师还很不现实。智能教学系统在增强教师方面比替代教师有更广阔的空间。

最后,人工智能应用于教育领域有何限度?本文主要对技术与系统的局限作分析,这种局限主要源自人工智能技术的缺乏常识与符号不能接地、迁移困难以及高能耗,而智能教学系统则存在设计难题、开发与迁移难题、生态化应用难题、评价与识别难题以及伦理难题等。

需要特别说明的是,分析局限不是为了否定,而是为了更全面和客观地认识,是为了在实践层面更合理地定位,在研究层面更准确地寻找创新的边缘与突破点。

[参考文献]

布希涅尔. 1979. 在将来的教学系统中计算机的作用[M]. 普莱西,斯金纳,等. 程序教学和教学机器. 刘范,等,译. 第2版. 北京:人民教育出版社:323-351.

科利斯. 2011. 计算机在教育中的应用(Computers in Education)[M]. T. 普洛波,D. P. 埃利. 教育大百科全书:教育技术. 刘美凤,宋继华,等,译. 第2版. 重庆:西南师范大学出版社:85-91.

刘清堂,吴林静,刘嫚,范桂林,毛刚. 2016. 智能导师系统研究现状与发展趋势[J]. 中国电化教育(10):39-44.

马文·明斯基. 2016. 情感机器:人类思维与人工智能的未来[M]. 王文革,程玉婷,李小刚,译. 杭州:浙江人民出版社.

麦尔荀伯格,库基耶. 2014. 大数据教育篇:教学与学习的未来趋势[M]. 台北:远见天下文化.

皮埃罗·斯加鲁菲(Piero Scaruffi). 2017. 智能的本质[M]. 任莉,张建宇,译. 北京:人民邮电出版社.

平克. 2015. 语言本能:人类语言进化的奥秘[M]. 欧阳明亮,译. 杭州:浙江人民出版社.

普萊西a. 1979. 一架以练习材料进行自动教学的机器[M]. 普莱西,斯金纳,等. 程序教学和教学机器. 刘范,等,译. 第2版. 北京:人民教育出版社:57-64.

普莱西b. 1979. 教学机器(和学习理论)的危机[M]. 普莱西,斯金纳,等. 程序教学和教学机器. 刘范,等,译. 第2版. 北京:人民教育出版社:120-131.

斯金纳a. 1979. 学习的科学和教学的艺术[M]. 普莱西,斯金纳,等. 程序教学和教学机器. 刘范,等,译. 第2版. 北京:人民教育出版社:65-81.

斯金纳b. 1979. 教学机器[M]. 普莱西,斯金纳,等. 程序教学和教学机器. 刘范,等,译. 第2版. 北京:人民教育出版社:82-105.

斯莱文(Slavin, R. E.). 2007. 教育心理学[M]. 姚梅林,等,译. 北京:人民邮电出版社.

松尾丰. 2016. 人工智能狂潮:机器人会超越人类吗?[M]. 赵函宏,高华彬,译. 北京:机械工业出版社.

王珠珠. 2018. 教育信息化2.0:核心要义与实施建议[J]. 中国远程教育(7):5-8.

危辉,黄旗明,潘云鹤. 1999. 常识:知识获取的瓶颈[J]. 计算机科学,26(9):17-19.

魏顺平. 2013. 学习分析技术:挖掘大数据时代下教育数据的价值[J]. 现代教育技术(2):5-11.

维尔斯曼(Wiersma, W.). 1997. 教育研究方法导论[M]. 袁振国,等,译. 北京:教育科学出版社.

沃森. 2011. 计算机辅助学习(Computer-assisted Learning)[M]. T. 普洛波,D. P. 埃利. 教育大百科全书:教育技术. 刘美凤,宋继华,等,译. 第2版. 重庆:西南师范大学出版社:77-81.

吴军. 2014. 数学之美[M]. 第2版. 北京:人民邮电出版社.

约翰·E. 凯利,史蒂夫·哈姆. 2016. 机器智能[M]. 马隽,译. 北京:中信出版社.

张志祯,张玲玲,李芒. 2019. 人工智能教育应用的应然分析:教学自动化的必然与可能[J]. 中国远程教育(1):23-35.

Smaldino, S. E., Russell, J. D., Heinich, R. et al. 2008. 教学媒体与技术[M]. 郭文革,等,译. 第8版. 北京:高等教育出版社.

Aleven, V., McLaren, B. M., Sewall, J. & Koedinger, K. R. (2009). A new paradigm for intelligent tutoring systems: Example-tracing tutors. International Journal of Artificial Intelligence in Education, 19:105- 154.

Aleven, V., Baker, R., Wang, Y., et al. (2016). Bringing non-programmer authoring of intelligent tutors to MOOCs. Proceedings of the Third ACM Conference on Learning @ Scale, 313-316. https://doi.org/10.1145/2876034.2893442

Anderson, J. R., Corbett, A. T., Koedinger, K. R. & Pelletier, R. (1995). Cognitive tutors: Lessons learned. The Journal of The Learning Sciences, 4(2), 167-207.

Arnold, K. E. & Pistilli, M. D. (2012). Course signals at Purdue: Using learning analytics to increase student success. ACM International Conference Proceeding Series. Doi: 10.1145/2330601.2330666.

Baker, R. S. 2016. Stupid tutoring systems, intelligent humans. International Journal of Artificial Intelligence in Education, 26(2):600-614.

Brundage, M., Avin, S., Clark, J., Toner, H., Eckersley, P., Garfinkel, B. et al. 2018. The malicious use of artificial intelligence: Forecasting, prevention, and mitigation. https://maliciousaireport.com/

Collins, A., & Grignetti, M. 1975. Intelligent CAI. Final Report (1 March 1971-31 August 1975). [2018-10-10]. https://eric.ed.gov/?id=ED11 4089

Dzikovska, M., Steinhauser, N., Farrow, E., et al.. 2014. BEETLE II: Deep natural language understanding and automatic feedback generation for intelligent tutoring in basic electricity and electronics. International Journal of Artificial Intelligence in Education, 24(3):284-332.

Graesser, A. C., Jackson, G. T. & McDaniel, B. (2007). AutoTutor holds conversations with learners that are responsive to their cognitive and emotional states. Educational Technology, 47(1):19-23.

Graesser, A. C. 2016. Conversations with AutoTutor help students learn. International Journal of Artificial Intelligence in Education, 26(1):124-132.

Grandbastien, M., Luckin, R., Mizoguchi, R., & Aleven, V. (2016). Preface to the IJAIED 25th anniversary issue. International Journal of Artificial Intelligence in Education, 26(1):1-3.

Heffernan, N. T., & Heffernan, C. L. (2014). The ASSISTments ecosystem: Building a platform that brings scientists and teachers together for minimally invasive research on human learning and teaching. International Journal of Artificial Intelligence in Education, 24(4):470-497.

Johnson, W. L., & Lester, J. C. (2016). Face-to-face interaction with pedagogical agents, twenty years later. International Journal of Artificial Intelligence in Education, 26(1):25-36.

Koedinger, K. R., & Aleven, V. (2016). An interview reflection on “intelligent tutoring goes to school in the big city”. International Journal of Artificial Intelligence in Education, 26(1):13-24.

Le, Q.V., Ranzato, M., Monga, R., Devin, M., Corrado, G. S., Chen, K., Dean, J., & Ng, A.Y. (2012). Building high-level features using large scale unsupervised learning. 2013 IEEE International Conference on Acoustics, Speech and Signal Processing, 8595-8598.

Liu, O. L., Brew, C., Blackmore, J., Gerard, L., Madhok, J., & Linn, M. C. (2014). Automated scoring of constructed-response science items: Prospects and obstacles. Educational Measurement: Issues and Practice, 33(2):19-28.

Liu, O. L., Rios, J. A., Heilman, M. , Gerard, L. and Linn, M. C. (2016).  Validation of automated scoring of science assessments. J Res Sci Teach, 53: 215-233. Doi:10.1002/tea.21299.

Mora, C., Rollins, R. L., Taladay, K., Kantar, M. B., Chock, M. K., Shimada, M., & Franklin, E. C. (2018). Bitcoin emissions alone could push global warming above 2°C. Nature Climate Changevolume, 8(11):931-933.

Merriam, S. B. 2009. Qualitative research: A guide to design and implementation. San Francisco: Jossey-Bass.

Nye, B. D., Graesser, A. C., & Hu, X. (2014). AutoTutor and family: A review of 17 years of natural language tutoring. International Journal of Artificial Intelligence in Education, 24(4):427-469.

Park, O., & Seidel, R. J. 1987. Conventional CBI versus intelligent CAI: Suggestions for the development of future systems. Educational Technology, 27(5):15-21.

Raschka, S., & Mirjalili, V. (2017). Python machine learning. Birmingham: Packt Publishing Ltd.

Sclater, N., Peasgood, A., & Mullan, J. (2016, April). Learning analytics in higher education: A review of UK and international practice. Retrieved December 12, 2018, from https://www.jisc.ac.uk/sites/default/files/learning-analytics-in-he-v3.pdf

Shulman, L. (1987). Knowledge and teaching: Foundations of the new reform. Harvard Educational Review, 57(1):1-22.

Tegos, S., Demetriadis, S., & Tsiatsos, T. 2014. A configurable conversational agent to trigger students productive dialogue: A pilot study in the CALL Domain. International Journal of Artificial Intelligence in Education, 24(1):62-91.

Tegos, S., & Demetriadis, S. 2017. Conversational agents improve peer learning through building on prior knowledge. Journal of Educational Technology & Society, 20(1): 99-111.

VanLehn, K. 2006. The behavior of tutoring systems. International Journal of Artificial Intelligence in Education, 16(3):227-265.

Woolf, B. P. 2009. Building intelligent interactive tutors. Burlington:Morgan Kaufmann Publishers.

Yao, M., Jia, M., Zhou, A. 2017. Applied artificial intelligence: A handbook for business leaders. ISBN 978-0-9982890-5-2 (Kindle) (kindle edition).