人工智能教育应用的视觉交互“赋能”效应研究

2021-08-11 11:03权国龙顾小清

开放教育研究 2021年4期

权国龙顾小清汪静

(1.江南大学教育信息化研究中心，江苏无锡 214122； 2.华东师范大学教育学部教育信息技术学系，上海 200062)

一、问题提出

人工智能教育应用正努力实现为主体赋能、为教育教学赋能的价值目标。在教育最优化的发展路径上，以计算为基础的人工智能技术，通过模式识别、机器学习、深度学习被应用于教育教学管理产品、教学系统产品和学习系统产品的研发与实践中。其在学习支持服务和教学以及行政管理服务方面的应用主要集中于：特征分析和预测、考核和评价、自适应系统与个性化和智能辅导系统四个方面(奥拉夫·扎瓦克奇-里克特等，2020)。人工智能技术的发展和创新不断为社会生产提供动力，教育应用也在不断深化并接近其发展目标——提高教育绩效、实现教育最优化(郭炯等，2020)。其中，人工智能与教育主体的“连接”是实现其应用价值与目标的关键之一。

人工智能教育应用效能的发挥主要依靠互动和交流，即主体与人工智能应用实体的“交互”。人工智能教育应用的情境主要有“人”与“物”两个方面，其在教育、教学和学习应用中的角色表现为伙伴、师长、管理者，以及支持工具与服务环境等五种。不同的应用形态都存在教育主体与人工智能应用角色的互动与交流问题——它与反思一样在人的学习与思考中具有重要意义。根据人在学习中感官参与的程度，视觉交流是人工智能应用中“人-智”互动的重要部分，涉及视觉感知、视觉反应及能被视觉感知的实体表达。人工智能能以多样的实体形态在多种场景中为教育、教学、学习提供支持与服务。视觉化、可视化是主体感知信息、形成意义、准确传达、高效呈现，乃至视觉分析与思考中不可或缺的方式，是人的学习中应用最多的学习方式。所以，人工智能视觉互动在人工智能教育应用中有重要意义。在科技界，华为与百度已发布了5G+人工智能工业视觉解决方案白皮书(百度智能云，2020)，为智能工业发展提供技术支持，也反映了视觉智能是人工智能应用的重点之一。

如何应用人工智能技术，如何创造、改进并运用人工智能视觉交互为主体赋能成为未来主体发展与教育发展的重要议题。本文重点关注人工智能教育应用形态中视觉交互的不同方式、赋能法则以及其对教育主体的影响。研究问题包括：1)人工智能教育应用有哪些主要应用形态，哪些主要交互形态，其视觉交互方式有何特点？2)人工智能视觉交互需要具备何种“赋能”特性？3)视觉交互对教育主体有何赋能效应？

二、人工智能教育应用的形态及特性

将人工智能与其相关技术结合起来考虑其如何被用于教育，才能透彻观察其教育应用的研究与实践。因为发展中的人工智能，形态不定、功能日增，其应用涉及方方面面；而且，连接“硬件”与“软件”的“潜件”更是其应用的要点。如果把人工智能作为一种问题解决方法，那么其教育应用就是要用人工智能技术解决现实教育问题，或用人工智能技术支持或满足现实教育需求。在现实情况下，研究并判定人工智能应用的真实教育场景与情景，厘清人工智能技术的本质及其擅长应对的问题，才能在实践中恰当地设计并应用它们。

考察人工智能教育应用如何赋能主体，需要全面理解人工智能教育应用形态。当前应用于教育领域的人工智能软件系统主要有三类：私人导师、协作学习智能支持系统和智能虚拟现实(Luckin et al., 2016)。贝克等(Baker et al.，2019)把人工智能教育应用工具按教育活动参与要素分为：面向学生的、教师的和系统的人工智能教育软件。事实上，人工智能技术可嵌入的教育系统要素，是由其“智能”本质和潜在需求决定的。兼具感知、计算、表征、存储以及识别、推理、表达等功能的人工智能技术可与教育教学主要要素相结合，针对教育教学实际需要设计技术样式，形成不同应用方向和应用层次的实践形态。杨绪辉等(2019)指出，通过人工智能技术之所长补足教育活动中人之短板来完成“人-技”关系重构，是使人工智能教育应用达到协同与融合状态的实践方向之一，是最终实现技术之教育价值的基本途径。所以，结合实际应用，人工智能教育应用形态可以更完整地分为：智能环境、智能工具、智能学伴、智能教师和智能管理者。

人工智能环境主要通过环境感知和信息整合从环境适宜的角度智能地为主体提供主动的活动建议或被动的行动指导，使主体拥有多元的场景感和深刻的现场体验。智能环境的特性在于环境信息联通，为学习者提供适时、准确的环境信息，“沟通”主体所需要的环境信息并按需调节，营造人性化的教育活动氛围。例如，由人工智能支持的教室是典型的智能环境，它能智能地调节光线、温度和空气质量。

人工智能工具主要利用判别、跟踪、预测等智能，通过信息整理、模式识别、思维感应等提供必要的认识监察和适宜的思维辅助，使主体拥有充分的认知和思维发展。其教育应用在于对“认”和“思”的辅助，对主体认知与思维的辅助是其释放其教育效用的重要目标。例如，智能软件为主体提供及时的反馈或提示。

人工智能学伴主要利用感应、识别、对话、思维、行动等智能通过不同层级与风格的同伴身份或伴学角色为主体提供“学友”式的人际交流与心智交流，使主体拥有人性化的心智发展体验。其教育应用特性主要是情志陪伴与社交往来。嵌入人工智能的智能学伴，使学生不仅不会缺少心理交流和社会交往，而且会因交往自由而放大智能“学伴”的效用。在积极正向的情志作用下，交流中的认知也会因灵活性和启发性增强而额外增强。

人工智能教师能利用识别、监察、决策、规划等智能为主体诊断学情、疏导心理、适应地推荐、检测目标等。人工智能教师可以辅助学生课业学习和个性成长，可以传授科目内容，耐心地为学生授业解惑。“人工智能+教师”的协同实践模式是人工智能教师形态的特别形式(周琴等，2020)，或可为教育教学带来更好的效果。在强人工智能技术支持下，人工智能教师可如同师长一样辅佐学生，帮助其成长为一位知识技能优秀、心智能力健全、人格品性和伦理观念兼具的“完人”。

作为人工智能管理者，其具体形态多样，功能上与其他应用形态的信息充分互联，担负着组织决策、系统协调的角色，负责团体、学校、社区的活动规划与资源调配(见图1)。其教育应用特性在于辅助决策与协同管理，使团体、学校、社区等活动井然有序、和谐发展。

图1 人工智能教育应用的管理者形态

在各应用形态中，人工智能技术发挥的功用主要有四种，包括独立或协同地知识建构、问题解决、系统决策和协同行动。对教育主体来说，其应用重点在于信息交换、引导思考、陪同交流和协助行动四个方面。正是基于上述支持，人工智能技术不同教育应用形态的主体赋能才得以展开，其教育价值实现成为可能。

不过，对于人际型的智能学伴、智能教师和智能管理者形态来说，机器人的出现将成为人工智能教育应用的拐点，其经典的“拟人”化实体代理就是智能机器人。由于智能机器人更加具象化、实体化，在满足主体即时的交流、沟通、指导、启发等需要时更具优势。实际上，随着数字智能的独立性和集成性的发展，人工智能教育应用形态也将更灵活多样。例如，智能工具与智能“学伴”或智能“教师”可以合二为一。在“软硬”技术成熟、应用形态理想的情况下，机器人的应用将成为人工智能教育应用的一大亮点。所以，在现阶段和未来很长一段时间内，几种形态的应用将独立存在；而未来的应用形态或将演化为：智能环境、智能“附件”、智能机器人(可代理多种教育角色)三种形式。

三、人工智能教育应用的视觉交互方式

与教育主体的互动“连接”是人工智能教育应用的重点。如果说互动“连接”是实现其赋能的关键，那么视觉交互智能就是打开教育主体赋能空间的钥匙。视觉交互能扩展人的实践活动范围，在人工智能服务中扮演非凡的角色。事实上，以视觉交互智能为代表的人工智能交互(简称“人智交互”)与“人机交互”之间存在本质的不同。

(一)“人工智能体”与教育主体交互的形态

人工智能依附于物理实体而存在，“人工智能体”与教育主体间的交互存在多种形态，即人智交互形态，涉及多个维度：1)由于人的活动涉及情感、认知、行为等层面，交互需要也涉及不同层面；2)交流动机不同，交互有主动与被动的差别；3)人工智能所属关系或地理位置不同，交互也存在面对面或异地的差异；4)交互涉及感官不同，存在多种方式；5)依附的实体不同，交互所依赖的硬软件样式也多种多样。对交互形态的多维度考虑，意味着对多样人工智能交互需求的支持，以及多样的人工智能交互形态的产生。

在实际应用中，多样需求与多维支持使人智交互呈现丰富的特点，其在人工智能技术的应用特性上表现为：1)功能有强弱，即已被熟知的强人工智能和弱人工智能，如影片《机器人管家》中的安德鲁和《机器人和富兰克林》中的“强智”机器人；2)显性或隐性的应用，即有无可见形象，如智能代理和智能软件工具；3)形象有虚有实，如车间的机器人、微软计算机操作系统(Windows)里的小娜(Cortana)；4)存在于人体内或外，如嵌入人体的人工智能单元与可穿戴的人工智能设备。多样的人工智能应用使人智交流方式更丰富。

在人智交互形态中(见表一)，多样的人智交互需求与人工智能技术形态有对应关系。人智交互形态依赖视觉居多，听觉次之，基于触觉的交互正在发展。根据感官通道与媒介性质的不同，人智交互方式可以归为：1)文本交互；2)语音交互；3)图形界面交互；4)虚拟代理交互，如与数字系统的智能代理或助手的交流；5)实体角色交互，如机器人与人之间的交流。这些交互方式有静态的文本与画面，也有动态的影像与图形；有抽象的文字与符号，也有具体的景象与人物。将媒介的交互方式与指向内容的交互形式适当结合，能增强人智交互形态的“表现力”。

表一人工智能教育应用的交互形态

人工智能应用形态、人智交互方式与交互形态之间存在“角色—拟态”的依存关系。人工智能教育应用形态是把人工智能技术应用于教育系统后形成的智能化实践模式与状态，主要表现为人工智能的教育用途。人智交互方式是人工智能发挥功能的方式，是产生服务效用的技术手段。人智交互形态是实现人工智能应用的技术性物化结果。人工智能应用的目的及对人工智能需求的认识影响人工智能应用物化的结果。三者都依赖人工智能技术的成熟度，决定于设计者的思想与设计。人工智能的交互形态与交互功能直接影响，甚至决定其教育应用形态，如包括功能的集成性、模式的可转换性等。人工智能教育应用的技术化媒介与程式通过“拟态”与教育角色的应用需求相结合，在彼此的互动关系中动态完成“人智”相依的系统样态。“拟态”的出现需要先经过“模拟”阶段，其成熟需要仿真与模拟技术的高度发达与创新应用。所以，技术形态与应用形态息息相关。

(二)“人-智”视觉交互方式

人工智能体与教育主体的交互有两个重要要素：交互方式和交互时机。人智交互主要是“近距离双向”交互(见表一)，交互方式直接影响人智交互的“沟通”表现，涉及感官通道，内容组织与解析形式。交互方式为交互内容服务，支持“人-智”间的信息交汇、知识交流、思维交融和创造协作等。交互时机取决于基于学习与教学原理的社会性行为设计，信赖于设计者的理解与设定。交互方式则与学习者的体验与参与度紧密相关，与人体感官关系密切，尤其是视觉交互方式。

典型的人智交互场景展示了人智交互的视觉方式与形态特点。例如，服务型“小胖”机器人(Fabo)，广泛应用于家庭、教学、娱乐和服务等场景(柳晨晨等，2020)。它集成移动监测、自主导航、空气净化、电器智控、应急报警等功能，可多方位提供智能化环境服务，如对封闭环境的空气质量监控与调整，对室内空调、热水器等的操控，大型封闭空间中的导航等。“小胖”与人的交互方式主要有：人脸表情、图像显示、视频投影、远程摄像及文本。其中，视频、图像是主要的视觉交互要素，通过播放、摄像与投影完成视觉交互功能；人脸表情是重要的交互方式，它关照主体情感，与语音一起集中体现社会性交互；屏显和投影是其视觉交互方式；多种视觉交互配上语音交互，使“小胖”在多场景智能服务中表现出色。

再如，武汉泰乐奇信息科技有限公司研制的“治趣(CureFun)医学虚拟诊疗云平台①，能够智能化地追踪、虚拟真实场景(高婷婷等，2019)，创建沉浸式学习环境。通过“仿真模型设备”“虚拟软件”“希尔曼(SimMan 3G PLUS)”等高仿真模拟人以及“标准化病人”，为学生提供问诊沟通、体格检查、临床思维、诊疗决策、团队合作等临床能力综合训练。此平台涉及的交互形式主要有仿真模型、虚拟模型、视窗界面，都是经典的视觉交互载体。而且视觉影像、触感与动作是其主要交互通道。屏幕、数字虚拟及仿真实体是其主要的交互形态。类似的智能技术应用还有很多，如谷歌云深度学习(Cloud ML)，百度的简易深度学习(EasyDL)、开源的深度框架(AutoKeras)等(王萍等，2020)。这些自动化平台应用人工智能技术于文本分类、图像分类、视觉分析和自然语言处理等，其交互形式大多是图形与文本，交互形态主要基于屏幕显示的数字系统。这也预示着，交互方式的视觉化选择与实际应用需求密切相关。

随着增强现实、混合现实以及全息投影等技术的创新发展，人智交互可以发挥更多更强的效能。例如，地理空间的景象还原、历史文化故事与人物复原呈现、想象空间模拟等，甚至支持人在其中与它们深入互动。而在自然语言处理、全息投影、视觉识别与追踪等技术的支持下呈现特定时空的地理空间信息与社会行业场景，以根据主体的需求与应答展现后续情景，提供虚拟历史场景，嵌入沉浸式学习环境，或智能追踪人的行为等，都为智能技术的深入应用提供了可能。所以，视觉交互在众多技术的支持下，将使人智交互更接近于“人—人”交互。教育机器人的发展与应用预示了这一前景。服务于儿童的社交机器人(Rubi)和微软的人工智能产品，与学生一起形成“同学”间的多元互动，在学习中充当了智能学伴的角色。它可以扮演虚拟的或实体的同事角色，与教师互动、共同备课、一起听评课等。拥有认知与情感智能的“计算机导师(AutoTutor)”“北极星人工智能助教”及“人工智能好教师”，则作为设计者和指导者，可精准分析学生的认知和行为模式，并结合情境为学生提供个性化指导(周琴等，2020)。作为学伴或教师的机器人，多基于各种技术集成打造而成，尤其是情感识别与表达、自然语言处理、面部表情与肢体语言等技术。这些机器人的交互方式主要有语音、面部、手势、肢体及虚拟与实体模型等，其交互形态逐渐从听觉走向视觉与触觉交互，从虚拟走向实体交互，从携带走向与穿戴和嵌入共存，而交互体验也逐渐接近于人与人之间的交流。因此，以实体机器人实现的人智交互将是人工智能教育应用的转折点，展现了人工智能在人性化教育中的美好愿景。其视觉交互是人智互动最直接、最常用的方式，在教与学中有重要意义。

四、人智视觉交互方式的“赋能”通则

在教育系统活动中，主体的知识技能增长与能力提高通常涉及学与教的活动及认知思维两个层面。人工智能应用赋能主体、赋能教育，也需要从活动与认知思维两个层面考虑。作为人工智能应用的“连接枢纽”，人智交互的形态与方式直接影响其应用的结果和效能。设计与应用更要重视视觉交互方式及交互形态，聚焦视觉交互操作以提高“内辅”效果，聚焦视觉互动活动以增强“外辅”效用。

(一)增强意向对象的“可见性”

人工智能视觉交互的重要任务之一就是帮助主体看见、看清、看准认知对象。学习中直接的感受和体验主要来自视觉。“直观地看到”是通过视觉形成感知、完成理解并产生视觉记忆的重要方式，但不是一切意向对象都“可见”。因此，视觉赋能的首要任务在于让对象“可见”：一是让看不见的看得见，要显微，即让微小的看得清晰，又要能缩小让庞大的看得完整；二是让看得见的看得明了，即让无形的看得明白，隐形的看得清楚；三是要让不存在的看得了，即要能虚拟，让不存在的看见其形；又要能增强，让存在的看得准确。总之，增强对象“可见性”就是借助人工智能视觉交互技术为教育主体表征意向对象的视觉影像，展现一切可学、将学之物。

在理想状态下，人工智能应用的视觉交互可以完美胜任“可视性”要求。这得益于智能型视觉应用的优势：1)交互中可即时网罗大量“可见”内容，可接入海量资源；2)在识别、比对、过滤等视觉功能的支持下，可以根据交互需要处理并展现事物，丰富“材料”展现方式；3)可根据交互情境与内容需要推理和计算，产生精准应需的“可视物”，即事物的准确展现。以“视像”表征意向对象，这是人工智能视觉应用“内辅”服务中的核心。

(二)提高视觉空间的“可变性”

人工智能视觉交互的另一项重点，是帮助教育主体看“懂”意向对象。视觉交互的直观可见在多数情况下是对意向对象表面信息的观察，往往不得其要。看“懂”意向对象不仅要明白其内在特征，更要将其置于本原环境中动态观察其内外部关系。所以，人工智能视觉交互支持下的“看懂”需要“转换形义”：一是引导主体看到重点，使其注意正确聚焦，使其心智有效操作；二是引导主体看得全面，使其理解连续而完整；三是引导主体看得透彻，使其抓住本质。在连续的交互中做到这些并不容易，需要交互理解和交互响应的连续往复。而在视觉空间内的可变展现，以及依据外在互动的可变调整，是智能化视觉交流赋能主体的重要途径。

人工智能应用的视觉交互可支持主体“看懂”的需求，更能满足其个性地看的需要。增强型人工智能视觉技术拥有强大的视觉处理能力，能结合语义处理等相关技术提供视觉空间的灵活抽取与呈现、“视像”对象的多元定制与多维处理、视觉交互语义的动态调整等支持服务，实现视觉空间中对同一事物不同形态的展现需要、同一事物不同的场景识别、不同事物的比较分析，以及对主体的交互动态与内在状态识别等。

未来人工智能视觉交互的技术发展与实践应用面临更多挑战。它的应用不仅能在交互进程中基于对主体理解状态的感知和判断，调整展现给主体的视觉交互内容及形式(即交互方式)，还能根据主体的完整交互状态调整交互策略。在此基础上，通过人工智能还原式或催化式的视觉转化以及智能机器人近似或逼真的“人格化”表达，视觉展现的意义改变和“肢体”语义表达的调整才能趋于完善、完美。“形义一致”的视觉空间“可变性”是高级智能化的表现，是人工智能视觉交互技术“内辅”心智与“外辅”互动的重要方式。

(三)意义空间中提升交互赋能的“智慧性”

人工智能视觉交互应用的更高层级是其视觉赋能的“智慧性”。就教而言，人工智能视觉交互技术的应用让主体“会看”，而不仅是机器“会看”。如果说“看见”是知道某物的存在，“看懂”是理解事物，那么“会看”就是能够根据实际从适当的角度、用适当的方法、从特定的立场看。不管如何，它的目标是要使学习者灵活地看、智慧地学(祝智庭等，2018；权国龙等，2018)。人工智能视觉交互技术的高阶发展可以达到“可见性”和“可变性”，但对它的“智能性”要求，是强人工智能技术应用面临的考验，就像机器认知发展——不仅是人让机器可以，而且通过人工智能使人可以。以教育目标分类而言，视觉交互的“智慧性”涉及视觉化迁移和应用，即对照和比较；涉及视觉化分析，即分解与解析；也涉及评价和创造，即多维与多元；而不仅仅是“看见”和“看懂”，即知道、理解。

人工智能应用的视觉交互要能赋能主体，使其“会看”，就需要上位的智慧理论、高维的知识框架、多源信息数据的构造与发明。智慧的要领在于灵活与巧妙，是价值取向、目的基准、方法优选下的灵活。人工智能视觉交互能力，要做到灵活地思考、智慧地思想，还需要依赖多模态高密集、即时更新数据与模型支持及时的运算切换，需要依赖已有的、未来创新的算法支持应需的灵活思考，更需要依赖只会快而不会慢的算力支持即时运算。就实际应用效力看，“智能性”要求是人工智能视觉交互技术“内辅”心智与“外辅”互动的重要手段。

如果说人工智能视觉交互的“可见性”和“可变性”主要辅助认知与学习，那么其“智慧性”主要辅助思维与教学。“可见性”“可变性”“智慧性”作为人工智能视觉交互应用通则，其发展与应用需要学习科学与教学理论的参与。就主体赋能过程看，“三性”通则在人工智能视觉交互技术赋能主体中有重要意义。

(四)人智视觉交互的“内辅”与“外辅”

本研究选用人工智能集成环境和人工智能机器人的经典案例，分析人工智能视觉交互在设计上的可期效果，以及应用过程与结果上的理性预期。这几个案例包括电影作品中的“智能舰长”、机器人瓦力和伊娃②，人形机器人(Pepper)和小胖机器人(Fabo)以及可穿戴式机器人(Fitbot)(柳晨晨等，2020)。它们分别代表未来预期的人工智能应用、当前主流应用和初期应用的交互形态。与实用的小胖等智能机器人相比，瓦力和伊娃在形态与智能上更接近于人。虽然经过了艺术加工，但他们是未来机器人发展的方向。我们可以从案例中比较不同视觉交互方式与形态的主体赋能潜力。

1．认知“内辅”的视觉方式差异明显。由于视觉化表达的需要，机器人瓦力和伊娃需要借助外部器件展现认知的事物，如屏显。人形机器人和小胖具备屏显功能，可以通过视像显示事物；可穿戴机器人几乎不具有视像显示能力。实际上，二维和三维投影技术就可以扩充、增强智能机器人的“内辅”展现能力——这也是机器人在视觉交互上完胜于人的地方。机器人只有充分具备呈现能力，才能以“可见性”与“可变性”辅助主体的认知需要。

2．互动“外辅”的视觉表达与互动回应以“表情”与动作为主。智能集成环境可以通过调用独立智能体以多种视觉方式完成互动回应。瓦力和伊娃具有灵活、逼真的肢体表现、面部表情及语言和语音系统，可以自如回应服务主体；人形机器人、小胖和可穿戴机器人有情感识别和情感交互功能，主要通过语音完成交互，表情和肢体表达偏弱；可穿戴式机器人主要依赖语音系统。可以看到，有独立行动能力的机器人往往具备两种重要的表达与回应方式：表情(包括眼神)和动作。这两种方式模拟了真人交往的重要元素，而语音的参与使这种模拟走向完美。互动“外辅”对维系个体情感和赋能关系有重要作用。刘革平等(2021)在虚拟实验中的手势交互说明，互动“外辅”可增强沉浸感，提高学习动机与学习体验，进而通过积极的参与和行动提高学习效果。

3．视觉交互的方式与形态是人工智能赋能主体的两个重要方面。“内辅”认知可用视觉符号表征“视像”，“外辅”互动主要依赖表情与肢体动作回应交流。屏幕与投影器是前者主要的视觉交互实体，具备表情与行动能力的机器人是后者的实体形态。人工智能视觉交互赋能主体，就是要辅助主体的内在认识，协同其外在行动。其中，“内辅”的重点在于视觉符号运用和展现方式选择；“外辅”的关键是实体形态与(交互)响应方式设计。两者都与人工智能视觉交互的设计目标与服务目的有关。依据视觉化、可视化之设计与应用研究(权国龙等，2016)，人工智能视觉交互的设计与应用要关注对象的表征、情境的还原和动态交互的展现，以透过学与教的原理辅助人的识别、呈现、模拟、分析、思考、表达，最终完成主体赋能。在机器视觉和计算机视觉发展成熟的情况下，人工智能视觉交互方式与形态将在教与学情境下大幅增强其主体赋能的能力，胜任情境还原、过程展现和空间对象表征等需要。例如，舞蹈机器人在教学中可通过丰富的视觉展现与演示“内辅”认知，而伺服机器人在服务中可通过灵活的参与“外辅”互动交流。而最后的重点依然回到人工智能视觉交互的设计思想和运用策略。不过，以人工智能视觉交互“赋能”主体，除关注交互形态与方式外，不可忽视其智能性，需要正视人工视觉智能的实际效应与理想效能。目前人工智能应用视觉交互的智能性尚处于有限的水平。

五、人智能交互的主体“赋能”影响

如果说以计算智能(王亚飞等，2018)为根基的人工智能教育应用是“内驱”数据动力的智能应用，那么以视觉交互智能为基础的人工智能教育应用就是“外展”实践空间的智能应用。人工智能视觉交互可以使教育实践活动在人智交互中充分展开，机器和智能的技术潜能也可以在人智交互中充分发挥。人工智能视觉交互质的变化将在各种应用形态中为教育主体带来深刻影响。

(一)从认知方式到行动策略全面促进主体学习

以视觉交互为主的人智交互应用将全面支持主体学习，深化其学习效用，满足“三性”通则的视觉交互可以将主体置于逼真的知识生产与应用场景，通过视觉变换最大限度地显现学习对象与学习过程，做到“内辅”认知方式，外辅”互动与行动策略。在视觉感知、视觉表达与行为表现的交互性理解与设计中， “三性”通则可以在多种情景需求中提供支持。机器视觉与计算机视觉技术的发展与应用，将进一步形成人工智能教育应用的发展方向。

“可见性”使学习主体能看到一切可看之物，在现实与数字的视域中、在感性与理性的范畴内、在逻辑与直觉维度上不再有“盲区”。“可见”使得一切变得容易接触，而“可变”使理解与掌握它们只是时间问题——众多可选的视觉样式、动与静的展开式使理解不再是无法想象的混沌思虑，而是可欲可求的知会过程与思想给养。“可见性”与“可变性”的辅助效用是在视觉交互中对主体“认”与“思”的延展；在视觉、听觉、触觉等多种模态交互信息的共同作用下，“可见性”与“可变性”通过“多源”信息融合为主体的理性思维与设计创造带来可能。对充满好奇心与求知欲的学习主体来说，“可见”“可变”的人工智能视觉交互特性将直接促进主体感性认识与理性思考的直观展现。而“智慧性”是在延展认知的基础上帮助主体独立思考和创新思维。人工智能视觉交互中的“智慧”传递过程本质上是思维的模仿。这里需要把握两点：一是智慧地传递，即视觉化展现的有效性和灵活性；二是智慧的实体，即视觉化呈现的事物及巧妙的呈现形式。智慧性应用只要形成例子就可以观察模仿。“智慧”“可变”的人工智能视觉交互是辅助主体思维和情感的重要方向。通过稳定主体情感状态，引导其动机与目标，人工智能视觉交互可以在情感交互和具象交流的基础上(柳晨晨等，2020)以特定的角色陪伴学习主体深化学习。在人工智能技术发展及情感研究的相互支持下，人工智能视觉交互也将进一步涉及主体的情感和意志。届时以视觉交互外展的人智交互对主体认知与行动的影响将变得全面而精致，主体在视觉空间与意义空间中的深层次自我认知与个性化外部反馈(郭炯等，2019)也将在人工智能的情感关照中变得丰富而人性化。

在现代科技的教育应用市场中，人工智能视觉交互应用的趋势是明显的。2020年教育技术行业的创收达到2520亿美元，年增长率为17%。其中，代表视觉技术应用的增强现实处于领先地位。这与其自身优势紧密相关，如学生的兴趣和注意力的抓取、无障碍学习材料、无需特殊设备、快且有效的学习过程、可改进协作能力、支持实践学习、适用于各类教育和培训(如对危险性工作的培训)等(Aleksandrova，2018)。

(二)从群众共性到个体差异精准改进主体的教学

人工智能视觉交互赋能主体、赋能教育必然包含对教师和教育教学的支持与服务。就教学应用而言，人工智能视觉交互的支持也是“有向”“准确”而“及时”的。“有向”指既能针对个体差异，也能关照群体共性。教育教学有此需求，教师在“一对多”的情形下更需要这种支持服务。人工智能视觉交互的支持也将变得“准确”，直指个体与群体的潜在需求与即时问题。人工智能应用总能指向应用场景的“问题所在”，明确可以调整、改变的部分，提供及时而有力的智能支持。在教学应用中人工智能视觉交互可以：1)在视觉化模拟与分析的基础上，准确预测教学中的关键目标、重点环节及实施策略以帮助教师做好充分准备；2)在视觉化识别与运算的基础上，把握学习者状态并理解其学习过程辅助教师适时调整教学；3)在视觉化分析与统计的基础上，诊断教学过程中存在的问题并能及时找到教学设计与实施中的疏漏与弊端；4)在视觉化推理与决策的基础上，提出新的教学革新方案，形成新的教学设计；5)基于对学和教过程的充分了解，及时发现“主体间”的问题，推荐或推行系统性的教学方案。

人工智能视觉交互的支持也将恰在其时，以智慧的方式与主体在实践情景中互动。在视觉交互层面上，教育系统中的数据、信息与知识甚至智慧都牵涉其中；智能教学中的主体感知、思考与行动也值得人工智能视觉交互的参与。人工智能应用，能以视觉化方式创建和管理学习内容，可以对所学内容及学习过程与结果做最大程度的可视化展现与分析；进而，在获得对学习进度和理解过程的重要见解(Sudarshan，2018)后，通过视觉交互在知识、技能、思维等方面“赋能”学习主体，如智能仿真教学系统(李爱霞等，2019)。无论是嵌入“环境”的人工智能，还是陪伴主体的人工智能，都离不开对环境和主体的状态与过程数据的收集，都需要信息识别，自动收集信息，快速分析，即时聚焦，合理推荐，以及支撑并完成视觉化的实践应用。也正是在合理科学地应用教育数据的基础上，人工智能视觉交互可以支持教育教学的价值选择和主体的思想与实践活动，如基于智能决策引擎的智能阅卷和智能推题(王亚飞等，2018)。

(三)从智能理想到教育现实辩证应对人智交互赋能的机遇和挑战

由智能视觉交互外展的人智交互有赋能主体于教育实践场域的“智能理想”。以机器视觉和计算机视觉技术为代表，以问题求解、逻辑推理、自然语言理解、自动程序设计、机器学习、人工神经网络系统、模式识别、智能检索等为基础(吴永和等，2017)，人工智能视觉交互在未来智能技术支持下将为教育主体带来全新的学与教模式、体验与效果。例如，增强现实应用带来的体验(汪存友等，2016；陈凯泉等，2017)。教育系统的人智交互使未来教育在认知方式、资源供给、课堂教学、教育形态和道德框架等方面面临变革(柳晨晨等，2020)。这是未来人工智能教育应用发展的机遇，也是人工智能技术、人智交互应用、未来教育协同发展的新起点。

与此同时，人工智能视觉交互的教育实践应用也存在诸多现实困境，涉及人工智能技术本身、主体的多元适应以及社会经济、政策与伦理等。例如，从技术应用看，先进技术的实践应用需要高昂的成本，教育所期望的人工智能技术发展不够成熟，应用缺乏师资队伍和师资培训，现有的教与学过程面临来自“新型智能与意识”的挑战，教育场域的人与人工智能共处的伦理问题，人工智能应用涉及教育的公平、主体和本体等哲学问题。从应用形态看，人工智能教育环境、系统、学伴、教师和管理者越来越“聪明”“自由”，作为独立的存在它们如何“和谐”地参与学与教的活动；人工智能实体与主体协作的过程与结果在教育评估中如何被认定。人工智能技术与人工智能视觉交互充分应用于教育活动时，现有的教育体制会成为“桎梏”还是“适配性容器”，现有的教育模式是否需要调整，如人工智能教育的“盲区”和“禁区”问题的解决(张坤颖等，2017)，等等。不过，可以肯定的是，当人工智能技术的教育参与已然使教育主体和谐，使教育格局均衡、实现生态化时，体制与模式所面临的更新就是必然的。

辩证地看待人工智能教育应用进程中的机遇和挑战是人智交互赋能未来教育的应有姿态。人工智能视觉交互作为人工智能教育应用的重要方向，要在理论研究与实践应用中把握教育科学规律，扬长避短使其良性发展。智能学习地图的设计与应用(顾小清等，2018)就是智能教育背景下学习主体需求导向的智能化设计与应用。正如奥拉夫·扎瓦克奇-里克特等(2020)的观察，人工智能教育不能与教学理论若即若离，要逐步探索符合教育规律和伦理规范的人工智能应用。人工智能视觉交互应用依然需要从“现代”人工智能的三个特征、算法的客观与公正、保护隐私与权利等方面检验人工智能对教与学的促进作用。而人工智能技术新进展所预示的教育应用新愿景也当成为当下人工智能教育应用的航标，毕竟人工智能的潜力是可期的，就像现在的人工智能发展让人惊讶一般。

[注释]

① 武汉泰乐奇信息科技有限公司网址：http://www.curefun.com。

② “智能舰长”、瓦力和伊娃出自影片《机器人瓦力》。