□王志军 吴芝健
国务院印发的《新一代人工智能发展规划》提出,“人工智能的迅速发展将深刻改变人类社会生活、改变世界,要抢抓人工智能发展的重大战略机遇”(国务院,2017)。教育领域也将在人工智能的影响下发生深刻变革。以ChatGPT 和Khanmigo 为代表的生成性人工智能采用 “人类反馈中进行强化学习”(RLHF)的训练方式,具备强大的检索能力和学习能力,不仅可以为学生答疑解惑,还可以自动生成范文段落示例或启发性思路提示,识别情境并结合专业学科知识,以人机协同共创的方式为学生提供动态教学支架与反馈,并优化其学习路径(卢宇,等,2023),提供智适应服务,成为一个很好的AI 助教(Alshater,2022;Aljanabi,et al.,2023;王佑镁,等,2023)。讯飞星火大模型能够自动化生成文本、图像、视频、音频等多类型内容的生成性人工智能,为人类学习的开展带来了更多的机会与可能。介于人工智能对教育的重大影响和发展潜力,本研究基于对人类知识生产方式和在线学习变革趋势的分析,进一步探讨生成性人工智能时代的在线学习新形态。
技术的发展推动着知识生产模式和知识观的变革(陈丽,等,2022)。在互联网时代,内容生产模式经历了从专业生成内容(Professional Generated Content,PGC)到用户生成内容(User Generated Content,UGC)再到人工智能生成内容(AI Generated Content,AIGC)的发展。在PGC 阶段,内容生产来自专业性较高的机构、团队或个人,内容的权威性高且质量有保障,但内容生产的成本高、周期长、更新缓慢。这也是人类长期主要的知识生产模式。以社交媒体技术为核心的Web2.0 时代的到来,促使每一位用户都能够同时参与到内容的消费和生产过程中。因此,每一个个体都是内容生产的主体。尽管知识的权威性不如PGC 阶段,但知识生产的速度和效率得到了极大的提升,用户的协同过滤与评价机制也实现了知识的快速流转、更新与迭代。人类的知识也因此具备了网络属性和全谱系特征,从精加工的符号化信息回归为全部的人类智慧,回归知识本身所具有的完整性、复杂性和动态性的特征(陈丽,等,2022)。在生成性人工智能时代,随着自然语言处理技术、深度学习和大数据模型的快速发展,基于用户需求的人工智能生成内容(AIGC)将成为日益重要的知识生产模式。AIGC 通过人工智能算法自动生成的内容(Cao,et al.,2023),具有数据巨量化、多模态融合、认知计算、虚实共生等特点(李白杨,等,2022),内容生成效率高、内容质量稳定且可拓展性强。同时,AIGC 的成本低、普及性强、使用门槛低,易被大众接受和使用。生成性人工智能时代,人机协同的知识生产模式,能够更好、更即时地满足用户需求,也为提高与解放人类生产力,提升人类的学习能力、创新能力和丰富精神世界提供了可能。
与知识生产模式的变革密切相关,人类的学习方式也在不断扩展。在线学习因其突破时空的局限,成为人类学习日益重要的组成部分。瑞秋等(Reich,et al.,2022)基于 “谁来设定学习活动顺序” 这一问题,提出可以将大规模在线学习分为教师提供、同伴驱动和算法生成三种模式。教师提供和算法生成的模式通常依赖于某种自动评分系统来评估学习者的表现;而同伴驱动的学习模式更侧重于话语和同伴反馈,通常避免正式的评估。此外,教师提供和算法生成模式下的学习通常从指导教师的教学方法中获得灵感,即桑代克所说的“专家传播知识供新手吸收”(Thorndike,1906),其内在逻辑为提升知识传授的效率和适应性。根据三代远程教学的划分(Anderson,et al.,2011),它本质上还是行为主义的教学法。本研究认为,教师提供、同伴驱动和算法支持不仅代表着三种在线学习模式,从教师提供到社群驱动,再到算法支持的过程实质上代表着知识生产模式变革与技术发展背景下人类学习理念和方式的变革。
教师提供的学习模式遵循 “行为-认知主义” 学习理念,学生学习的知识基础来自教师的设计或选择;课程中的学习按照特定的顺序安排,一切学习活动和步骤都由教师进行选择和设计。虽然学生可以以自己的方式自由地学习这些材料,也可以帮助同伴,但大多数学生一般都是沿着教师规划的主要路径前进,最终产出的学习结果也几乎相同。学习评价也是在教师设计的工具和系统中进行。由精英大学创建的大规模开放在线课程(xMOOCs)即此类学习的典型实践。
在社群驱动模式下,知识主要来自社群中的同伴,他们可以互相提供指导、案例、评论和反馈,也可以相互关注,形成子组和网络,用户通过自己创设的学习空间与群体间展开交流与互动,实现知识的共创。因此,该模式最大的特点就是交互性强,学习者在持续的交互中学习,在群体智慧的帮助下不断进步。米塔拉(Mitra,2016)指出,如果将学习者组织成小群体,并且为其提供互联网的学习资源,同时在学习过程中给予适应的支持和辅导,学习者便能够学习各种复杂的主题。联通主义学习指导的cMOOCs、知乎等众多用户自发驱动形成的学习社群就是这一类学习的代表,其背后的学习理念是联通主义学习理论或者社会建构主义学习理论。
算法生成的学习通常依托于适应性、智能化学习平台开展。算法根据学习者的学习数据或者其他学习序列、用户的信息输入和交互需求等进行推荐和生成,并自动化适应学习者的学习。即自适应系统是一个能够通过算法对集群内容、活动进行聚合、分析、处理和重现,并提供个性化、适应性的学习内容和学习体验的集成体(乔恩·德龙,等,2018)。生成性人工智能技术的发展,不仅可以提高人机操作交互的效率,还可以极大地提高情境适应性、个性化和精准性。学习者可基于自己的兴趣与需求,确定学习主题,规划行动方案,充分利用智能化学习空间生成的学习资源、学习支持和学习引导,开展自我导向的学习,进而实现个性化的学习目标。此外,学习行为和过程等的数据化会促进算法的持续优化,从而为学习者提供更加精准的支持与服务;以数据为中心,实现学习者和算法的良性互动、人机共生,这也将是人类在日益复杂的信息网络环境中的主要学习方式。
正如吴恩达在斯坦福大学的演讲中所述:人工智能作为一种通用技术,未来就像电一样,在许多领域中得以应用(Stanford Online,2023)。人工智能时代的学习,是充分融合人的智慧和机器智能的学习。在线学习将成为人工智能时代学习的最基本的组成形式。因此,确切地说,人工智能时代的学习是一种以在线学习为基础,算法技术支持下,充分融合机器智能和人的智慧的学习,是一种算法和社群双驱动的智适应社群化学习。下面本文将在梳理智适应和社群化学习发展历程、优势与问题的基础上,从算法和社群双驱动的角度来论述人工智能时代在线学习的发展。
智适应学习系统是指根据学习者的个性特征与具体情况,通过呈现适当信息与学习资料、提供反馈和建议来创设符合学习者需要的智能学习环境的学习系统。自20 世纪50 年代计算机发展以来,人类就对计算机辅助教学这一人工智能支持个性化教学方式展开了探索,可编程自动教学系统(Programmed Logic for Automatic Teaching Operation,PLATO)就是其中的代表。20 世纪70 年代,人工智能教育应用随着第二波人工智能浪潮的发展而受到重视,智能教学系统开始涌现。如用于南美洲地理教学的Scholar,用于物理、数学、编程等教学的AutoTutor 等。数十年的智能教学系统探索确实为促进认知和学习提供了一些有效的工具,但是与人类教师的教学智慧和教学策略相比,这些系统的 “智能性” 还有待提升(肖睿,等,2020)。近年来,大数据和学习分析技术的发展,促使研究者们对自适应学习系统的关注进入了新阶段。人工智能技术尤其是生成性人工智能技术的发展,将推动教育从以往的 “数据主义” 转向了 “智能主义”(周琴,等,2020),从自适应系统支持的自适应学习也走向了智适应系统支持的智适应学习。
智适应学习以知识空间理论、信息流理论、贝叶斯定理三大理论为基础,可深度模拟教师,帮助学生找到知识薄弱点,继而提出个性化的、智能化的学习优化路径,从而实现个性化适应性学习。Knewton 利用大数据分析技术实现了针对学习者的适应性测试,从而直接引导不同类型的学习者以 “最适合” 该学习者的路径进行学习(李玲静,等,2019)。智适应学习可以根据个体的需求、能力和目标,并结合实际学习情况和表现,动态调整向学习者提供的支持支持类型和程度(Vandewaetere,et al.,2011),同时调整学习进度和难度,从而提高学习效率和效果。同时,智适应学习可以适应不同的学习环境,包括在线学习、移动学习和社交学习等,其在学习节奏、授课方式和学习内容方面具有高度灵活性,促使学习者更容易将学习嵌入到繁忙的工作日程中,随时随地参与学习(Morze,et al.,2021)。最后,由于智适应学习更多地依赖于平台和算法,对资源和教师的需求较小,因此它比传统的课堂学习更具成本效益。智适应学习系统也可以通过提供更具互动性和身临其境的体验来提高学习者的参与度(Paramythis,et al.,2003)。因此,算法支持的智适应系统依托于生成性人工智能技术,具有更强的情境感知能力和人机交互能力。它基于多种算法模型,对学习者的学习开展精准测评、诊断和推荐,提供最符合学习者特征的个性化服务与体验,以满足学习者不同阶段与情境的学习需求。
然而,人是社会化的动物,智适应学习本质上是一种人机交互,虽然表面上看,它可以提高学习的效率,但是单一的人机交互由于缺乏集体学习氛围和学习情境中的相互比较,让学习者容易感到孤独、社会存在感低,难以坚持学习。这是xMOOCs 的辍学率较高,也是融资八轮的Knewton 最终被低价收购的重要原因。生成性人工智能的智适应虽然会带来一定的社会交互感,但其本质上仍是一种自主学习,需要学习者具有较强的自主性,否则学习效果容易适得其反。例如,研究发现ChatGPT 输出的文本过于逼真,教师无法分辨该文本来自学生还是来自ChatGPT,这可能帮助学生完成作弊;而一旦学生从中获益,很可能产生依赖感,甚至沉迷其中(Cotton,et al.,2023;王佑镁,等,2023)。智适应学习所采用的算法模型需要大量的个体数据进行训练才能达到理想的效用,如果数据不足或者数据质量不好,就会影响模型的预测准确性和可靠性(Johanes,et al.,2017)。同时,由于数据的历史性,这些系统通常依据过去的数据作判断和推荐,难以指向学习者的当下和未来。智适应学习需要使用复杂的模型来描述个体的学习能力和表现等,学生模型特征的完整性、表征的准确性直接关系学习系统能否为学生提供与之相适应的学习策略、学习内容和学习资源等,进而决定学生个性化学习能否实现(崔向平,等,2019)。这将不可避免地增加算法的复杂度和计算成本。
互联网的发展推动着教育领域相关研究从基于论坛的学习、虚拟学习社区、网络学习共同体、基于网络的社会性学习到社群化学习的发展(王志军,等,2018)。与前几类学习作为正式教育体系中的辅助性角色不同,社群化学习是一种依托于 “互联网+” 环境所具有的开放、联通、共享、共创等特性所创生出来的新的学习形式(王志军,等,2018)。它是在人机和人际的操作交互、寻径交互、意会交互和创生交互相互作用下的螺旋式的网络建构和知识创生的过程(王志军,等,2015)。社群化学习是“互联网+” 时代,学习者在自身学习需求、兴趣的驱动下,基于互联网,与有共同的兴趣、任务或价值观的人自发组织而成的群体,群体间通过互动、共享、生成等强交互活动来实现知识共享共创,联结为知识共享网络。联通主义学习理论是社群化学习的理论基础(王志军,等,2018)。社群化学习以连接建立、群体智慧共享和知识生成为核心。连接建立是社群化学习发生的必然过程,也是这类学习发生的重要结果。社群以开放、灵活且相对平等的组织模式,指向当下和学习者未来的需求以及问题解决。
社群化学习是一种个体学习和群体学习相结合的主动学习(王志军,等,2018)。社群化学习以兴趣为导向,跨越时空与专业限制,快速建立人与人,人与知识之间的关联。参与者在参与社群交互和协同问题解决过程中,会建立情感连接,形成归属感和群体动力,推动学习持续开展。因此,社群化学习的社会存在感强。杜威指出学习的过程就是自我更新的过程。深层次的社群化学习即是一个不断产生认知冲突并完成认知升级的过程,这种基于群体智慧共享的知识创新即知识生成是社群化学习的高阶目标与发展保障,也是社群化学习区别于传统教育体系中的学习的主要特征(王志军,等,2018)。基于社群化的学习环境,每一个个体都可以基于自身学习目标,与社群中的人和生成的内容展开个性化交互,以满足自身独特的学习需求和自我更新。但是,社群化学习也存在参与人员复杂、交互周期较长、生成的内容和资源质量参差不齐等问题。因此,社群化学习不仅需要学习者具有较强的信息筛选和判断能力,而且社群化学习活动的组织、管理、参与都需要学习者投入较多的时间和精力才能实现高质量、个性化学习的目标。实践表明,如果没有人工智能技术的支持,所需的学习支持服务工作量巨大。
人工智能是科学技术发展的必然趋势,越来越强的智适应人机互动是大势所趋。马克思指出:“人是最名副其实的社会动物,不仅是一种合群的动物,而且是只有在社会中才能独立的动物”(马克思,等,1972)。高度的人际互动是人之所以为人的重要方式,也是日益重要的学习形态。人工智能时代的学习是一种算法和社群双驱动,机器智能与群体智慧协同共创的学习。
首先,算法驱动的智适应学习系统的优势在于可充分发挥机器智能的优势实现个性化和自适应。它通常基于深度学习算法、协同过滤算法、社交网络算法等,通过对学习者的行为数据进行分析,识别学习者的学习方式、兴趣爱好和学习需求等个性化特征,为学习者推荐最适合的学习资源、关系和路径,提高学习效率和效果。算法模型可让学习者之间连接更加高效,将更多的时间用于社群中的深度讨论和合作。例如,可汗学院开发的Khanmigo 基于机器学习算法和深度学习算法可以提供各类学习材料的背景,并模拟各种角色,以不同的语气提供提示和建议来推动学习者的个体学习和协作学习。同时,算法可以实时监测学习者的状态与进度,提供及时反馈,智能化完成大量学习支持服务工作,节省成本;也释放了学习者有限的时间,使得他们有更多的机会回到自身学习及人机/人际互动中来。算法还能根据学习者的表现深度模拟人类教师,找到学习薄弱点,自动调整与优化学习者的学习策略和路径。更重要的是,算法在分析学习者数据优化学习的同时,学习者在社群中的讨论互动又会生成新的数据,这些数据将在人类的监督下进一步投喂算法,使得算法模型更加智能,从而实现积极的影响,产生积极的结果,积极的结果反过来强化最初的积极影响。这意味着算法生成的个性化学习路径会在学习者与社群的交互分享过程中得以持续优化,最终实现最佳学习效果。
其次,社群驱动的最大的优势在于社群成员在深度交互过程中产生的群体动力和汇聚的群体智慧。学习者不会因为仅有算法的支持而感到孤独,缺乏社会存在感,反而会在算法的帮助下,基于自身兴趣与社群成员开展深度交互,利用群体智慧来解决实际问题。基于算法的推荐和引导,也提高了学习的效果和效率。来自社群成员的相互监督、支持、鼓励和批评,会产生群体动力、激发学习积极性和自主性。值得注意的是,学习者在与教师、同伴、环境、资源的交互过程中产生的学习问题具有高度的复杂性与延展性,即使是生成式人工智能也难以对所有问题进行预设和穷尽(武法提,等,2023)。因此,学习者不仅不会因为生成式人工智能的强大而产生依赖性或失去思考动力,反而会在算法和社群的驱动下更积极、高效地思考与学习,社群也因此生成更高的群体智慧。
综上所述,为了实现人工智能与人类智慧的有效协同,需要充分发挥算法驱动和社群驱动的双重优势,本文提出算法支持的智适应社群化学习是人工智能时代在线学习的新形态。算法和社群双驱动机制如图1 所示,一方面,坚持算法驱动,充分发挥算法机器智能的优势,持续为学习者推荐资源和社群,促进学习者的个性化学习路径的制定,推进学习者与其他学习者之间建立连接,以及学习者个体和群体间的合作,最大程度实现学习的个性化和自适应。另一方面,坚持社群驱动,充分发挥学习社群天然具备的互动合作和群体动力优势,来促进群体智慧的汇聚和协作问题解决,实现社群的持续进化和发展。同时,学习者在参与社群化学习过程中会生成大量新数据,这些数据在人类的监督下进一步投喂给算法,有效促进算法的持续优化和发展。算法智能和社群智慧双向互动、相互支撑,能有效克服纯算法驱动导致的学习者孤独感强、学习动力不足的问题,以及纯社群驱动造成的信息冗余和学习支持不足的问题,实现人工智能与群体智慧的双向协同与创新,促进社群化学习的持续进化和发展。
图1 人工智能与群体智慧协同共创
爱因斯坦指出:“智能的真正标志不是知识,而是想象。” 在算法支持的智适应社群化学习中,人工智能有助于启发更多的新想法新意识,强化群体智慧的发挥。例如,可汗学院的Khanmigo 和Quizlet 中的QChat 基于启发性内容生成能力,可以生成针对性资源和素材,引导学生从不同角度对知识点进行理解,辅助提升学生的知识探究与创新能力(卢宇,等,2023)。融入了AIGC 技术的 “数字人” 具备情感智能、泛在陪伴、多模交互以及自主演化的特征(陈卫东,等,2023),也充分体现了人类智慧和人工智能协同作用产生的 “1+1>2” 的效用。但是,值得注意的是,智能并非全能,智能源于智慧,但无法取代智慧,智能需要在人的智慧支持下实现更新迭代,即在算法和社群双向驱动的过程中,依然需要把握好人的主导作用。
在算法支持的智适应社群化学习中,不同的算法发挥着不同的场景价值,代表性的算法技术如表1 所示。数据库的结构化程度极大影响着算法的智能性和有效性,知识图谱技术通过知识获取、知识表示、知识存储、知识建模、知识融合、知识理解、知识运维,将智适应社群化学习携带的海量数据结构化,使其中的信息和知识可以被利用和检索,不仅有助于强大问答系统和智能客服的形成,促进人机互动和人际互动;还能通过描述学习者的个人信息、兴趣爱好等来形成偏好信息提供给其他算法实现个性化推荐。此外,决定机器智能化程度的算法还包括机器学习算法和深度学习算法等。机器学习算法主要应用于认知模拟、规划和问题求解、数据挖掘、图像识别、故障诊断、自然语言理解等,它通过对学习者的信息进行分类和问题求解,可以实时监测学习者的状态,并提供即时反馈。它还可以结合学习者的偏好信息,分析学习者的学习风格,构建学习者画像,进而预测学习成效,为学习者提供决策支持(吴砥,等,2023)。而深度学习算法具有自动提取高纬语义的能力,可以处理机器学习算法无法处理的一些语义较为复杂的数据,其实现的识别能力做到了真正接近人类,被广泛应用于计算机视觉、自然语义处理、语音识别等。它在智适应社群化学习中的场景价值在于分析学习者在社群中的学习行为,结合学习者输入的文本、图像等数据计算学习者的成效、情感等,从而实现精准测评以及个性化资源和社群推荐。
表1 智适应社群化学习中具体算法技术的场景价值
社交网络算法和协同过滤算法同样可以分析并预测学习者的行为,与深度学习算法的不同在于,社交网络算法通过分析和处理学习者的社交网络数据,揭示各个大小社交网络的模式、特征和动态来构建学习者的社交关系网,并分析其在社交网络中的影响力来实现行为分析及社群和内容的个性化推荐。而协同过滤算法则利用采集到的学习者偏好信息构建学习者画像,与社交网络算法的分析结果相结合,实现更精准更有效的个性化推荐。
Transformer 模型作为革命性的生成式预训练模型,通过基于自注意力机制的编码器和解码器进行工作,能够高效捕捉序列数据中不同位置间的依赖关系,并处理任意长度的自然语言序列数据(卢宇,等,2023)。该模型从全局的角度考虑信息,能够结合上下文感知对话情境,避免出现局部不连贯的问题,以更符合人类语义的文本推荐合适的资源路径,能有效启发引导群体智慧,进而促进社群人际互动与合作。
在算法支持的智适应社群化学习中,算法为学习者个性化推荐资源与社群、促进其学习与合作,反之社群也会产生的大量数据并在人类的监督下投喂算法,使算法模型更加智能。实现这一场景价值的算法包括遗传基因算法、生成式对抗网络(GAN)以及基于人类反馈的强化学习技术等。遗传基因算法可以结合社群投喂的数据实现数据库中的“优胜劣汰”,并结合特征选取(不仅包括学习者特征,还包括学习材料、学习资源、网络拓扑结构的特征)优化算法模型的参数。而生成或对抗网络能够利用社群投喂的数据让生成器和判别器相互对抗来达到训练的目的,从而提高生成器生成逼真数据的能力。基于人类反馈的强化学习技术则可以将社群投喂的数据转化为奖励信号,结合强化学习算法加速智能系统的优化,从而有效提高信息的准确性和可靠性,以纠正和优化模型的行为和决策。
人工智能时代,各类算法模型正处于高速发展期,可以预见未来会有更加智能、更加高效的算法融入智适应社群化学习中来,在算法和社群双驱动作用下,机器智能与群体智慧协同共创的学习模式,必将在人工智能时代更好地满足学习者的需求。
教育正义是主体对复杂的教育根本价值合理性的追求(郝文武,2019)。从根本上说,在教育和学习中,算法是否公平或无偏见,与教育环境中可用数据质量以及使用此类工具作出决策的人的读写能力和批判性思维直接相关。因此,重视人对人工智能算法和模型的主导作用非常重要。在纳入算法和模型工具的开发和训练过程中,很容易陷入不完整的数据、算法自身的偏差、处理数据人的主观意见以及研究人员有意无意的偏见等问题中。如果使用者不加批判地使用算法模型、复杂计算和机器学习,会导致自动化不平等,触碰技术红线,并很有可能加剧原有的算法歧视与偏见,由此造成教育的不公平和不公正的问题。
为了推动算法驱动的社群化智适应社群化学习的快速发展,必须重视“人在回路”(Human in the Loop) 的概念,即重视人在人工智能算法和模型训练、应用和迭代过程中人的主导作用。一方面,正如英国上议院人工智能特别委员会指出的一样,在发展和应用人工智能过程中,必须把伦理道德置于核心位置,以确保这项技术更好地造福人类(Select Committee on Artificial Intelligence,2018)。技术提供方要保证数据的安全,不被盗用和泄漏,这也是所有人工智能应用应坚守的原则。更重要的是,如美国教育部教育技术办公室发布的《人工智能与教学的未来》报告(Office of Educational Technology,2023)中提到的一样,开发与训练算法或模型工具时,社群中的学习者和管理者、算法模型的研发者以及所有相关人员必须坚持履行人对人工智能技术、算法和数据的监督职责,基于已经确立的现代学习原则、教育从业者的智慧,利用人类的批判性思维和专业知识检查可能存在的歧视与偏见,提高公平性。
根据乌塔姆昌达尼等(Uttamchandani,et al.,2022)的研究,具体来讲,要做到以下五点:第一,要重点关注AI 工具开发和部署的环境,用于训练的数据能代表学习者最真实的情况,始终突出学习者的地位和利益以及教师和学习者的深度参与。第二,不能盲目信赖算法,要运用批判性思维理智看待算法生成的内容,以及人工智能的舆论属性和社会动员能力。第三,在优化算法的同时,应将现代化学习原则与伦理原则纳入智能系统的决策程序,使其能够在不完整和不确定的知识情境下做出正确的决策(Anderson,et al.,2007)。第四,要将公平性视为中心问题,制定专门的教育指南和防护措施,并开发独立于算法模型的工具来维护这种公平性。最后,要加强问责制,每个相关组件的正确运行都必须有人或部门对其负责,确定责任实体,提高过程的稳健性。这样才能确保算法支持的智适应社群化学习充分发挥自身独特优势,实现改善教育公平的效果。第五,也是最重要的一点,信任在人工智能及其相关产品不断更新迭代中至关重要(Zeide,2017),这也是算法支持的智适应社群化学习发挥出最大效用的关键。正如2014年美国总统行政办公室发布的大数据报告所指出的那样,“由于学习本身是一个试误的过程,因此以这种允许创新的方式使用数据尤其重要”(Executive Office of the President,2014)。所有利益相关者应该在遵守伦理道德原则、建立相互信任关系的基础上,积极拥抱、发展和推进人工智能时代的学习方式创新。