杭小羽
世界人工智能大会(WAIC)创办于2018 年,由国家发展和改革委员会、工业和信息化部、科学技术部、国家互联网信息办公室、中国科学院、中国工程院、中国科学技术协会和上海市人民政府共同主办。[1]其中,教育论坛作为世界人工智能大会的重磅论坛之一,已在此前成功举办了五届,为各界研讨和促进智能教育领域交流合作搭建了平台。
2023 年7 月8 日,世界人工智能大会教育论坛以“引领学习变革智创教育未来”为主题,在上海市世博中心以线上线下相结合的方式成功举行,参会人次超4.6 万。人工智能引领的当下,学校教育正加速向着智能化、数字化迈进。随着大数据、生成式人工智能、在线教室、微课等技术推陈出新,学校在校本课程与非正式课程的研发建设中大力聚焦现代教育技术,打造智慧教育环境,这不仅促使教师角色和学生角色的重塑,更为知识的整合、人才的培养和教学的创新带来了新生力量。与会专家围绕人工智能时代教育教学的核心问题,研讨了通用人工智能时代的教与学如何更加快速、更加科学地实现数字化转型,从而引领学习变革。
人工智能时代的课堂教学,首先需要解决的问题是教与学的知识从哪里获取。世界的知识复杂多变、永无穷尽,令人应接不暇,人们获取知识的渠道也因为科技的进步而不断丰富,这种现象在信息大爆炸时代尤为显著,因此在教与学中如何便捷有效地获取并筛选出可靠的知识是一个持续发展的课题。
人工智能技术作为教学的辅助工具之一,首先需要解决机器的知识从何而来的基础问题。传统的知识获取途径,通常源自知识工程专家系统,即使用计算机符号表示专家在大脑中产生的逻辑、规则等知识经验。大数据知识工程作为新型方法,是从大数据中通过机器学习的方式获取知识的。同济大学校长、教育部大学计算机教学指导委员会主任郑庆华在主题报告《大数据知识工程理论与应用》中指出了使用传统专家系统获取知识的不足之处,从而提出了大数据知识工程在获取知识方面的优势与可行性。
“知识工程”的概念最初由计算机科学家费根鲍姆(E.A.Feigenbaum)在1977 年第五届国际人工智能会议上提出,是指以知识本身为处理对象,研究如何构造高性能的知识系统来解决复杂问题。[2]麦肯锡全球研究所将“大数据”定义为“规模超出传统数据库软件获取、存储、管理和分析能力的数据集,该数据集的规模随着技术发展持续增长”[3]。大数据知识工程主要通过挖掘知识、融合知识、形成结构化知识体系并进行推理,最终在实际中得到应用。
相较传统专家系统,大数据知识工程的不同之处主要体现在知识表征、知识获取和知识应用这3 个方面。[4]具体来说,前者的知识表征主要基于逻辑规则,而后者基于逻辑规则和向量表示;前者通过人工构建知识的获取途径,后者则采用知识引导和数据驱动结合的推理方式;前者通过符号推理应用知识,后者则通过符号推理和神经计算相结合的方法获取知识。这3 个方面的差异也使得两者应用的场景有所不同,前者适用于因果关系严密、边界清晰的推理,而后者更多地建立于关联的基础之上,适合场景动态随机、边界位置多领域混合的问题。
当今的学习场景趋于复杂化、多元化,课堂上学生需要解决的问题也趋于动态化,大数据知识工程在帮助学生获取知识方面有着显著优势,并能在更多场景中解决一些可推理的问题。
大数据知识工程相比传统专家系统而言,能获取更多的知识并解决复杂的实际问题,因此,如何从大数据中动态地学习并将人类智慧与机器学习二者相结合,是各领域当下最迫在眉睫的挑战。为解决大数据如何转换为机器可获取、可表征的知识,郑庆华教授及其所在团队于2011 年提出“知识森林”(knowledge forest)的概念[5],试图以大数据的方式解决包括教育领域在内的各行业共性问题,其核心思想是将散、杂、乱的碎片知识通过“知识森林”的模型相融合,通过知识的推理应用到实际的工程领域,实现知识的整体化、有序化和结构化。知识森林的构建方法分为3 步:第一步,人工确定该领域知识的主题;第二步,从大数据中挖掘碎片知识装配到主题树上,形成树木;第三步,当有了主题、树枝和树根后,挖掘它们之间的语义关系,形成一个完整的知识森林。如此一来,既能见到树木,又能见到森林,也就是既能单独查看某个特定的知识点,又能宏观地浏览与该知识点相关的其他知识点,使原本复杂分散、难以归类的知识有效地结构化、系统化,优化海量学习资源的组织方式,提高教与学的效率。
目前,知识森林技术已被应用于基础教育和职业教育等领域,助推大规模在线开放课程平台的研制。除此之外,郑庆华教授及其团队研制了“知识森林3D 全息显示技术”,由联想研究院予以产品化,推出HoloTable 工具。该工具通过知识森林构建,在界面中不再呈现线性罗列的知识体系,而是通过“森林”的结构来导航学习,为教师寻找教学资源和学生自主拓展学习资源提供了便捷路径。
郑教授认为,于未来的智慧教育而言,知识森林等大数据知识工程技术将大有可为,其用途包括招生考试的数字化建设、学科大数据的建设、专业知识图谱的建设、数字化教材的建设、就业大数据的建设,以及辅助学校智慧教育决策等。
大数据、生成式人工智能等技术日趋成为师生获取学科知识的新途径,为了全面实现技术赋能教育的目标,先要培养能够研发高新技术的人才和熟练驾驭这类工具的人才。新型技术总是日新月异、不断更迭,无论是学习、生活还是娱乐,人们对接踵而来的技术应接不暇,有时人们在感叹技术自身发展时,总是忽略了“人”作为主角在技术发展中起到的无可比拟的作用。国防科技大学教授、中国科学院院士王怀民在此次论坛上做了《群体智能与智能教育》主题报告,认为人类今天所拥有的各项前瞻高新技术均是人类群体智能发展的成果,这些技术在空间中汇聚、向新人类传播,也警醒我们,技术是手段和工具,人始终是第一本位,培养人才是国家教育之根本。
回溯人类教育发展史,每一次教育技术的腾飞,均是人类群体智能的结果。从语言、文字到笔墨纸砚,再从印刷术到计算机,教育技术发展的进程更快了,效率更高了,手段更丰富了。对此,王院士提出第一个核心思想:“人类教育能力的提升,源自人类激发和汇聚人类群体智能的手段和水平的提升。”
到了20 世纪,人类步入信息化时代,英特尔(Intel)创始人之一戈登·摩尔(Gordon Moore)于1965 年提出有关集成电路发展速度的“摩尔定律”,即芯片的性能每过24 个月(后改为18 个月)提高一倍,成本降低一半。[6]该定律是当代高科技发展的重要规律,即随着高科技的发展,产品性能不断提高,低成本的数字技术驱动了包括教育资源在内的万物的数字化。随着互联网、移动互联网和物联网的进一步渗透,人、机、物广泛联结并产生交互数据,再通过云计算模式予以驱动,这些数据得以汇聚、沉淀,产生机器学习、学习模型等前沿技术。今天的我们在学习使用任何一项技术时,都应当跳出“唯技术论”的思维桎梏,发现教育技术中蕴含的人文价值,景仰人类群体共同孕育的智慧。
在诸多群体智能的产物中,ChatGPT 自诞生起就被推上了风口浪尖,在有的学校明确禁用ChatGPT 的同时,有的学者则认为ChatGPT 为教育创造了新的机会。ChatGPT 的背后,大语言模型(LLM),即利用大语言语料数据进行预训练的预训练语言模型[7],已成为最新热点。据此,王怀民院士提出第二个核心思想:“大语言模型是今天激发和汇聚群体智能的最新技术成果,是支撑智能教育的最新技术手段。”这意味着,在教育领域,未来的大模型将成为教学的助手。当教师应用模型辅助教学时,可先对模型发问,随后模型提供反馈数据,教师判断模型反馈的质量,将意见提供至研究空间,研究人员再重新调整、训练模型,提升模型质量,使下一次发问时模型的反馈更准确,于学习者而言,也能不断提升发问水平。如此一来,教师和模型之间形成“教”“用”相长的循环过程,同时可以提高人机系统的水平。
当今主流的大语言模型经过人类文明多年积淀而成,而该技术仅代表人类教育技术文明的结晶之一,也终将成为未来人类的谈资。在未来复杂变化的数字世界中,人类作为智慧的群体还会进一步研发其他智慧的结晶,但人类始终是知识的主动发起者、技术的第一创造者,始终保持着恒定的智慧。对此我们需要明确一点:技术的研发有赖于人才的培养,人才也能反向利用技术、改进技术,促使学与教互惠。
目前,我国正在开拓一条人工智能赋能教育的道路,国家层面对于教育数字化转型尤为重视,为人工智能的发展孕育了良好的土壤,创造了坚实的基础。2022 年,党的二十大首次将教育数字化写入党代会报告中[8],习近平总书记指出,推进教育数字化,建设全民终身学习的学习型社会、学习型大国。同年,教育部健全了教育信息化标准规范体系。2023 年5 月,习近平总书记在中共中央政治局第五次集体学习时强调,教育数字化是我国开辟教育发展新赛道和塑造教育发展新优势的重要突破口。
华东师范大学吴永和教授在此次论坛做了《教育通用人工智能大模型标准系列研究成果》主题报告,回顾了国家教育数字化转型的历史,更指出了人工智能作为智能教育的重要技术应当如何为教育赋能。纵观人类研究的范式发展,是由从几千年前实践研究的实证范式,到数百年前理论推演的理论范式,到近代计算机仿真的计算范式,到20 年前的数据范式再到当下智能驱动的智能范式,今天以ChatGPT 为代表的新一代AI工具对教育有深刻的影响,当这些工具运用于智能教学时,亟待解决教师如何教、学生如何学、知识如何生产传播应用、研究者如何进行学术研究、教育管理者如何进行教育现代治理等问题。
2021 年,华东师范大学吴永和教授作为首席专家,承担了国家社会科学基金2021 重大项目“面向未成年人的人工智能技术规范研究”,他站在人类命运共同体的新视角深度研究未成年人和人工智能技术的关系,从核心素养、安全伦理等层面为人工智能技术规范提供指导。
随着2022 年ChatGPT 的兴起,吴永和教授等专家对教育通用人工智能大模型进行了系统研究,发布了两项研究成果。第一项是“教育通用人工智能大模型标准体系报告研究”,该报告分析了国内外包括ChatGPT、华东师范大学EduChat、华为盘古大模型、百度文心大模型等在内的通用人工智能大模型,并给出模型的技术框架、模型特征、产品服务以及模型在教育领域运用的场景案例。第二项成果是“教育通用人工智能大模型系列标准”,该标准包括“总体框架”“信息模型”“数据规范”“测评规范”和“教学应用要求”5 项内容,于2023 年8 月8 日开始实施。[9]从宏观层面来看,实施教育数字化战略行动、健全数字教育标准体系不容迟缓,但在落地实施过程中也须规范操作,注意安全伦理等问题。
科技与教育是“器”与“道”的关系,两者互相成就、密不可分,机器的智能化不禁让人产生了过多的忧患意识。香港科技大学首席副校长、英国皇家工程院院士郭毅可在此次论坛上的主题报告以1950 年出版的两本名著(《计算机械与智能》和《人有人的用处:控制论与社会》)为序言,指出了机器与人的根本差别,强调了人的重要用处。[10]图灵在《计算机械与智能》中提出了图灵测试,即测试一个机器是否能够表现出类人的智能,让一位评判者与一台机器、一个人分别对话,如果评判者不能确定哪个是人、哪个是机器人,则说明机器通过了测试,具有智能。虽然今天的生成式人工智能已被认为超越或通过了图灵测试,然而机器在情感、道德、社会化等领域仍有着难以逾越的鸿沟。维纳在《人有人的用处:控制论与社会》中也曾指出,人和机器在心智的领域基本没有区别,因为人和机器从本质上来说都是信息载体,机器可以通过复杂性的涌现产生智能。然而,人类在传输信息的过程中还伴随着人类所特有的人文思想,人之所以有人的用处主要在于人有区别于机器的道德、人格、情感、记忆等精神活动。人类不会被机器彻底取代,在人机共存的环境下,人和机器之间如何交流、人如何控制机器是最重要的问题,也是我们解决教育技术问题的根本,因此我们要寻找到如何在教育中合理引入机器的方法,使教育与技术手段达到平衡。
生成式人工智能的到来引发人们对教育的再度思考,关于如何培养人、教师如何开展教学、学生如何学习、我们对知识如何定义等问题始终困扰着大数据时代的教育者们。
传统的学习主要是通过大脑与书本形成知识的积累,教师是其中的联结。初代人工智能应用于教育后,最初仅作为一种工具,用于教学评估、教学质量分析、知识图谱、研究学生心理状况、找寻答题错误等,这些功能相对传统。而当今的生成式人工智能使教育面临挑战,亟待解答以下问题:什么是知识?机器生产的内容是否是知识?学习的本身是什么?我们的教学又是什么?
针对第一个问题“什么是知识”,郭毅可院士表示,知识是随着人类的发展不断进化的。古希腊学者柏拉图认为,知识是一种可以解释的观点;20 世纪的美国哲学家盖蒂尔认为,知识是被证实了的真的信念。当今通过大模型训练得到的知识是一种搜索后的抽象结果,显然是未经验证的,它只是互联网信息的压缩和凝练。正如ChatGPT,能讲话,但是不能和人交流,不能对人发问和辩论,换句话说也就是机器产生的知识良莠不齐,不建议拿来就用。第二,什么是学习?当ChatGPT 和人脑的主观世界碰撞时,学习变成了一种验证,将前两者与真实世界对照,通过人工智能,ChatGPT 与人脑主观世界信息分布之间的不相似性(即互熵)达到最小,学习过程就完成了。第三,我们的教学有何变化?人工智能时代,教学逐渐从一代人的记忆变成一代人的怀疑和批判性思维,进而由传递真实的观点变为帮助建立或证明一个真实的信念,并将我们的人性注入计算机产生的信息中。
可见,人类学习与机器学习具有两极性,人类的基因由百万年进化而成,由幼儿好奇心的培养到青少年培养价值观再到系统地学习学科知识,最后步入社会;机器学习则反之,先将人类百万年进化的数据快速导入学习模型中,再通过人类反馈得到常识,人类和机器不同的学习速度和模式形成了两者的本质差别。在新时代大模型影响之下,学习的本质、学习的方法、教学的原理皆发生了巨大的变革,适应新时代的教与学是新一代师生需要思考的。
虽然有不少学者对ChatGPT 在原创能力、情感能力和自主提问等方面存在质疑,但无可否认ChatGPT 在经过规范化后赋能教学的潜能,比如在辅助教师教学时提供有益的经验,成为教师的教辅工具,提供智能化课后辅导;比如用于个性化教学;比如给予教学自动化评分和反馈,提供模型、分析预测学习情况等。积极、合理地应用ChatGPT 技术将对学生学习和教师教学发生正面的、根本性的变化。
在过去的学习中,学生经常是被动的接收者,而在ChatGPT 辅助教学过程时,学习目标始终在调整,机器起到扩充探索的作用,例如引导学生与模型对话,提升学生的反思能力和元认知。教师和学生需要铭记“人”的中心论,不断提升创造性和批判性思维,同时增强人和机器的交互。遨游在数字科技世界的当代师生,应当规范运用ChatGPT 等人工智能技术赋能教与学,用我们创造的智能机器去培养更智慧的人,并创造更智慧的智能机器,如此一来,会形成一个良性循环。
以ChatGPT 为代表的人工智能技术带来的科技变革使教育同时迎来了机遇和挑战。从教师层面出发,应躬行实践,终身学习,积极应对挑战。教育部课程教材研究所副所长陈云龙为此次论坛带来了《以实践为中心的中小学人工智能教育》的论题,由教育部课程教材研究所课程改革实验研究中心负责人魏娜汇报。
教育部课程教材研究所指出,教师首先需要充分理解开展人工智能教育的几大缘由。第一,是社会进步使之,第三次工业革命使人类进入了信息化时代,近年来的第四次工业革命以智能化为主要趋势,将数据作为社会发展的关键生产要素,被数字技术加持的各行各业融合发展,不断涌现出分享经济、移动支付等互联网新型产品。第二,新形势下我国实施了创新驱动发展、人才强国战略,迫切需要培养科技创新人才。习近平总书记于2021 年9 月在中央人才工作会议的讲话中指出,“加快建设世界重要人才中心和创新高地”。因此,我们要充分利用现有优势,为加快建设世界重要人才中心和创新高地创造更有利条件,要更重视科技人才培养,重视科学精神、创新精神、批判性思维的培养教育。习近平总书记的讲话强调了我国在新形势下实施创新驱动发展和人才强国战略的重要性,以及培养科技创新人才的紧迫性。对于教师而言,在教学中合理运用人工智能技术,在一定程度上可以为国家培养出高素质科技人才。第三,数字时代各行业的人才需求发生了变化,在未来的数字化生活空间中,人才需要具备数字素养。2019 年经济合作与发展组织(Organization for Economic Co-Operation and Development,OECD)发布《OECD 学习罗盘2030》(OECDLearning Compass2030),将数字素养(digital literacy)和数据素养(data literacy)列为学生2030 年需要具备的核心基础。[11]我国新修订的课程标准,也将人工智能融入中小学信息技术教育。教师应当先行一步,引领学生进入人工智能的学习领域。
其次,需要对一线教师进行大量的实践创新训练,培养教师的数字素养。2022 年5 月,教育部课程教材研究所与上海人工智能实验室合作开发了中小学人工智能教育实践研究项目,面向23 个基础教育课程改革实验区,对700 多名教师开展培训教研活动。该项目设计了一款人工智能模型,通过“问题分析”“方案设计”“事实验证”“优化迭代”等步骤,帮助教师完成了大单元教学难题,根据选定主题或实际问题进行了大单元任务设计。
面对人工智能的挑战,中小学各学科教师应积极响应,主动将教育技术融入传统课堂教学;利用人工智能挖掘课外教辅资源;利用大数据技术优化评价机制,预测学生成绩,实施个性化教学。
上海人工智能实验室智能教育中心主任戴娟在此次论坛上做了《人机共智时代的AI 教育》的分享,介绍了团队发明的产品“浦育小世界”虚拟空间。研究者在设计时融合了让·皮亚杰的认知发展理论、马文·明斯基的Framing 知识表达和无限构建工具等理论,提出了HEIM 学习范式理论。学生通过假设、试验、创新和记忆4 个步骤,可以在虚拟空间内假设问题、解决问题、实现创新。
该项目在虚拟空间环境中提供了丰富的UI界面,设计了弹簧案例、传送带摩擦力案例、小车通过崎岖道路案例等物理实验,供学生体验尝试,甚至让学生亲身参与基于物体的具象编程,享受适当的失控感和挫败感带来的经验价值。这有助于学生在非正式学习环境下,效仿科学家、工程师的学习模式,运用发散思维,突破边界,不断创新,优化学习策略,增强学生的社会竞争力。
近年来,我国为建设教育强国持续注入了强劲力量。在当下,充分实现教育数字化转型是我国开辟教育发展新赛道和塑造教育发展新优势的重要突破口。人工智能作为一门持续发展的新兴科学与技术,为教育带来了较大的革新,渗透在教学工具、教育理论、教学方法的方方面面。人才的培养决定了人工智能所能达到的高度,同时,人工智能对教育的支持能更好地优化教育的质量,符合新时代的特性。因此对于教师而言,他们需要以身作则,提升数字素养意识,熟练掌握新型技术,充分利用数字化教学平台,培养数字时代跨学科人才与终身学习先进理念。
技术是不断变革的,不变的只是教育的本体。人工智能时代下,教师如何教、学生如何学、知识如何传递是持续关注的热点。我们既需应对瞬息万变的技术,又需秉持初衷,这或许是新一代师生应对人工智能技术及其持续效应的良好策略。相信在未来,当我们把握好科技与教育、“器”与“道”的最佳平衡点,那么技术一定会为教育赋予更大的可能性。