万力勇 杜静 熊若欣
2022年是AIGC(Artificial Intelligence Generated Content)火爆出圈的一年,其标志性事件是OpenAI 发布大语言模型应用ChatGPT(蔡子凡等,2023)。ChatGPT除了具有交互式问答的优势外,还可以实现代码生成、论文写作、诗词创作、新闻写作、音乐创作等多场景任务。全球各大科技企业都积极拥抱AIGC,不断推出相关技术、平台和应用,如谷歌的Bard、百度的文心一言、阿里的通义千问等。当前,AIGC 已率先在传媒、电商、影视、娱乐等行业得到创新性应用,其在教育领域的应用前景也倍受学界和业界关注。教育领域中与AIGC 应用最为契合的当属数字化教育资源建设与开发。AIGC 作为人工智能时代内容创作的变革性工具之一,为解决数字化教育资源开发中的瓶颈问题提供了新的思路和解决方案。在AIGC 场景下,人机共创将成为数字化教育资源开发的新方向。本研究试图对基于AIGC的数字化教育资源人机共创的可能性和必然性进行分析,对基于AIGC的数字化教育资源人机共创范式内核、人机共创框架及流程进行阐释,以期为数字化教育资源开发者和相关研究者提供借鉴和参考。
我国数字化教育资源开发在演进历程上,按开发主体的不同,可分为政府开发模式、市场开发模式、公益开发模式和自主开发模式四种。政府开发模式是指由政府部门主导并推动的开发,所开发的资源依托国家级、省级、市县级等各级资源平台,形成了较为完整的数字化教育资源供给网络。市场开发模式是指以市场机制为推动,依靠企业、出版社等多方力量开发数字化教育资源的方式(柯清超等,2018)。公益开发模式是由社会性非营利组织或个人开发资源,旨在扩大优质资源受益面。而自主开发模式则是指各级各类学校根据自身特点自主开发校本化、地方性教育资源的一种方式。
开发与共享是资源建设过程中相辅相成的两个环节,其往往能形成联动效应。按共享模式的不同,我国数字化教育资源开发主要经历了共建共享、公建共享、共创共享三个发展阶段。共建共享是指借助现代信息技术,在一定范围内共同开发资源,基于资源共享平台以免费或适当收费的方式供师生使用(钱冬明等,2013)。公建共享强调由政府承担顶层规划、资金投入和统筹协调的主体责任,统整各方数字资源建设主体,最终形成集资源生成、管理服务、推送配置和使用反馈等于一体的数字化教育资源建设机制(赵晓声,2015)。共创共享则强调以多方资源开发主体协同共创为理念,以满足师生个性化资源需求为导向,借助数字化教育资源共创平台,开展数字化教育资源的协作开发、实时发布、迭代优化和高效共享(王晓晨等,2016)。
若按资源内容生成模式的不同,数字化教育资源在演进上又可分为专业生成内容、用户生成内容、AI辅助生成内容和AI生成内容四个阶段。专业生成内容(Professional Generated Content,PGC)是由专业个人或团队有针对性地开发具有权威性的、制作精良的教育资源。用户生成内容(User Generated Content,UGC)泛指用户将自己原创的内容通过互联网平台进行展示,是Web 2.0环境下的一种个性化内容创作与组织模式(万力勇等,2014)。AI 辅助生成内容是指互联网用户或专业团队在AI 的协助下生成内容。AI 生成内容亦即AIGC,是AI 辅助生成内容在技术上的进一步发展,其终极目标是AI 脱离人的辅助直接自动、自主生成内容,从而大幅提升内容生成效率。不过,AIGC 在数字化教育资源开发领域的应用尚处在理论探讨层面,目前尚无相关实践案例。
通过对我国数字化教育资源开发的演进历程进行梳理,可以发现,我国数字化教育资源开发历经多年发展,在资源开发模式上已较为成熟,整体呈现出多方开发主体协同、多类用户参与、多种共享模式共存的资源开发特色。但现有资源开发模式仍存在一定的瓶颈,首先是资源体量还不够大,资源类型还不够丰富,无法完全满足数字化时代师生对资源的多样化和海量化需求。其次是资源开发效率有待提高,目前的资源开发主要以人工开发为主,需要耗费大量的人力、物力和时间。再次是资源质量难以完全得到保证,尤其是在多用户共创共享、用户生成内容等资源开发模式下,更容易出现资源质量参差不齐等问题,资源开发方需投入大量的成本进行资源质量监控和内容审核。
随着AI 在新闻写作、剧情续写、视频剪辑、语音生成等领域的广泛应用,资源开发者与AI 进行人机共创,将成为数字化教育资源开发领域新的发展趋势,有望解决当前数字化教育资源开发中体量、效率和质量等方面存在的问题。在人机共创模式下,一方面,AI 内容生产将推进数字化教育资源的批量化、海量化和高效化开发;另一方面,资源开发者可以从传统资源开发工作中解放出来,扮演资源质量把关者、资源开发协同者、资源内容共创者等角色,不断激发自身创造力,使资源开发过程更具科学性、协同性和创意性。
AIGC 的发展源于算法、数据和算力的综合提升,相较于PGC与UGC而言,AIGC运用大量基础算法模型,突破内容生成类型与效率上的限制,使得内容生成走向自动化和智能化。
在算法层面,AIGC 算法模型不断获得突破。Transformer 模型、Diffusion模型等基于深度学习算法的模型相继出现,并被运用于自然语言处理领域。2023年3月发布的GPT-4,其模型具备强大的识别能力,允许用户指定视觉或语言任务,并具备长内容创建、扩展会话、文档搜索和分析等功能。在数据层面,当下的Web3.0 数据资源同时具有海量化、智慧化、多模态、自组织等多重属性,为AIGC 的持续发展提供了强有力的数据“原料”保障。在算力层面,以ChatGPT为例,AI算力是其模型训练与产品运营的核心基础设施,从GPT 大模型的三次历史迭代可知,OpenAI 的GPT、GPT-2和GPT-3 的参数量从1.17 亿增加到1750 亿,这表明AI 的算力不再是传统算力,而是“智能算力”,即以多维度的“向量”集合作为算力的基本单位(朱嘉明,2023)。
相较于PGC和UGC而言,AIGC在内容生成方面具有天然优势:第一,自动化内容创作与生成。预训练模型技术大幅提升了AIGC 模型的通用化能力和工业化水平,同一个AIGC 模型可以高质量地完成多样化的内容输出任务(胡晓萌,2023),实现内容生产与服务的自动化。第二,多模态信息融合与交互。多模态融合是指将多种感官进行融合,而多模态交互是指人通过多种通道与计算机进行交流(袁鸣等,2023)。随着算法模型的持续迭代升级,AIGC 技术正朝向多模态信息融合、跨模态内容生成、智能化场景落地快速发展,多模态信息融合与交互正成为AIGC区别于传统UGC和PGC的显著技术特征。第三,具备认知交互能力。输入输出是人与机器交互的底层逻辑,传统技术环境下,人与机器的交互主要通过键鼠、触控等方式来实现(李白杨等,2023)。而AIGC 的出现则为人与机器的沟通带来更为多样化和便捷化的交互方式,通过文本对话交互、语音交互等方式可模拟人类对话过程,使机器交互能力上升到类人化层面,从而使其在交互感知和交互手段上更具先进性。
基于AIGC 的内容生成特点及技术优势,其与数字化教育资源人机共创具有极高的契合性,具体体现在如下三个方面:
第一,AIGC 已具备与人类进行资源共创的潜力。AIGC 发展到现在已具有极强的内容生成能力,这种生成能力使其可以在资源内容创作中大展拳脚。AIGC 能够以优于人类的信息生成能力和知识水平承担信息挖掘、素材调用、复刻编辑等基础性工作,从技术层面实现以低边际成本、高效率的方式满足海量数字化教育资源的生成需求。同时AIGC 能够创新内容生产的流程和范式,推动教育资源开发向更有创造力的方向发展。其在内容生产领域即将实现三大技术突破:一是智能数字内容孪生,即建立现实世界到数字世界的映射,在将现实世界中的物理属性和社会属性进行数字化的同时,对现实世界中的内容进行智能增强与智能转译,以实现现实世界内容到数字世界内容的高质量映射。二是智能数字内容编辑,即通过数字内容的语义理解和属性控制两类技术来实现对内容的修改和控制,同时利用数字世界高效率仿真和低成本试错的优势,为现实世界内容生成提供快速迭代。三是智能数字内容创作,其主要目标是让人工智能算法具备内容创作和自我演化的能力,实现从基于模仿的内容生成向基于概念的内容生成转变(中国信息通信研究院,2022)。这三大技术突破均会对数字化教育资源内容及形式的创新产生显著推动作用。随着大模型相关技术的发展,AIGC 在创造性内容生成方面已表现出一定的潜力。以ChatGPT为例,它作为“通用语言模型”的表现已经超过了专用语言模型,能够适应不同的任务情境,根据任务情境生成个性化内容(邓建国,2023)。此外,ChatGPT 除了能完成传统的模式化内容生成外,还可以模拟人类的创作过程,创造小说、诗歌、戏剧、计算机代码,进而实现更加高效的创作方式和更加多样化的内容生成。
第二,AIGC 本质上是人机互动生成的过程。目前AIGC 尚不具备完全自发自主生成内容的能力,其内容生成主要以人类的输入为前提,根据人类的输入请求生成并输出个性化内容。以ChatGPT为例,其通过自然语言理解来与人类用户对话,通过考虑上下文信息、语义理解来生成人类所需的内容。因此,提问措辞要具体精确和具有创造性(邓建国,2023),避免使用模糊的术语和含糊的语言,以及避免使用过于主观、带有偏见或结构过于复杂的问题。这表明能否向AI提出一个好的问题,能否与AI进行高质量的互动,是确保AIGC生成高质量资源内容的前提所在。这也从一个侧面证实,AIGC本质上是人机互动生成的过程,人机共创理念也顺应了这一内容生成机制的发展。
第三,AIGC生成高质量资源离不开人的审核把关。尽管AIGC使用了先进和高精度的自然语言处理技术,具备达到人类创作水平的潜能,但目前在内容深度、广度和整体质量方面仍存在不足,甚至还有可能包含语言冗余和事实方面的错误。OpenAI曾公开表示,ChatGPT有时会写出看似合理但不正确或荒谬的答案,其原因可能是在强化学习训练期间,没有获得真实的信息来源;训练模型的谨慎导致它拒绝回答本来可以正确回答的问题;监督训练可能会误导模型,因为理想的答案取决于模型知道什么,而不是人类知道什么等(OpenAI,2022)。因此,AIGC要生成高质量的数字化教育资源,离不开人类对资源内容的质量审核与把关。以ChatGPT 为例,人类可以对其生成的内容进行整合、重组、驳斥、修改和润色等,最终使这些内容达到高质量水平(邓建国,2023)。相关报道指出,从试用ChatGPT的结果来看,它已具备了一定的创作能力,但与专业人员的写作水平仍存在一定差距,如果得到人类作者的修改和编辑,将可能达到专业化水平。比如,2022年,英矽智能创始人兼首席执行官Zhavoronkov博士在学术期刊Oncoscience 上发表了一篇文章,将ChatGPT列为共同作者,原因是该文章中的大部分内容由ChatGPT生成,Zhavoronkov重点对ChatGPT生成的观点进行了审核与把关。
人机共创即人与机器以协同合作的方式共同创作内容,人机各自承担相应的创作任务。人机共创的理念基础是人机协同,人机共创的理想和终极状态是人机共生。
简言之,人机协同就是人与机器相互协作,二者取长补短,共同认识、共同感知、共同思考、共同决策、共同工作、互相理解、互相制约和监护(毛刚等,2021)。人机协同不是人类智能和机器智能的简单相加,而是一种人机融合的智慧,其目的是让机器智能成为人类智能的拓展和延伸(高琼等,2021)。在价值论层面,人机协同系统可替代人类的部分工作,将人类解放出来,让人类有精力投入其他更富有创造性的工作(方海光等,2022)。在伦理层面,人机协同是对人与技术和谐统一和平衡状态关系的表述,体现了工具理性与价值理性的统一(杜娟,2019)。随着人工智能技术的发展,人机协同中的“机”已经超越了计算机等一般机器的范畴,而且机器在与人的互动中不断提升其智能化水平,人机协同正在向人机共生的高级形态发展(毛刚等,2021)。
人机共生这一理念源于生物学领域中的共生理论。共生理论认为,共生是不同种属的生物按某种物质联系共同生活,按其共生行为方式可划分为偏利共生、偏害共生、互利共生等类型(张学军等,2020)。共生现象不只存在于生物界,同样也存在于社会、经济、政治、教育等领域。人工智能领域的“人机共生”是一种对人类和机器之间合作互动的理想化预期,即通过人与机器之间的和平共处和合作耦合,实现人与机器的和谐相处、共同进化(王一岩等,2022)。人机共生同样强调人机之间的双向“互利”,即利用人类智能和机器智能之间的互补性,将二者结合起来实现共创价值最大化(于雪等,2022)。
原则一:人与机器互促。在人机共创过程中,机器的优势体现在内容生成的速度、效率和体量上,能为内容创作快速提供适切的内容和信息;人的优势体现在创作者能合理把握内容创作的方向、构思的深度、内容的结构与形成过程,并且具有个性化创意能力。人与机器互促体现为二者充分发挥各自优势促进内容的创作与生成。机器所生成的内容可作为内容创作者创作时的参考,内容创作者充分发挥运筹、构思和创意能力,对机器生成的内容进行优化重组。与此同时,机器也能以人的创作过程为基础不断对其算法模型进行训练、迭代和优化,不断向人类学习,提升其内容创作能力。
原则二:人与机器互信。信任是人机合作的前提。在某些规则清晰、明确且可以良好定义的领域,将工作交给机器去做可能比交给人类做更放心(何文涛等,2023)。同时,人机互信是人机协同发展的重要基础。诸多实践已然证明,人类和智能机器可以共同完成彼此无法独自完成的复杂任务,智能机器是人类的学习伙伴,而不是工具媒介。因此,实现人机共创的前提是人与机器要加强互动和合作,人机之间要保持充分的信任关系,达到人和机器各司其职、彼此协同、深度合作。
原则三:人与机器互补。在人机共创过程中,智能机器和人类要融合各自的长处,弥补彼此的弱点,增强彼此生成内容的能力。当前,机器在算法和模型上存在的“天生”弱点导致其在互联网上生成信息的质量参差不齐(何文涛等,2023),此时便需充分发挥人的批判性思维和信息鉴别能力,对这些信息进行判断、过滤和筛选,以保证机器生成内容的质量。同时,机器快速处理和生成信息的能力也可以帮助人类提高工作效率。因此,人机共创必须遵循人与机器优势互补的原则,扬长避短,提升人机共创内容的质量和效率。
第一,基于AIGC 的数字化教育资源人机共创是系统化的人机协同过程,其旨在融合人的智慧和机器的智能以形成超越人机各自智能的新型资源开发形式。资源开发者与AIGC 协同合作所产生的整体效能由人机各自发挥的效能和二者相互作用产生的协同效能之和组成,产生“1+1>2”的效应。在此过程中,AIGC 作为技术人造物,与资源开发者共同形成了数字化教育资源建设中人机“双主体”格局(方海光等,2022):一方面,资源开发者与AIGC 可以协同合作的姿态实现技术的具身与应用,并以人机融合的方式开展资源内容创作;另一方面,人机共创可使资源开发的专业化与智能化充分融合,进而使人机协同向智慧化阶段跃迁。
第二,基于AIGC 的数字化教育资源人机共创是人机互动生成的过程。在人机共创过程中,人机互动是人机之间开展信息交换和认知碰撞的有效途径,也是人机共创的基础和前提。它强调以用户需求为牵引,以人机对话为手段,能有效触发资源内容的生成、转化、流动和演化。如前文所述,AIGC 本质上是AI 与人互动生成的过程。在AIGC场景中,人机互动形式正在由文本互动向多模态互动发展,更有助于提高人机互动的效率、准确性和用户满意度。在全新的人机互动模式下,人机共创的内容可在资源开发者与AIGC之间充分共享,并以内化方式纳入资源开发者的原有知识体系,促进其知识结构的更新;同时生成的内容也会在资源开发者的审核与修订过程中不断得以迭代优化,以确保生成资源的质量。
第三,基于AIGC 的数字化教育资源人机共创是人机互利共生的过程。互利共生是生态系统中最重要的种间关系,强调两个物种间互相依赖、双方获利。在数字化教育资源人机共创过程中,AIGC擅长极速处理海量数据并快速生成满足用户需求的内容;而资源开发者擅长灵活地适应各种不断变化的环境,并具备常识、创造力和共情能力。人与机器之间的差异性和互补性,为人机互利共生创造了前提。不同于AIGC出现之前人机之间松散的“工具型”关系,互利共生模式下的人机共创将人类和智能机器视为共同解决任务的“伙伴”和“共同体”,通过人和机器之间对等的智能感知和交互决策,既凸显出人的能动性,又强调机器的智能性和自主性(于雪等,2022)。如此不仅可以提升资源开发者的专业能力和创意能力,增强其进行实践创新的智慧,同时也可以提升AIGC的自主进化和演进迭代能力,从而达到二者的互利共生。
(1)互动生成机制
AIGC 的内容生成离不开AI 与人的有效互动,且互动方式正日益多样化。而且当前多数AIGC已具备连续多轮互动对话的能力。在该技术的支持下,AIGC 能够根据资源开发者输入的问题或关键词提供更准确、更贴合语境的资源素材。多轮对话有助于解决传统智能问答系统只能进行僵硬的“一问一答”式对话、无法存留“记忆”等问题(张洪忠等,2023)。在数字化教育资源生成过程中,多轮对话对提升资源内容的准确性和科学性具有不言而喻的促进作用。资源开发者可以通过多轮对话,从细节完善角度不断对AI 所生成的资源素材提出修改意见,使其不断迭代优化并最终达到专业人员生成资源的质量水平。但当前AIGC在提供资源内容的同时并不能提供信息来源,因而用户很难对信息进行溯源或追问。这无形会阻断用户与AI 进行更深入互动的可能,尤其在内容生成过程中,AI 看似条分缕析的回答可能会限制用户思维的发散,压缩用户的认知空间(张洪忠等,2023)。
因此,要提高人机共创数字化教育资源内容的质量和创新性,需要资源开发者掌握人机互动话语的内在规律,提升资源开发者的问题意识和提问能力。同时,在人机共创过程中,为了避免资源开发者对AIGC的过度依赖,还应高度重视并充分彰显资源开发者的想象力、洞察力、判断力、思辨能力、共情能力、合作能力、创新能力在人机共创中的独特作用。
(2)深度加工机制
精细化和个性化是数字化教育资源深度加工的两个重要特征。精细化包括资源素材的精细化和资源聚合的精细化。在资源素材的精细化方面,AIGC 已具备多模态生成、情感生成、增量生成、可解释生成和对抗生成等丰富多样的素材生成能力,能够帮助资源开发者生成精细化和个性化的数字化教育资源。在资源聚合的精细化方面,AIGC能实现基于多媒体信息的智能组合、同主题信息的自动整合等,从而帮助资源开发者快速生成聚合化的数字化教育资源包。
数字化教育资源内容的创作,既需要满足学习者的个性化学习需求,也需要体现资源开发者的创作风格。这种独具风格化与个性化的资源内容也是资源开发者竞争优势的体现(彭兰,2020)。由于AI创作本质上是遵循相对固化和模式化的算法逻辑,在内容结构、知识表征、底层逻辑等方面难以做到完全个性化和风格化,因此,在人机共创模式下,要彰显数字化教育资源的个性化和风格化,可以从如下方面进行探索:首先,资源开发者要坚持专业视角的判断与个性化表达,提高数字化教育资源的表现水平与知识价值;其次,资源开发者要与AI进行深度互动,对资源属性和需求进行个性化描述,使AI能更好地理解这些个性化的描述,从而生成更具风格化的资源;再次,可以探索将AIGC与UGC这两种内容生成模式进行有效整合,让资源使用者也参与到基于AIGC的资源创作中,使资源生成与用户需求直接对接,进而满足用户对资源的个性化需求。
(3)协同互补机制
协同互补是基于AIGC 的数字化教育资源人机共创的关键机制,具体体现在以下三个方面:
第一,AI 的客观呈现与人的主观描述互补。人类智能形成的学科知识是有机的、能动的、自主的,而AI 作为类人主体,是对人类智能的模拟,其最缺乏的是对于现实物理世界的感知能力,它很难真正意义上学到人类所感知和理解的知识,知识对于AI 来说只是一堆代码和符号而已(陈昌凤等,2023)。AIGC 以互联网上的数据集为知识来源,其对知识的描述基本是中性的,很少带有主观性和倾向性。但人类有能力理解复杂和抽象的概念,能在看似无关的语句之间建立联系并进行自主建构和主观描述。因此,在人机共创过程中,AI 的特长在于基于海量数据对某一知识进行相对客观的呈现,而资源开发者擅长从知识阐释视角对其进行主观描述,二者的互补有助于实现资源外在呈现方式与内在属性描述的统一。
第二,AI的信息加工与人的观点阐释互补。在信息处理方面,AI无疑具有显著优势,无论是信息采集的维度与广度,还是信息加工的速度与效率,人类都无法企及(彭兰,2020)。在数字化教育资源开发过程中,资源开发者需要充分挖掘AIGC批量化内容生产和信息加工能力。但从学习者对数字化教育资源的需求特点来看,其真正所需要的,除了规模化的知识内容外,对这些知识内容的概括、解释、提炼与分析可能更为重要。虽然AI也具备一定的规律阐释和总结能力,但仍无法与人类相提并论。因此,人类在观点阐释和提炼方面较之AI具有优势,这种优势可以与AI 的信息加工优势形成互补,从而实现资源信息加工与观点阐释的统一。
第三,AI的知识生成与人的意义建构互补。数字化教育资源开发不仅仅是生成知识内容,还需要深度挖掘知识的价值和内涵。从知识管理的角度来看,知识可分为显性知识和隐性知识两类。显性知识是客观有形的,能够以一定的信息化形式进行表达或编码;隐性知识是一种高度个人化的知识,难以规范化,包括个体的思维模式、价值观等。AI所生成的知识以显性知识为主,随着AIGC 的发展,其在某种程度上也可生成部分隐性知识。而人类的学习不但能建立起一套隐性知识体系,还能建立起隐性知识之间不确定的秩序或规则,即进行意义建构。意义建构是基于人的视角及学习目标对知识的应用,是将知识转化为生产力与创造力的过程(彭兰,2020)。因此,要实现数字化教育资源开发过程中显性知识与隐性知识的有机融合,可以将AI的知识生成与资源开发者的主观意义建构进行互补。
(4)质量监控机制
AIGC所生成的内容存在一定的质量风险,包括内生风险和外在风险。内生风险主要是指与算法有关的风险,比如不可解释风险和不可问责风险;外在风险主要指与数据有关的风险,如个人隐私风险或数据被误用与滥用的风险等。以ChatGPT 为例,其训练数据主要来自互联网,而互联网上的信息包罗万象,质量参差不齐。ChatGPT所使用的语言模型是在大量文本数据上训练获得的,其很难准确区分数据集中的事实性信息和虚构类信息,生成的部分资源也有可能是以虚假信息为基础,最终导致资源在科学性与正确性方面出现偏差。
如前文所述,AIGC 内容生成机制中存在数据和算法两大关键技术。因此,基于AIGC的数字化教育资源质量监控也应兼顾这两大关键技术。首先在数据方面,对海量数据的治理是确保资源质量的重要前提,加强对数据真实性、标准化、分类与管理等方面的治理(钟祥铭等,2023)。其次在算法方面,对算法模型的治理是确保资源质量的关键因素,要加强对算法的评估、优化、安全和可解释性的治理。
在具体操作方面,应采取资源开发团队专业把关、AI 技术甄别审核、资源使用者评估反馈相结合的人机协同质量监控机制。其中,资源开发团队对资源质量的审核包括学科专家审核和技术人员审核。学科专家主要对资源内容的相关属性(如准确性、完整性等)进行审核,技术人员主要从生成技术角度对资源进行语言流畅度评估、情感倾向分析、对话质量评估、主题分类评估、语义相似度评估等。伴随AI 内容检测工具的不断涌现(如GPTZero、Sapling等),AI审核已经成为AIGC内容核查与质量监控的重要辅助手段,不仅可以审核和识别不当、有害或虚假性内容,还可以实现信息来源分析、信息模式识别、生成技术鉴定、信息演变跟踪等质量监控(彭兰,2020)。同时,资源开发团队还可以与AI 协同开展质量监控,最典型的监控方式是交叉验证,即人与AI 对可能有质量问题的某一资源进行交叉核实和验证,最后由资源开发者结合交叉验证结果得出审核结论。除了资源开发团队外,资源使用者在使用过程中也可以对资源质量进行评估和反馈,其评估和反馈结果也可作为资源质量判定和改进的重要参考。
本研究以人机协同和人机共生理念为基础,遵循人机互促、人机互信、人机互补三原则,将基于AIGC 的数字化教育资源人机共创物理空间、信息空间与社交空间相融合,进而构建起人机共创三元空间(方海光等,2022):在物理空间,资源开发者与AIGC 发挥各自优势,协同完成资源开发目标;在信息空间,AIGC 所具有的智能与资源开发者的智慧和创意彼此互补,有助于人们通过算法程序将其认知进行外显表征;在社交空间,资源开发者与AIGC 之间进行广泛互动,触发内容创生。在人机共创三元空间中,通过嵌入前文所述的互动生成、深度加工、协同互补、质量监控四种共创机制,即可形成基于AIGC的数字化教育资源人机共创框架(如图1所示)。在该框架中,互动生成机制与社交空间形成对应关系;深度加工机制与信息空间形成对应关系;质量监控机制与物理空间形成对应关系;协同互补机制同时对应物理空间和信息空间。四种人机共创机制均能清晰划分出资源开发者与AIGC 的创作职责范围,比如在深度加工机制中,资源开发者的职责是实现资源的个性化,而AIGC的职责是实现资源的精细化;又如在协同互补机制中,资源开发者主要负责对知识的主观描述、观点阐释和意义建构,而AIGC则主要负责对知识的客观呈现、信息加工和知识生成。
图1 基于AIGC的数字化教育资源人机共创框架
基于AIGC 的数字化教育资源人机共创在流程上由确定需求、素材生成、素材审核、重组聚合、分发应用、反馈优化6个环节构成(如图2所示)。
图2 基于AIGC的数字化教育资源人机共创流程
确定需求是数字化教育资源开发的起始环节,资源开发者在充分调研的基础上,精准确定师生对资源内容、类型、表征形式、结构、体量、质量、服务平台的相关需求。
素材生成是指以师生需求为导向,资源开发者将资源需求转化为精确的互动话语,与AI 通过互动输入的方式生成多模态的数字化教育资源素材,包括文本、图像、音频、视频、动画、虚拟人等,生成方式有文本生成、音频生成、图像生成、视频生成、跨模态生成、虚拟人生成等。其中,文本生成可提供结构化文本、非结构化文本以及交互式文本的生成。音频生成包括语音克隆、由文本生成播报语音、自动生成背景音乐等。图像生成可提供自动图像生成、个性化画作生成等。视频生成可提供视频属性编辑、自动视频剪辑合成等。跨模态生成是指基于模态之间的语义一致性,实现不同模态内容在表现形式上的相互转换,包括文字生成图片、文字生成视频、图像生成视频、图像生成文字、视频生成文字等。虚拟人生成主要是指生成虚拟教师形象或虚拟学伴形象。整体上,资源素材的生成是一个迭代式互动生成的过程,即通过互动话语的不断迭代,由AI生成符合要求的资源素材。
素材审核是指资源开发者与AI 通过人机协同方式对生成的资源素材进行形式和内容方面的监测与评价,目的是通过二者的协同筛查,剔除部分不符合质量要求的资源素材。素材审核的重点包括内容安全审核、内容校对/勘误、低质量识别、虚假信息检测、交叉验证、演变跟踪等。资源开发者审核的重点包括资源内容的准确性、完整性、教育性、知识性和相关性等。其中,准确性是指素材客观反映知识内容的属性,完整性是指素材内容的广度和深度,教育性是指素材内容是否与特定的教学目标一致,知识性是指素材内容是否包含学科知识,相关性是指素材内容与学习者需求的匹配程度(万力勇,2013)。AI 审核的重点包括素材来源的真实性、可靠性、互操作性和规范性等。其中,真实性是指素材来源真实可信,可靠性是指素材本身的稳定性和安全性,互操作性是指素材能够在多个系统或平台中运行或互访,规范性是指素材符合数字化教育资源的开发标准。
重组聚合是指资源开发者和AI 共同完成资源素材的重组与聚合,将已有的人工生成素材和人机共创素材汇集在一起,实现对资源素材的集成和包装,使其形成一个功能齐全、结构完整的有机整体。重组聚合具体包括素材编目、素材标签提取、素材重组、创意聚合、生成知识图谱等。在此过程中,AI 主要负责固定范式的资源素材合成与生产,比如将文本和图像按知识层级结构合成为图文并茂的PPT 课件;而资源开发者负责从创新资源表征形式、呈现手段、呈现时序等方面完成对资源的创意化合成与生产,比如将虚拟教师嵌入教学视频中,形成声画同步的虚拟教师讲授视频等。聚合完成的数字化教育资源包括音视频学习资源、数字化教育资源包、全媒体数字教材、在线课程等多种形式。
分发应用是指将生成的数字化教育资源根据师生的个性化需求进行分发使用。此阶段的操作包括对师生用户进行画像,对资源进行智能检索、智能推荐和按需定制,最终实现对资源的精准分发。
反馈优化是人机共创资源的最后一个环节。在该阶段,通过对师生资源使用行为数据进行分析,再结合师生使用数字教育资源后的评论反馈及使用效果,进一步挖掘出数字化教育资源存在的问题及不足并反馈给资源开发者,使其再次确认资源需求并对资源开发的相关环节进行优化和完善,进而形成人机共创资源迭代优化的闭环结构,促进资源开发效率和质量的不断提升。
AIGC作为AI在内容生成领域的最新技术,在教育教学中的应用已初见端倪。在教育领域中,基于AIGC的数字化教育资源人机共创有望成为数字化教育资源开发的新范式,并将大大提升数字化教育资源开发的效率、体量和质量。但任何新兴技术都是一把双刃剑,AIGC也不例外。AIGC在数字化教育资源人机共创中的应用可能会引发诸如内容版权、伦理与安全、算法歧视与偏见等风险。
在内容版权方面,AIGC 本质上属于机器学习的应用,在模型的学习和训练过程中不可避免会使用大量的数据集,目前行业内部对于训练后生成内容的版权归属问题存在很大争议。一种观点认为产出的内容由素材库训练生成,其本质上来自素材库,因而需要向相关素材作者支付版权费;另一种观点则认为AIGC生成内容的过程是一个完全随机的过程,不涉及版权问题(杜雨等,2023)。到底哪种观点更合理目前尚无定论。尤其是在数字化教育资源人机共创过程中,资源创作的主体既包括资源开发者又包括AI,共创生成资源的版权到底应该归属于资源开发者还是AIGC平台,还是由二者共同拥有版权?谁以及如何对共创生成资源的版权进行保护?这些都是需要我们进一步思考的问题。
在伦理与安全方面,随着AIGC 的不断成熟,AI 已经能够通过分析事先收集的大量训练数据,制造出以假乱真的音视频。这项技术不仅可以用于篡改视频,还可以用于制造完全虚构的视频内容(杜雨等,2023)。由于契合人们“眼见为实”的认知共性,这项技术的滥用将使资源开发者和学习者难以甄别真实和虚假信息。虽然AI 内容检测工具可以检测出部分虚假内容,但伴随相关算法模型的不断升级,AIGC 生成的内容逃避检测的能力也将越来越强。与一般的数字化资源不同的是,数字化教育资源必须严格具备科学性、准确性、真实性、权威性、规范性等属性,虚假信息、伪造信息的掺入将使共创生成的数字化教育资源面临不可预知的质量风险和误用风险。
在算法歧视与偏见方面,由于AIGC 所依赖的训练数据主要来自从互联网上抓取的各种信息,而这些信息往往鱼龙混杂且质量参差不齐,因而难以保证数据集的多样性、代表性、公正性,亦容易导致偏见、“观点霸权”、刻板印象、文化片面性等问题。此外,数据集的类型区分不清,还会导致事实与想象不分,进而加剧错误信息的扩散和传播(陈昌凤等,2023)。如果这些带有偏见和片面性的信息内容不慎进入到数字化教育资源中,将会对学习者的思维方式和价值观念产生误导,久而久之容易让学习者形成认知偏见,造成不良后果。
综上所述,开展基于AIGC 的数字化教育资源人机共创机遇与挑战并存,AIGC 应用所带来的内容版权、伦理与安全等风险,需要各方共同努力来积极应对。未来需要针对数字化教育资源开发的具体应用场景,进一步优化AIGC 相关技术和功能,推进制定相关法律法规,加强师生伦理教育与指导,促进AIGC 的良性发展,形成AIGC 与数字化教育资源开发双螺旋式的互促共进(卢宇等,2023)。