郭小明,游少鸿
(桂林理工大学,广西 桂林 541004)
2023年3月份ChatGPT的出色表现在人工智能领域及其应用辐射的相关领域激起千层波。该应用的一个直观感受就是一款更加智能的搜索引擎,它可以通过分析使用者的意图,搜索海量知识库,归纳总结出使用者想要的答案,并以人类能够接受的语言方式呈现出来。
其实,ChatGPT使用的就是AI生成内容技术的一个应用,它的出现给各个行业带来了机遇与挑战。目前的在线课程设计模式基本是固定的:教师把教学视频、课件、作业放到网上,在讨论区回答几个学生的提问,学生在线上完成考试,就算完成了一个线上教学周期。这种教学模式是否真正满足课程的达成度要求,或是对学生的过程性考核是否行之有效,是我们值得深思的。
在线开放课程(MOOCs)基于联通主义理论的应用而生。由于其利用互联网和新兴技术,提供便捷、费用低廉、高品质的教育资源,为所有学习者提供了一个平等、全球化的学习机会而风靡全球。我国对在线课程的建设目标提出了不同的要求,其主旨是拓展固有的教学时空,在新网络时代挖掘并增强对学生的教学吸引力,激发学习者的积极性和自主性,并扩大优质教育资源受益面。但存在的问题也非常明显。例如:虚拟的教学场景限制了师生教学的互动性、平台建设良莠不齐、国内师生的信息化水平与素养不高、线上的评估难度大、线上学习诚信问题等不容忽视[1-2]。
人工智能生成内容技术是一种基于人工智能算法和深度学习技术,利用大量数据训练模型,自动生成文本、图像、视频等内容的技术。目前,该技术已应用于多个领域,如自然语言生成、图像生成、视频生成等。其中,自然语言生成技术是最常见的一种,它可以根据语料库中的数据,自动生成符合语法和语义规则的语言内容。如一些AI聊天机器人、智能写作软件就是利用自然语言生成技术实现的。图像生成技术是利用深度学习算法、学习图像的特征和规律,然后自动生成符合特定要求的图像。例如,生成对抗网络(GAN)是一种常用的图像生成技术。视频生成技术则是利用图像和音频生成技术,将生成的图像和音频拼接起来,生成符合用户要求的视频内容。
总之,人工智能生成内容技术正在成为一种重要的工具和应用,在搜索引擎、智能客服、语音合成、视频制作、音乐创作等多个领域都有广泛应用。
ChatGPT是一个基于人工智能技术的在线聊天机器人,它的核心就是人工智能生成内容技术。它能够在聊天过程中自动理解用户的语言,并根据用户的输入提供相应的响应。解决该场景的算法是基于深度学习技术,利用大量的自然语言处理数据进行“训练”,从而达到自动学习和提高自身的响应能力。
ChatGPT 是基于自然语言生成的领先技术,可以帮助企业快速建立和发展具有智能的自动聊天机器人,以改善客户服务和提高客户满意度。ChatGPT 不仅可以为用户自动建立智能的会话,提供定制的建议和回答,在遇到问题时询问用户更多信息以确定最佳答案,还可以对用户进行情感分析,以更好地满足他们的需求,并帮助企业了解他们的客户。其应用除了可以拓展到供应链管理、智能分析、智能客服外,还可以使用在多种场景中,包括在线客服、智能对话、教育辅导等领域。
在教育领域,GPT可以用来提升语言理解技术,从而改善自然语言处理(NLP)技术,例如分析文本、建立问答对话等。一个典型的GPT在教育领域的应用案例是使用GPT来帮助学生理解文本的概念,并且可以帮助他们自动检索相关材料,节省答题时间和精力。GPT也可以作为辅助教学工具,增进教学质量,并且可以为学生建立问答库,帮助他们解决学习过程中的问题。此外,GPT也可以用于自动编写教学资料,例如教学文档、教材材料等,从而减轻教师的负担。
目前,在线课程设计存在的局限性、互动性体验一直不令人满意。在线课程主要以自学为主,很少有互动与讨论的机会。学生难以获得即时反馈和指导,这可能导致学生缺乏动力和信心,影响学习效果。现在大部分的课程教学平台都存在该问题,例如中国大学慕课、智慧树等,在线课程的设计基本包括:公告、评分标准、课件(视频、PPT)、测试与作业、考试、讨论区。在这几个板块中,师生只有通过讨论区进行互动。其实这种模式也就是将我们传统的线下教室照搬到了网络上而已。任课教师并没有掌握学生真实的学习动态,课程知识点也并未有效传达给学习者,这种学习是生硬的[3]。
由图1可以看出,在课程的学习周期,师生的互动目前仅限于中期的线上答疑。教师对第一阶段的学习导向是否达到效果并未有直观的反馈,而第三阶段其实也是目前线下课程一个考评的照搬,并未体现出大数据时代对在线课程的辅助作用。
图1 在线课程一个教学周期简图
而随着人工智能内容生产技术的出现及升级,例如ChatGPT的模型GPT-3的参数目前国内外已经达到了千万级,甚至是万亿级,但是对于我们一门课程的知识点参数来说其实很小,所以在后面随着人工智能模型的普及,我们可以逐渐建立基于专业、学科的知识点谱系,逐渐形成在线课程的教育模型,如图2所示。
图2 基于AI生成内容技术的在线教学骨架模型
图2中,根据在线教学周期对应的三个阶段分别建立对应的人工智能分析模块:知识点学习分析、主观性行为分析、客观行为分析。对应这三个学习阶段,根据GPT-3模型原理,将课程的内容知识点根据考查点来确定相应的参数,即课程知识点的数据库。该部分参数的采集不能只注重课程内容本身知识点,还应该对应学习者在学习过程中会对知识点“触发”什么事件,例如学习者观看学习视频的完整度、倍速、是否手动拖动进度条等事件,可将其作为判断学习者学习效率、认真程度、学习效果等的参考依据。在第二阶段的学习中,记录学习者的学习行为,如自我评价、他人评价、主观性作业等,与之相对应的参数库采集属于学习者的自主学习行为。学习的主观行为分析要复杂许多,但是可以根据课程的要求简化该过程的参数。该过程利用AI的语义分析,分解学习者学习内容。根据AI分解的内容可以与学习过程中的课程知识点数据库做匹配,甚至可接入相关知识库做更详细的分析,例如内容查重等。模型的第三阶段对应的是常见在线课程的设计,即客观题目的综合考查。利用AI模型除了可以掌握学习者的客观题正确率,更重要的是可获取学习者在学习过程中的行为参数,如题目的作答速度、修改次数等。该部分参数可为授课教师反馈学习者对知识点的掌握程度、知识点的难易程度等。三个参数库可以勾画出学习者对该门课的学习画像,根据需要可让授课教师掌握学习者的学习状况,也可反馈给学习者本人让其清楚自己对知识点还有哪些内容需要强化,这是传统在线课程所不具备的。
为了强化在线课程的交互性,我们可以参考ChatGPT这种智能对话系统的一些原理范式。例如,ChatGPT使用自然语言处理技术将用户输入的语音或文本转换为可处理的数据,它对文本理解使用文本分析和语义理解技术,将用户输入的话语或文本进行分析并判断用户的意图。该模块可以嵌入我们线上课程互动模块中,通过分析学习者意图,生成学习者课程学习效果矩阵。该结果可以供授课教师精准掌握学生的学习情况,学习效果的交互有助于让授课教师掌握学生的学习痛点和难点,可以及时地修改课件内容,形成良性的教学循环。
另外,反馈和迭代是ChatGPT的一个智能模块,具有学习和不断优化的能力,它会通过用户反馈不断更新自己,提高对话能力和个性化的智能化表现。其实它属于生成式的大规模语言模型,其底层的技术,包括Transformer、监督微调训练、强化学习等,已在人工智能领域有广泛的应用,并非算法上的实质性创新。ChatGPT巧妙地叠加这些技术,成功展现了由于模型规模带来的突现能力,经过近几年不断迭代部署,量变的积累产生质变,形成了ChatGPT的语言智能。
该模块的功能也对我们改善线上教学互动性有良好的借鉴作用。通过在线课程学习周期对学生数据的迭代,生成学生的学习画像,根据课程达成度设置的参数,可对比学习是否有进步。更进一步,可以纵向比较学习数据,形成该门课程阶段性的评估,这作为授课教师而言是非常重要的学习反馈[4]。
我们对大数据的研究可分为数据收集、数据分析、数据可视化。目前的AI模型可以根据课程学习模型构建相应的知识点参数、授课者参数、学习者参数、活动者行为参数以及基于各种观测主体的关联参数。而AI模型不仅可以归纳、分析各种参数为学习者提供个性化的参考,让其做出最优的学习计划,而且可以为授课教师发现各个知识点与学习者的潜在关联因素,找到课程新的发展趋势,有效识别或者预见可能存在的不利闭环,从而弥补教学过程中的黑盒效用。
传统的学习评价一般都是静态模式,对于学生个性化评价、过程性评价、非常规性学习因素评价很少或者缺乏,所以,前期对于在线课程的模型建立尤为重要,因为它会影响我们模型的反馈,这也是目前出现的几种先进模型的参数量级都很高的原因。选取相对充足而且有效的学习参数可以保证课程的正确评价,这也弥补了我们对课程教学的主观评价单一性和样本少的问题[5-6]。
ChatGPT的智能学习模型是通过大量数据的训练而得。比如在课程的学习过程中,学生在线上的每一个动作都是一个数据采集点,学生的学习效果反馈应该来自几个方面:一是固定知识考查,即客观性题目,是对课程基本知识点的掌握考查;二是非固定知识考查,即主观性题目,例如教师针对知识点设置的具有考查学生其他学习能力的问题;三是系统反馈能力考查,即学习反馈模型通过分析学生的学习行为而生成的评价,例如题目的作答时间、答题时长、答案内容分析、内容修改等,都可以给出我们以往都没有的一些结果分析,而这些反馈却可能是我们如何提高学生个性化学习的新方法。
基于AI生成内容技术产生的应用重点是模型的建立及有效参数的设置。对于普通的课程教学可将各个学科、专业的课程进行自动生成操作,可以遵循几个原则:一是学习任务分解,明确参数指标值;二是根据分析主体确定相关数据及来源,建立数据元模型;三是对学习模型进行分类,建立控制策略;四是根据建立的数据库对课程主体进行分析,生成学习数据及课程评价。
一般来说,在线课程的教学评价可以考虑以下几个方面:一是学习者体验程度。在线课程作为数字时代的一个“产品”,学习者作为“产品用户”其“感受”是在线课程教学评价的要点。学习者的体验充分体现在课程设计、教学内容、教师授课等方面。二是在线课程的内容质量高低。课程内容是决定一门在线课程质量高低的关键,同时也是影响学习者体验的重要因素[7].三是教学资源的丰富度。在线课程的教学资源包括教师、教材、技术设备、平台服务等,评价教学资源的好坏需要综合考虑各个方面,并优化资源的配置和使用,以提高教学效果。四是教学创新。教学创新是在线教学的一大特点,包括教学方法、课程设计、教学环境等方面。评价在线教学的创新需要考虑教学的特点和传统教育相比的优势,同时从学生的角度出发,评估教学的实用性和效果。
归根到底,人工智能和在线课程的结合可以更好地满足学生的需求,提高教育水平和效果。通过人工智能技术,可以实现个性化教学、自主学习、智能评估和反馈等功能,帮助学生更好地掌握知识和技能。同时,在线教育平台也能够收集学生的学习数据和行为数据,通过数据分析和人工智能算法,对学生的学习情况进行分析和评估,提供更加精准的教学反馈和指导,让每一个学生都能够得到适合自己的教学帮助。
但是大数据的使用,肯定会涉及个人的隐私,因为学习者在参与即使是一个学习周期的在线课程学习,也会在数据库中留下海量的个人信息。例如最基本的账号信息、个人学习过程数据、成绩、评价等,甚至于以目前的人工智能技术可以推断出学习者个人的一些行为属性、社会属性等敏感数据。所以分析过程中确保个人隐私不会被泄露或滥用显得至关重要。在做人工智能技术与在线教育结合的同时,如何保护个人隐私而且又能让学习者从中受益,那么管理和使用大数据的道德与法律问题的研究就必须同时开展。
根据目前调查研究,由于大数据技术在各个领域的广泛应用,它们往往会涉及大量的个人数据。大数据伦理问题主要包括以下几个方面:一是隐私保护,大数据应用需要收集、存储、处理和分析大量的个人数据,这些数据包括敏感的个人信息,必须确保个人隐私得到保护,防止个人数据被滥用。二是公平性和歧视,大数据分析可能会产生偏见,例如在雇佣和信用评分等方面,必须确保大数据分析不会歧视任何群体。三是透明度和责任,必须确保大数据运用的透明度和责任。例如,大数据分析的结果必须能够被理解和验证,同时,需要有责任机制来解决不当使用数据的问题。四是数据安全,必须确保数据被安全地存储和传输,以防止未经授权的访问或攻击。
结合对大数据隐私保护手段的主要研究,如果将人工智能技术应用于我们具体的课程教学中,保护学习者隐私的问题也至少要考虑以下四个方面:一是合理的匿名化处理,将个人身份信息经过混淆、脱敏等处理方式使其与个人身份不能直接关联。二是数据安全加密,采用对称加密或公钥加密等方式对敏感数据进行加密保护,只有授权的用户才能解密数据。三是数据访问权限控制,在大数据平台上通过内部网络、门禁等方式对数据进行访问控制,只有经过严格授权的人员才能访问。四是隐私协议的制定和执行,企业和机构应规范自身的隐私协议,并落实执行。总之,保护大数据隐私需要加强合法性、合理性、规范性和监管性,这是一个系统工程,需要各方共同努力。
随着技术的发展,无论是大数据还是人工智能,教育的发展都应跟上时代的步伐,利用新技术使我们的教学工作更加有效、有意义。虽然近几年我们对传统的教学做了一些改革尝试,但是很多仅仅是形式的改变,特别是对于人工智能技术,我们尚未在教育行业发挥其应有的优势。本文仅以在线课程建设过程遇到的问题为例作了相关构思,但是要做到新的数据技术与教育的紧密结合,从数据模型的分析建立,到真正产品的落地还需要不断地去尝试与努力。