李 艳 许 洁 贾程媛 翟雪松
(浙江大学 教育学院,浙江杭州 310058)
自2022 年底ChatGPT 问世以来,生成式人工智能在世界范围内受到了关注(朱永新等,2023)。区别于之前的人工智能技术,生成式人工智能可以根据使用者的个性化需求自动创建内容(如图像、文本和视频)(Ma & Huo, 2023)。以ChatGPT 为代表的生成式人工智能不仅对人工智能领域产生了极大冲击,也给各级各类教育系统带来诸多挑战。
2023 年初,出于对大学生使用生成式人工智能可能会产生不良后果的担心,全球多所高校出台政策禁止学生使用生成式人工智能。例如,法国巴黎政治学院严格限制ChatGPT 的使用;印度将ChatGPT 列入考试禁止使用项目名单等(唐科莉等,2023)。单纯的禁止不是解决问题的办法。如果高等教育机构一味采用禁止态度,未来专业人士的职业技能终将不完整(吴青等,2023)。经过数月的探索和讨论,全球越来越多高校意识到生成式人工智能的使用势不可挡,开始积极探索通过安全、可靠的方式将生成式人工智能融合到教育教学中。多所高校发布了生成式人工智能使用指南。例如,中国香港大学、新加坡南洋理工大学等为师生提供生成式人工智能工具访问权限(Yu,2023;NTU,2023)。截至2023 年底,中国很多高校尚未明确发布师生使用生成式人工智能的相关指南或规范。
基于以上认识,本研究开展大学生生成式人工智能使用现状调研,探讨不同性别、年级、专业大类的学生使用生成式人工智能的行为有无差异,并收集使用建议,以期为生成式人工智能融入高等教育以及制定高校教育改革政策提供建议。具体而言,本研究旨在回应:1)大学生使用生成式人工智能的基本状况如何?2)大学生在四大典型场景使用生成式人工智能 的现状如何?3)不同性别、年龄、专业大类的学生使用生成式人工智能有无差异?4)大学生对使用生成式人工智能有哪些建议?
本研究选取浙江大学部分本科生作为研究对象。浙江大学学科门类齐全,设有哲学、经济学、法学、教育学等13 个学科门类和39 个专业学院(系),这些学科门类和专业分别归属在七个学部(人文学部、社会科学学部、理学部、工学部、信息学部、农业生命环境学部和医学部)。2023 学年,在校本科生2.9 万余人。
基于已有文献,本研究编制了“大学生生成式人工智能使用现状调查问卷”(见表1)。问卷分四部分。第一部分为学生基本信息,包括性别、年级、专业大类等,共5 题。第二部分旨在了解大学生使用生成式人工智能的状况,共7 题。第三部分用于了解大学生在四大典型场景使用生成式人工智能的状况,共17 题。典型场景和具体内容的确定源自文献梳理及针对十余名本科生的半结构化访谈结果,涉及课程学习、科研活动、日常生活和升学求职四大典型场景。第四部分为开放性问题,目的是了解大学生希望高校有哪些作为,助力他们更好地使用生成式人工智能。
表1 调查问卷基本构成
本研究通过公共在线问卷平台——问卷星发放,调查问卷回收时间为2023 年11 月15—25 日,共回收在线问卷1380 份。删除相同答案占比较高的问卷(Rafique et al., 2020),本研究最终收回1190份有效问卷,有效率达86%。结果显示,参与调研的1190 位本科生中,男生占50.25%,女生占49.75%。年级分布为大一学生占25.04%,大二学生占25.29%,大三学生占22.02%,大四学生占27.65%。专业分布依次是医药学部学生占27.82%、社科学部占16.81%、工学部占14.20%、理学部占12.86%、农业生命环境学部占10.67%、人文学部占9.92%和信息学部占7.73%。本研究采用SPSS25.0 软件,通过描述统计呈现大学生使用生成式人工智能的现状,运用单因素方差分析方法呈现使用生成式人工智能在不同调节因素上的差异。
调研发现,超过七成的大学生(72.77%)表示熟悉生成式人工智能。三分之二的大学生开始使用生成式人工智能的时间在2022 年12 月—2023 年6 月间(67.05%),四分之一的大学生开始使用生成式人工智能的时间是2023 年7—11 月(26.47%),小部分大学生表示没有使用过(6.47%)。大学生使用最多的生成式人工智能工具是ChatGTP(83.45%),其次是文心一言(36.72%)、New Bing(30.50%)和讯飞星火(9.75%);最常使用的生成式人工智能技术是文本生成(90.50%),其次是图像生成(35.21%)、语音生成(9.08%)和视频生成(5.71%)。在使用频率方面,超七成大学生(71.76%)偶尔使用,经常使用的占21.51%,从未使用过的占6.72%。大学生最常用的功能是文本生成(43.19%)和信息搜索(36.89%),少数大学生使用生成式人工智能进行语言翻译(4.87%)、对话互动(4.29%)、语法检查(2.18%)、调试代码(2.52%)等。6.89%的大学生经常学习生成式人工智能的知识或技能,超过一半的大学生(53.87%)偶尔学习生成式人工智能的知识或技能,近四成大学生(39.24%)从未学过(见表2)。
表2 大学生使用生成式人工智能状况
本研究调研了大学生在课程学习、科研活动、日常生活、升学求职四大典型场使用生成式人工智能的状况(见表3)。平均而言,科研活动场景得分最高(M=3.03,SD=1.08),之后依次为课程学习(M=2.85,SD=1.06)、日常生活(M=2.20,SD=1.01)和升学求职(M=1.39,SD=0.69)。本研究通过统计分析选择“基本符合、符合以及完全符合”(以下简称“符合”)和“完全不符合和不太符合”(以下简称“不符合”)的大学生人数和比例,发现大学生在四大典型场景使用生成式人工智能的内容及频率差异明显。
表3 大学生在四大典型场景使用生成式人工智能的状况 (n=1190)
科研活动场景中, 72.5%的大学生使用生成式人工智能辅助选择研究问题, 67.4%的大学生使用生成式人工智能辅助题目、段落或全文写作;64.2%的大学生使用生成式人工智能翻译外文学术文章或资料;62.8%的大学生使用生成式人工智能提取文献的关键信息;55.3%的大学生会使用生成式人工智能修改论文或报告文本。五个题项中选择“符合”的人数都超过一半,说明生成式人工智能已成为大学生科研活动的重要帮手。
课程学习场景中,74.6%的大学生使用生成式人工智能查阅课程内容, 68.1%的大学生使用生成式人工智能辅助完成课程作业,49.1%大学生使用生成式人工智能回答老师的提问, 42.8%大学生会让生成式人工智能评价作业和给予反馈。利用生成式人工智能查阅信息和辅助完成作业的比例最高,其次是辅助回答教师的问题以及评价作业和给予反馈,说明生成式人工智能在大学生课程学习中发挥着重要作用。
日常生活场景中, 54.1%的大学生会问生成式人工智能有关生活常识、社会、历史、地理、文化等问题; 38.1%的大学生无聊时会和生成式人工智能互动聊天;35%的大学生遇到困难(如饮食、理财、社交)会求助生成式人工智能;29.2%的大学生会让生成式人工智能设计多样化的娱乐内容(如猜谜、游戏等)放松自己;24.9%的大学生会让生成式人工智能提供心理辅导。由此可知,生成式人工智能在大学生日常生活中扮演着一定的角色。
升学求职场景中,50.7%的大学生会让生成式人工智能策划活动;43.3%的大学生会让生成式人工智能制作或改写简历;29%的大学生会和生成式人工智能互动模拟面试。这说明大学生在升学求职中会寻求生成式人工智能的帮助。
本研究采用差异检验和事后多重比较等方法,探究性别、年级、专业大类等因素对大学生使用生成式人工智能的影响。
1. 性别
独立样本t 检验结果显示,性别对大学生使用生成式人工智能有显著影响:1)男生熟悉生成式人工智能的程度(p=0.000<0.05)显著高于女生;2)男生开始使用生成式人工智能的时间(p=0.004<0.05)显著早于女生;3)男生使用生成式人工智能的频率(p=0.004<0.05),高于女生;4)男生学习生成式人工智能知识或技能的频率(p=0.004<0.05),高于女生。
性别对大学生在三大典型场景使用生成式人工智能也存在重要影响:1)课程学习(p=0.004<0.05),2)科研活动(p=0.001<0.05),3)日常生活(p=0.079<0.05)。其中,男生使用生成式人工智能明显多于女生。男女生在升学求职场景中使用生成式人工智能的行为没有显著差异(见表4)。
表4 不同性别大学生使用生成式人工智能的差异
2. 年级
方差齐性检验结果表明,不同年级大学生使用生成式人工智能的现状满足方差齐性条件(sig>0.05),故本研究采用单因素方差进行差异分析:1)不同年级大学生对生成式人工智能的熟悉程度存在显著差异(p=0.035<0.05)。大三学生最熟悉,大二和大一学生次之,最后是大四学生。2)不同年级大学生开始使用生成式人工智能的时间存在显著差异(p=0.000<0.05)。大二学生最早使用,大三和大四学生次之,大一学生使用最晚。3)不同年级大学生使用生成式人工智能的频率没有显著差异。4)不同年级大学生学习生成式人工智能知识或技能的频率没有显著差异。
年级对大学生在三大典型场景使用生成式人工智能也存在重要影响:1)课程学习(p=0.000<0.05),大三>大四>大二>大一;2)科研活动(p=0.000<0.05),大四>大三>大二>大一;3)升学求职(p=0.016<0.05),大三>大四>大二>大一。不过,不同年级大学生日常生活场景使用生成式人工智能的行为没有显著差异(见表5)。
3. 专业
方差齐性检验分析结果表明,不同专业大类的学生使用生成式人工智能的现状不满足方差齐性条件(sig<0.05),故本研究采用Welch’s ANONA 方法进行差异分析:1)不同专业大类大学生熟悉生成式人工智能的程度存在显著差异(p=0.000<0.05)。熟悉程度依次为:信息学部>工学部>社科学部>农业生命环境学部>理学部>医药学部>人文学部。2)不同专业大类大学生开始使用生成式人工智能的时间存在显著差异(p=0.000<0.05)。使用时间先后依次为:信息学部>工学部>社科学部>人文学部>医药学部>农业生命环境学部>理学部。3)不同专业大类大学生使用生成式人工智能的频率存在显著差异(p=0.000<0.05)。使用频率从高到低依次为:信息学部>工学部>社科学部>农业生命环境学部>理学部>人文学部>医药学部。4)不同专业大类大学生学习生成式人工智能知识或技能的频率存在显著差异(p=0.000<0.05)。学习频率从高到低依次为:信息学部>工学部>人文学部>理学部>社科学部>农业生命环境学部>医药学部。
专业大类大学生在四大典型场景使用生成式人工智能也存在差异:1)课程学习(p=0.000<0.05)的使用程度依次为:信息学部>工学部>社科学部>人文学部>医药学部>农业生命环境学部>理学部;2)科研活动(p=0.000<0.05)的使用程度依次为:信息学部>工学部>社科学部>医药学部>理学部>人文学部>农业生命环境学部;3)日常生活(p=0.010<0.05)的使用程度依次为:工学部>人文学部>理学部>社科学部>农业生命环境学部>医药学部>信息学部;4)升学求职(p=0.000<0.05)的使用程度依次为:工学部>社科学部>信息学部>人文学部>理学部>医药学部>农业生命环境学部(见表6)。
310 名大学生给出了使用生成式人工智能的建议(见表7)。两名研究人员对建议进行编码发现,频次最高的建议是开设生成式人工智能相关课程或讲座,其次是防止滥用、规范使用生成式人工智能、提供生成式人工智能使用渠道,以及加强生成式人工智能使用。其他建议有提供生成式人工智能功能;关注抄袭、学术不端、避免侵权等问题;开发个性化生成式人工智能工具;减少低质量、重复性作业,布置创新性作业,培养思维能力;出台生成式人工智能指导规范,增加生成式人工智能应用软件和保护数据隐私等。
参与调研的大部分学生熟悉生成式人工智能,经常或偶尔使用生成式人工智能,常使用的生成式人工智能工具包括ChatGPT、New Bing、文心一言和讯飞星火等,最常用的生成式人工智能功能是文本生成,其他还有图像生成、语音生成和视频生成等多媒体内容生成功能。这说明大学生对该技术的接受度较高,生成式人工智能已渗透进大学生的日常学习和生活。可以预见,随着生成式人工智能多媒体内容生成能力的提升,更多大学生会使用该功能。此外,六成大学生偶尔或经常学习生成式人工智能相关的知识与技能,可见大学生有较强烈的学习生成式人工智能相关知识和技能的需求。
在四大典型场景中,科研活动中使用生成式人工智能最活跃。在科研活动的五个题项中,选择“符合”的人数均超过一半,说明生成式人工智能已成为大学生开展科研活动的重要助手。其中,超七成大学生使用生成式人工智能辅助选择研究问题,这说明作为较为理想的对话式学习工具(戴岭等,2023),生成式人工智能能够生成具有创意性、启发性的文本,启发学生思考,辅助学生探索研究问题。约三分之二大学生使用生成式人工智能辅助写作,翻译外文学术文献或资料。这与生成式人工智能的文本生成功能、语言翻译功能契合,说明大学生能较好地利用这两类功能。研究证实生成式人工智能具有帮助研究者拓宽信息获取渠道,完成各类耗时、重复性工作的潜力(刘宝存等,2023),高校学生管理和科研管理部门有必要深入了解大学生科研活动新动态,并制定相关规范。
课程学习是大学生使用生成式人工智能的第二大重要场景。四分之三大学生会向生成式人工智能咨询专业名词,或与课程内容相关的资源等。生成式人工智能成为辅助大学生完成作业的重要工具,其文本生成功能可以帮助大学生完成重复性的学业任务。由此可见,生成式人工智能正成为学生完成作业的代理人,在帮助学生减轻课业负担的同时,也对学生高阶思维发展带来挑战。因此,教师有必要重新思考学生的作业设计问题(李海峰等,2023)。较少大学生会使用生成式人工智能回答课堂上老师的提问,可能是学生在课堂上会认真听课,能够利用已有知识回答问题。少数大学生会使用生成式人工智能进行作业评价和反馈,可能是由于大学生缺乏这方面的意识,不认为生成式人工智能可以作为评价工具,没有充分了解生成式人工智能的潜在功能。
在日常生活场景中,生成式人工智能也发挥着作用。超过一半的大学生会咨询生成式人工智能有关生活常识、社会、历史、地理、文化等问题。近三、四成大学生无聊时会与生成式人工智能聊天互动,遇到困难或向其求助,还会让其设计多样化的娱乐内容,四分之一大学生会让生成式人工智能提供心理辅导。可见,调研证实了学者的判断,即生成式人工智能正成为学生的个性化陪伴助手,帮助学生解决生活中遇到的难题(陈玉琨,2023)。同时,生成式人工智能已成为少数人群的娱乐工具和心理辅导工具(宋韵雅,2023)。可以预见,生成式人工智能在满足大学生个性化需求方面还会持续发挥重要作用。
此外,生成式人工智能正在助力大学生的升学求职活动。一半大学生会让生成式人工智能帮助策划创意性活动,超四成大学生会让其制作或改写简历,与其互动进行模拟面试。相对来讲,大学生较少将生成式人工智能用于升学求职场景,这可能是高年级大学生(如大四)才会有相关需求。本次调研中,低年级学生对该场景的使用需求还不足。
调研发现,不同性别大学生在大多数维度(生成式人工智能的熟悉度,开始使用生成式人工智能的时间,使用频率,生成式人工智能相关知识和技能学习,在课程学习、科研活动和日常活动三大典型场景使用生成式人工智能)上存在显著差异。整体而言,男生使用行为更积极。该结果与已有研究一致(Volman & van Eck,2001),即男生在技术使用方面明显优于女生。不过,男女生在升学求职场景的生成式人工智能使用没有显著差异,可能原因是相对于其他场景,大学生在升学求职场景使用生成式人工智能的整体水平偏低,性别差异尚未凸显。
不同年级大学生在多个维度(生成式人工智能的熟悉度,开始使用生成式人工智能的时间,在课程学习、科研活动和升学求职三大典型场景使用生成式人工智能)存在显著差异。整体而言,大三学生对生成式人工智能最熟悉,大一学生开始使用生成式人工智能的时间明显晚于大二、大三和大四学生,这主要因为大一新生2023 年上半年处在高三备考期。在课程学习、科研活动、日常生活和升学求职场景中,大三和大四学生使用生成式人工智能的比例明显高于大一和大二学生,原因可能是大三和大四学生熟悉高校的学习和生活环境,获取信息和资源的渠道多于低年级学生,大一、大二学生课业负担重,尤其是大一新生,入学后还需要适应大学学习和生活。不过,研究发现,不同年级大学生使用生成式人工智能的频率、学习生成式人工智能知识或技能的频率和日常生活场景中的使用行为不存在显著差异。
不同专业大类的学生使用生成式人工智能的维度存在显著差异。在所有维度上,信息学部和工学部的学生优势明显,其他专业大类的学生在不同维度表现有异。这一结果与专业相关,信息学部学生最易接触生成式人工智能。工学部学生涉及编程知识、机器学习等课程,使用生成式人工智能有优势。社科学部学生容易从专业研究动态中了解生成式人工智能的影响力,会引发使用行为。相对而言,理学部、医学部、人文学部和农业生命环境学部等专业学生关注生成式人工智能相对滞后,使用频率相对较低,
调研显示,为了更好地使用生成式人工智能,大学生提出最多的建议是开设生成式人工智能课程或讲座,其次是防止滥用、规范使用生成式人工智能。生成式人工智能是一把双刃剑,利用得好,会给大学生的学习和生活带来便利和帮助;利用得不好,会引发抄袭、作弊、传播虚假信息、削弱思考力等问题。因此,大学生希望学校开设相关课程或讲座。虽然大部分学生支持将生成式人工智能用于教育教学,但强调要规范使用,不能削弱学生的思考力。此外,很多生成式人工智能工具需要付费,大学生希望能从官方渠道获得免费使用的生成式人工智能工具。因此,大学生建议学校加强生成式人工智能使用,关注抄袭、学术不端等问题以及教师创新作业布置等,这些都为高校教学部门制定生成式人工智能政策使用提供了思路。
基于调研结果,本研究从高教管理部门、公司、高校、教师等角度提出启示与建议。
参与调研的大学生希望高校能有自己的生成式人工智能平台,能为大学生提供免费的生成式人工智能服务。现在大学生使用最多的是ChatGPT。然而,出于意识形态的风险,教育领域应避免直接采用国外开发的ChatGPT 类通用大模型作为教育辅助工具(贺樑等,2023),而应结合本土文化、意识形态、教育理念和教学需求开发属于自己的、真正开源和透明的教育大模型。此外,高校应出台生成式人工智能指导规范,明确使用原则、技术支持体系建设要求等,通过出台规范和部门层面的统筹协调,促进生成式人工智能的安全有效应用。
启发性内容生成、序列任务执行是生成式人工智能技术最核心的能力(卢宇等,2023),但研究显示,生成式人工智能的感知拟人性没有对大学生的使用意愿产生影响(翟雪松等,2023)。本次调研发现,大学生建议“增强生成文本的拟人性,减少机械化”,这表明生成式人工智能拟人性还不够强。在完善生成式人工智能技术方面,学生建议相关研发机构开发可以免费使用的生成式人工智能网页,增加生成式人工智能应用软件,使其融入大学生的生活和学习。学生也希望研发机构或开发团队完善生成式人工智能技术时应以“人”为中心,提高服务的透明度,保护数据隐私。这包括通过讲座或发布指南的方式帮助高校、教育者和学习者理解生成式人工智能如何给出特定结果或建议;如何追踪和记录系统决策的过程;相关模型如何被训练、调整和评估等。透明度的提高,能够加强人—机间的信任,让用户能够参与并帮助检测和纠正潜在的偏见、不公平或错误(U.S. Department of Education,2023)。
国家互联网信息办公室等(2023)发布了《生成式人工智能服务管理暂行办法》,高校可据此制定符合本校需求的政策和指导规范,明确生成式人工智能教育应用的范围、原则和准则。这些指导规范将为教育管理者、教师和学生提供清晰的使用指导,确保生成式人工智能的应用符合教育教学的目标和价值观。调研发现,大学生提出的生成式人工智能使用建议中,频率最高的是希望学校开设相关课程或讲座。因此,高校应响应学生需求,为其开设相关课程或讲座。内容可以包括普及生成式人工智能使用方法,介绍提示工程方法,为大学生准确获得信息提供帮助。相关课程内容需包括使用生成式人工智能伦理道德,让学生学会科学、合理地使用生成式人工智能。高校可以邀请技术人员展示生成式人工智能应用于学习、生活等案例,教师也可以提供应用式、场景式讲授。最重要的是,学校应重新定义抄袭、学术不端等问题,优化查重机制,做好监管工作,防止学生滥用生成式人工智能。
教师作为知识传授者和科研工作者,要不断提高能力素养,确保自身的主体性地位以及创新能力不被技术所消解至关重要(刘宝存等,2023)。首先,教师应自主参与生成式人工智能相关培训,学会使用生成式人工智能连续有效地发问,熟悉生成式人工智能的教学应用场景,了解生成式人工智能相关伦理等。其次,调研结果显示,信息学部、工学部、社科学部大学生以及大三和大四学生使用生成式人工智能的频率较高,因此,对跨专业或跨年级课程,教师可考虑让这些专业大类或年级的学生分享他们的生成式人工智能使用经验,以便让更多专业和年级的学生理性使用生成式人工智能。最后,生成式人工智能的输出结果倾向于强化主流观点,由此产生的知识同质化限制了创造性思维的发展(兰国帅等,2023)。教师要重新思考书面作业的设计,布置生成式人工智能不能完成但人类能完成的任务(UNESCO,2023),如布置创新性作业,让生成式人工智能辅助基础工作;鼓励学生开展创新性活动或实践,激发学生的思考力、协作能力、批判性思维和创造性思维等高阶思维。教师要注重对学习者高阶思维的评价,建立高阶低阶融合贯通的教学新模式(周玲等,2023)。根据布鲁姆目标分类理论,教育者应减少对学生记忆、理解、应用等维度的知识考核,增加对分析、综合、评价、创造等维度达成度的考核。