李军华 燕 翔 李 慧
机器是否会思考是一个简单而复杂的问题[1]。1955 年,McCarthy 等人在一次学术活动中创造了“人工智能”这个词,它指的是模仿人类认知并像人类一样做出决策的机器和过程[2]。大型语言模型是人工智能的一个重要进步,尤其是朝着类人通用人工智能的目标迈进了一大步。2022 年11 月,OpenAI 实验室发布了一款名为ChatGPT 的聊天机器人,它的后台采用了GPT-3.5 大型语言模型。ChatGPT 可以模仿人类对话,可以创造新的作品,如诗歌、故事、小说等。除了常规问答,它还可以“承认错误、挑战不正确的前提,并拒绝不适当的请求”[3]。大型语言模型虽然没有正式定义,但通常是指参数数量达到数十亿甚至更多的深度学习模型[4],自从2018 年发布GPT-1 和BERT 等初级大型语言模型以来,这些模型的更新换代速度飞快。包括Google、OpenAI、DeepMind 和Meta 等厂家都相继推出了自己的产品。这些模型通过大量的数据训练,具备了惊人的自然语言处理能力,为自然语言理解和生成领域带来了前所未有的突破和发展。
随着当代社会数字化程度不断提高,全民数字素养与技能的提升已成为国家发展的重要战略。2023 年2 月,中共中央、国务院印发《数字中国建设整体布局规划》指出,要构建覆盖全民、城乡融合的数字素养与技能发展培育体系[5]。数字素养是数字时代人们应具备的核心素养之一,包括信息素养、计算机素养和数据素养等多个方面,其重点在于数字技术的应用,通过掌握数字技术,人们可以更加高效地进行知识的搜集、理解、整合、再利用以及分享交流。提高数字素养可以帮助人们更好地适应数字化社会的发展,并在日常生活和工作中更加灵活地应对各种挑战。随着大型语言模型的出现,数字素养教育将迎来前所未有的革命。作为面向公众的公共文化和社会教育机构,图书馆应该积极开展数字素养宣传和培训,为方便民众参与数字中国建设做出贡献[6]。
目前,我国图书馆的数字素养教育方式主要以讲座、培训和通识课程为主,多依附于信息素养教育框架,缺乏创新的教育方式。大型语言模型的出现为数字素养教育带来了新的机遇和挑战,其强大的文本生成和理解能力为数字素养教育提供了强有力的支持。例如,它可以辅助信息检索,帮助学习者更便捷地获取和理解大量数字信息,从而提高学习效率;此外,与大型语言模型的交互还能启发学习者,激发创新思维,产生新的见解和创意。本文将探索和挖掘大型语言模型在数字素养教育中的应用潜力,以期推动数字素养教育迈向更高水平、培养更具竞争力的数字时代人才、助力社会的可持续发展,为图书馆数字素养教育及实践提供一定的参考。
在教育领域,大型语言模型的应用主要通过基于其算法构建的聊天机器人来实现,通过与这些聊天机器人进行对话,实现教学和学习的交互。研究发现,聊天机器人在以学生为中心的学习方法中具有显著的适用性。通过与聊天机器人的互动,学生可以获得认知知识,促进个性化学习和思考能力的发展,而不仅仅依赖于简单的记忆过程[7]。近年来,中小学校、大学及各个学习平台广泛采用教育聊天机器人,用以解决学生提出的重复性问题。人工智能聊天机器人在教育领域解决了多方面的问题,例如帮助学生从众多信息源中筛选出所需信息[8],缓解教师无法回答大量重复问题的难题[9],增强远程学习和在线课程中的互动体验[10],同时还让学生能够在同伴面前更自信地提问,避免因担心评判而犹豫不决[11]。尽管聊天机器人自1966 年问世以来已经历了长期的发展[12],但真正引起全球关注并令人期待的ChatGPT 却在2022 年11 月底才出现,使得商业爆发似乎不再遥不可及。
聊天机器人的技术发展经历了多个演进阶段,从最初的基于规则的方法,逐渐发展至机器学习、神经网络、Transformer 等技术,并最终达到了目前的GPT-4 技术水平。这些技术的持续改进使得机器生成的回复在准确性、自然性和人性化方面有了显著提升。
在ChatGPT 出现之前,聊天机器人在图书馆领域主要用于参考服务,包括回答常见问题、辅助数据库使用、发布公告等功能[13]。而在教育领域中,聊天机器人的应用主要集中在两个方面:聊天机器人的设计和聊天机器人在教育上的效果评估。在设计方面,研究人员主要从个性化[14]、功能角度[15-16]、问答处理流程角度[17]进行探索与研究。个性化的设计使得聊天机器人能够更好地适应个体学习者的需求,功能角度的研究关注于增强聊天机器人的各项功能,而问答处理流程的优化则旨在提高聊天机器人应答问题的效率和质量。而在教育效果评估方面,研究主要集中在两个方向:评估标准[18]和评估方法[19]。评估标准的研究旨在建立衡量聊天机器人在教育中应用效果的标准体系,而评估方法的研究则探讨如何科学客观地评估聊天机器人在教学过程中的实际表现。总体而言,聊天机器人在教育领域的发展与应用正逐步深入,研究人员在不断探索和改进技术,以提升聊天机器人在教育中的实用性和效果。
自ChatGPT 问世以来,其在教育领域的应用受到广泛关注。部分研究专注于探讨ChatGPT 在医学教育[20]和临床管理[21]方面的潜在应用,并认为其能够促进个性化和交互式学习[22],为学生提供增强学习体验和支持教师工作的机会[23]。然而,在数字素养教育方面,仅在ChatGPT 应用于图书馆研究方面有些许涉及。例如,Cox 指出类似ChatGPT 的大型语言模型的出现使得数字素养教育比以往任何时候都更为重要。图书馆员需要协助教师教授学生批判性思维技能,以验证ChatGPT 所提供内容的质量[24]。蔡子凡等人认为,基于AIGC 的信息素养教育能更好地增强学习的体验感和交互感,适应新技术环境下用户对于知识和技能的获取[25]。李书宁等人探讨了ChatGPT 在图书馆信息素养教育方面的挑战。认为传统的素养教育主要侧重于“构建检索策略”,但如今这已失去意义,更有价值的是如何运用自然语言进行高效提问以获取更有价值的结果。此外,他们还强调加强批判性思维和学术判断力的培养[26]。龚芙蓉探讨了ChatGPT 类生成式AI 对高校图书馆数字素养教育的影响,认为人工智能对批判性思维、逻辑思维和计算思维都有一定的开发和引导作用,但也有可能形成新的工具依赖和信息茧房[27]。
综上所述,ChatGPT 在教育领域展现出的卓越能力引起了教育工作者的共同关注,因为人工智能的进步似乎已经彻底改变了现有的教育实践。然而,目前ChatGPT 在数字素养教育领域的相关研究与应用仍处于理论探讨和初步实践阶段。因此,基于ChatGPT 的大型语言模型在数字素养教育方面的研究还有待进一步深入探索。
数字素养由Paul Gilster 于1997 年正式提出,认为一个人要“能够理解并读懂通过电脑显示的各种数字资源及信息的真正含义,强调个人的批判思维与整合能力”[28]。美国图书馆协会将数字素养定义为:使用信息和通信技术来检索、评估、创建和传播信息的能力,需要具备认知技能[29]。因此,实施数字素养教育需要依据数字素养框架规定的目标、内容和标准进行。数字素养框架彰显了人们熟悉与掌握的数字技能,为了更好地提升民众数字素养,一些国家及组织出台了一系列战略规划并制定了数字素养框架。比较有影响力的框架有联合国教科文组织制定的《全球数字素养框架》、世界经济合作组织等制定的《数字商数全球框架》、欧盟制定的《DigComp2.2》和美国大学与研究图书馆协会制定的《高等教育信息素养框架》。本文综合考虑这些素养框架,并挖掘ChatGPT 可以发挥作用的地方,从提升信息与数据素养技能、促进交流与合作、创造数字内容和提高安全意识四个角度,简要探讨ChatGPT 的应用场景,如图1 所示。
图1 ChatGPT 在数字素养中的应用场景
随着ChatGPT 在全球市场的普及,且在内容深度搜索方面表现出色,人们开始广泛讨论它是否能替代传统搜索引擎。尽管数据时效性和真实性问题仍然存在,因此在中短期内它无法完全替代传统搜索引擎,但在处理知识类和创意类问题时,ChatGPT 提供的搜索体验远胜于传统搜索引擎。
在信息检索方面,ChatGPT 是最佳的搜索引擎助手。(1)理解用户搜索意图。在使用搜索引擎进行检索时,通常需要了解特定领域的术语才能高效地检索信息,但有时我们并不了解这些术语的存在。因此,当用户输入一个查询时,ChatGPT 能够分析其语言结构和上下文,以确定用户正在寻找什么类型的信息(见图2);根据ChatGPT 提供的关键词,我们可以有针对性地进行检索并制定检索式。(2)指导搜索策略。ChatGPT 可以为用户提供搜索策略和技巧,帮助用户更有效地使用搜索引擎和关键词,以获得更相关的搜索结果。它可以教授用户如何使用引号、排除符号等高级搜索技巧,使用户在海量信息中更快地找到需要的内容。
图2 理解用户搜索意图并提供搜索建议
在信息评估方面,ChatGPT 可以利用其对自然语言的理解和分析能力,从两方面辅助师生开展信息评估:(1)提高信息可信度:通过评估信息来源,从多个来源验证信息的可信度。当信息涉及逻辑推理时,可以分析逻辑是否合理来辨别错误信息。此外,通过识别文本中的关键词、情感和语气等因素,ChatGPT 可以教导用户如何辨别信息的种类,使得用户能学会区分事实报道、观点、广告和线上内容,从而增强对信息的批判性评估能力;(2)总结信息:ChatGPT可以对大量文本信息进行分析和总结,提取主要观点、信息和结论,并提供实例和案例,从而帮助师生更好地理解和评估信息的重点和关键内容。
在信息管理方面,ChatGPT 可以发挥多种作用,帮助用户更有效地管理和组织复杂的信息,具体包括:(1)数据可视化与表达:ChatGPT 可以教导师生如何制作在线或动态表格,并以图表等可视化形式展示数据,帮助用户更清晰地呈现信息。例如,学生需要在报告中展示统计数据时,ChatGPT 可以提供指导,让他们使用图表或图形来展示数据,使得报告更加直观和易于理解。(2)数据工具应用:ChatGPT 可以引导用户使用数据库、数据挖掘、分析软件等数据工具,提高数据处理和组织的效率。例如,一个市场营销人员想要分析用户行为数据,ChatGPT 可以建议使用何种数据挖掘工具及方法来挖掘用户的偏好和行为模式。
在当今数字化和智能化的时代,人工智能技术的迅猛发展已深刻影响人们的生活和工作方式。过去的“交流”领域更注重个人的语言表达能力,现在我们不再局限于传统的面对面交流,而是在数字环境下进行交流和合作,这为我们带来全新的可能性。
在交流与合作素养方面,ChatGPT 能够协助人们更好地沟通和协作,从而提高工作效率和质量。它可以通过多种方式协助师生进行沟通和协作。(1)智能问答:学生可以利用ChatGPT 自动回答问题,不必等待老师的回复。这将帮助老师更好地管理时间,让学生更快地获得所需信息;同时,学生还可以通过与ChatGPT 对话练习来提高与人工智能进行沟通的技能。例如,学生可以询问ChatGPT 关于特定主题的问题,观察回答,并根据回答调整自己的表达方式,学习如何与AI 系统有效交流。(2)回复邮件:ChatGPT 可以根据原始邮件主题确定需要回答的问题,直接生成回复,或根据邮件内容列出几条回复意见供用户选择,甚至催促期刊审稿人发邮件。这样可以提高工作效率和准确性。(3)模拟对话:教育者可以利用ChatGPT 进行角色扮演,让学生扮演不同角色进行对话练习,鼓励他们积极表达和参与。通过与ChatGPT 的互动,学生可以提高口语表达能力和工作面试技巧,也能学会与团队成员合作,共同解决问题。(4)提供网络礼仪:ChatGPT 可以向用户提供网络礼仪和道德准则的指导,帮助他们认识到在线行为可能对他人产生的影响。例如,在社交媒体上尊重他人观点,避免恶意攻击和散布虚假信息,促进更加友善和理性的网络互动。
ChatGPT 的基本原理是通过训练大量文本有目的地学习人类语言知识和模式。它能生成高质量的文本,非常适合用于数字内容创作。虽然有时可能会“胡说八道”,但这不一定是坏事。它表达的是想象力,是小说创作的基础,也是童话或天方夜谭的素材。作家兼艺术家Austin Kleon 曾提出过一个观点:所有艺术家都是从其他来源“窃取”创意,这是创造过程的自然组成部分。在他的《Steal Like an Artist》一书中,Kleon 认为完全原创并非必要,甚至不可能。从其他来源汲取灵感并将其融入自己的作品是自然而有益的[30]。然而,“窃取”并不意味着未经授权或许可就复制他人的作品。相反,它意味着使用其他来源作为灵感,并以创造性和原创的方式将这些想法融入自己的作品中,例如通过改编、混合或重新诠释这些想法。
在文字素养方面,Megahed 等人认为大型语言模型作为科学作者等各个领域的写作工具非常有用[31],尤其ChatGPT 在辅助师生开展文字创作方面作用显著。(1)开展头脑风暴:根据Nature 的一项调查显示,ChatGPT 在科研用途中最常用于头脑风暴,占比27%,其次是写代码[32],学生可以向ChatGPT 提出各种问题,以拓展研究思路。ChatGPT 能够生成与输入文本相关的无限可能性的文本,为学生提供灵感,激发他们的创造力,帮助他们涌现出新的创意和想法。(2)改进语言表达能力:ChatGPT 可以分析输入的文本,帮助学生改进语言表达能力,提高写作水平。ChatGPT 可以根据上下文和语言习惯生成语句,从而协助学生更好地掌握语言的运用。(3)语言翻译:ChatGPT 目前已经支持超过70 种语言翻译和跨语言搜索[3]。(4)校对和编辑:ChatGPT 能够协助学生校对和编辑他们的作品,自动检查拼写、语法、标点符号和语言规范等方面的错误,并提供有益的反馈和建议,帮助学生进一步完善他们的写作技能。(5)提供参考文献:ChatGPT 能够根据输入的主题或关键词提供相关的参考文献,帮助学生深入研究和了解所写的主题,丰富他们的写作素材。(6)提高写作速度和效率:ChatGPT 可以帮助学生更快地完成写作任务,因为它能自动完成某些任务,例如短语和句子的生成,从而节省时间和精力。同时,ChatGPT 能让学生在没有外界干扰的情况下专注于写作,提高写作效率。
在编程素养方面,ChatGPT 的训练数据集涵盖大量源自Github 的代码,可用于编写代码并提供编程语言相关的知识和概念解释。Nature 的研究人员发现,聊天机器人非常适用于处理小型独立的编程问题,使用ChatGPT 能够完成80%-90%的代码编写任务[33]。ChatGPT在辅助师生编写代码方面也有很大作用。(1)生成代码:ChatGPT 可以根据师生的需求,提供相应的代码,同时支持多种编程语言,如Java、Python、JavaScript、HTML、CSS、C/C++、SQL、Kotlin、PHP 等。(2)代码转换:ChatGPT 能将代码从一种编程语言翻译成另一种语言。比如,巴黎居里研究所的生物物理学家Mathieu Coppey 利用ChatGPT 将MATLAB 代码转换为Python 形式。以往花费数天时间的工作,如今整个过程只需约一小时[34]。(3)代码优化:ChatGPT 能根据特定需求优化代码,协助编写更加优质的代码。(4)代码调试:ChatGPT 能根据师生提供的代码,发现代码中的问题,并提供解决方案。(5)生成样本数据:ChatGPT 能够生成代码运行所需的特定数据,帮助师生更好地测试所编写的代码。
随着技术的不断发展和应用场景的扩展,数字环境中的风险变得越来越复杂和多样化。在数字环境中,许多风险都是通过语言表达来交流传播和扩散的。因此,利用ChatGPT 丰富的自然语言知识,可以分析和理解人类语言的方式,识别数字环境中存在的各种风险,例如诈骗、网络攻击、虚假广告等。
作为一款人工智能语言模型,ChatGPT 可以协助师生意识和提高数字应用风险防范。(1)提供安全教育和培训:ChatGPT 可以作为安全教育的智能导师,为师生提供丰富的安全知识资源,例如网络威胁、网络诈骗、数据隐私保护等,以提高他们对网络安全风险的认知和理解。同时,通过个性化的交互式培训,模拟数字安全方面的危险场景,让师生亲身体验数字环境中的风险和危害,从而教育师生如何避免恶意软件、钓鱼网站、欺诈等攻击方式,以帮助他们更好地应对数字环境中的风险。(2)提高网络安全水平:可以让ChatGPT 成为防御武器库的一部分,用于软件漏洞修复和安全测试。通过学习攻击者的攻击脚本,利用ChatGPT 生成自动化的安全测试脚本,协助进行安全测试和漏洞扫描。通过这些自动化测试脚本可以更快速、更准确地测试网络和系统,发现潜在的安全漏洞。在网络安全渗透测试、漏洞扫描、漏洞赏金计划、风险分析等方面,ChatGPT 的应用将发挥较大作用。(3)指导安全决策:ChatGPT具备分析和解释复杂安全信息的能力,为用户提供决策支持。通过模拟和评估不同安全措施,用户能够更明智地选择适合自身情况的安全策略。
本文探讨了ChatGPT 在数字素养教育应用中的部分内容,这是一项新兴技术,并正在快速发展。如果合理使用并得当利用,ChatGPT能够为师生提供更多的支持和帮助,提高他们的学习和教学效果。图书馆馆员需要进一步探索和挖掘更多的创新应用,以充分利用这一技术的潜力。
随着大型语言模型在数字素养教育中的广泛应用,高校图书馆员的角色愈发关键。虽然这些模型为学习者提供了丰富的资源,但与模型互动时,用户可能面临语言表达难题和需求理解不足等挑战。因此,高校图书馆员需要加强沟通能力,以满足用户需求。他们应了解不同用户的背景和需求,熟悉语言模型的特点和限制,并能够引导用户提出明确问题。其中培训用户使用提示语尤为关键。提示语可以是关键词、短语或句子,起到引导和促进对话的作用[35]。许多人反映,生成式人工智能难以产生出色的文章、诗歌、绘画、音乐、视频等作品,因为输入给人工智能的自然语言提示语质量不高[36]。在与人工智能系统对话时,输入的提示语质量直接决定了生成式人工智能输出结果的品质。通过培养出色的沟通技巧,高校图书馆员可以更好地协助用户挖掘大型语言模型的潜能,帮助用户获取准确、高质量的信息,从而促进数字素养教育的有效发展。
传统数字素养教育主要关注文献检索、综述、数据分析、成果展示、论文写作以及数据库资源的使用。科研人员通常需要花费大量时间和精力来完成这些任务,但如今大型语言模型的出现极大地简化了这些工作。研究表明,使用ChatGPT 可显著改进科学家编写综述文章的过程,加速草拟、构建提纲、添加细节,并提升写作风格,效率和质量[37]。这些大型语言模型通过处理大量数据和文本,能够自动生成文章、总结文献、翻译文章、编写代码等。由于这些技术的创新性和复杂性,现有的数字素养培训通常无法涵盖这些方面。因此,图书馆员有必要重新设计培训课程,以培养学生使用大型语言模型进行论文搜集、概括、翻译、润色及编写代码等能力。
大型语言模型的输出与其训练数据密切相关。在预训练阶段,很可能会引入不准确和带有偏见的内容,缺乏对现实世界的直接观察和经验[38]。这意味着,ChatGPT 无法进行控制实验,难以确定因果关系,呈现出不可靠性,可能误导用户,影响其决策和行为,甚至导致不良后果。此外,ChatGPT 并未探索人脑结构和认知机制。它仍然是一种基于统计学习神经网络的黑箱模型,无法解释其内部工作机制,不适用于严肃的应用。作为图书馆员,还需关注另一问题,即加强用户信息处理能力以应对信息过载。随着大型语言模型输出增加,用户可能面临海量信息的冲击,导致难以筛选和理解有效信息。因此,需要采取措施来协助用户处理这些输出,使其更加高效地获取所需信息,同时避免被误导或淹没在信息中。综上,将大型语言模型用于数字素养教育时,图书馆员需验证输出结果的可信度和可用性,同时增强用户信息处理能力以应对信息过载。
在将大型语言模型应用于学术研究和数字素养教育的过程中,图书馆员首先必须认真关注安全风险问题,这些风险包括恶意文本生成、私人数据泄露、信息收集及产生不道德内容[39],这些风险会对广大用户产生直接而深远的影响。因此,图书馆员有责任了解如何在使用大型语言模型时避免这些风险,采取措施避免对话内容成为模型的训练数据,以提升用户的信息素养和数字安全意识。除了安全风险问题,图书馆员还应关注与学术研究相关的版权问题。大型语言模型以其强大的生成能力为学术研究提供了便利,然而这些内容往往是基于模型对海量数据的学习,可能涉及他人的著作权或其他知识产权。为解决这些版权问题,图书馆员应加强对知识产权法律法规和学术道德的培训,提高对版权问题的认识,并确保严格遵守相关规定,以在学术界树立良好的榜样。
尽管ChatGPT 技术提高了数字素养教育效果,但过度依赖可能导致技术隔离,影响人际互动[40]。在将ChatGPT 技术应用于数字素养教育时,图书馆员需综合考虑教师和技术的角色,以促进学生全面发展。教师不仅传授知识,还需引导学生、激发兴趣,这些机器难以替代。学生若过度依赖机器,盲从答案,将损害认知水平和创造力,影响批判性思维和问题解决能力[41]。因此,图书馆员需要加强学生的批判性和创新性思维教育,引导适度使用模型。此外,培养信息交流能力同样重要。数字素养不仅仅是获取和处理信息的能力,也包括与他人交流、分享和合作的能力。在使用ChatGPT 时,鼓励学生进行小组讨论、合作、演讲,促进交流理解。引导解决实际问题,培养他们运用数字技术和团队合作解决问题能力,提升信息交流和合作的技能。综上,应用ChatGPT需平衡教师和技术。图书馆员引导学生使用ChatGPT 的同时,应重视学生批判性思维、创新能力的培养,同时注重信息交流和合作技能培养。通过综合教育,充分利用技术优势,保持对学生全面发展的关注,为他们未来的成长和学习奠定坚实基础。
随着大型语言模型的出现,信息获取变得更加便捷和准确。这使得我们对数字素养的要求更高了,因此数据素养教育的重点内容也需要不断更新和调整。图书馆馆员需要不断更新自己的知识和技能,以帮助读者更好地应对数字时代的挑战。
在数字素养教育中使用大型语言模型是一个有前途的研究领域。它提供了许多机会来增强学生的学习体验,并支持教师的工作。然而,要充分发挥它们的教育潜力,必须谨慎使用这些模型,并批判性地评估它们的局限性和潜在偏见。因此,将大型语言模型集成到教育中,必须满足严格的隐私、安全、环境、监管和道德要求,并且必须结合持续的人类监控、指导和批判性思维来完成。针对图书馆数字素养教育,未来的研究需要关注有效使用和管理大型语言模型所需要的能力是什么,以及如何培养这些能力。