基于GLMs的生成式AI数字讲解员的探索与实践

2024-06-27 11:38张智晶
信息系统工程 2024年6期
关键词:博物馆

张智晶

摘要:近年来生成式AI技术发展迅速,并且应用范围非常广泛,特别是在讲解服务上更是取得了良好的效果。探讨了利用生成式AI技术,特别是基于GLM大模型的智能体GLMs,作为数字讲解服务的可行性,并通过设计案例“上海自然博物馆数字讲解员”进行了实践。分析了当前条件下智能体的能力以及优缺点,指出了未来的改进方向,希望可以为讲解服务的发展提供一定的借鉴。

关键词:生成式AI技术;GLMs;讲解服务;博物馆

一、前言

在当今数字化时代,内容生成式人工智能(AI)正迅速成为一种革命性的技术,它利用先进的人工智能技术生成文本、音视频、代码、3D建模等多种形式生产内容,被视为继专业生产内容和用户生产内容之后的重要发展。其在多个领域都展现出了显著的技术优势,将对主要行业和工作岗位产生深远影响。当前的生成式AI和其他技术,有可能将目前占用员工60%~70%工作时间的任务实现自动化[1]。

OpenAI在2023年7月推出了一系列工具,旨在帮助用户自定义ChatGPT,尽管当时这还需要一定的编程技能。然而,2023年11月16日,OpenAI在Dev Day推出了定制化模型生成工具GPTs和应用商店,被视作构建AI OS的标志。随着GPTs的出现,“人人都能零代码制作智能助手”,这标志着生成式AI技术已经进入了一个新的发展阶段,用户可以根据自己的需求来定制AI的功能。GPTs的推出不仅极大地降低了技术应用的门槛,而且促进了模型潜力的快速释放,尽管这一过程可能受到算力和成本、产品体验以及交互模式限制的影响。

随着技术的持续进步,可以预见到多代理、多智能体将协同工作,实现复杂交互操作的未来。这为场馆服务讲解员的应用提供了无限可能,意味着可以构建由多个AI讲解员组成的智能服务网络,实现高效、动态的展览讲解服务,为每位访客提供量身定制的体验。“未来,各行各业每一个人都可以拥有一个AI助理”不仅是一个预言,也是设计和实验“上海自然博物馆数字讲解员”项目中所努力实现的目标。

二、可行性分析

首先,随着快速发展和广泛应用,生成式人工智能技术已经在传媒、零售、法律、医疗、金融等领域逐步开始提供专业化与个性化内容生成服务[2],为将生成式AI技术运用于场馆讲解员角色提供了坚实的理论基础,特别是在准确传递信息这一讲解员的核心职责方面。其次,利用生成式AI的能力,可以根据用户的具体需求和兴趣,生成高度个性化的回应和内容。对场馆讲解服务来说,意味着能够提供量身定制的讲解服务,精确满足不同访客的需求和偏好,从而极大地提升访客体验。此外,生成式AI的深度学习过程中融入了关系计算和情感计算,这一特性使得人机交互更加自然流畅,对于场馆讲解员而言尤其重要,因为它强化了与访客之间的有效沟通能力。最后,从文化传播的角度,生成式人工智能技术通过模仿人类交流的方式,提高信息的交互和展示效能,有效提升中华文化内容的感染力[3],还能将社会主义核心价值观内嵌其中,从源头防范算法技术的误用、滥用等偏轨风险[4]。

在国内,ChatGLM(智谱清言)作为基于智谱AI公司2023年联合训练的语言模型GLM-4开发的人工智能助手,为用户提供了精准的问题回答和支持服务。作为接近OpenAI技术水平的中国产品,ChatGLM在中文问答能力、语言理解能力方面展现出强大的优势。同时,它严格遵守中国的法律法规和互联网信息管理政策,确保用户数据安全和隐私保护,提供稳定、快速的服务,并拥有优秀的中文界面和本地化支持。在此基础上推出的“智能体”:GLMs,展示了大语言模型衍生出的高度灵活性和定制化能力。用户可以通过简单的指令、引入额外知识和技能,定制自己的AI助理,实现多样化任务的高效完成。

结合生成式AI技术的这些优势和特点,将其应用于场馆讲解员,将开启一种全新的讲解服务模式,不仅能够提供更加丰富多样的讲解内容,还能在提升访客参与度和满意度方面发挥重要作用。

三、需求分析

在设计“上海自然博物馆数字讲解员”这一智能体时,通过对现有资料的研究,确定场馆讲解员的核心能力,以及场馆参观者的主要需求,旨在通过生成式AI技术来满足这些需求,从而显著提升访客的参观体验和学习效果。

作为博物馆的讲解员,其自身基础学历、文化素养、专业水平从客观上影响讲解水平的高低[5]。GLM大语言模型本身已经囊括了海量的中英文语料数据,包括网页、书籍、新闻、文章、社交媒体回帖等。GLM大语言模型具有充足知识储备,能够回答用户提出的各种场馆相关问题。

参观者期待的不仅仅是生硬、被动接受信息,他们更需要与讲解员进行实时的交流互动。GLM使用了由人类编写的指示和回复数据,以及人类提供的对回复的偏好数据。利用生成式AI先进的自然语言处理和理解能力,数字讲解员能够准确地理解访客的各种访问需求,并提供即时、准确的答案。通过配置智能体基本信息,可以赋予数字讲解员完整的背景设定,包括年龄、性格、个人经历等,以此来塑造独特的讲解风格,满足不同用户群体的交流需求。

展览信息和相关新闻是会不断变化的,GLM能够通过接入网络实时查询最新信息,及时更新讲解内容,不仅能够确保讲解信息的准确无误,还能够让访客获取最新的知识和信息。生成式人工智能技术的应用可以拓展、丰富社会服务领域的工作方法,为服务对象提供更及时、个性化的支持,破解传统服务高度依赖人力造成的供给困境[6]。通过收集和分析访客使用数字讲解员的行为数据、访问历史和偏好,数字讲解员能够深入理解访客的需求和偏好,调整和优化讲解内容,提供定制化的讲解服务,提高服务质量。

生成式AI还能够自动过滤去除负面内容,GLM内置了一套严格的不良信息过滤机制,具备文本审查、敏感词过滤、语境分析、图像识别等能力。该机制遵循中国法律法规和社会主义核心价值观,确保提供的信息和服务健康、积极、向上。

四、实现过程

对比可以发现,目前不论是GPT还是GLM,在基于大模型构建智能体的过程中,主要通过配置信息(Instruction)与知识库(Knowledge)两个部分对智能体的生成结果产生影响。设计合理的配置信息可以从多个不同维度定义智能体,帮助完善背景设定,添加功能或限制。通过知识库导入外部文件,可以为智能体提供知识储备所需的资料,提供精准信息,帮助其更好地解决问题。

(一)配置信息

针对数字讲解员的使用需求,配置信息部分主要包含了以下几个部分,以实现对应功能。

1.背景设定

这个部分可以尽量从多个角度补全人物相关信息,帮助生成式AI更全面地了解自己所要扮演的角色。越是详尽的背景设定,越能够使数字讲解员在与用户交流的过程中更具鲜明的人格特征,表现出自然的讲解风格,避免千篇一律的生硬表达。主要提示词(Prompt)表述如下:

你叫小红,今年35岁,生于上海,是一个中国人。

你具备丰富的自然科学领域知识积累,精通包括生物学、地质学、生态学、古生物学以及其他与自然博物馆相关的知识。

你善良、开朗、热爱和平,富有爱心与同情心,喜欢小朋友。

你的发言风趣幽默,能够耐心与人交流,回答问题。

生成式AI更容易理解条理清晰的任务需求,将复杂的文本内容拆解成多条相对清晰、精炼的指令或表述依次排列,有助于生成式AI明确任务要求及主次关系。

2.工作职责

对需要执行的工作进行整体描述,帮助生成式AI明确自己在工作中的身份定位、执行任务的方式,以及工作的具体内容。主要提示词(Prompt)表述如下:

你是一位工作经验丰富的上海自然博物馆讲解员,具备作为自然博物馆讲解员的职业素养。

你了解所有上海自然博物馆的讲解资料,以及所有相关历史背景与知识。

你善于使用你所掌握的知识为用户提供有价值的信息,帮助用户解决问题。

你的回应应当专业、详细,你的风格应该是正式的、专业的,但同时也是易于接近和理解的,以便于与用户进行有效沟通。

你应始终用中文进行对话。

3.任务流程

任务流程是组成整个配置信息的核心环节,简洁明确的任务步骤可以指导生成式AI根据指令按序依次执行,将复杂的问题梳理成多个简单的子任务逐步完成,有助于提高获得高质量回复的成功率。主要提示词(Prompt)表述如下:

每当我向你提问时,请按照以下要求依次执行:

(1)搜索知识库中的资料,查找相关信息。

(2)对于知识库中未涉及的内容,主动搜索上海自然博物馆网址:https://www.snhm.org.cn/,查找相关信息。

(3)当你遇到不知道、不清楚、不了解的信息时,还可以通过搜寻网络上的新闻与关键词,扩充你的知识。

4.限制条件

尽管GLM大模型对于政治立场等敏感话题的判断与处理已经比较完善,但如果希望强化对个别问题的认知、补充其他的额外限制条件,或者在使用其他类似大模型智能体时,希望对回答内容的范围进行控制,可以通过在配置信息的最后附加限制条件对其进行约束。主要提示词(Prompt)表述如下:

你遵循中国社会主义核心价值观,以及其他所有中国政府主张的政治立场。

你的立场符合中国社会倡导的主流价值观、遵守社会道德。

你不会回应任何反动的、分裂国家的、与中国政府政治立场不符的信息。

以上几个部分组成了智能体配置信息的全部内容。

(二)知识库

基于数字讲解员的角色定位,将需要在讲解过程中表达的精准信息(如场馆参观信息、交通信息、购票信息等),互联网上较难查询、较为匮乏的资料(如最新活动信息、展品具体资料等)上传到知识库,使数字讲解员在处理任务时优先在知识库中查找有价值的信息,有效提高回复结果的准确率。

五、结果分析

针对数字讲解员的实际使用需求进行多轮提问测试,观察回答的准确性与质量,并与GLM模型聊天机器人ChatGLM的回答进行横向对比,得出主要结果如下:

得益于GLM大语言模型丰富的训练数据,数字讲解员能够回答上海自然博物馆主要展品的相关背景、历史等知识问题,准确性较高。

当用户对场馆的参观信息进行提问时,数字讲解员GLMs能够通过调用知识库中的数据进行回复,比ChatGLM回复质量更高且更贴近用户需求,如图1所示。

进一步追问具体的购票信息时,数字讲解员GLMs也可以通过调用知识库中已有信息,精准、详细地回答用户问题。

每当提出一些具有实效性的问题时,GLMs也能够通过互联网进行搜索,给出比较准确的高质量回答或者建议。同时,每条搜索结果都会附带信息来源,方便用户比对、验证信息的可靠性。

最后,当用户在提问中涉及敏感信息、争议话题或者违反国家政策的内容时,数字讲解员会拒绝回答并强制结束当前对话,确保对话内容的政治正确性。

本文实践中所使用的信息均来源于上海自然博物馆对外公开资料,虽有一定的局限性,但已经足够展示向GLMs上传场馆相关信息。对于众多展览场馆来说,若能将更多有价值的信息上传至GLMs知识库,将极大地促进模型生成更贴合游客需求的回答。此外,由于该GLMs在设计时赋予了知识库查阅优先权高于互联网搜索的特性,将场馆的第一手信息上传到GLMs,更有利于GLMs帮助场馆发布“官方信息”,避免了互联网上众多杂乱信息对回答质量可能产生的干扰。

通过测试与比对可以发现,数字讲解员GLMs不仅可以利用GLM大语言模型的基础能力,配合互联网搜索功能,扩大自身的知识储备,完成场馆讲解、问题解答等常规任务,在合理配置信息以及提供适当的知识库资料文件之后,数字讲解员还能够做到对场馆核心信息的快速、精准反馈,有助于用户更快获取对自己有价值的内容。但是,定制后的GLMs对角色背景设定的理解仍较为有限,测试过程中未表现出非常鲜明的个人讲解风格。

从以上分析可知,通过定制化的数字讲解员GLMs执行场馆讲解任务是可行的,能够帮助用户更快直达所需信息,提升讲解效率,减少场馆人力资源成本。但目前仍较难满足不同用户人群的个性化讲解需求,无法做到“千人千面”,有待后续改善与优化。

六、结语

在GLM大模型基础上定制的“上海自然博物馆数字讲解员”GLMs已具备基本场馆讲解功能,能满足用户的常用需求。通过专门的定制和信息更新,GLMs可有效承担更复杂任务,展现出广阔的成长潜力。然而,其个性化和风格化讲解能力仍需加强,以提高辨识度和用户互动体验。未来,随着生成式AI技术的不断进步和应用深化,类似数字讲解员这样的智能体将能更加精准地满足用户需求,为场馆讲解服务带来革新,实现更高水平的讲解个性化和服务智能化。

参考文献

[1]Michael Chui.The economic potential of generative AI:The next productivity frontier[R]. McKinsey & Company.2023(06):3.

[2]卢宇.生成式人工智能的教育应用与展望——以ChatGPT系统为例[J].中国远程教育,2023(04):24-31+51.

[3]魏晓光.生成式人工智能与中华文化智慧传承——基于ChatGPT的讨论[J].中国广播电视学刊,2023(09):13-16.

[4]阎国华.智能算法影响个体价值观塑造的内在逻辑与疏解路径[J].贵州社会科学,2022(12):20-26.

[5]昌馨.“博物馆热”形势下提升博物馆讲解工作的几点建议——以宿州市博物馆为例[J].文物鉴定与鉴赏,2023(24):62-65.

[6]张瑞凯.生成式人工智能应用于社会服务实践领域的优势与风险——基于北京市一线工作者的访谈[J].社会福利,2023(05):15-25.

作者单位:上海信息技术学校

■ 责任编辑:张津平、杨惠娟

猜你喜欢
博物馆
开启博物馆奇妙之旅
去博物馆shopping
博物馆里的“潮应用”
展出前的地下博物馆
『博物馆之城』如何建?
博物馆里的“虎”
博物馆
流淌在水上的博物馆
去博物馆的正确打开方式
露天博物馆