摘要:通过对AIGC发展历程的分析,探讨人工智能生成内容对于科研信息服务冲击的理论基础。AIGC促进科研信息服务内容、服务途径和服务模式逐渐升级迭代,完成信息服务方式从被动到互动、服务内容从常规到精准、服务场景从单一到多元的发展,从而加速了交互型智慧咨询、知识型报告生成服务、即时型的文献传递服务、多场景型的科研信息服务在图书馆的应用实践的进程。
关键词:AIGC;人工智能;ChatGPT;科研信息服务
中图分类号:G201文献标识码:A
人工智能时代,数字世界与现实世界的深度融合催生了数字生成内容的技术要素,各种AIGC工具应运而生。2023年11月7日,OpenAI宣称公司的人工智能生成工具ChatGPT的周活用户数达到1亿人,有200万开发者正在使用OpenAI的API,92%的财富500强公司正在使用OpenAI的产品搭建服务[1]。国内互联网及企业科研机构也加入其中,陆续推出了各自的AIGC工具,例如百度公司的文心一言,科大讯飞的讯飞星火及清华大学的ChatGLM等。AIGC在人机交互、音乐及文案创作的优异表现,使它以迅雷不及掩耳之势进入智慧科研、智慧教育及金融等领域,科研信息服务领域也不例外,如何利用这个智慧型工具,追踪科研前沿动态,构建具有全球视野、多场景模拟和深度知识服务的信息服务平台,是信息咨询服务工作者应该认真思考的问题。
目前,高校图书馆界已经开始关注AIGC对于图书馆智慧化建设的研究,例如武汉大学龚芙蓉采取实证研究,分析AIGC工具对学生高阶思维与情感价值的影响[2]。安徽大学管理学院储节旺等认为应该在信息检索、参考咨询、阅读推广、特殊全体服务等方面加速AIGC的应用[3]。上海图书馆郭利敏等认为AIGC可以在资源加工、馆员助理、智慧检索和综合应用上助力图书馆服务[4]。综上所述,图书馆界对于AIGC助力图书馆的研究较多,专注于某一领域相对较少,特别是从研究AIGC在科研信息服务的文献屈指可数。本文从AIGC的技术发展历程,研究其对于科研信息服务的冲击和影响,并通过具体的应用场景进行阐述。
1人工智能生成内容的发展历程
人工智能(ArtificialIntelligence)是计算机科学的一个分支,是研究开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学[5],发展历程可以追溯到20世纪50年代的。
AI诞生阶段(1950—1956),人工智能之父艾伦·图灵,在1950年发表的论文《计算机器与智能》中提出了图灵测试。1956年,美国科学家约翰·麦卡锡和克劳德·香农等科学家,召开了达特茅斯会议,将机器模拟人类智能的新学科定义为人工智能,1956年也被公认为人工智能诞生元年。
起步发展阶段(1958—2006),随着卡耐基梅隆大学开发了XCON专家系统、人工神经网络技术的发展,实现了语音识别的突破,但是识别效果不佳。随后统计学模型的引入,有效地提高了语音识别的准确率,但是计算机运算能力严重不足,缺乏常识性的数据储备,人机互动效果不佳。
稳步发展阶段(2006—2014),2006年,李飞飞教授意识到了“数据”的重要性,于是开始构建大型图像数据集—ImageNet。随着计算机运算能力指数级别增长,搜索引擎、新媒体、电子应用产生海量数据,推动了人工智能的进一步发展,能够进行语音识别、翻译及内容的简单生成。
快速发展阶段(2014—2021),2014年,聊天程序“尤金·古斯特曼”在英国皇家学会举行的“2014图灵测试”大会上,首次“通过”了图灵测试。随着云计算和物联网等信息技术的飞速发展,泛在感知数据和图形处理器等计算平台推动了以深度学习神经网络的飞速发展,如语音识别及图像识别等应用技术实现了重大突破。
蓬勃发展阶段(2021至今),2021年,OpenAI提出DALL·E和CLIP。DALL·E两个新的神经网络,CLIP则能够完成图像与文本类别的匹配,并在2022年11月30日发布了ChatGPT,使用了Transformer神经网络架构,拥有语言理解和文本生成能力,可以自主生成原创音乐、创作文案、视频、编写程序,与人类进行多场景的交流互动。
人工智能经历70多年技术嬗变,历经3次高潮低谷,终于磨砺成珠,AIGC产品的产生,使得人工智能完成从传统知识型向智慧型人工智能的转变。
2AIGC视域下对科研信息服务的冲击
在人类文明发展的历史长河中,每一次技术创新,必将引起生产方式的巨大变革,促进生产关系加速转型。在信息知识生产内容快速增长的视域下,信息爆炸式增长,快速影响着图书馆的信息服务工作,使图书馆的信息服务内容、服务途径和服务模式逐渐升级迭代,完成信息服务方式从被动到互动、服务内容从常规到精准、服务场景从单一到多元的发展,从而达到信息服务专业化、即时化、立体化和多语言化的服务效果。
2.1服务方式从被动到互动
传统的信息服务以文献资源为核心,从信息服务内容上主要是PDG有专业的内容创作者或团队进行创作、编辑和发布的内容,如图书馆信息部门发布的纸质文献、电子资源等,用户主要是被动地接受文献信息。随着社交媒体的盛行,UGC是指用户生成内容应运而生,它由普通用户或受众群体参与创作、编辑和发布的内容,如博客、知乎等,提倡知识共享共建,用户的参与度大幅度提升,但是单方面参与,互动效果差强人意。AIGC创作者是人工智能程序,通过与用户的互动,高效地获取用户需求,快速产生智能问答、论文及原创音乐等,促进个性化信息知识互动服务。随着人机互动频率的增加,可以促进自然人和机器本身的共同发展,能够比单人或者单机的思考,更具创新性和全面性。
2.2服务内容从常规到精准
随着科研数据密集化,学科知识融合化及复杂化的趋势,对与信息服务工作者学科知识的宽度及深度有了更高的要求,而常规的信息服务内容的专业性及精准性相对不足,已经无法满足用户的需求。常规的信息服务多是依托馆内资源,进行简单资源提供查找服务,例如文献传递、参考咨询及信息素养讲座等,而对于学科知识的精准知识服务相对较少。究其原因在于服务人员专业知识与高校科研工作者来比相差较远,信息服务馆员受制于学科背景及学历层次,难以进行全学科的、专业的知识服务。而AIGC的各种应用则可以弥补馆员专业知识储备的不足。2023年12月7日,谷歌正式发布的多模态人工智能AIGC模型Gemini1.0系列,在MMLU(大规模多任务语言理解)测试上得分高达90.0%,即数学、物理、法律等57个领域测试中,GeminiUltra成为第一个超越人类专家水平的AI模型[6]。AIGC打破学科行业壁垒,为信息服务专业化、精准化、跨学科化提供了可能性,信息服务馆员,可以利用AIGC的优势根据用户的科研需求,提供专业精准的信息服务。
2.3服务场景从单一到多元
数字化时代,用户的需求更加多元化,如论文写作、项目申请、课件制作、旅行工作及语言学习不同的场景需要不同的信息需求。传统的信息服务多为单一场景服务,用户单一或者多人,但是信息服务内容多为同一类型。不但场景单一、服务单一,并且信息服务容易受到时间、空间及人员限制,极大地阻碍了信息服务的开展。AIGC卓越的知识生成能力,能协助论文撰写、智能搜索、生成原创音乐及视频等多模态、多场景的应用,促进了信息服务场景的多元化扩展。不但如此,人工智能虚拟人技术的发展,可以使虚拟人真实化,可以给用户创造更真实的服务体验。
3AIGC视域下图书馆科研精准信息服务的应用场景
AIGC是建立在多模态之上的人工智能技术,它不仅影响了信息服务的服务方式、服务内容和服务场景,而且加速了高校图书馆科研信息服务模式的转变。结合图书馆现有信息服务现状,本文主要从交互式智慧咨询、知识型报告生成服务、即时型的文献传递服务、多场景型的科研信息服务等四个方面探讨AIGC在图书馆的应用。
3.1交互型智慧咨询服务
传统的信息咨询以人工咨询、电话咨询、QQ及微信咨询等方式进行,咨询范围较为单一,咨询内容相对简单,咨询时间相对局限。近几年有些高校图书馆引入了智能机器人咨询,如2021年5月,清华大信息服务对话机器人“清小图”可以自动应答关于图书借还、电子资源、座位预约等问题。还有南京大学的“图宝在线”,服务内容不但涉及图书馆相关咨询,更扩充至生活领域如“查汇率”“查快递等”,但是智能咨询效果差强人意。而AIGC的出现正好弥补了传统信息咨询的不足,以前的对话机器人的知识储备、理解能力,交互性更加优越。以Gemini1.0为例,其支持文本、图像、视频、音频及代码等任意形态的输入,具备复杂的多模态对话、多语言对话、可视化翻译及严密的逻辑推理能力。高校图书馆可以借助Gemini1.0,为高校科研工作者提供科研咨询、学科动态及课件制作等咨询服务,并且支持多轮对话及错误反馈,极大地满足了用户的信息需求。
3.2智能型报告生成服务
信息咨询部门的查收查引、科技查新服务,作为信息部门的常规工作,占用了信息服务人员大量的工作时间和精力。在用户进行项目评奖及职称评审时,往往时间要求紧迫,大量用户排队的情况时有发生。为了解决这种日益增长的查收查引需求和工作人员偏少、工作时间偏短的矛盾,可以利用AIGC创建智能程序,自助生成检索报告,并且是由电子印章,可以大量节约用户及服务方的时间和精力。而科技查新更需要大量的阅读,对比中外文数据库如Elsevier、PQDT等数据库将近40个数据库,涉及期刊论文、会议论文、专利及标准等各种文献类型,工作繁杂,时间紧迫。以Gemini1.0为例,它具有阅读、过滤以及理解信息,从数十万份文件中提取见解的卓越能力,并且具有多语言能力,特别适合做文献的抽取和对比,把AIGC引入科技查新服务,可以快速缩短文献检索阅读及比对时间,极大提高科技查新的效率。
3.3即时型的文献传递服务
文献传递受高校数据库的学科类别及数量限制,高校科研工作者经常需要进行文献传递服务。从最初的馆际互传及平台的邮箱传递,传递时间为3~15天,到后来的QQ、微信等新媒体工具传递,速度明显加快,响应时间缩短至2~10分钟,用户满意度得到了提升。但是毕竟是人工服务,工作时间为早上8:00至晚上10:00,无法做到科研时间全覆盖。学术资源文献传递与互助平台应运而生,如郑州轻工业大学的SPIS,覆盖国内外主要全文数据库,用户可以直接下载,但是其文献数量还是会有不足,缺乏人工服务。利用人工智能生成工具打造虚拟文献传递人员作为补充,对于一些平台缺少文献进行跨平台补充式检索,或者是相关文献推荐,尽可能地满足用户的文献需求。
3.4多场景的科研信息服务
高校科研工作者承担着不同身份,如教师、项目负责人、科研管理者和决策者等,面对不同的信息服务场景。信息化时代,面对纷繁复杂的海量文献、日益迫切的科研进程压力,繁杂的教学事务、对科研工作者的工作效率有了极高的要求。需要文献的快速阅读能力、创新的实验设计能力、多种类型文献的制作能力,这些都离不开信息资源阅读和整理。Gemini1.0,卓越的文献阅读能力,可以极大程度提高科研工作者的阅读能力,达到科研辅助的作用。其次,AIGC可以根据提示词,依托数字化的资源,按照科研工作者的构思和目标提供不同的实验及论文思路,促进用户进行创新性思考。
结语
AIGC作为一种新型的内容知识方式为人工智能的技术创新带来了新的范例,也加速了信息服务业的变革与转型[7]。但是AIGC的不足与风险也不应该被我们所忽略和轻视。这些问题体现在:第一,数据的局限性,各个数据库商、搜索引擎及新媒体视频网站的数据往往具有商业壁垒。大语言模型关键需要大量数据训练,数据的质量及数量的限制会影响模型逻辑思维能力的构建,从而造成生成结论的偏差。第二,受生成内容工具公司制作人员的社会意识形态、传统习惯及知识储备的影响,生成内容往往体现不同的中西方文化的偏差。第三,内容同质化,如何界定知识产权保护问题。虽然用户需求千差万别,但是大规模的普及应用难免会出现创作内容相同的情况,相同内容被不同人员使用,知识产权如何界定也是一个值得探讨的问题。因此,图书馆信息馆员使用AIGC工具时,应该遵循信息道德,合理有效利用扬长避短,更好地进行科研信息服务。
参考文献:
[1]江月.OpenAI升级GPT大模型软件开发者迎“iPhone时刻”[N].21世纪经济报道,20231108(003).
[2]龚芙蓉.ChatGPT类生成式AI对高校图书馆数字素养教育的影响探析[J].图书情报知识,2023,40(05):97106+156.
[3]储节旺,杜秀秀,李佳轩.人工智能生成内容对智慧图书馆服务的冲击及应用展望[J].情报理论与实践,2023,46(05):613.
[4]郭利敏,付雅明.以大语言模型构建智慧图书馆:框架和未来[J].图书馆杂志,2023,42(11):2230+133.
[5]周志敏,纪爱华.人工智能[M].人民邮电出版社,2017.
[6]张梦然.谷歌发布最新人工智能模型Gemini[N].科技日报,20231208(004).
[7]朱富霖,章东旭.基于新型智能算法的多自由度机器人控制系统研究[J].轻工科技,2024,40(01):8789+97.
项目:本文系2017年度河南省社会科学规划项目“基于知识转移的产学研协同创新项目研究”阶段性研究成果之一(项目编号:2017SZH011);2023年度河南省图书情报研究项目“数智化场景下高校精准信息服务体系研究”阶段性研究成果之一(项目编号:HNTQL2023159)
作者简介:郑书娟(1981—),女,汉族,河南新郑人,硕士研究生,馆员,研究方向:科研信息服务。