刘岚芬
摘 要AIGC时代的发展正促进图书馆服务进行范式转变,ChatGPT等AI模型影响着企业竞争情报获取的方式,也为图书馆创新企业竞争情报服务提供了科技支撑。论文通过系统梳理ChatGPT发展历程、技术特点,分析国内ChatGPT技术布局及应用场景,总结 ChatGPT对图书馆企业竞争情报服务产生的影响,带来的问题,并提出图书馆可以从夯实资源建设、支持NLP模型嵌入、完善交互机制、开发智能情报平台四个方面提升企业竞争情报服务效能,助力ChatGPT 赋能图书馆服务的落地应用。。
关键词 ChatGPT;大规模语言模型;企业竞争情报服务;图书馆
分类号 G259.339
DOI 10.16810/j.cnki.1672-514X.2023.10.009
Enlightenment and Reflection of ChatGPT on Competitive Intelligence Service of Library Enterprises
Liu Lanfen
Abstract The development of the AIGC era is promoting the paradigm shift of library services, and AI models such as ChatGPT affect the way enterprises obtain competitive intelligence, and also provide scientific and technological support for libraries to innovate enterprise competitive intelligence services. By systematically sorting out the development history and technical characteristics of ChatGPT, this paper analyzes the layout and application scenarios of domestic ChatGPT technology, summarizes the impact of ChatGPT on the competitive intelligence services of library enterprises and the problems brought about, and proposes that libraries can improve the efficiency of enterprise competitive intelligence services from four aspects: consolidating resource construction, supporting NLP model embedding, improving interaction mechanisms, and developing intelligent intelligence platforms, so as to help ChatGPT empower the landing application of library services.
Keywords ChatGPT. Large-scale language models. Enterprise competitive intelligence services. Library.
0 引言
2022年是人工智能生成內容迅速发展的关键时期。随着人工智能技术的快速发展演进,人们对于数字内容的需求不断趋向综合化、多元化、个性化和智能化,以 ChatGPT[1]、Apprentice Bard[2]等为代表的AI智能对话工具也就应运而生。其中,ChatGPT更是火爆全网,助推咨询服务、教育培训、科技产业、数字文创、程序设计等行业获得全新的技术支撑。
企业竞争情报服务是图书馆基于自身馆藏资源、数据库资源和专业情报部门成员,使用现代化的信息技术向企业用户提供关于市场竞争环境、竞争对手及竞争策略的情报服务[3]。在企业竞争情报服务的场景中,ChatGPT即时高效的信息获取、文本处理能力,以及可对外提供智能问答、数据整合、内容生成等方面的服务功能,让企业竞争情报服务中的数据组织管理、商业信息检索、竞争情报研究分析、市场监测评估等核心职能和主体业务面临着一定的挑战。为此,笔者结合ChatGPT的发展历程、带来的影响等进行总结分析,并提出ChatGPT等人工智能应用的发展对图书馆企业竞争情报服务的思考与启示,以期为ChatGPT等AI工具的中国本土化以及图书馆服务迈向智能化提供必要的借鉴和参考。
1 ChatGPT概述
1.1 ChatGPT概念
ChatGPT(Chat Generative Pre-trained Transformer),也称聊天生成预训练模型。目前学界对于ChatGPT的概念表述尚未形成定论,但内涵趋向一致。Van Dis等从ChatGPT基于TB级文本语料数据进行自主预训练的过程着手得出ChatGPT为大规模语言模型[4]。焦立涛也基于ChatGPT的深度学习、人工反馈及大规模语料训练等底层技术指出其为专注对话的AI模型[5]。Taecharungroj聚焦ChatGPT突出的智能对话功能,得出ChatGPT是对话AI系统组不断发展下的最新产物的结论[6]。蒋华林通过研究ChatGPT强大的人机交互功能得出ChatGPT同样是具有智能AI文本生成及文献爬取功能的先进工具[7]。李荣等关注ChatGPT相较于历代GPT模型较为成熟的人类反馈强化学习(RLHF)技术,指出ChatGPT是出色的学习型文本生成对话人工智能机器人[8]。
1.2 ChatGPT发展现状
ChatGPT是由OpenAI推出的一种基于深度学习的自然语言处理模型。其发展历程如表1所示。ChatGPT开发历程可以追溯到2018年,当时OpenAI推出了第一代GPT模型,即基于Transformer架构的自然语言处理模型。在之后的几年中,OpenAI先后推出GPT-2、GPT-3、ChatGPT及GPT-4,版本的变革带来的是训练语料规模的不断扩大、质量的持续攀升、模型容量的显著扩充以及模型参数的实时优化,从而实现了GPT模型从简单的文本生成产品成长为能够根据大规模语料训练和反馈学习完成各种NLP任务的智能语言模型这一“复利效应”成就。这也助力“人工智能飓风”在AIGC时代到达一个新高潮。
AIGC时代,ChatGPT技术在全球范围内获得了如火如荼的普及发展,国内众多科技企业也加入了这场群雄逐鹿的ChatGPT技术布局战役。科技企业主要以构建AI大模型为手段开发智能AI产品,其应用场景涉及广泛,如软件嵌入、智能企业、AI客服等。同时,国内科技企业在ChatGPT技术领域的开发研究中也呈现出百花齐放却又趋向协作的姿态。其中,百度[9]基于搜索引擎业务,通过大数据和人工智能技术开发了文化大模型,用于知识服务产业应用、社会发展等领域;阿里巴巴基于云计算布局,推出了通义大模型,加强电商行业的服务提升;华为深耕技术架构,打造了盘古大模型,主要面向于工业人工智能领域;此外,腾讯、360、讯飞、京东等也各自擅长的领域,研发相关大模型。但目前国内尚未出现图书馆引入ChatGPT技术产品的案例。
1.3 ChatGPT与图书馆服务
ChatGPT也引起了国内外图情学界的广泛关注。李书宁等通过调研图书馆对ChatGPT的应用情况提出其可以助力图书馆业务效率提升和馆员成长、智能咨询系统建设、知识服务深入开展和各类检索系统体验改善[10]。郭亚军等根据 ChatGPT 特有的启发性内容生成能力、对话情景理解能力、序列任务执行能力以及程序语言解析能力总结了ChatGPT 赋能下图书馆智慧服务的应用场景[11]。赵瑞雪等立足图书馆智能知识服务的发展,鼓励图书馆积极将ChatGPT等人工智能模型引入检索系统[12]。Chen指出ChatGPT可以嵌入图书馆系统馆藏检索平台,从而优化馆藏检索效果,提高检索效率及查准率[13]。Subaveerapandiyan等通过对网络群体、学者群体和图情机构工作人员进行调研发现他们都具有接受ChatGPT等AI服务的意愿[14]。目前大多数学者主要从ChatGPT的功能特色着手研究,在智慧场景、知识服务、风险挑战等方面进行探索,鲜有研究探讨ChatGPT对于图书馆企业竞争情报服务的相关性等问题。
2 ChatGPT对图书馆企业竞争情报服务影响
ChatGPT 作为AIGC时代的典型产品,其在执行NLP任务和生成文本等方面的突破性能力、情景交互能力、序列任务完成能力以及程序语言运用能力,都能不断完善图书馆企业竞争情报服务的信息获取、情报分析及个性化服务等问题。从现实和积极的角度看,这对于提升图书馆企业竞争情报的搜集与处理效率方面的确表现出促进的作用。
2.1 情报获取:从信息检索到智慧问答
目前,图书馆企业竞争情報服务的在信息获取方面主要依靠传统信息检索方式,通过对庞杂的、多样的行业报告、市场数据、竞争对手信息进行组织著录,再配合搜索引擎利用关键词匹配检索结果,实现对海量竞争情报的检索获取服务。ChatGPT借助其理解上下文的情景交互特色功能和基于深度学习构建而成的大规模知识网络,能够从语义层面理解数据内容,支持多轮长对话,自我更新、接受反馈、敢于质疑,识别细粒度知识元,综合内容观点,从而为企业用户提供专业参考咨询、行业数据汇总、专利查新、市场报告智能生成等更加智能化的自然语义问答服务,推动传统信息检索方式向智慧问答方式转变。
新加坡国立图书馆利用 ChatGPT 技术完善了一款名为 "Ask Jamie" 的智能问答系统,为企业提供一站式服务,实现服务智能化升级。企业用户可以在该系统中提出各种问题,例如市场情况、竞争对手产品信息、商业计划等,系统通过 ChatGPT 技术对问题进行分析,并返回相应的答案和建议。该系统一经推出便收获一众好评,其不仅提高了企业获取竞争情报的效率和准确性,也降低了成本和时间开销。
2.2 情报分析:从专家分析到大规模智能分析
竞争情报分析过程包括问题界定、情报源梳理、数据准备、关键信息提取、统计分析、观点提炼以及报告撰写等一系列复杂工作。当前,图书馆的情报分析更多的是沿袭传统手段,凭借专业馆员进行人工操作。但随着企业用户需求类型的多样化和个性化,图书馆所提供的情报服务已经不能满足用户实时变化的需求。
ChatGPT 等人工智能技术已具有观点提炼、内容综述、场景问答、语言翻译、语义分析、智能推荐、辅助决策的潜在能力。首先,ChatGPT 强大的自然语言处理与生成能力,可部分替代情报人员的预处理工作,比如信息的跨语种互译、自动化文本分类与标注、实体关系识别与分析、简单的数据统计分析及可视化展示等。其次,ChatGPT在文本、图像、视频之间的跨模态生成功能帮助图书馆建立馆藏结构性和非结构性数据之间的关联,并建立文本、图像与视频之间的关联。ChatGPT依靠深度学习机制可以对非结构性数据的内容进行描述,使得图书馆资源描述从表面信息组织方式转变到语义内容组织方式,并通过对现有数据的重新聚类,自动形成主题化、专题化的分类。除此之外,ChatGPT 的自动生成摘要、综述、文案、报告撰写与润色等功能,为企业用户提供解决问题的答案和增值服务。这些都推动着图书馆企业竞争情报服务的升级。可以为情报分析人员提供智能化工具,辅助竞争情报分析工作。
2.3 个性化服务:从传统画像到智能生成
传统企业竞争情报服务囿于人力,往往无法做到对广大企业用户群体进行精确画像,服务效果相对较差。并且随着企业用户情报内容及类型的需求趋向个性化和多样化,传统企业竞争情报服务呈现出发展滞后状况。ChatGPT 作为AIGC时代现象级产品,其开发公司OpenAI 保持开源态势,为使用者提供诸多集成应用路径,其中就包括能够帮助创建用户画像的API 标准接口和自建模型等路径。图书馆可以借用RESTful API 接口或Python API 接口将ChatGPT模型接入企业竞争情报服务系统[15]。除此以外, OpenAI 同样开放了用于处理包含语义检索和文本分类等自然语言任务的GPT-3接口、用于进行自然语言智能翻译的Codex接口和用于建立画像的DALL·E的接口[16],图书馆借助以上API接口将对应的模型植入企业竞争情报系统,便可以根据企业用户的所处行业情况、情报浏览记录、数据检索记录等内容,识别企业用户的情报类型偏好、情报内容需求和潜在需求,将企业用户数据与需求进行关联,自动生成企业竞争情报画像。
在接入ChatGPT模型后,图书馆可以将ChatGPT的预训练模型保存至本地,借助TensorFlow、PyTorch等深度学习框架帮助ChatGPT进行企业竞争情报检索需求的处理。它能够根据所学习的关键词和条件,自动从各种渠道采集竞争情报数据,并对数据进行自动化处理和分析,对所处行业报表数据、专利查新报告、市场政策改动、主要竞争对手的市场策略、产品和服务特点等情报内容进行聚类组织,生成符合企业情报需求的可视化数据内容,为企业用户提供情报数据和文本。这极大减轻了人工采集和处理的工作负担,缓解了情报服务部门的报告生成压力。
3 ChatGPT应用存在的问题
ChatGPT 等 AIGC 技术助力图书馆企业竞争情报服务专业化程度的提升,促进图书馆智慧服务场景的完善发展。但ChatGPT作为一项仍在不断进行开发完善的产品,其目前存在的技术漏洞也是其无法全面介入情报服务工作一大原因。因此,图书馆应以更加客观、谨慎的态度对 ChatGPT 的带来的问题加以审视。
3.1 数据可靠性问题
ChatGPT的数据来源是预训练的大规模文本语料以及少部分的人类监督学习所得,文本语料数据来源纷繁复杂,数据本身可能存在偏差,质量良莠不齐。在模型强化学习时期,如若训练数据中缺少问题的标准答案,那么模型就会按照既定规则拒绝回答用户或者采用模糊的答案进行反馈。因此,如果图书馆提供的商业数据语料、商业数据库链接、网络信息来源出现偏差,就会导致模型在竞争情报服务过程中出现输出数据完整性、时效性无法保证的情况,影响企业用户的情报研判。
3.2 信息安全性问题
ChatGPT内置的情景交互功能使其能够根据用户对话的上下文语义生成符合用户需求的表格、文本数据,即便ChatGPT内置了诸多如差分隐私、 加密通信等的隐私保护技术,但也暗含商业信息泄露的风险。一是ChatGPT依托海量数据库的文本语料及数据信息进行预训练,这些信息本身就存在涉密性的可能,其中极有可能存在用户自主输入的个人隐私信息以及企业情报信息。二是ChatGPT在监督、强化学习阶段会不断理解并吸收用户的查询检索记录、浏览记录及情报需求偏好,从而精准用户画像,这虽然便于图书馆为企业提供竞争情报服务,但也容易被竞争对手情报人员监视情报意图,造成情报泄密。
3.3 情报可及性问题
ChatGPT强大的文本生成能力对于传统商业报告的撰写俨然形成了巨大的挑戰。但企业竞争情报讲究时效性、针对性以及系统性,产出的过程在本质上是针对特定的企业问题开展针对性的信息采集、组织分析以及场景规划,需要情报人员对每一个环节都具有系统掌控,这样才能生成可及性高的情报产品。而在长时间复杂的对话中,ChatGPT可能会因为缺乏对企业用户基本情况的精确感知而造成情报效果减弱,同时监督训练方式也会带来生成文本逻辑性差、来源不明等弊端。企业用户在传递情报需求时使用词语不当也无法形成良性的人机交互,从而要求情报人员具备更加广博的多学科专业知识、精深的情报处理底蕴以及敏锐的情报感知与判断能力。因此,在处理复杂多维度的情报问题时,ChatGPT情报产品的可及性还有待商榷。
4 启示与思考
ChatGPT基于大规模自然语言处理模型,运用无监督学习的方式,在TB级别的文本训练数据中学习符合用户思维逻辑、语言场景、信息互动的语言规范和思维规则,从而能够根据用户的自然语言沟通精准反馈与用户需求相适配的内容。它在信息处理领域最大的优势便是内容的快速整合与生成,其内置的AI算法在海量数据信息的筛查循证过程中能够弥补传统语言模型存在的知识利用不连续、演绎推理片面等不足。这些优势都能够帮助图书馆挖掘支撑企业市场决策的可信竞争情报,增强竞争情报对于促进企业发展的积极效益。因此,图书馆应当积极探讨国内外同类产品在企业竞争情报服务场景下的本土化应用。
4.1 夯实商业资源建设,提供商业文本数据语料
ChatGPT作为一种基于自然语言处理模型的人工智能应用,它通过对大规模文本数据的预训练来学习文本数据的内在逻辑,之后通过微调完成下游任务,例如智能问答、数据分析、给出市场报告等等。在微调过程中,ChatGPT也需要使用与目标任务相关的文本数据进行训练,以提高人工智能应用的准确度和效率。同时,ChatGPT也可以通过自身生成文本来丰富和扩充文本数据语料库,从而形成一个良性循环的自我完善的过程。因此,文本数据语料作为ChatGPT的输入和训练源,其真实有效性对ChatGPT的反馈效果具有决定性的影响。
图书馆凭借其自身庞大的商业数据库与完善的信息管理体系和保护机制,能够为ChatGPT等人工智能应用提供丰富的文本数据资源和储备,从而确保ChatGPT能够提供基于当前市场发展趋势和企业发展现状的竞争情报服务。在这个过程中,图书馆需要开发、挖掘、整合年度市场报告、行业数据等全文文本数据,打造高质量、可信赖的商业文本数据语料库,进行ChatGPT 等人工智能应用预训练充分发挥自身具备的海量优质商业文献语料优势。同时,图书馆还可以通过建立文本数据开放平台,向社会公众提供开放接口和数据共享服务,促进文本数据资源的共享和交流,推动知识创新和应用创新的发展。
4.2 支持NLP模型嵌入,提供智能问答服务
通过ChatGPT的发展历程可以看出, OpenAI始终在探索如何扩展大型语言模型,预训练所使用的语料库在不断地扩增,直到GPT-3的1750亿训练参数。但是从ChatGPT开始,OpenAI将关注点转移到与其他能够增加用户体验的技术进行集成应用,例如最新的GPT-4提供支持插件式软件开发的API等等。同时,Google等国际互联网企业也在AI模型与云计算等层面进行了集成服务,不断完善自身应用于用户交互的产品。无论是OpenAI还是Google,为用户提供的最直接的交互体验就是问答与检索服务。ChatGPT对于检索结果的高度智能化凝练极大程度上满足了用户对于检索响应完整度的期望。其基于自然语言处理模型也能够较好解决用户检索需求不明确、检索语句过于宽泛、检索结果连续性、真实性及完整性不尽如人意等常见问题,节省用户检索时间。因此,图书馆应当深化NLP模型在馆藏检索程序内的嵌入,支持企业用户采用自然语言描述情报检索需求,再有模型根据自然语言关键词识别检索出适配情报需求的数据库资料及文献数据等,满足用户模糊检索需求,提升用户检索体验。
4.3 完善用户交互机制,提升个性化服务体验
以ChatGPT为代表的人工智能应用可以通过自然语言对话的方式获取并总结企业目前所面临的困境及所需的情报类型。并且,ChatGPT作为一种生成式的人工智能服务工具,能够结合企业用户历来提供的信息产出适合企业当下发展的竞争情报产品。此类工具的诞生进一步增強了用户的个性化体验,使用自然语言检索查询的方式也进一步完善了人机交互智能服务机制,用户对于市场信息和产品信息的查询检索也更加便利,人工智能服务工具结合人机历史交互信息给出情报产品的方式也大大提升了竞争情报服务的精准度。因此,图书馆应该继续夯实人工智能服务工具在识别用户需求方面的能力,采用自然语言给予用户反馈方案,以此来获取完善人机交互体验并产生用户黏性。
4.4 开发智能情报平台,深化大规模语言模型应用
ChatGPT作为一种基于大规模自然语言处理模型的AI工具,其基于文本内容进行的文本分类、实体识别、关系提取、文本生成、智能问答、个性化推荐等文本处理服务对于情报服务产生了重大的影响。用户使用ChatGPT就能够实现最新市场政策关键词提取、行业报表数据统计、行业专利查询等操作,大量减少聘请情报机构专家的费用成本以及人工查询的时间成本,助力企业及时高效地应对市场变化,调整竞争策略。因此,图书馆可以深化ChatGPT在企业竞争情报服务中的应用,开发智能化、交互性强的竞争情报服务平台,着重加强其在市场年度报告等市场、行业数据挖掘加工中的文本提取、数据分类、分析预测以及在情报服务中的智能问答、全文检索、专利查新、生成报告摘要等应用,实现市场情报信息、企业市场战略落点及对手市场策略的深度挖掘和智能化服务平台的构建。
5 结语
AIGC时代的到来让ChatGPT等大型语言模型和生成型人工智能等新技术进入到大众视野,并为当前图书馆智慧化进程带来巨大冲击,化风险为机遇是每一位图书馆界人士需要深入思考的问题。图书馆应该充分利用人工智能技术带来的技术优势,借助ChatGPT等大规模语言模型探索企业竞争情报服务全新的实现方式,让企业竞争情报服务成为ChatGPT助推图书馆智慧知识服务发展的试验田,让技术进步与图书馆发展实现同频共振、和谐共鸣。
参考文献:
OpenAI. Introducing ChatGPT[EB/OL].(2022-11-30)[2023-06-12]. https://openai.com/blog/chatgpt.
Google. Apprentice Bard AI[EB/OL]. (2023-02-06)[2023-06-12]. https://www.apprentice-bard.ai/.
王知津. 竞争情报[M]. 北京:科学技术文献出版社, 2005.
VAN DIS E A M, BOLLEN J, ZUIDEMA W, et al. ChatGPT:Five priorities for Research [J]. Nature, 2023,614(7947): 224-226.
焦立涛.论ChatGPT对铸牢中华民族共同体意
识的影响及其应对策略[J].民族学刊, 2023: 1-8.
Taecharungroj V.“What Can ChatGPT Do?”Analyzing
Early Reactions to the Innovative AI Chatbot on Twitter [J].Big Data and Cognitive Computing, 2023,
7(1): 35.
蒋华林.人工智能聊天机器人对科研成果与人才
评价的影响研究:基于ChatGPT、Microsoft Bing
视角分析[J].重庆大学学报(社会科学版),2023,
29(2):97-110.
李荣,吴晨生,董洁,等.ChatGPT对开源情报
工作的影响及对策[J].情报理论与实践,2023,
46(5):1-5.
百度.文心大模型[EB/OL]. (2022-08-03)[2023-
06-01]. https://wenxin.baidu.com/.
李书宁,刘一鸣.ChatGPT类智能对话工具兴起
对图书馆行业的机遇与挑战[J].图书馆论坛,
2023,43(5):104-110.
郭亚军,郭一若,李帅,等.ChatGPT赋能图书馆
智慧服务:特征、场景与路径[J].图书馆建设,
2023(2):30-39, 78.
赵瑞雪, 黄永文, 马玮璐, 等.ChatGPT 对图书馆智能知识服务的启示与思考[J].农业图书情报学报, 2023, 35(1) :29- 38.
CHEN X T. ChatGPT and its possible impact on library reference services[J].Internet reference services quarterly,2023:1-9.
SUBAVEERAPANDIYAN A, VINOTH A, TIWARY N. Netizens, Academicians, and Information
Professionals Opinions About AI With Special Reference To ChatGPT[J]. arXiv preprint arXiv:2302.
07136, 2023.
OpenAI.Build next -gen apps with openAIs powerful models [EB/OL].(2022-11-30)[2023-06-01]. https://openai.com/api/.
OpenAI.OpenAI-model-overview [EB/OL].(2022-
11-30)[2023-06-01]. https://platform.openai.com/docs/models/overview.