AIGC赋能的科技情报智能服务:特征、场景与框架

2023-12-18 07:31刘逸伦黄微张晓君等
现代情报 2023年12期
关键词:科技情报

刘逸伦 黄微 张晓君等

关键词: 人工智能生成内容; AIGC; 科技情报; 智能服务; 服务框架

DOI:10.3969 / j.issn.1008-0821.2023.12.008

〔中图分类号〕G250.2 〔文献标识码〕A 〔文章编号〕1008-0821 (2023) 12-0088-12

在ChatGPT 掀起的新一轮“AI 军备竞赛” 浪潮下, 人工智能生成内容(AI-Generated Content,AIGC)作为人工智能技术应用的前沿领域正迅速成为当前研究热点。我国于2023 年4 月公布了《生成式人工智能服务管理办法(征求意见稿)》, 在政策上明确支持对相关技术的自主创新、合作研究与推广应用。在此背景之下, 科技情报服务应充分发挥“耳目、尖兵、参谋” 的历史使命[1] , 时刻关注前沿技术, 抓住人工智能技术大发展的历史性机遇,充分利用技术红利解决自身发展当前面对的问题。

在科技情报服务相关研究中, 依据我国科技情报服务在不同发展阶段的特征和特色, 我国科技情报服务已历经情报1.0 和情报2.0时代, 现已进入以“互联网+” 和智能服务为主旋律的情报3.0 时代[2] 。在此大背景下, 我国研究者开展了对新时代科技情报服务能力的相关研究, 文献[3]提出了RI?AC 四层科技情报服务能力模型, 文献[4]则在此基础上构建了情报3.0 下的科技情报服务能力评价指标体系。针对我国面对的新形势和复杂环境, 相关文献[5-7]对我国科技情报事业的发展指出了新的发展方向, 并对我国科技情报技术基础建设和科技情报知识生态体系的构建进行了探究。随着近年来人工智能相关技术的飞速发展, 有研究者对人工智能技术与我国情报工作的融合进行了理论性研究。文献[8]探索了情报、智能与智慧三者间的关联, 同时指出自然语言处理是科技情报工作者在未来重点关注的技术领域。此外, 文献[9]基于情报是人脑做出的有价值的判断这一核心概念, 针对未来可能出现的基于人工智能技术的情报判读系统,明确了人工智能技术在情报工作中的应用依然是将“人的经验纳入情报工作”, 因而不会改变情报工作的本质。文献[10]通过总结AIGC 技术的演进,探讨了GPT 技术应用对开源情报工作带来的影响。然而, 在科技情报研究领域, 目前我国对AIGC 技术与科技情报服务的融合研究尚处于起步阶段。

基于以上研究, 我国科技情报服务进入“情报3.0” 时代, 既是网络信息技术、大数据和人工智能技术发展到一定程度后的必然, 也是新技术与科技情报生产中各环节要素间相互作用、共同演进发展的结果[11] 。一方面, 新的技术环境带来了传统科技情报业务流程上的变化; 另一方面, 新需求的出现推动传统科技情报机构进行服务功能拓展。具体表现在以下几个方面: ①如何在复杂信息环境下保障信息获取的全面性与数据的有效性[3,6,11] ;②如何高效地处理和分析海量多源异构数据[3,36,12] ;③如何感知用户需求并提供个性化情报服务[3,8,36] 。据此, 本文通过探索AIGC 的技术特征, 明确其技术赋能场景, 进而构建AIGC 赋能的科技情报智能服务框架, 以新技术的应用对以上问题的解决提供新思路, 推动我国科技情报服务向智能化发展, 更好地为打破外部技术封锁、同步世界科技水平前沿和开展原创性科技创新提供基础性支撑和保障[5] 。

1人工智能生成内容(AIGC)的内核与特征

1.1人工智能生成内容(AIGC)

目前, 我国学术界对于人工智能生成内容(AIGC)的概念的界定主要从“内容生产者” 和“内容产生方式” 两个角度出发。其中, AIGC 既是指代由机器(人工智能)作为内容生产者所产生的一类内容, 又代指一种内容生产的方式, 即智能内容自动生成相关技术的集合[13] 。从广义上看,人工智能生成内容, 一般认为是相对于PCG(专业生成内容)、UCG(用户生成内容)和AI-UGC(AI辅助创作内容)而提出的概念。在此基础上, AIGC可以看作是像人类一样具备创造能力的内容生成式AI 技术, 即生成式AI。它可以通过数据训练和算法模型自主生成并创造文本、图像、音乐、视频、3D 交互内容等各种形式的内容和数据。对此, 国际上通常称之为“人工智能合成媒体(AI-genera?ted Media/ Synthetic Media)”, 其定义为: 通过人工智能算法对数据或媒体进行生产、操控和修改的统称。从技术组成上看, AIGC 由3 个关键部分组成:数据、硬件和算法。

训练数据可直接影响生成式AI的能力, 训练数据越庞大、数据来源越丰富、数据形式越多样,则生成式AI 所生成的内容越具备智慧性、专业性和时效性。算力支持则直接决定了生成式AI 的学习效率与生成式AI 对数据处理的效率, 本地硬件提供的算力越强, 则生成式AI 在进行大规模机器学习和深度学习时的效率越高。近年来, 随着芯片技术与集成电路技术的飞速发展, 硬件运算设备也随之快速迭代, 大规模机器学习的效率不断提高。目前, 英伟达与2022 年推出的5 纳米工艺的H100-80G SXM5 GPU, 其图形处理单元的时脉速度已经达到1065MHz, 相比于英伟达于2018 年推出的V100-16G GPU, 当二者同时用于BERT 的大型推理运算时, H100 的运算效率达到了V100 的十倍以上[14] 。此外, 云计算技术的发展也进一步为机器学习提供了额外的算力保障, 通过云技术支持的GPU 和TPU 集群进一步增强大型数据训练的效果。算法技术是AIGC 是否具备人类经验与智慧的决定性因素。其中, Transformer 模型是许多先进算法模型的基础, 它不仅应用于自然语言处理(NLP)领域,也同时可被应用于对图像、音频等多模态数据进行的处理, 因此具备良好的多模态数据融合能力。作为一种神经网络, 其最初用于弥补循环神经网络(RNN)在处理上下文关系感知上的不足导致的机器语言翻译存在翻译不准确问题。Transformer 具有独特的自我关注机制, 使之可以直接计算任意两个词之间的相关性, 不再需要通过隐藏层进行传递,进而充分挖掘序列各节点之间的深度信息, 因此可以轻松地捕捉全局信息[15] 。此外, 区别于传统的神经网络, Transformer 模型中的自我注意力机制使之可以通过矩阵计算的并行化实现完全的并行计算,以便其进行大规模数据计算时更充分地利用GPU算力资源, 强化模型的训练和推理性能[16] 。此外,人类反馈强化学习(Reinforcement Learning from Hu?man Feedback-RLFH)也是保障生成式AI 能够提供真实的、有效的反馈内容的重要步骤。RLFH 作为一种机器学习的方法, 通過独特的“奖励与惩罚”信号机制, 使AI 能够在人为设定的奖惩规则内,自行探索学习最合适的行为策略[17] 。RLHF 同样具备广泛的适用性, 能够用于多种不同类型的任务, 如: 自然语言处理、图像处理等, 其目前已经被应用于OpenAI 开发的ChatGPT 系列聊天机器人中。总结来说, 高性能硬件提供的充足算力、庞大的训练数据和先进的算法模型是AIGC 技术进一步发展的必要基础前提。

AIGC 技术包括以GPT 技术为代表的诸多种类的内容生成式AI 技术。根据内容分类, AIGC 的技术体系可以分为AI 生成的自然语言技术、AI 生成的视觉内容技术和AI 生成的多模态内容技术三大类, 如表1 所示。

从数据模态上看, AIGC 可以被分成单模态生成式AI 与多模态(跨模态)生成式AI, 如图1 所示。其中, AI 生成文字内容技术与AI 图像处理技术可以被看作单模态内容生成模型(Unimodal Models)。这一类模型在设计时, 主要用于接收所输入的特定模态的原始数据(文本、图像等), 并通过预测后以同样模态的数据输出结果。与之相对的则是AI的多模态及跨模态内容生成, 依托于多模态跨模态内容生成模型[30] , 其中包括视觉—语言生成(Vi?sion Language Generation)、文本—音频生成(TextAudio Generation)、文本—图像生成( Text GraphGeneration) 和文本—代码生成(Text Code Genera?tion)等。

1.2 AIGC 的技术优势特征

综合上文的分析和总结, AIGC 技术有着学习能力强、数据规模巨大、数据处理高效、人机智慧融合的显著特征。

1.2.1大规模数据训练

为了保障AI 生成内容的实用性、专业性和时效性, 对AI 进行大规模的数据训练成为最佳途径。目前, 在卷积神经网络(CNN)和Transformer 模型基础上, 机器学习的规模已经突破亿级。目前, 由OpenAI 开发的世界首个大规模图文多模态数据集LAION-400M 的数据量级已经达到4 亿个图片—文本配对数据[31] 。百度开发的百度文心一言所应用的大规模训练数据也已达到万亿级网页数据、搜索数据和图片数据以及5 500亿的事实知识图谱。2023 年7 月, Meta 宣布推出CM3Leon 的人工智能(AI)多模态语言模型, 该模型通过数百万张来自Shutter?stock 的授权图片进行预训练, 参数高达70 亿个,达到了OpenAI 的EALL-E2 模型规模的两倍以上[28] 。因此, 在目前技术条件下, AIGC 技术已经能够支持多模态数据的大规模模型训练, 经大规模数据训练后的生成式AI 本身即可作为拥有巨大知识存量的AI 系统。

1.2.2多模态数据处理与内容生成能力

目前已有多种AIGC 技术产品支持多模态及跨模态的内容生成, 如OPENAI 开发的GPT-4 和Meta 推出的CM3Leon 等。使用者可通过自然语言向AI 输入指令, 要求AI 根据指令和用户提供的其他形态数据进行各类内容生成任务。例如, 由Me?ta 公司开发的CM3Leon 作为AI 发展史上首个单一模态模型, 可以依据文本生成图像, 也可以为图像生成文本描述, 并回答有关图像内容的问题, 或根据文本指令编辑输入的图像[28] 。此外, 得益于算力与算法技术的发展, 生成式AI 在知识组织与挖掘方面表现出较大提高。在针对文献的知识挖掘中,生成式AI 不再局限于简单的标题、摘要或关键词,而可以深入到文献内容, 实现更细粒度的知识表达, 有利于语义知识的组织与表达。在行业应用中,生成式AI 已在多领域实现了多模态与跨模态融合的应用。如: 在影视制作领域, 生成式AI 发挥其创造力进行协同创作, 有助于特效制作与剧本改进;在教育领域, 生成式AI 可以将抽象的教科书文字内容转换为具体的可视化的图片、视频、音频等多种形式, 有利于增进学习体验; 在工业生产和建筑领域, 生成式AI 可以将给定的数字几何数据迅速转化为基于物理环境的3D 模型, 为工业生产和建筑建设节省大量成本并提高工作效率。

1.2.3智慧交互能力

人工智能内容生成技术(AIGC)利用技术赋予机器部分人类思维能力, 以生成有价值内容。智慧性是AIGC 产生有价值内容的基础, 具备人类思维与智慧交互能力是其发展趋势。因此, “智慧性”是AI 能够产生有价值内容的基础要求, 具备人类思维认知并具备智慧交互的能力, 已经成为AIGC未来发展的必然趋势[32] 。根据目前现有研究发现,大语言模型在语言理解推理、对话生成等多项任务上已经达到甚至超越了人类的平均水平[33] 。而在感情分析方面, ChatGPT 在情感分析上有着高达85%以上的准确率[34] 。目前, 生成式AI 已经具备语言翻译、语义分析、智能推荐、智能问答、知识综述、知识提炼的相关能力, 并且在部分行业领域的服务场景下已经展开了拓展应用。如ChatGPT-4已开放其API 端口, 应用程序可通过API 接入进而为用户提供多种内容生成服务; 微软与谷歌也接连宣布在其Office 系列软件和谷歌邮箱服务中内置生成式AI, 为用户提供写作辅助、写作建议、主题文稿自动生成、自动邮件回复、自动排序和摘要、图片、声音、音视频会议笔记自动记录等功能。

2 AIGC的技术赋能路径、场景与工作模式

综合上文所述, 本文认为: AIGC 技术“大数据” “多模态” “智慧交互” 的特性与我国科技情报服务目前亟待解决的问题和需求高度契合, 共同构成了基于技术—需求—场景的AIGC 技术赋能路径与场景, 如图2 所示。

2.1复杂信息环境下的信息获取

当前网络信息技术的高度发达, 为信息的传播提供了多样化的渠道, 同时使信息的传播变得空前迅速, 继而带来信息总量的骤增。然而, 网络信息空间中存在着大量的虚假信息、垃圾信息和不良信息, 导致了网络信息质量的良莠不齐。网络信息空间的发展既为情报工作中的数据获取带来了便利,但也为有效数据的获取带来了挑战。对科技情报工作来说, “科学就是数据” “一切以数据为准”, 所有情报成果的产出都离不开数据的支持[36] 。因此,情报3.0 背景下的科技情报服务对信息获取渠道的全面性和所获取信息的有效性提出了更高的要求。在信息源上, 主要包括商業数据库、公开信息数据和社会化媒体数据三大类。因此, 在信息采集中,不仅要求在维普、万方、CNKI 等非结构化数据库进行有效数据抓取, 还需考虑在相关网站、论坛、微信、微博等媒体平台进行有效数据的抓取[35] 。只有对信息采集渠道的全面覆盖, 才能够支持多种信息渠道的数据进行互相验证, 保证所获取数据的真实性和有效性。

通过现有的AIGC 技术可以解决目前所面临的信息获取渠道全面性和数据有效性问题。目前, 生成式AI 已经具备成熟的数据资源调用能力, 通过API 接口生成式AI 能够全面地获取近乎无穷的网络数据资源、云资源与科技情报机构自有的内部数据库, 利用AIGC 技术可以自动识别和调用这些接口, 获取信息采集不易触达的深层数据, 扩展采集渠道的广度与深度。例如, 目前ChatGPT-3 所采用的网页抓取技术(Web Scraping), 能够支持AI自动根据需求, 从互联网网页上抓取文本数据进而提取出所需信息。此外, 通过数据库查询技术和API 收集技术, 生成式AI 能够通过API 接口實现与其他信息系统之间的数据交互, 并进行数据检索和调用, 如图3 所示。

在保障数据的有效性上, 目前生成式AI 在大量数据训练基础上已经具备对基础常识问题和部分专业领域问题进行判断的能力。通过以科技情报领域的专业语料库对AI 进行强化训练的同时增加人类反馈强化学习(RLHF), 可以进一步强化AI 的情报数据判别能力。此外, 利用知识图谱等技术,对采集数据中的实体、事件和关系等要素进行知识验证与标注, 能够在一定程度上判断数据信息的准确性与可信度, 为后续利用提供参考依据。因此,通过AIGC 技术对获取数据进行过滤清洗、校验、仿真、交叉印证等方式进行数据清洗和真伪识别,替代人力对数据的有效性、真实性进行初步筛选、过滤和验证, 能够有效防止垃圾数据、无效数据和无关数据对分析结果产生干扰。

2.2多源异构数据的分析和处理

在情报3.0时代, 科技情报工作中的信息获取不再局限于传统的情报信息资源体系和信息获取渠道, 情报数据分析的要求从抽样分析向全样本分析转变[34] 。随着网络信息空间的空前发展, 科技情报工作正面临采集到的大量数据来源复杂、结构多样且真假难辨[11] 。从数据结构上看, 所获取的数据包括结构化数据和非结构化数据; 从数据的形式来看, 包括文本、图像、音频、视频、数值等; 从数据来源上看, 分为公开信息数据库、商业化数据库和社会化媒体平台。因此, 目前科技情报工作所需要进行处理和分析的数据通常具有海量化与碎片化的特征。在传统的科技情报服务中, 往往需要投入大量人力、花费整个情报工作流程中大部分时间用于处理与分析数据。因此, 高效地处理和分析采集到的数据, 已经成为当前科技情报业生产中的急需解决的问题。在此情况下, 以机器学习、知识挖掘、语义推理、知识图谱等技术为基础的智能知识计算技术成为解决问题的最佳方案。

在信息的处理与分析上, AIGC 技术的多模态数据处理能力包括: 真伪识别、内容转化、数据清洗、数据评估等, 能够有效解决目前科技情报生产中大量多源异构数据的处理和分析问题。首先, 如上文所述, AIGC 技术的数据清洗能力能够删除冗余、提取词干、识别错漏进而辅助情报的真伪识别[36] 。同时, AIGC 技术具有处理结构化数据、非结构化数据和半结构化数据的能力, 能够实现这3种数据类型之间的自动关联、映射和融合, 进而实现不同数据模态之间的有效结合, 丰富数据的内涵与关联, 提高数据加工的效率。此外, AIGC 技术可以在不同数据模态(文本、图像、视频等)中自动发现相同的或相关的知识要素, 如同一事件或概念的不同表现形式, 进而挖掘不同数据模态之间隐含的深层关联, 发现更加全面而准确的知识, 节省人力。AIGC 技术还可以根据不同数据模式之间的关联, 构建涵盖多个数据模式的统一数据模型, 如知识图谱、关联图谱等。此类型的数据模型可以综合存储和表达不同数据模式中的信息, 从而为数据管理和应用提供更加全面系统的支持。综上所述,AIGC 技术能够实现不同数据模式之间的自动关联、融合和建模等, 在一定程度上能够替代人工进行多源异构数据处理的工作, 并显著提高科技情报生产中数据处理的效率和质量。

2.3科技情报服务中的个性化服务

得益于近年来移动通信技术的快速发展, 世界也被无形中的网络连接成了一个整体, 瞬息万变的科技与社会发展导致用户对情报服务产品也提出了动态性、便捷性和实时性的需求, 即: 情报数据动态化、服务情境移动化和服务内容个性化。为了满足以上需求, 利用数据对情报用户需求的精准感知成为了提供情报服务的前提。为了获得足够的用户行为数据和用户需求反馈, 则需要情报用户全程参与情报工作中, 以便情报工作者通过与情报用户的交互数据对其需求进行精确分析, 进而提供精确服务。因此, 情报用户与情报工作者之间的交互成为解决问题的关键。目前, 个人移动终端如智能手机、智能平板电脑等已经具备较为强大的硬件性能和高速网络的接入能力。在此基础上, 开发情报服务的移动端服务APP和基于微信、微博等平台的小程序成为了满足当下交互需求的最佳方案。移动端服务APP 可以为情报工作者和用户之间的实时数据交互更新提供便利, 一方面, 通过移动终端收集用户行为数据; 另一方面, 传递用户各种基于不同情境下的个性化情报服务需求, 进而按需求为用户提供个性化的实时情报推送, 并随时为用户提供有效的情报监测和预警服务。

为了更好地感知情报用户的需求并为用户提供更为及时的、个性化的服务, 同时更充分地发挥互联网技术与AIGC 技术的优势, 构建以生成式AI为服务核心的科技情报智能服务平台成为了最佳解决方案。如图4 所示, 新技术的应用也带来了工作模式上的变化, 一方面应充分发挥生成式AI 在数据获取、加工、处理等方面的优势, 并应用于情报工作相关流程, 提高效率; 另一方面, 充分发挥其智慧交互能力和多模态内容生成能力, 以用户数据分析其需求。具体来说, 情报工作者可通过利用移动端的情报服务应用程序(或微信小程序)与用户进行实时信息交换, 在获得用户允许后通过移动端服务应用程序对用户的信息行为和服务需求进行收集。随后将收集到的信息行为数据与用户需求数据汇总到预置生成式AI 的智能情报业务平台, 通过大量数据进行预训练后的生成式AI 利用其分词技术、翻译技术、对话机制与大量机器学习、用户画像技术、内容推荐算法技术等对用户信息行为数据的分析, 进而向情报用户移动端服务APP 进行主动内容推送服务。目前, 互联网搜索引擎、电商APP和短视频平台普遍已经应用了类似的算法推荐服务。此外, 通过将用户行为数据与用户需求数据相结合, 情报工作者在生成式AI 的辅助下可以获取更多的用户特征信息, 从而更为精准地分析用户需求后为情报用户提供内容服务。此外, 预置了生成式AI 的科技情报服务平台可以在情报工作者非工作时间独立为用户提供7?24 小时的智能自助情报服务, 充分满足情报用户的全天候情报服务需求。情报用户可以通过在移动服务端进行设置条件, 根据设定数据数值触发条件或时间触发条件, 以获取AI 服务助手第一时间的实时情报更新及状态追踪推动。目前, 类似的AI 服务功能已经在金融证券市场交易、电子商务服务等多领域广泛应用, 可以为科技情报服务中相关服务内容提供实践性经验。

3 AIGC赋能的科技情报智能服务模型构建

3.1服务框架构建原则

本文构建科技情报服务框架模型应遵循全面性、逻辑性、应用性、前瞻性和开放性的原则。其中,全面性指本文所构建服务框架模型应涵盖科技情报工作中的所有关键环节, 从而更好地指导科技情报服务的智能化发展。逻辑性与应用性指本文构建的框架模型应保障各层级之间逻辑衔接紧密, 各要素之间能够互相协同支持, 从而为科技情报工作者提供清晰的工作指引、提高工作效率, 同时具备较强的实际应用可行性。前瞻性指本文在构建的服务框架中充分考虑科技情报服务的未来发展趋势与可能出现的全新的服务需求, 推动智能化技术的进一步实际应用。开放性指本文在服务框架的设计上应充分考虑未来新技术、新业务与新需求的融入, 提供较大扩展空间以适应当前不断变化的外部环境。

3.2服务框架的构成

综上, 本文基于AIGC 技术内核与优势, 并结合科技情报服务当前的发展需求, 以我国杰出科学家钱学森提出的系统工程理论为基础, 构建了面向AIGC 技术的科技情报服务4 层框架模型, 如图5所示。

系统工程理论既不是单纯的整体论, 也不是还原论, 而是将整体论和还原论辩证地结合后得到的成果。钱学森认为, 系统是由相互作用、相互依赖的多个部分结合的, 具有特定功能的有机整体[37] 。从系统工程视角出发, 可以从服务框架的环境、结构和功能三大要素对科技情报服务框架的构建展开讨论。在系统工程视角下的“环境”, 可以划分成软件环境与硬件环境。其中, 硬件环境指保障科技情报智能服务能够开展的物理设施和技术设备; 软件环境则由保障科技情报智能服务的相关技术、数据和方法组成。“结构” 则指服务框架下各个构成要素之间的逻辑关联和相互作用关系。在系统工程视角下, “功能” “环境” 与“结构” 共同构成一组转化关系。其中, “功能” 受到“环境” 和“结构” 的影响, 既为科技情报工作者和外部参与者提供工作上的智能化便利, 也为用户提供高质量的智能化服务体验。基于以上论述, 在结构上, 根据服务框架下各个构成要素之间的相互关联可以分为4 个层级, 包括: 支撑保障层(S)、智慧应用层(A)、平台服务层(P)、成果产出层(O)。

3.2.1支撑保障层

支撑保障层是整个服务框架实现智能服务的基石。从支撑保障层面看, 算力、数据和算法技术是构成科技情报智慧服务AI 的必要组成要素。在设备方面, 高性能的运算设备如高性能计算机、大型服务器、工作站等, 其所提供的算力是支撑AI 高效工作的必要条件。而云服务平台、存储设备和网络安防设备如云服务器、SSL VPN、API 网关、身份认证服务器等, 则是保证本地数据安全、云端数据安全进而构建巨型科技情报知识库的重要设备。在数据方面, 充分的外部和内部数据能够为AI 提供源源不断的“学习资源”, 进而提升AI 所生成内容的深度和广度, 满足最终情报成果的专业性、时效性和智慧性。在数据上, 外部数据包括并不限于科技知识数据、科技活动数据、科技产业数据、科技管理数据等, 其获取渠道则包括目前主流的维普、万方、CNKI 等非结构化数据库和其他相关的网站、论坛、微信、微博等媒体平台。与之相对的, 内部数据则是指科技情报机构业务平台、情报服务门户网站和移动端APP 及微信小程序中的用户信息行为数据、用户注册数据、用户业务咨询数据等隐私数据, 也包括科技情报机构内部业务流与办公数据、自有知识成果库等。此外, 构建巨型科技情报云知识库, 则可在未来情报工作中起到“储存池、发酵池和蓄电池” 的作用, 成为未来科技情报业务的“中心厨房”[34] 。此外, 从算法技术上来看, 算法模型的先进性对AIGC 的学习能力和输出成果起到了关键性作用, 算法的不断迭代更新推动着AIGC 从单一模态内容生成向多模内容生成跨越。其中, 对抗生成网络( GAN)、扩散模型(Diffusion Model)、神经网络模型(Transformer)、跨模态深度学习模型(CLIP)等算法模型构建了目前AIGC 技术的算法基础, 大量新模型都是在这些模型的基础上进行扩展和改进[38] 。因此, 为了保障科技情报智慧服务AI 的多模态内容识别与内容输出能力, 科技情报工作者应不断更新算法库, 保持所应用算法技术的先进性。

3.2.2智慧应用层

文献[2]将科技情报工作流程主要划分为: 业务受理—信息获取—信息处理与分析—情报加工—情报交付。本文尝试以AIGC 技术赋能科技情报服务的各个工作流程, 构建智慧科技情报服务功能性应用。智慧应用层的核心是情报智慧服務AI, 其本质上是通过科技情报专用知识语料库进行大规模数据训练的生成式AI。科技情报机构可以通过委托开发的形式, 根据现有情报服务需求进行定制化开发其所需生成式AI 产品。以目前生成式AI 的技术水平, 已经可以实现对科技情报工作的全流程的AI 赋能, 包括智能业务受理、智慧信息采集、智能情报加工和智慧内容生成。在业务受理阶段, 用户通过智能身份认证后, 可通过自然语言、图片、代码等多种形式将情报需求提供给智慧服务AI 进行需求分析。智慧服务AI 则基于用户需求、用户信息行为深度挖掘用户个性化需求并同步反馈给科技情报机构。同时, 智慧服务AI 可根据用户需求进行快速工作方案制定, 并为用户、情报工作者分配合适的权限以完成本次服务。在信息加工与情报分析阶段, AI 将根据对用户情报需求的分析计算整体工作量, 并据此进行合理的任务分配, 帮助情报工作者进行初步信息采集、处理和分析, 为情报工作者进一步的情报判读与应用提供全面的数据保障。在情报生成与成果交付阶段, 在智慧服务AI支持下, 可完全由人工智能为用户提供部分科技情报功能性服务, 如: 研究热点分析与热点追踪、智慧情报搜索、指定题目的情报自动生成、情报数据趋势预测、订阅情报智能推送等。智慧服务AI 还可以通过移动客户端所收集的客户信息行为, 进而分析客户实时场景需求, 并为科技情报移动服务端APP 提供7?24 小时无人化智能客户服务和动态情报数据监测等个性化服务。在科技情报服务综合管理上, 管理者也可通过智能服务AI 对科技情报服务进行监督、管理和维护, 如智能计费管理、智能业务进度监测、智能权限分配等。

3.2.3平台服务层

服务平台是承载各种智慧情报服务应用的基本载体。通过构建数智化的科技情报服务平台, 将各类智慧情报服务应用有效集成、统一维护和管理,进一步强化人的智慧与机器智慧的融合发展, 提高情报工作效率的同时也可对AI 进行反馈训练, 不断强化其智慧程度。在平台服务层面上, 服务平台主要分为3 个部分: 情报服务门户网站系统、科技情报移动服务客户端APP 和微信/ 微博小程序。科技情报服务门户是为情报用户提供科技情报服务的主要网络平台, 用户可以通过平台提出服务需求,全程跟踪情报工作进度并参与到情报工作中去。情报门户网站也同时负有情报资源共享和办公系统的功能。科技情报移动服务客户端则是作为情报服务门户网站的移动服务补充, 移动服务端一方面可以为情报用户提供实时情报服务, 也为情报工作者和情报用户之间的实时交互提供巨大便利。针对科技情报机构的日常办公管理需求和科技情报工作中的业务需求, 科技情报机构可基于智慧服务AI 构建智能办公系统、智能情报业务系统和科技情报机构的移动办公端APP。其中, 内部智能办公系统专门用于情报机构的日常办公与行政管理, 同时兼顾与政府等涉密用户之间的文件和数据交互, 通过API 接口管理系统可以精确地对智慧服务AI 的数据获取权限进行规定, 进而避免数据外泄相关的安全风险。此外, 科技情报移动办公端APP 则为科技情报工作者和参与情报工作的外部专家提供全天候移动化办公的便利。智能情报业务系统可通过智能服务AI 大大提高情报工作者在情报工作流程上的工作效率, 节约人力资源。

3.2.4成果产出层

从科技情报成果与产出层面看, 科技情报成果作为科技情报服务的直接产出, 既是科技情报服务经济与社会价值的体现, 也是评价科技情报服务的重要依据。结合前文对当前科技情报服务在功能和内容上亟需扩展的相关阐述, 情报3.0 时代下的科技情报智能服务不仅要求科技情报机构提供传统意义上的科技情报产品, 如: 情报研究、外部环境监测、需求分析、风险预警等[39] , 也应具备部分“智库化” 服务内容, 如: 政策咨询、战略分析和决策制定等[40] 。因此, 在科技情报智慧服务AI 的支持下, 结合当前科技情报服务中新增的实时情报监测和科技情报预警等个性化服务需求, 科技情报智能服务的产品与成果应包括并不限于: 文献服务、科技服务、出版物服务、创新服务、政策服务、战略与决策服务六大门类, 如图4 所示。其中, 文献服务构成了情报服务的基础, 包括: 文献检索、文献传递、文献编目、查收查引等。情报服务则是传统情报服务的核心内容之一, 包括: 知识产权服务、竞争情报服务、统计分析等。平台服务是指利用网络技术构建的情报服务平台, 实现情报资源的集成与共享, 并依靠服务平台提供数据共享、实时数据监测、预警服务等。科技服务主要指通过专业的科技信息与知识, 为相关用户提供技术咨询评估、技术转移与科技监测、科技查新等服务。出版物服务主要利用情报处理与编辑能力, 对选定的情报资源进行整理和编辑, 形成系统的文字、图表与数据等形式的出版物, 为用户提供情报简报、情报年鉴、科技期刊等形式的宣传与策划服务。创新服务是近年来科技情报服务转型升级的重点发展方向, 目前主要包括区域创新服务和企业创新服务。其中, 区域创新服务主要针对区域内企业及相关机构的技术创新需求, 提供技术情报监测、技术路线图绘制、技术标准服务等, 支撑区域技术创新与产业发展;企业创新服务主要针对企业在技术研发与产品创新过程中的情报需求, 提供技术情报监测、竞争情报分析、知识产权服务等, 支撑企业技术创新、提升行业竞争力。政策服务主要为政策的制定与执行提供咨询和决策支持, 以提高政策的执行能力。其中,政策咨询服务主要根据用户在政策制定、执行与应用等过程中的需求, 提供定制化的政策咨询与建议,帮助用户制定科学的决策方案。政策分析服务指通过对相关政策内容和环境的深入分析, 提出政策效果评价与政策建议, 为未来决策提供理论与思路支持。战略与决策服务主要包括战略策划服务和决策分析服务。其中, 战略策划服务主要根据用户的发展定位与目标, 进而提供战略研究、产业策划与路线图等服务, 帮助用户制定科學的发展战略; 决策分析服务则针对用户在重大决策过程中的情报需求, 为其提供情报监测、问题分析与方案评估等服务, 充分保障用户决策的科学性。

4总结与展望

本文通过总结科技情报服务当下的需求, 遵循需求—技术—场景—服务框架逻辑, 尝试将AIGC相关技术应用于科技情报服务中, 构建了AIGC 技术赋能的科技情报智能服务框架模型。在理论上,本文提出了以AIGC 为代表的数智技术赋能情报服务的内涵与路径, 回答了“如何将人工智能技术融入科技情报服务” 的关键问题, 进一步拓展了情报服务向“数智化” 发展的理论内涵。在技术视角上, 本文通过对AIGC 技术的有效利用, 合理地将其与科技情报服务的业务各环节流程相匹配,实现了情报服务业务流程的数字化与智能化。在情报服务内容上, 本框架利用AIGC 技术增加新的业务模块与服务模式, 实现服务的优化与升级, 满足用户更深层次的情报需求。在科技情报服务组织与管理角度上, 新建框架为科技情报服务的组织和机构的日常管理提供了自动化与智能化支持, 提高组织与管理能力。在用户体验角度上, 本文所构建的框架通过AIGC 技术为用户提供在移动端、聊天接口等新渠道的情报服务应用, 提高了用户的互动性与获取感知水平, 强化了用户体验。在未来研究中,将继续探索先进技术在科技情报服务中的应用, 进一步构建完整的科技情报智能服务体系, 进一步推动我国科技情报服务迈入数字智能时代。

猜你喜欢
科技情报
新型举国体制下我国科技情报工作制度构建研究
浅谈新形势下科技情报工作
基于CiteSpace的科技情报研究现状与前沿趋势可视化分析
复杂信息环境下科技情报理论体系构建问题研究
基于数据工程的国防科技情报生态体系构建
基于向量空间模型的科技情报用户画像及场景化服务推送研究
企业如何有效识别和运用科技情报
铜陵市科技情报工作存在的问题与发展对策
试论市场经济条件下农业科技情报自动化发展策略
加强科技情报档案管理工作的建议