对话式人工智能赋能科研创新的可能性、局限性及未来发展

2023-06-12 19:57:40周青

出版参考 2023年4期

周青

摘要：以ChatGPT为代表的对话式人工智能的出现给科研生产带来了新的机遇，为科研创新提供了新的空间与可能。对话式人工智能赋能科研创新的可能性在于，一是拥有海量训练数据助力知识的整合与创新，二是多种人工智能技术助力复杂知识性任务的完成。未来人类会将更多注意力转向如何以人工智能赋能科研创新，并在保证人类安全与促进科技发展之间寻求平衡。

关键词：ChatGPT 对话式人工智能科研创新

2022年11月美国人工智能实验室OpenAI公司推出对话式人工智能工具ChatGPT，这一大型语言模型很快引爆了全球人工智能市场，引发一场人工智能新竞赛。对话式人工智能的浪潮迅速席卷全球，对科技、教育、设计、编程等众多行业产生了巨大冲击，引发了强烈震动。受此影响，国内外科技公司纷纷加码相关研发，相继推出自研的对话式人工智能工具，并加快与其他软件和应用的集成整合。可以想见，在不久的将来，对话式人工智能将在社会各个垂直领域加快应用。人工智能对科研行业也将产生巨大影响，将极大改变以往的科研模式、优化科研流程，给加速科研创新带来新的空间与可能。

一、对话式人工智能赋能科研创新的可能性

以ChatGPT为主要代表的对话式人工智能已经可以通过自然语言理解人类意图，完成人类指令，输出具有一定准确性和逻辑性的结果，其辅助优化科研流程、提升科研效率的功能已经得到了大量验证。那么，这类人工智能工具是否也有助于激发科研创新？下文从三个角度来探讨对话式人工智能赋能科研创新的可能性。

1.海量训练数据助力知识的整合与创新

对话式人工智能是一种在预训练阶段需要使用海量知识数据进行训练的大型语言模型，其训练语料中包含的全部知识远远超过人类个体在有限的生命时间内所能掌握的广度和深度。此外，海量训练数据集中包含多个学科众多领域的知识，使得人工智能在知识学习的过程中能完成知识的整合与重构，在解决专业性和知识性问题，特别是需要跨学科研究以及涉及交叉学科知识的问题时，会有令人意想不到的知识连接，从而表现出一定的创新性。

对科研人员来说，对话式人工智能工具在多学科多领域知识整合重构基础上呈现出的知识连接能够引发使用者的“头脑风暴”，刺激其从不同视角进行思考，在其借助人工智能进行科学研究的各个环节，如确定研究方向、选择研究概念、考证研究逻辑、设计研究框架、收集实验数据、验证实验结果等，都有可能激发研究者的创意与灵感火花。

OpenAI已证实，GPT-4能基于学科知识的整合完成具有一定知识性和复杂程度的任务，表现出良好的迁移能力和泛化能力，其在专业性和学术性上的表现已接近人类水平。我国也已关注到对话式人工智能在推进科研创新方面的空间与可能。如科技部已在近期启动“人工智能驱动的科学研究”（AI for Science）专项部署工作，结合数学、物理、化学、天文等基础学科关键问题，围绕药物研发、基因研究、生物育种、新材料研发等重点领域科研需求，布局“人工智能驱动的科学研究”研发体系。[1]

2.多种人工智能技术助力复杂知识性任务的完成

对话式人工智能在技术上的跨越式发展来源于人工智能两大分支领域即机器学习与自然语言处理领域的持续技术积累，以及多项底层技术的不断创新。例如，采用Transformer模型来进行文本内容的特征抽取；通过深度学习（Deep Learning）来研究如何有效增加模型层深及模型参数容量以提升模型复杂度；采用生成式预訓练（GPT，Generative Pre-trained）+微调（Fine-tuning）的模式解决下游任务的迁移问题；采用自回归模型（Auto-Regressive Model）+零样本/少量样本（Zero/Few Shot）模式解决自然语言生成问题，等等。

正是这些底层技术的不断创新，以ChatGPT为代表的对话式人工智能工具得以不断完善语言模型、修正算法策略、进行多样化语料训练，实现学习机制的自我迭代更新，从而在自然语言理解与生成任务中表现出良好的逻辑推理能力。这种逻辑推理能力表现在：理解语义之间的关联、保证输出结果的一致性和连贯性；基于人类的反馈调整输出结果；对复杂问题的拆解与分层次分步骤处理；能力的迁移与泛化等。

因而，科研人员可以利用人工智能的逻辑推理能力，辅助完成复杂的知识性任务。在这个过程中，使用者需要通过投喂背景语料、提高提问与指令的精确性与指向性、调整尝试不同提示语以及提供相似案例，不断引导人工智能对回答进行修正。这种“提问—反馈—进一步提问—更深入反馈”的进阶式人机对话过程，同时也刺激使用者思考积累的疑问、梳理思路与想法、分层次分步骤拆解复杂问题，进行归纳、演绎、类比、推理等思维活动。

由于大型语言模型复杂的模型结构与巨量参数规模，人类尚无法理解人工智能模型内部的一系列具体决策过程，以及它是如何产生逻辑推理能力的。但可以肯定的是，ChatGPT这样的对话式人工智能在面对具有一定复杂程度的知识性任务时，能够模拟人类思考与解决问题的心理过程，呈现令人惊艳的表现，从而为激发科研创新提供可能。

3.强大算力助力对未知领域的科研探索

某些未知领域的科研探索比较复杂，有时需要处理大量数据、进行大量计算、针对复杂结构建模，或是设计不同方案、理清复杂关系、应对多重任务，这类研究人类通过手工操作往往难以实现。而对话式人工智能的强大算力可以大大加快科研进程，保证在较短时间内完成海量运算，规避人工操作的大量人力和时间成本，保证研究的持续推进，从而激发对于未知领域的探索。

一个例子是药物的研发，新药物研发的关键性任务是识别具有特定生物活性的化学物质。通过构建化学结构式生成、确定打分函数，人工智能可以加快化学物质生物活性的验证过程。[2]另一个例子是针对物种共存模式的研究，由于物种共存模式的复杂性，传统实验方法难以对植物群落的物种共存模式进行预测，但是人工智能工具却可以通过复制和模拟物种构成及其在不同类型土壤中的相互关系，发现有更大可能在物种构成方面带来高度多样性的先锋物种。[3]

可见，越是那些需要为复杂系统建模、进行高阶结构设计，或是设计规划实验、分解流程步骤的领域，如生物科学、材料科学领域或是药物研发领域，人工智能越是有可能提供研究的新方法和新途径。

总之，“借助机器学习对高维问题的表达能力，人类可以更加真实细致地刻画复杂系统的机理”[4]，随着人工智能技术的飞速发展，未来我国将“逐步构建以人工智能支撑基础和前沿科学研究的新模式，加速我国科学研究范式变革和能力提升”[5]。

二、对话式人工智能赋能科研创新的局限性

1.受限于数据和算力的制约

一方面，可获取的预训练数据集的数量和质量决定了人工智能工具的表现。大量开源和开放英文高质量语料资源为国外对话式人工智能工具的开发提供了便利。GPT-3的英文训练数据中有大量数据来自维基百科、开放图书馆网站、论文期刊网站（如arXiv.org）、技术问答社区（如Stack Exchange）、新闻存档网站（如The Real News Network）、医疗数据网站（如Pub Med）、代码社区（如GitHub）、网页爬虫数据网站（Common Crawl）。“相较于英文数据，中文数据的开源程度较低，导致中文数据集的规模相对较小。[6]MOSS团队曾表示，“中文网页上的干扰信息较多”[7]，这制约了处理中文语料的对话式人工智能的发展。随着大型语言模型的快速发展，也有计算机科学家预测，“到2026年，大型语言模型的训练将耗尽互联网上的可用文本数据，届时将没有新的训练数据可供使用”[8]，大型语言模型的进一步发展将面临困难。

另一方面，大型语言模型的训练与应用有赖于大量算力的支持。语言模型要达到一定的规模，一定时长和频次的训练，才能产生逻辑推理，展现处理复杂问题的能力。而模型的规模越大，需要的算力也就越多。类似ChatGPT这样的大型语言模型的每次回应指令，都需要数十亿次的计算。因此，新训练一个类似的大模型，需要上万块高性能GPU芯片的支持。可以说，当前谁能获得更多的高性能GPU芯片，谁就能在对话式人工智能的训练与应用上占得先机。

此外，在算力有限的背景下，如何分享和分配对话式人工智能工具的访问权也将成为越来越引发关注的问题。此前，由于访问需求量过大造成的算力紧张，OpenAI公司曾短暂暂停付费用户注册，并大规模清理亚洲等区域批量注册的账号。未来随着人工智能在科研行业渗透率的不断提升，算力紧张造成的人工智能访问权的差异将成为拉大彼此之间科研差距的潜在风险。

2.有赖于使用者的人工审核与全流程把控

一方面，使用者需要对人工智能的输出结果进行人工审核与把关。这是因为对话式人工智能是一种语言生成模型，其生成原理不同于搜索引擎的“匹配制”，即并非在已有数据库中搜索与关键词最匹配或最相近的结果，而是采用自回归模型的“预测式”生成办法，即根据使用者输入文本的前一部分内容依次预测下一个词，以此确定输出内容。这种“预测式”生成模式决定了其输出结果的真实性和可靠性受到了限制，即使采用了过滤和筛选机制，也难以完全避免生成虚假信息、帶有偏向性或是误导性的信息。因此，需要使用者通过人工审核对输出结果进行把关，考察其真实性、准确性、逻辑性、有效性、可操作性等。总之，人工智能赋能科研创新要求使用者了解人工智能工具的生成原理、局限性与使用边界，对其输出结果进行人工审核与把关。

另一方面，对话式人工智能作为一种大型语言模型，其拥有的海量训练数据意味着人机对话的演进方向有无数种可能。要让人工智能了解哪一个对话方向符合使用者的需要，有赖于使用者给予人工智能恰当而精确的持续反馈，即对人机对话进行全流程把控和引导。这种把控与引导包括：投喂合适的科研语料以帮助人工智能学习背景知识，准确描述需求与意图，尝试不同的交互方式，如提问—回答、输入指令、设定目标、界定情境、设定角色、提出个性化要求，等等。总之，只有给予人工智能持续的精确反馈与引导，对人机对话的演进方向进行全流程把控，才能更好地干预、调整、改进人工智能的输出结果，不断推进研究的深入。

三、未来发展方向：在保证人类安全与促进科技发展之间寻求平衡

随着ChatGPT的快速风靡，通过对话式人工智能进行的科研造假与由此引发的版权风险等问题已得到学界的广泛讨论，然而，技术的不当使用根源在于人，未来随着抄袭检测工具的开发与完善、科研评价标准的调整与改进，人类正确科研价值观的逐渐确立，人工智能工具的负面影响终将慢慢消解。科研工作者会将注意力更多转向探索人工智能工具的使用边界，发掘其在不同场景不同任务下可能实现的最大功能，将其打造成为具有多样化集成性功能的科研辅助工具，以优化科研流程，赋能科研创新。

总之，以ChatGPT为代表的对话式人工智能在技术上的跨越式发展预示着迈向通用人工智能的历史洪流已然开启。从历史发展的进程来看，未来社会各个行业与人工智能工具的深度绑定将加速实现，人工智能工具将最终成为人类社会智能基础设施中必不可少的一部分。同时，面对数据泄露、隐私侵犯、虚假信息、人机竞争等各种潜在风险，人类将持续推进人工智能技术的迭代升级，针对如何建设“可信赖”的人工智能进行更广泛的讨论，争取对人工智能模型和算法的透明度、可解释性等的监管在更大范围达成一致，以在保证人类安全与促进科技发展之间寻求平衡。

（作者单位系《中国特色社会主义研究》杂志社）