张丽娟,高静晖
(1.中国科学技术信息研究所;2.中国地质大学(北京)外国语学院)
2 0 2 3 年6 月, 经 合 组 织(OECD)发布《科学视野中的人工智能:研究的挑战、机遇和未来》报告认为,提高生产力是人工智能最具经济价值和社会效益的能力。当前,虽然人工智能正在渗透科学的所有领域和阶段,但其全部潜力远未实现。研究系统的决策者和参与者应进一步加速和深化人工智能在科学中的应用,扩大其对研究的积极贡献。对此,OECD提出了一系列政策建议。
人工智能有力提升了科学生产力。在经济方面,经济学家已建立了基础研究创新与长期生产力增长之间的基本关系:疫情导致的经合组织国家经济不景气、人口老龄化等问题使寻求增长变得更加紧迫。同时,现代经济中科学发挥的作用往往被低估:从科学贡献看,相关评估表明,仅依赖物理研究的产业对欧洲经济产出和经济总值的贡献就超过零售业和建筑业总和;从影响范围看,基础科学研究比以商业为导向的应用研究在更多国家和更多领域产生了更持久影响。理论研究表明,与产品自动化带来的增长相比,由高效研发带来的增长更为持久。在科学方面,尽管各学科领域快速发展(如天文和医药),但一些长期存在的问题仍未得到解决,通过加速科学创新,人工智能可能有助于找到解决全球挑战的方案。从技术创新、全要素生产率等衡量指标来看,科学本身也正变得更加困难,政府必须投入更多资金以维持现在的有效科学产出率。在此背景下,人工智能应以不同形式参与科学研究之中,帮助解决各类问题。
人工智能正应用于科学各领域和阶段,从假设生成到实验设计和模拟,再到科学出版和交流。未来,人工智能可能会优化许多科学工作流程,从数据收集到最终的统计分析,但要使人工智能真正发挥对科学的潜在影响,还有很长的路要走。
目前,人工智能正以不同形式参与到科学的各个阶段。在研究阶段,人工智能的主要应用有如下几类:典型的机器学习模型,对于假设生成、实验监督和精确测量等任务十分有帮助;具有生成新数据能力的生成式模型能协助模拟,如数据提纯和图像降噪;深度学习能有效处理非结构化数据,如卫星图像和全球气象数据;因果模型能分离相关性和因果关系,为医学和社会科学带来巨大益处。人工智能还可以跟踪长期科学进展中积累的多种不确定性,并在出现不确定性时优先确保数据收集;可以通过数学进步来间接促进科学发展,如2022年底,DeepMind宣布使用了一种强化学习技术来更快运行矩阵乘法。此外,人工智能还在科学中有其他更广泛的应用,如构建模型用于论文摘要总结和进行同行评审。但人工智能也会带来潜在问题,如深度学习模型无法识别数据库外的情况;开发人工智能模型需要投入巨大计算资源进行训练等。
除上述人工智能应用外,大语言模型将对未来产生巨大影响。2022年11月,OpenAI发布ChatGPT,这一语言模型能提高知识产出效率,并使科学界受益:能够快速自动编写演示文稿、论文等各种材料;能够快速撰写摘要;能够提高书面语言质量;能够降低非母语者语言障碍;能够编写计算机语言代码;能够通过对话激发创造力;等等。但这类大语言模型有时也会出错,需要在扩展训练时进行评估,确保其精确性。
研究人员认为,以实验科学为代表的科学,其未来在于人工智能主导的闭环自动化系统。自动化能够提高许多领域的生产效率,科学领域亦如此。未来,人类科学家需要思考如何与人工智能合作,其在多大程度上可帮助自己确定问题和解决方案,这是因为人工智能可能会发现人类科学家在研究中存在的偏差,或者发现其未能探索的研究领域,从而产生协同效应。为评估人工智能的自动化等级,研究人员制定了科学自动化五级框架。在第一级,人类仍然完整地描述问题,机器会进行一些数据操作或计算;第五级则对应完全自动化,没有人为干预。2020年首届图灵挑战研讨会参与者预测,第五级系统将在未来20~30年内实现。
统计机器学习是目前最常见且最成功的模型,但还不具备人类科学家的理性推理能力、抽象建模能力和逻辑思维能力(演绎和归纳),这些能力是科学发现的核心。其主要局限在于:需要大量数据,而某些科学领域往往无法获得这些数据;数据注释和标记问题;数据差异导致的数据不可泛化问题;机器学习的黑箱特性导致数据不可得。因此,无论数据供应丰富与否,数据理解和泛化问题都不能简单地通过应用更强大的统计计算来解决。目前,人工智能仍无法提出有趣的研究问题,设计适当的实验,并理解和描述其局限性,未来需要投入更多资源来构建科学发现所需的相关人工智能方法论框架。
除统计机器学习外,自然语言处理技术也有较为广泛的应用。但目前尚不能完成复杂的自动阅读理解任务,根本原因在于自然语言处理技术缺乏丰富的世界模型作为语言基础。另外,应用于科学领域的自然语言处理技术大都仅关注文章表面结构。为推动自然语言处理技术的进步,研究人员建议建立研究中心、通过资金支持或出版来激励研发。
未来,新型人工智能将通过与人类合作构建共同智慧推动科学进步。共同智慧旨在充分利用人类的直觉、情景化思考能力和抽象能力以实现合作能力超越单独个体能力总和。目前,充分将两者结合的认识正处于起步阶段,未来主要可通过编码与发现知识、连接并结构化知识以及监督与控制质量方式构建共同智慧。
此外,语言模型可作为研究工具参与到科学研究之中,并提高研究生产力。这类智能研究助手可保证工作质量、开放非专业人士对研究的访问权限、减少科学家耗时工作等。当前研究工具并不能有效协助研究人员快速、系统地获得答案,因此研究人员构建了人工智能研究助手Elicit。Elicit使用了包括ChatGPT-3在内的语言模型,能完成文献检索、审查、摘要、分类改写并识别提取对照实验的关键信息。通过Elicit,语言模型的进步使其直接转化为更好的研究工具。更好的语言模型意味着Elicit可找到更多相关研究,更准确地撰写摘要,并提取细节以帮助评估相关性或可信度。预计未来语言模型或将提供有关具有前景的研究方向的实用指导。ChatGPT和Galactica等模型的推出,强调了需要对评估过程进行审查以确保在应用扩展时的准确性。若其性能能继续改进,未来基于语言模型的研究助手或将具备提取参考文献并抓取元数据和故障排除等功能,并有可能形成由研究人员带领的独立团队。但人工智能研究助手也存在一定风险:高质量语言模型可能产出更多低质量内容;语言模型多由英语国家进行训练,未来可能会积累英语偏见和西方中心偏见。
近年来,人工智能的进步主要由大型科技公司开发或大规模部署深度学习技术来推动,大学和公共部门研究人员更多采用产业界开发的强大软件工具和模型。但深度学习的快速进步与公共或私人研究议程紧密结合所带来的短期好处也存在风险。例如,由于产业界可用的模型规模更大,学术界可能很难开发竞争性模型,或解释产业界的模型,并开发公共使用的替代方案。研究人员列出了目前的主要问题:人工智能研究的多样性近期出现停滞甚至下降;产业界主导的决策者研究比学术研究主题更狭窄但其影响力更大,其重点是深度学习技术;产业界倾向于专注深度学习以及在线搜索、社交媒体和广告定向等应用,较少关注决策者在医疗健康领域的应用以及对决策者社会影响的分析;一些最大、最负盛名的大学在人工智能研究的主题多样性方面低于预期;影响力较强的大学往往是私人公司的主要合作伙伴。
一是各国应展开广泛多学科计划,汇集计算机科学家、工程师、统计学家、数学家等,利用人工智能应对各类挑战。
二是促进机器人专家与领域专家互动,实验室机器人有能力彻底改变特定科学领域、降低成本并显著加快实验进度。
三是政府可鼓励并支持有前瞻性和深远影响的倡议。
四是推广普及高性能计算和软件,促进人工智能与科学共同发展。
五是利用人工智能技术协助学术培训,各国政府可采取措施提升开放研究数据的可用性,发掘从健康到气候等多个领域的数据潜力。
一是公共研发可针对性地深化人工智能在科学和工程领域的应用,专注突破性研究领域。
二是支持开发开放平台,跟踪以最为有效的人工智能模型解决不同问题的效果。
三是考虑到公共研发有助于培养新的跨学科高水平能力,各国政府应支持广泛计划,建立科学领域关键人工智能知识库。
四是决策者可支持相关研究,评估和量化人工智能研究范围变小对技术韧性、创造力和包容性可能带来的影响,以及相关行业对人工智能研究的影响力。
五是资助者可助力开发专业工具,增进人类科学家与人工智能团队的合作,并将这些工具纳入主流科学。
一是政策机构应系统评估人工智能对日常科学实践的影响,包括人类科学家与人工智能团队的合作、工作方式、职业发展轨迹和培训。
二是资助者和决策者应设立响应机制,依据所收集的意见建议采取行动。
三是资助者和决策者应支持建立新的独立论坛,持续对话探讨科学工作性质的变化及其对研究生产力和文化的影响。
四是决策者应关注大语言模型的实际应用。
五是政策应解决人工智能驱动的药物研发的双重用途所引发的潜在风险。
一是利用现有社交网络和平台来推广新兴实践。
二是采取措施提高人工智能研究的可重复性,公共资助机构可要求与第三方共享代码、数据和元数据,允许其在自己的硬件上进行试验。
三是决策者应支持发展中国家和地区,尤其是撒哈拉以南非洲地区,在科学领域获得更多的人工智能资金。