谢 国 王 乐,2 宋和平,3 肖 斌,4 廖 清,5 王志衡 吴国政
人工智能是信息科学中研究最活跃、发展最迅速、影响最广泛的领域之一.人工智能发展的重要趋势包括大模型、多模态智能、具身智能、大数据智能、联邦学习和隐私保护、可解释性和可信度、人机协同和交互、强化学习和自主决策等,这些趋势将推动人工智能技术的不断发展和应用,为各领域带来更多的创新和进步.
国家自然科学基金委员会(简称自然科学基金委)信息科学部信息科学二处(简称信息二处)人工智能领域主要资助人工智能及相关交叉学科领域的基础理论、基本方法和关键技术研究,一级申请代码F06.下设10个二级代码[1],具体包括:F0601,人工智能基础;F0602,复杂性科学与人工智能理论;F0603,机器学习;F0604,机器感知与机器视觉;F0605,模式识别与数据挖掘;F0606,自然语言处理;F0607,知识表示与处理;F0608,智能系统与人工智能安全;F0609,认知与神经科学启发的人工智能;F0610,交叉学科中的人工智能问题.重点支持机器学习、计算机视觉、模式识别与数据挖掘、自然语言处理、智能系统等方向的理论方法研究[2].
本文详细分析2023年度信息二处人工智能领域各类项目申请与资助情况,主要包括“人才”项目系列的创新研究群体项目(简称创新群体项目)、国家杰出青年科学基金项目(简称杰青项目)、优秀青年科学基金项目(简称优青项目)、青年科学基金项目(简称青年项目)、地区科学基金项目(简称地区项目)和“研究”项目系列的重点项目、面上项目,并对人工智能的学科发展提出若干展望,旨在为相关研究人员了解人工智能领域基础研究队伍、主要研究方向及项目资助情况等提供参考.
情况
自然科学基金委设立创新群体项目、杰青项目、优青项目以来,人工智能领域共资助创新群体项目4项、杰青项目35项、优青项目65项,其中,8名优青项目负责人获得本领域杰青项目资助、3名杰青项目负责人获本领域创新群体项目资助.
创新群体项目支持优秀中青年科学家为学术带头人和研究骨干,共同围绕一个重要研究方向合作开展创新研究,培养和造就在国际科学前沿占有一席之地的研究群体[1].2023年领域创新群体项目的申请数为3项,二级申请代码如下:F0604,机器感知与机器视觉(2项);F0608,智能系统与人工智能安全(1项).资助数1项,资助率为33.33%.
表1统计近五年(2019~2023)创新群体项目二级申请代码分布情况.
表1 近五年(2019~2023)F06各二级代码下创新群体项目申请与资助情况
从表1中可以看出,按申请数从多到少排列依次是:F0604,机器感知与机器视觉(12项);F0609,认知与神经科学启发的人工智能(7项);F0601,人工智能基础(3项);F0606,自然语言处理(2项);F0608,智能系统与人工智能安全(2项);F0603,机器学习(1项);F0605,模式识别与数据挖掘(1项);其余二级代码的申请数均为0项.最终,3个项目获得资助,分别归属于F0601、F00603和F0604这3个二级申请代码.
杰青项目支持在基础研究方面已取得突出成绩的青年学者自主选择研究方向开展创新研究,促进青年科学技术人才的成长,培养和造就一批进入世界科技前沿的优秀学术带头人[1].2023年度,领域受理来自全国51家依托单位的杰青项目申请78项,经通讯评审后推荐会议答辩项目8项,最终获资助5项.
表2给出近五年(2019~2023)杰青项目申请与资助情况.领域杰青项目申请数先从2019年的39项增至2020年的54项,随后在2021年减少到45项,2022、2023年连续增至51项、78项.从资助情况来看,资助数保持缓慢增加,资助率呈现波动,资助率最低为2023年的6.41%,最高为2022年的9.80%.
表2 近五年(2019~2023)F06代码下杰青项目申请与资助情况
表3统计近五年(2019~2023)领域杰青项目按各二级申请代码分布情况.近五年来,F06代码受理杰青项目申请共计267项,最终资助21项.总体来看,近五年二级代码F0604(机器感知与机器视觉)申请数和资助数最多.二级代码F0602(复杂性科学与人工智能理论)申请数最少.二级代码F0601(人工智能基础)、F0609(认知与神经科学启发的人工智能)、F0604(机器感知与机器视觉)、F0603(机器学习)、F0606(自然语言处理)近五年平均资助率高于领域近五年平均资助率(7.87%),其余二级代码的近五年平均资助率均低于领域近五年平均资助率.
表3 近五年(2019~2023)F06各二级代码下杰青项目申请与资助情况
优青项目支持在基础研究方面已取得较好成绩的青年学者自主选择研究方向开展创新研究,促进青年科学技术人才的快速成长,培养一批有望进入世界科技前沿的优秀学术骨干[1].2023年度,人工智能领域受理来自全国62家依托单位的优青项目申请91项,经通讯评审后推荐会议答辩项目12项,最终获资助8项.
表4给出近五年(2019~2023)领域优青项目申请与资助情况.
表4 近五年(2019~2023)F06代码下优青项目申请与资助情况
由表4可见,近五年项目申请数在一定范围内波动.从资助情况上看,资助数保持在8项或9项,资助率呈现波动,资助率最低为2020年的8.60%,最高为2022年的10.71%.
表5统计近五年(2019~2023)领域优青项目按各二级申请代码分布情况.近五年来,F06代码受理优青项目申请共计441项,最终资助42项.总体来看,近五年二级代码申请数和资助数排名前三的是F0604(机器感知与机器视觉)、F0605(模式识别与数据挖掘)、F0603(机器学习).二级代码申请数和资助数最后三名分别是F0602(复杂性科学与人工智能理论)、F0609(认知与神经科学启发的人工智能)、F0610(交叉学科中的人工智能问题).二级代码F0603(机器学习)、F0607(知识表示与处理)、F0606(自然语言处理)、F0604(机器感知与机器视觉)、F0605(模式识别与数据挖掘)的近五年平均资助率高于领域近五年平均资助率(9.52%),其余二级代码的近五年平均资助率均低于领域近五年平均资助率.
表5 近五年(2019~2023)F06各二级代码下优青项目申请与资助情况
青年项目支持青年科学技术人员自主选题开展基础研究工作,培养他们独立主持科研项目、进行创新研究的能力,激励他们的创新思维,培养基础研究后继人才[1].2023年,人工智能领域收到516家依托单位的1 484项青年项目申请,其中有2项申请因不符合年度项目指南规定的申请条件或要求被初筛,其余1 482项申请经通讯评审和会议评审后,157家依托单位的344位申请人获资助,资助率约为23.18%,资助占比(获资助依托单位数/申请依托单位数)约为30.62%.与2022年度同类项目相比,获资助青年项目的依托单位增加15家,从资助层面上反映青年项目的覆盖面越来越广.
图1统计青年项目申请量排名前十的依托单位申请与资助情况.
图1 2023年度领域青年项目申请数排名前十的依托单申请与资助情况
在图1中,中国人民解放军国防科技大学、中国科学院自动化研究所、之江实验室申请项目数排名前三,哈尔滨工业大学、中国科学院自动化研究所、四川大学(并列)、浙江大学(并列)、中国人民解放军国防科技大学(并列)获资助项目数排名前三.这10家依托单位的总申请数约占领域总申请数的12.87%、获资助项目数约占总资助数的22.97%.从10家依托单位的单位资助率(本单位获资助数/本单位申请数)上看,这些依托单位均高于平均资助率(23.18%),哈尔滨工业大学获资助率最高,超过本领域青年项目平均资助率的3倍,其后的四川大学、浙江大学单位资助率均超过50%.
表6统计近五年(2019~2023)青年项目的申请数、资助数和资助率情况.由表可以看出,近五年人工智能领域的青年项目申请数逐年增加,而项目资助率近三年呈下降趋势.
表6 近五年(2019~2023)F06代码下青年项目申请与资助情况
表7统计2023年度领域各二级代码的申请和资助占比情况.表中,F06表示申请人只选择一级申请代码F06作为其主要申请代码,下同.由表可见,F0610(交叉学科中的人工智能问题)、F0604(机器感知与机器视觉)、F0603(机器学习)、F0605(模式识别与数据挖掘)、F0606(自然语言处理)5个二级代码申请数和资助数均位列前五.从资助率上看,排名前五的二级代码为F0601(人工智能基础)、F0603(机器学习)、F0606(自然语言处理)、F0608(智能系统与人工智能安全)、F0607(知识表示与处理).
表7 2023年度F06各二级代码青年项目申请与资助情况
地区项目支持特定地区的部分依托单位的科学技术人员开展创新性的科学研究,培养和扶植该地区的科学技术人员,稳定和凝聚优秀人才,为区域创新体系建设与经济、社会发展服务[1].2023年度人工智能领域收到来自12个省份106家依托单位的地区项目申请400项,经通讯评审和会议评审后,35家依托单位的61位申请人获资助,资助率约为15.25%.
图2统计地区项目申请量排名前十的依托单位申请与资助情况.其中,新疆大学、桂林电子科技大学、昆明理工大学申请项目数排名前三,云南大学、西北民族大学、广西师范大学(并列)、江西师范大学(并列)、昆明理工大学(并列)、桂林电子科技大学(并列)获资助项目数排名前三.这10家依托单位的总申请数约占领域总申请数的36.50%、获资助项目数约占总资助数的45.90%.从10家依托单位的单位资助率(本单位获资助数/本单位申请数)上看,这些依托单位除北方民族大学、新疆大学、贵州大学以外均高于平均资助率(15.25%),云南大学获资助率最高,超过本领域地区项目平均资助率的3倍,其后的西北民族大学、广西师范大学、江西师范大学单位资助率均超过25%.
图2 2023年度领域地区项目申请数排名前十的依托单位申请与资助情况
表8统计近五年(2019~2023)地区项目的申请数、资助数和资助率情况.由表可以看出,近五年人工智能领域的地区项目申请数、资助数逐年增加,同时项目资助率近三年呈上升趋势.
表8 近五年(2019~2023)F06代码下地区项目申请与资助情况
表9统计2023年度领域各二级代码的申请与资助情况,F0610(交叉学科中的人工智能问题)、F0606(然语言处理)、F0603(机器学习)、F0605(模式识别与数据挖掘)、F0604(机器感知与机器视觉)、F0601(人工智能基础)这6个二级代码申请数和资助数均位列前六.
表9 2023年度F06各二级代码地区项目申请与资助情况
从资助率上看,排名前二的二级代码F0602(复杂性科学与人工智能理论)、F0609(认知与神经科学启发的人工智能)的资助率超过本领域地区项目平均资助率的2倍,其后的F0601(人工智能基础)、F0606(自然语言处理)、F0608(智能系统与人工智能安全)资助率均超过15%.
本节分析人工智能领域重点项目和面上项目等四类项目申请与资助情况.
重点项目支持从事基础研究的科学技术人员针对已有较好基础的研究方向或学科生长点开展深入、系统的创新性研究,促进学科发展,推动若干重要领域或科学前沿取得突破[1].信息科学部通常在当年发布的重点项目申请指南中给出下一年度的重点项目立项建议征集信息,根据2022年度征集的指南建议,并结合信息科学学部“十四五”发展战略规划和优先资助领域,2023年度,自然科学基金委信息科学部共发布4个重点项目群(20个研究方向)和104个重点项目立项领域[1],F06代码下有10个重点项目立项领域,收到重点项目申请34项,根据通讯评议结果,12个项目获得上会答辩资格.经过专家会议评审,2023年度F06共资助重点项目8项.
图3统计近五年(2019~2023)领域重点项目申请量排名前十的依托单位申请与资助情况.
图3 近五年(2019~2023)领域重点项目申请数排名前十的依托单位申请与资助情况
在图3中,中国科学院自动化研究所、西安电子科技大学、清华大学申请项目数排名前三,中国科学院自动化研究所、清华大学、北京大学(并列)、西安电子科技大学(并列)、西北工业大学(并列)获资助项目数排名前三.这10家依托单位的总申请数约占领域总申请数的38.58%、获资助项目数约占总资助数的41.82%.从10家依托单位的单位资助率(本单位获资助数/本单位申请数)上看,西北工业大学获资助率最高,超过本领域重点项目平均资助率的2倍,其后的中国科学院自动化研究所、清华大学、北京大学单位资助率均超过25%.
表10统计近五年(2019~2023)F06代码下重点项目的申请与资助情况.由表可以看出,近五年人工智能领域的重点项目申请数和资助数均呈现波动趋势,2021年度资助率最低为17.02%,2019年度资助率最高为25.42%.
表10 近五年(2019~2023)F06代码下重点项目申请与资助情况
表11为F06各二级代码下近五年(2019~2023)的重点项目申请与资助情况.从资助率上看,排名前五的二级代码F0604(机器感知与机器视觉)、F0606(自然语言处理)、F0609(认知与神经科学启发的人工智能)、F0603(机器学习资助率)、F0608(智能系统与人工智能安全)申请数和资助数均排在前列.F0602(复杂性科学与人工智能理论)、F0607(知识表示与处理)、F0610(交叉学科中的人工智能问题)这3个二级代码近五年未获重点项目资助.
表11 近五年(2019~2023)F06各二级代码下重点项目申请与资助情况
面上项目支持从事基础研究的科学技术人员自主选题,开展创新性的科学研究,促进各学科均衡、协调和可持续发展,为基础研究持续积蓄创新活水[1].2023年度,人工智能领域收到455家依托单位的1 675项面上项目申请,其中有2项申请因不符合年度项目指南规定的申请条件或要求被初筛,其余1 673项申请经通讯评审和会议评审后,111家依托单位的292位申请人获资助,资助率约为17.43%,资助占比(获资助依托单位数/申请依托单位数)约为24.40%.与2022年度同类项目相比,获资助面上项目依托单位减少9家,从资助层面反映面上项目的资助越来越趋于集中.
图4统计2023年度面上项目申请量排名前十的依托单位申请与资助情况.
图4 2023年度领域面上项目申请数排名前十的依托单位申请与资助情况
在图4中,西安电子科技大学、哈尔滨工业大学、浙江大学(并列)、电子科技大学(并列)申请项目数排名前三,哈尔滨工业大学、天津大学、四川大学获资助项目数排名前三.这10家依托单位的总申请数约占领域总申请数的14.39%、获资助项目数约占总资助数的22.26%.从10家依托单位的单位资助率(本单位获资助数/本单位申请数)上看,这些依托单位的资助率(除电子科技大学)均高于平均资助率(17.43%),天津大学获资助率最高,超过本领域面上项目平均资助率的3倍,其后的四川大学、哈尔滨工业大学、北京邮电大学、深圳大学单位资助率均超过25%.
表12统计近五年(2019~2023)面上项目的申请数、资助数和资助率情况.由表可看出,近五年人工智能领域的面上项目申请数除2021年以外逐年增加,而项目资助数持续增加,资助率在小范围内波动.
表12 近五年(2019~2023)F06代码下面上项目申请与资助情况
表13统计2023年度领域各二级代码的申请和资助占比情况,F0610(交叉学科中的人工智能问题)、F0604(机器感知与机器视觉)、F0605(模式识别与数据挖掘)、F0603(机器学习)、F0606(自然语言处理)这5个二级代码申请数和资助数均位列前五.
表13 2023年度F06各二级代码面上项目申请与资助情况
从资助率上看,排名前五的二级代码为F0606(自然语言处理)、F0601(人工智能基础)、F0608(智能系统与人工智能安全)、F0603(机器学习)、F0609(认知与神经科学启发的人工智能).
2023年度F06代码下的面上项目、青年项目、地区项目和重点项目均开展基于科学问题属性的分类申请与评审机制.
科学问题属性A——鼓励探索,突出原创:旨在让新思想及时得到支持,鼓励源于科学家灵感的自由探索,强调首创性,使科学基金成为新思想的孵化器.
科学问题属性B——聚焦前沿,独辟蹊径:旨在扩展新的科学前沿,强调开创性和引领性,使科学基金成为科学前沿的牵引器.
科学问题属性C——需求牵引,突破瓶颈:旨在破解国家重大战略需求和经济社会发展中的核心科学问题,使科学基金成为经济社会发展和国家安全的驱动器.
科学问题属性D——共性导向,交叉融通:旨在以共性科学问题为导向,促进不同学科的交叉融合,使科学基金成为人类知识的倍增器[1].
根据基础研究发展的新形势和新要求,自然科学基金委2024年度进一步优化分类申请与评审模式,将四类科学问题属性简化为“自由探索类基础研究”和“目标导向类基础研究”两类研究属性.“自由探索类基础研究”是指选题源于科研人员好奇心或创新性学术灵感,且不以满足现阶段应用需求为目的的原创性、前沿性基础研究.“目标导向类基础研究”是指以经济社会发展需要或国家需求为牵引的基础研究.分类评审的项目范围为重点项目、面上项目和青年科学基金项目.
表14列出2023年度F06代码下面上项目、青年项目、地区项目和重点项目科学问题属性的分布情况,各类项目申请中B类和C类科学问题属性的数量明显多于A类和D类,受申请数量的影响,资助数在科学问题属性上的分布特性与申请数基本一致.面上项目、青年项目、地区项目和重点项目中A类科学问题属性的申请和资助数量均最少(A类科学属性的重点项目获资助数为0项).D类科学问题属性的申请数和资助数也较少(D类科学属性的重点项目获资助数为0项).因此,如何在自然科学基金委资助架构下,加强人工智能原创探索研究和与其它方向的交叉研究以及投入成为亟待解决的问题.
表14 2023年度F06代码下面上项目、青年项目、地区项目和重点项目科学问题属性分布情况
1)人工智能辅助指派.《国家自然科学基金委深化改革实施纲要》明确指出,要“完善评审机制”,实现“分类、科学、公正、高效”的智能化辅助评审,2023年度F06代码下的所有面上项目、青年项目、地区项目采用人工智能辅助指派(AI指派)系统,以提升评审专家和申请书之间匹配的精准度[2].
2)负责任、讲信誉、计贡献的评审机制[2].2023年度F06代码下的所有项目采用RCC(负责任、讲信誉、计贡献)的评审机制.鼓励评审专家认真负责地对申请书进行评审,做出科学的判断.对评审专家的评审效果和公正性进行统计,包括评审的准确率、反馈意见的及时性和说服力等.鼓励评审专家在评审过程中,尽可能地对申请人的工作提出有价值的建议,特别是提出重要的学术思想,同时对评审专家的责任和信誉方面的贡献做出统计.
3)相似度核查工作[3].在2023年度通讯评审过程中,信息二处对F06代码下的所有面上项目、青年项目和地区项目申请书进行相似度核查.若本年度受理的申请书和往年未资助的申请书相似度大于30%,且申请人不同,则与相关申请人联系并要求出具知情同意书,如被联系人表示不知情,则对已受理的申请人按照相关规定处理.若本年度受理的申请书与已获资助的申请书相似度大于30%,则将相关材料整理到会议评审现场,请会议评审专家综合评价并作决议.若本年度受理的申请书之间相似度大于30%,则将相关材料整理到会议评审现场,请会议评审专家综合评价并作决议.
4)优先资助情况.为落实中央精神,信息二处在2023年度对F06二级代码的F0601(人工智能基础)、F0603(机器学习)、F0608(智能系统与人工智能安全)方向上的项目在同等情况下予以优先资助.
根据国家“十四五”规划的整体布局,信息二处在国家自然科学基金资助框架下,就人工智能领域提出如下发展战略和科学部优先发展方向[4-5].
1)安全可信人工智能基础理论.围绕人工智能应用中的安全可信复杂性难题,重点研究大型知识库自动构建、表示与推理等方法,探索自主遂行复杂任务的智能本体理论,建立具备自主学习和进化能力的认知模型,发展通用人工智能算法,支持安全可信人工智能模型验证,有效支撑工业、医疗、公共安全等领域人机混合应用的快速发展.
2)类脑模型与类脑信息处理.为了克服构建类脑智能模型等难题,重点研究复杂环境高性能智能视觉传感器及系统技术,对视听感知等生物智能对应脑区的神经网络实现精细模拟,从而构建大脑视觉智能和芯片功能验证方法体系,探索大脑信息处理机理,为类脑自然环境的感知、理解和自主决策奠定理论基础.
根据国家“十四五”规划的统一部署,以及2021~2035年科学基金中长期发展规划的具体要求,自然科学基金委信息科学部2024年度拟在F06代码下设立“数据要素流通基础理论与关键技术”重点项目群,拟资助5个重点项目,二级代码分别为:F0607(面向数据要素高效共享流通的跨域数据管理关键技术研究),F0607(数据要素基础元件的构造、关联与协同计算理论方法),F0607(数据要素流通链路穿透式安全保障技术),F0607(非完备信息下的数据供需撮合技术),F0607(面向数据要素竞价的复杂均衡演绎方法与平台建设).
为了促进学科发展,国家自然科学基金重点支持从事基础研究的科学技术人员针对已有较好基础的研究方向或学科生长点开展深入、系统的创新性研究,促进学科发展,推动若干重要领域或科学前沿取得突破.信息二处在征集到的88份重点领域建议书的基础上,经通讯评议、会议评审讨论投票,2024年度拟在F06代码下以重点项目形式重点支持以下8个方向:F0601(无人集群的自主社会化学习与进化),F0603(基于大语言模型的可解释多模态学习方法),F0604(面向复杂场景解析的神经拟态视觉计算),F0606(藏医药知识智能分析方法研究),F0607(大小模型协同的跨模态知识融合计算),F0609(大模型赋能的脑机融合智能新范式),F0610(基于神经符号系统的数学推理研究),F0610(基于经络脉象网络的中医数据挖掘与解析研究).
2024年,自然科学基金委将进一步推进科学基金深化改革,出台一系列改革举措持续提升资助效能,主要包括:择优遴选不超过20%的杰青项目给予滚动支持;将女性申请杰青项目的年龄限制放宽到48周岁;继续试点资助优秀博士研究生、本科生;优化分类申请与评审模式,将四类科学问题属性简化为“自由探索类基础研究”和“目标导向类基础研究”两类研究属性;取消面上项目连续两年申请未获资助后暂停一年申请的限制等.信息二处在自然科学基金委及学部统一领导下,按照“四个面向”的要求,坚持基础研究“两条腿走路”,坚决贯彻落实科学基金的各项改革举措,密切关注人工智能领域发展动态,组织领域专家凝练关键科学问题,积极谋划重点以上类项目布局,持续加强领域基础研究和应用基础研究.