美国国防语言能力人工智能建设

2021-04-26 18:08梁晓波
关键词:自然语言处理人工智能

梁晓波

摘 要:人工智能已成为当今世界军事建设的重头戏。为了加强国防语言能力建设,美国国防部很早就开始强力推进人工智能的研究和应用。自20世纪70年代以来,美国国防高级研究计划局和情报高级研究计划局牵头规划了大量项目,对美国国防语言能力建设起到了重要的推动作用。美国军方在推进国防语言能力人工智能建设方面有十大特征:理念上高度重视;时间上贯穿发展全程;内容上凸显技术深化、复杂化、实战化和高水平化;形式上更加复合系统化;技术上以自然语言处理为核心;生态上与其他项目共同交织、互为补充、相互伴随、相互嵌套、相互融合;效果上成效显著、引人注目;驱动上以创新作为项目发展的重要源泉;管理上形成了有效引导模式;路径上形成了高级科研指导部门牵头、其他有能力有实力单位负责承担完成的机制。美国国防语言能力建设在建设理念、领导机关、建设机制、创新驱动、军民融合、体系结构等方面对我国具有重要的启示意义。

关键词:人工智能;国防语言;语言能力建设;自然语言处理;语言智能

中图分类号:TP18  文献标识码:A  文章编号:1004-8634(2021)02-0123-(12)

DOI:10.13852/J.CNKI.JSHNU.2021.02.013

随著计算机科学技术的发展,特别是算法的改变、芯片性能的快速提升、计算机运算速度的显著提高以及大规模数据的快捷运算和处理能力的实现,当下人工智能的研究进入了一个异常快速发展的阶段。世界各国都纷纷制定人工智能的发展战略,抢占人工智能研究和产业高地。美国作为人工智能研究和投入的领衔国家,在这个领域有着许多突出的成绩。在技术上,从基于规则的模拟发展到概率统计的近似,再到联结主义、神经网络和深度学习自吻合;在处理能力上,从简单模式识别到语音识别,再到深度情感分析;在人机能力比拼上,从深蓝计算机打败卡斯帕罗夫到AlphaGo打败李世石、柯洁;在智能研究产品上,从波士顿一代行走狗到二代跳跃翻滚狗;在实战化装备上,从单机版的无人机完成远程任务到数以百计的蜂群无人机同时参与演练;等等。人工智能时代已经来临,而且有愈演愈烈的势头。尽管还存在一些短板和瓶颈问题,但美国人工智能的发展已渗透进科技、教育、工业制造等各行各业,在军事、政治、经济和社会生活各领域都孕育着新发展、新挑战,特别是为科技创新发展带来了新的天地。由于人工智能研究的发展,美国军事领域受益匪浅,其国防语言能力建设也获得新赋能,有了新模式,进入新境界。本文将结合美国主要国防机构在国防语言能力人工智能领域的项目开发及能力建设,来探讨美国人工智能的发展对国防语言能力建设的影响,以期对我国有所启发和借鉴。

一、美国人工智能战略

美国一直高度重视人工智能的投入和发展,自1998年以来人工智能就被置于战略发展地位,2013年以来更是发布了多项人工智能的战略级计划。1为了进一步确保在人工智能领域的领导地位,2016年美国又连续颁布了《为人工智能的未来做好准备》和《国家人工智能研发战略计划》。特朗普更是高度重视人工智能的地位,2018年1月颁布的《国防战略》报告,专门强调了人工智能中多个领域对国家安全的重要性——先进计算、大数据分析、自主性和机器人等。2018年3月,美国国际战略研究中心发布《美国机器智能战略研究报告》,同年,美国新安全中心和国际战略研究中心分别发布《国际安全与人工智能》和《人工智能与国家安全:AI生态系统的重要性》。2019年2月,美国总统特朗普签署《美国人工智能倡议》,同年6月,美国白宫又颁布新版《国家人工智能研究和发展战略计划》。2一系列的重要战略和举措,使得人工智能成为美国当下最为引人注目的新科技、新领域、新方向。

美国军方对人工智能的重视程度也超乎寻常,同样发布了相应的战略规划,以更好地发挥人工智能在军事上的重要推进器作用。仅从2016年有关数据来看,美军运用人工智能提升军事装备能力的项目就多达16项,覆盖了士兵头盔和战场信息呈现装备、雷达跟踪与对抗、无人机蜂群战术、反无人机、小型定向航天器、持枪机器人、人机协同、士兵自发电装置、无线电自适应装置等;同年,美国陆军部还公布了到2045年影响世界的科技前沿技术,排名前10项的物联网、机器人与自动化系统、智能手机与云端计算技术、智能城市、量子计算、混合现实、数据分析、人类增强、网络安全、社交网络都是与人工智能紧密相关的领域。2019年2月12日,也就是特朗普签署行政命令启动“美国人工智能计划”一天后,美国国防部网站公布《2018年国防部人工智能战略摘要——利用人工智能促进安全与繁荣》,文中特别勾画了人工智能在国防领域面临的战略形势,指明了国防部加速推进人工智能能力提升和应用的途径、方法。3同年9月,美国空军发布2019年人工智能战略,强调美国“空军负责为国家提供空中和太空优势、全球打击、快速全球机动能力、情报、监视和侦察以及指挥控制”。这也成为迄今为止首份较为详尽的美国军种人工智能发展战略。4

二、美国国防人工智能的语言相关项目

美军推进人工智能为军队发挥作用的最为重要的机构是国防高级研究计划局(DARPA),其次就是国防部另一个下属机构国防部情报高级研究计划局(IARPA),新近成立的联合人工智能中心(Joint Artificial Intelligence Center,缩写JAIC)、国防创新小组(Defense Innovation Unit,缩写DIU)等也开始发挥作用。自20世纪60年代起,以前两个机构为主的美国军方就持续不断地设立专门的项目,牵引人工智能的研究力量,为军队解决关键技术和核心技术。许多技术都是军队发展中极具创新的项目,为军队多方面的能力提升发挥了重要作用。

为了更为直观地展示这两家机构设立的项目及其特点和发展变化,下面以表格的形式(表1、表2),列举了自人工智能研究开始以来,美国国防部国防高级研究计划局和情报高级研究计划局为国防语言能力领域规划的涉及语言智能的重要项目,也列举了其他个别部门设立的涉及语言智能的重要项目。

除表1、表2美国国防部国防高级研究计划局和情报高级研究计划局设置的涉及语言的人工智能项目外,还有美国国防部长办公室设置的人类社会文化行为建模项目(Human Social Culture Behavior Modeling Program),①美国国家标准与技术研究所设置的自动内容抽取项目(Automatic Content Extraction,縮写ACE)。②

三、分析与评价

表1、表2列举了美国国防部下属机构国防高级研究计划局和情报高级研究计划局等机构牵头推进的与国防语言能力相关的人工智能项目。

从项目数量和建设内容来看,这两家机构显然为美国国防语言能力人工智能领域的建设发挥了重要作用。项目建设大体经过了50多年的发展,其内容不断丰富、深化和复杂化。概而言之,各类项目建设内容大体经过了以下路径:语言语料库的资源建设→语音识别与理解→语言信息的抽取、分析及摘要生成→跨语言信息检索→人机交互与交流→多语言文本与语音的翻译→有限语种口语交流与翻译系统→机器阅读与文本理解→海量信息语音识别与机器翻译→大数据驱动下的多语言文件自动分析与翻译→多模态文本信息处理与理解→社交媒体话语理解与分析→智能媒体技术→认知深度伪造技术(图像、视频语音文本等)→基于大数据深度信息检索→多维度、多模态智能信息处理→知识表征与大脑认知(认知语义计算)→多学科、多维度、多领域的信息计算(认知语义计算)→社会文化、心理行为建模与计算(复杂社会计算/认知语义计算)→多学科结合与融合的情景分析与预判(多学科复杂融合大数据智能建模计算)。

以上这个过程是一个从低级到高级、简单到复杂、单一到多重的过程,一个能力不断增强、不断迭代的过程,一个不断提高、走向融合、形成体系化的过程,一个由一般性机器识别与翻译到复杂语境和社会环境下的智能翻译、信息处理、获取关键信息并做出复杂判断及决定的不断升级的过程,也是一个由初级语音识别到高级认知计算模拟大脑认知解决问题能力不断提升的过程。

从两家机构主导的国防语言人工智能项目可以看出,国防高级研究计划局既重视多语种的资源和翻译建设,也重视语言在多种模态和语境下的分析、判断;而情报高级研究计划局更看重将语言置于认知计算下和开展多学科研究,尤其关注多学科、多领域的大数据和复杂计算。国防高级研究计划局更看重开发应用于军事训练和指挥类的语言文化等方面的基础性、服务性项目,此方面的项目数量该局牵头的明显较多;情报高级研究计划局的项目更注重对情报的获取、分析和决策能力,注重为情报的生成能力提供支持,特别关注集语言文化、行为心理等多领域诸多社会因素于一起的情报分析能力的提升。

纵览以上这些项目我们不难发现,美国整个军方国防语言能力的人工智能建设具有以下一些重要特点:

第一,从理念方面看,美国军方高度重视人工智能在国防语言能力建设方面的特殊作用。美军在国防部国防高级研究计划局和情报高级研究计划局等领衔单位的规划下,从20世纪70年代就开始探索将人工智能的理念、技术、装备引入国防语言能力建设领域中。尽管其间美国人工智能有起有落,但是美军一直没有弱化人工智能在国防语言能力建设领域的研究。相反,自从引入人工智能以来,美国军方是越来越重视人工智能的项目设置,也越来越知晓人工智能对美国国防语言能力的支撑作用,走出了与国防语言能力人才队伍建设比翼齐飞的另一条智能化国防语言能力建设的路子。

第二,从时间方面看,项目建设贯穿人工智能发展全过程。美国国防语言能力的人工智能建设从20世纪70年代始,几乎贯穿了美国人工智能建设的全过程。在过去的50多年中,美国人工智能经历了基于规则、概率统计和深度学习的自适应学习三个阶段。由于人工智能的特殊性,语言研究本身既是其中的基础项目,也是其中的长远项目。语言智能问题是许多项目都面临的基础问题与共性问题,因此,我们很容易注意到,在发展的所有阶段中,美国人工智能研究都与国防语言能力研究相结合。半个多世纪的发展中,国防语言能力与人工智能的结合始终是美国人工智能研究着手解决的关键问题,各时期都有持续投入,而且投入有不断增加的趋势。

第三,从内容方面看,国防语言人工智能不断凸显技术深化、复杂化、实战化和高水平化。美国国防语言能力建设走过了一条由简单到复杂,由单语种到多语种,由单一功能到多维用途,由保障军队获取情报、支持军方早期形势研判、参与现场军事行动应对和作战、研制拥有可靠性能的装备到提升部队生存能力、战斗力和影响力的道路,为美军在情报搜集、获取与分析,战场态势感知与处理,军事行动与作战指挥,海外复杂语情、社情、民情、政情、文化形态多种环境下生存,应对与处理复杂事端提供了有力支持,成为美军新质战斗力的重要组成部分。

第四,从形式方面看,从单一简单项目向复合系统性项目发展。美军国防语言能力人工智能建设,经过半个多世纪的探索和实践,已经走上了成熟的道路。其项目建设一般经过一段时间的预研,然后经过项目的评估,接着才是项目的正式下达。项目完成后,如果军队运行效果较好且又产生新的能力需求,美军还会以第二阶段、第三阶段的形式追加经费。其项目实行更为灵活的竞争机制,邀请一批科研机构和商业公司参与解决某个领域的现实问题的对抗性竞赛,以挑选合适的人员和单位承担有关项目的研制。从研制的单位来说,一批一流的大学、商业公司和其他科研机构(不乏一批美国顶尖大学和公司,甚至包括国外公司和机构)成了项目的合作方,如哈佛大学、斯坦福大学、马里兰大学、宾夕法尼亚大学、谷歌公司、雷神公司等。

第五,从技术方面看,自然语言处理是人工智能的核心支撑学科。无论是初期较为单一简单的项目,还是后期更为复杂复合的项目,大都需要自然语言处理作为核心支撑。初期主要集中在语料库建设、语音识别、语音与文本转写、主题词追踪、词语和文本聚类、本体构建、摘要生成、语义分析、情感分析、自动翻译等方面;后期越来越与其他技术相结合,特别是大数据分析、深度学习、多领域数据挖掘、多语言多模态资源分析、视频数据综合分析、社会文化建模、多因素综合分析与决策等技术。自然语言处理中的多项技术综合应用成为国防语言人工智能建设的重要支撑。在后期建设中,自然语言处理的理论和技术也与其他领域的技术融合,为国防语言能力建设走向复合型提供了支撑。

第六,从生态方面看,语言项目与其他项目交织,互为补充、互相伴随、相互嵌套发展。美军国防语言能力人工智能研究项目,是整个美军人工智能项目的重要内容,更是美军人工智能研究的重要基础。国防语言能力人工智能项目既是单纯的语言能力建设的重要尝试,也是其他项目的重要基础。正是因为国防语言能力人工智能的创新研究,使得美军许多其他项目得以有效开展,而其他项目的发展又推进了国防语言能力建设的发展。美军国防语言能力人工智能领域的發展,并不仅仅是国防语言能力的发展,更是人工智能整体能力和水平的发展。也就是说,美国国防语言能力从单纯的本领域研究走向了复合型、嵌入型、伴随型、共生型、复杂型的人工智能生态。

第七,从效果方面看,建设成效引人注目。美军国防语言能力建设的人工智能举措走过了50多年的历程。既有一次性投入的单个项目,更有一些得到持续性投入的项目,如多语言、跨语言翻译和信息处理领域。半个多世纪以来的建设与发展,使得美军在国防语言能力人工智能领域有了良好的基础和成功的经验,一些领域甚至取得了关键性突破。其中,多语种领域的自动翻译及语言文化心理行为建模较为突出,基于认知的人机互动也有明显的进展。总体来说,美军国防语言能力人工智能建设成绩斐然,引领全球,令世界瞩目。

第八,从动力方面看,人工智能与国防语言能力建设成为相互创新的源泉。一方面,美军人工智能建设成为国防语言能力建设的重要创新源头,为美军解决语言专家不足、语言支持服务人手不够、军事行动前方语言保障无法做到语言人力到场、综合语言情报分析水平不高、大规模语言文化信息处理能力严重不足等问题提供了良好的解决办法。另一方面,国防语言能力的人工智能项目研究也是美军整个人工智能领域创新的重要源泉,一系列的创新为美军人工智能的创新打下了坚实的基础。

第九,从管理方面看,形成了国防语言能力人工智能建设的有效引导模式。众多项目的牵引单位是美国国防部下属的国防高级研究计划局和情报高级研究计划局,而这两家本身就是长期从事战略性、前瞻性、全局性和关键性技术项目研发的筹划、设置、发布和管理单位。它们既了解美军全军的重大需求,又知道技术研发面临的瓶颈问题和应该发展的方向,对于各类项目推进的全过程也非常熟悉,因而使得各类项目能够得到有效的管理,从总体上避免了项目主管单位过多、项目管理各自为政出现内耗、管理不力、项目推进困难、研发出现偏差、项目建设重复或雷同、战略服务方向偏离、理论方向与应用方向脱离等局面的产生。

第十,从路径方面看,形成了一种高级科研指导部门牵头、其他有能力有实力单位承担完成的特殊机制。美国国防部成为美国军方国防语言能力人工智能建设推进的最为重要的顶层设计师和高级推手,根据美军在日常生活、军事训练、多国联合演练、军事侦察、军事战斗、反恐行动、人道主义救援、战后重建中所产生的对语言能力的重大需求,形成研究问题并转化成研究项目,然后向军地机构公布,通过能力评估挑选合适单位(一个项目往往涉及多家单位的参与,很多是军地单位的共同参与)实施研究直至结项。美国有大批高水平的商业公司、高校以及其他科研单位,因此,一个项目经常由一批大学和公司共同参与、共同完成,而国防部的下属机构所扮演的角色主要是对项目建设指引方向、指导推进、实施评估、资助与再资助。由此,美国建成一支强有力的军民融合的国防语言能力人工智能建设大军,由此带动了军队和地方科研院所、商业公司的飞速发展,也培养了一批既有能力、发展潜力也有影响力和创新力的人才队伍和科研基地。

四、重要启示

前文介绍了美军在国防部下属的国防高级研究计划局和情报高级研究计划局牵头推进的国防语言能力人工智能建设项目的基本情况,并对其主要做法做了归纳和总结。从美军的主要做法中,可以得到一些重要的启示。

第一,要高度重视国防语言人工智能建设。从美军来看,经过长期持续不断的建设,美军国防语言能力人工智能领域已经取得长足的进步,在语音识别、多语种翻译、文本分析和理解、大数据检索、多模态文本理解、基于大数据的智能媒体监控与传播、语言文化心理与行为建模、人类认知与大脑思维模拟等领域都取得了重大进展,既有效地推进了美国人工智能的发展,促进了国防语言能力的自身发展,也促进了美国军方在国防语言能力及其相关领域形成了强大的技术能力、装备能力、学科能力、体系能力、综合能力。

第二,要成立专门机构来指导和推进国防语言向人工智能领域进军。美军在国防部的领导下,主要由国防高级研究计划局和情报高级研究计划局来负责推进和落实,避免了专项工作没有相关部门负责和管理、项目出现无序发展、科研空转或者重复立项、不成体系、无法配套等问题的产生。美军在建设中非常注重利用国防部这两家重要机构的指导和牵引作用,努力保证国防语言能力人工智能建设能够在军队长期坚持下去,并且根据军队的需要有步调、有衔接、有接口、成体系地发展下去。再就是由于领导机构固定,在项目建设中统一标准,使得项目之间的数据接口能够通用,哪怕项目建设完成多年以后,其数据、系统和装备依旧可以与后面的项目形成模块化即插即用。

第三,要建立一套推进人工智能走进国防语言并向多领域纵深发展的项目驱动机制。美国很早就注意到人工智能对国防语言能力的重大支撑作用,而人工智能很多领域又以语言智能的发展为基础。在这种双面夹心饼干效应的作用下,美国采取以项目驱动为主要机制的多样化国防语言能力人工智能建设的办法。对于大部分项目,设有一个预先研究的时间段,在研究评估过后,再进行正式资助,展开大规模研究;对于项目进展较好、有良好需求和效益、未来发展有很大潜力的,则进行持续不断的资助。随着研究的推进,项目不断深化和拓展,并与其他领域产生联合、融合效应,既促进了国防语言能力建设,也有利于以国防语言能力为基础的技术延伸和项目融合,从而促进项目群向高精尖及纵深发展。

第四,要以创新思维来鼓励和引导国防语言人工智能建设的快速发展。人工智能在国防语言领域的研究项目多数都是基础性、探索性项目,往往创新性极强。这种求新求变的思维和举动,对美国国防语言能力建设提供了创新的发展动力,极大地缓解了美军语言人才不够、语言能力存在短板、语言分析能力不足、大规模语言文化信息处理能力偏弱、海量的多模态军事情报信息获取与分析应对乏力,以及发展迅速的社交媒体不断产生大数据分析和智能分析的巨大压力。这种创新使美国国防语言能力建设形成了一条区别于国防语言能力语种人力队伍建设的另外一条道路:高技术条件下的国防语言能力人工智能道路。这条道路应该是有效地促进了美军国防语言能力的技术建设,也减轻了人才队伍建设高投入、见效慢、难持续、难以随时保障的压力。

第五,要积极探索国防语言能力人工智能建设的军民融合之路。美国人工智能研究领先全世界,是一条集合军队和地方各类机构的军民融合之路。除了军方部门和军兵种参与外,美国的高校,如麻省理工、卡耐基梅隆大学、斯坦福大学、哈佛大学、马里兰大学、加州大学伯克利分校、宾夕法尼亚大学等一直都是军方人工智能研究的重要基地。同时,语言领域的人工智能产业实力也很雄厚。在2019年公布的全美排名前50家人工智能公司1中,与语言领域相关的公司超过10家;一些商业巨头公司,如谷歌、苹果、微软、雷神等都为美军国防语言能力人工智能建设贡献了不可多得的力量。一些大学的研究团队也取得了长足发展,在相关研究领域独占鳌头,如斯坦福大学的自然语言处理方向,宾夕法尼亚大学的语言数据联盟(Linguistic Data Consortium)等。美军国防语言能力建设军民融合道路的发展,极大地发挥了民间人力和技术优势,也有效地提升了美军国防语言能力的科技实力。

第六,要认真研究美军国防语言能力人工智能建设的发展轨迹,科学借鉴其体系结构。美军从人工智能研究出现后不久就将其引入军中,让人工智能在提升军队战斗力中发挥作用。到现在为止,经过半个多世纪的发展,美军人工智能的研究和开发应用已经成为值得世界各国学习借鉴的领先者,在国防语言能力人工智能领域也自不待言。美军国防语言能力人工智能建设经历了由浅到深、由简单到复杂、由不成熟到成熟、由孤立到融合的过程。这一过程中,语言资源获取和标注属浅层次研究,而人文计算、社会计算、神经认知计算则十分复杂;语言资源的建设与深层分析是基础,自然语言处理是核心技术,实现多语言、多资源、多维度、多媒介、多模态信息的自动分析、自动翻译、自动处理、自动应对是较为重要的归属,最终目标是实现人工智能像人一样思考和完成任务。美军国防语言能力人工智能建设形成了一套相对完备的体系,涉及多语种多模态资源建设、多语种语音和文本分析、多语种文本语义分析、多语种文本自动翻译、多语种知识挖掘与构建、多语种多文化大数据分析、社交媒体语言与传播智能分析、多语种多文化的语言文化心理行为分析、人类语言与大脑概念结构、人类语言思维与脑机接口的跨学科认知研究等。美军国防语言能力人工智能建设的发展轨迹值得研究,其体系结构值得学习和借鉴。

(责任编辑:苏建军)

猜你喜欢
自然语言处理人工智能
人工智能之父
2019:人工智能
人工智能与就业
数读人工智能
基于组合分类算法的源代码注释质量评估方法
下一幕,人工智能!
下一幕,人工智能!
面向机器人导航的汉语路径自然语言组块分析方法研究
词向量的语义学规范化
汉哈机器翻译中的文字转换技术研究