罗 浩,张剑锋,郭 喻,韩恩权
(海军研究院,北京 100161)
人工智能涵盖了计算机科学、统计学、脑神经学、社会科学等诸多领域,是一门处于快速变化中的交叉学科[1-3]。人工智能是让人觉得不可思议的计算机程序,是与人类思考方式、人类行为相似的计算机程序,是会学习的计算机程序;是根据对环境的感知,做出合理的行动,并获得最大收益的计算机程序[1]。人们希望通过研究,将其用于模拟和扩展人的智能,辅助甚至代替人们实现多种功能,包括识别、认知、分析、决策等。2016年以AlphaGo为标志的第3次人工智能浪潮的到来,是更强大的计算能力、更先进的算法、大数据、物联网等诸多因素共同作用的结果。人工智能算法大致的发展历程如下[2-3]。
1956年夏天,在达特茅斯夏季人工智能研究会议上,约翰·麦卡锡、马文·明斯基等科学家,共同讨论当时计算机科学领域尚未解决的问题,第一次提出了人工智能的概念。
神经网络算法是机器学习算法中的一个重要分支。20世纪40年代起,就有学者开始从事神经网络的研究。第一个大突破出现于1958年,Rosenblatt在计算机上模拟实现了感知机(Perceptron)模型,可以完成一些简单视觉处理任务。1969年,Minsky等人论证了感知机在解决异或等基本逻辑问题时能力有限,这一缺陷直接导致了此后长达10年的冷静时期。直到80年代,神经网络迎来复兴,物理学家Hopfield在1982年和1984年发表了2篇关于人工神经网络研究的论文,提出了一种新的神经网络,可以解决一大类模式识别问题。1995年,Rumelhart、Hinton等许多神经网络学者成功实现了使用后向传播 BP算法来训练神经网络。Yann LeCun等人受生物视觉模型的启发,改进了卷积神经网络,在手写识别等小规模问题上取得了当时的最好结果。2001年,Hochreiter等发现使用BP算法时,模型训练超过一定迭代次数后容易产生过拟合,神经网络又一次进入低谷。2006年,Hinton和他的学生在 Science杂志上发表了一篇文章[4],从此掀起了深度学习的浪潮。深度学习能发现大数据中的复杂结构,大幅提升了应用效果,在语音识别、图像数据库分类等问题研究上,取得了惊人成果。2014年,Ian Goodfellow等学者发表论文提出生成对抗网络,为创建无监督学习模型提供了强有力的算法框架。
即使神经网络的发展如日中天,浅层学习算法也在持续发展,在一些任务中占有一席之地。1984年,Breiman和 Friedman提出决策树算法;1995年,Vapnik和Cortes提出支持向量机(SVM),用一个分类超平面将样本分开达到分类效果。
强化学习从60年代诞生以来一直发展着,直到在 AlphaGo中与深度学习的创造性结合让它重获新生[5-6]。深度学习是机器学习的一个子类,它从原始特征出发,自动学习高级特征组合。强化学习问题是给定数据,选择动作以最大化长期奖励;它的输入是历史的状态、动作和对应奖励,要求输出的是当前状态下的最佳动作。许多控制决策类问题都是强化学习问题,比如让机器通过各种参数调整控制无人机实现稳定飞行,通过各种按键操作在电脑游戏中赢得分数等。2016年由谷歌旗下DeepMind公司的David Silver创新性地将深度学习和强化学习结合,打造出围棋软件AlphaGo,接连战胜李世石、柯洁等世界围棋冠军,展现了强化学习的巨大威力。2017年,升级版的AlphaGo以Master的网名,在对奕平台上,与中日韩最高水平棋手在内的数十位人类顶尖棋手过招,奕出了60∶0的绝对优势战绩。
目前,在人工智能的主要技术方向上有机器视觉、语音识别、机器翻译、规划决策系统、自动驾驶等[2]。
水下攻防作战主要是指为争夺制水下权,敌我双方兵力开展的攻击和防御作战,其参与的主要兵力有水下的潜艇、UUV等,以及为争夺对水下空间控制权而投入的反潜飞机、反潜水面舰艇等非水下兵力。在水下攻防作战中的许多领域都存在重难点问题,人工智能方法,尤其是深度学习、强化学习等方法的出现,为这些重难点问题的解决提供了新的思路,有望取得很好的应用效果。考虑到潜艇、水下无人集群等将成为未来水下战的主要兵力[7],本文重点针对潜艇和UUV群装备的人工智能应用开展构想。
潜艇是水下作战的传统兵力,随着人工智能技术的应用,有望进一步提升潜艇作战能力。想象一下,在潜艇指挥舱室,指挥人员分配给机器大致的任务或要求,如搜索 A海区潜艇。机器理解任务或要求后,或通过询问指挥员方式进一步明确有关输入,进行任务规划,形成最优执行方案并执行。执行过程中,机器会根据外部战术环境变化及需要,对方案进行动态调整并与指挥员进行协商确认,在这种指挥方式下,系统反应可能更快速。由于指挥目标的多样性,可以通过键盘鼠标、语音等方式传达指挥员意图,从而指挥机器完成有关任务。为便于实现,可适当限定机器可接受的任务命令范围。语音包含的含义较丰富(智能语音识别技术可提供支撑,为防止误识别、误触发,可进一步优化改进),通过键盘鼠标输入和选择表达的含义比较精确,便于描述精确性数字、约束等内容。在指挥过程中,随着时间变化,在机器认为有必要让指挥员做出选择决策时,也可以采用协商的方式与指挥员协商确认,这种协商技术依赖于人机沟通的深度融合。智能指挥的程度可以根据应用需要向人机结合半自动化、并逐步向机器自主全自动化方向发展。
图1 潜艇智能指挥控制示意图Fig.1 Schematic diagram of submarine intelligent command and control
在目标探测方面,重点是通过传感器对水下水声、电场、磁场、激光等感知,检测目标是否存在。水下环境条件下,传统上是通过信号处理方法对目标进行检测,如智能探测潜艇、探测水雷等。随着人工智能技术的发展,有可能通过对信号处理图像或原始信号进行智能识别处理(深度学习和计算机视觉技术可提供支撑),快速提取目标特征,提高目标检测的速度,实现机器自动快速检测目标,并使得传感器感知范围得到增强。艇上具有较强的计算处理能力,具备进行复杂计算的基础。
在目标运动要素解算方面,以往在假设目标匀速直线运动的状态下,本艇对目标作纯方位观测,本艇需进行机动,方能解算出目标运动要素。该问题是一个非线性问题,能否解算出可用的结果与目标是否机动有关。一旦目标机动,不满足假设,需要在目标机动后重新进行解算。目前基于深度学习的神经网络技术可以解决一些非线性问题,因此可以尝试进行一些探索性试验:一是可以通过大量的仿真数据及实际测试数据,研究是否可训练出用于识别目标机动行为的模型;二是可以研究目标匀速直线运动假设下是否可以基于神经网络训练出目标距离、目标速度或目标航向等要素,为解算目标运动要素提供新方法;三是可以研究机动目标的解算方法和本艇机动方法;四是可以通过仿真分析,甚至可以探索研究基于目标方位跟踪信号的目标运动要素估计方法。
在目标识别方面,主要是识别目标种类(潜艇、UUV、大型水面舰艇、商船、渔船、水雷、鱼雷、鱼、鱼群等)、属性(敌、我等)。水下攻防作战重点是水声识别。可有针对性地通过声呐等传感器采集大量数据作为训练样本,利用深度学习神经网络、决策树、支持向量机、知识图谱等技术,通过大量训练,形成识别率较高的算法,为目标识别提供支持。
在威胁估计方面,传统的威胁估计主要是针对态势中的目标信息。根据目标的作战能力、与我方兵力位置的相对几何态势信息,通过特定方法分析计算得到目标的威胁程度并排序。随着人工智能技术的发展,可以考虑规范威胁判断的输入信息,通过军事专家研讨分析的方法,研究各种场景下目标的威胁程度,获取大量宝贵训练数据,通过训练得到基于神经网络、决策树或支持向量机的威胁估计方法。所获得方法的威胁估计结果可以与现有方法进行分析比对,判别新方法的有效性。
在攻防决策方面,结合目标运动状态信息,当确认待打击目标或面临的威胁目标后,为了达到最好的打击或防御效果,需决策武器的选择、武器的使用时机、使用方式。如果能够将决策问题的边界和规则明确,一方面可以采用类似AlphaGo的自身博弈的方式(深度学习和强化学习技术可提供支撑),不断调整优化自身决策模型,以得到最好攻防效果;另一方面可以考虑充分利用军事专家的经验,考虑基于规则的专家系统解决有关决策问题。
武器控制方面:在武器发射前,提高发射控制流程的自动化水平,进一步缩短反应时间,可考虑应用发控动作自动监控识别确认、多智能体并行控制等技术减少人工干预环节,提高发控流程的连贯性、并发程度;在武器发射后,可智能预估打击效果并据此动态调整打击目标。
未来水下攻防作战中采用多个UUV形成群(如图2)协同执行完成任务将是重要发展方向。如美深海SHARK系统中的多个UUV能够在部署后自主组网成集群,进行区域监控,并对进入监控区的目标进行接力跟踪,并实施打击。当UUV群在领受任务,并被部署后,如何动态地组织,进行任务分配,在保持群的队形的同时,完成协同探测、跟踪、决策、打击、评估、情报上报等任务,是亟待解决的问题。在UUV群的应用上,可以有2种思路:一种是将UUV群当作一个整体,规定好UUV个体基本的机动、探测、识别、决策、打击、通信、能量管理的控制命令及响应流程,采用强化学习、智能生物群(如鱼群)等方法统筹研究,实现对其机动、探测、识别、决策、打击、通信、能量管理等行为的统一决策和控制,综合得出 UUV群的最佳行动控制策略;另一种是针对具体的研究难点,在潜艇指挥控制有关技术研究基础上,进一步针对 UUV群应用特点研究解决。
图2 UUV群分布式行为控制示意图Fig.2 Schematic diagram of UUV group distributed behavior control
1)在水下通信自组网方面,考虑到水声通信延迟大、带宽窄,并存在不确定性,多个UUV的水声组网通信需适应水下特点、考虑隐蔽需求。相比无线网络,应以尽可能少的信息交互实现组网。为保证网络拓扑结构的相对稳定,还需要对 UUV群的队形进行适当的控制。
2)在水下协同探测方面,实现对目标的定位和跟踪是必须要解决的问题,具体在实现上涉及到协同探测的任务规划、协同探测数据处理等,考虑到UUV上计算处理能力较为有限,应尽可能采用简便易行的方法。
3)在目标识别方面,UUV群需基于声、光、电、磁等各种探测信息,尤其是水声信息,自主识别目标种类、属性,以完成自主执行的任务。相比于潜艇对目标的识别,UUV群的任务可能较为单一,在目标识别上可进一步聚焦其所针对的目标。
4)在自主交战决策方面,UUV群在发现并跟踪目标、判别目标身份后,需决策是否进行交战以及交战的时机,需决策对群内节点的武器目标分配。武器发射后,需对打击效果进行评估,并决策是否继续交战。
5)在机动控制方面,每个 UUV需要能够主动规避航行中的威胁或障碍物,确保UUV的航行安全。
6)在能量管理方面,每个 UUV自身能源有限,需做好UUV群的能源均衡管理统筹,使UUV群执行任务的时间尽可能长。
美国海军在2018年对水下航行器(UUV)投入了巨大热情,其John Richardson上将的《维护海上优势 2.0设计》列出了不迟于2025年的多个UUV的打包合同:ORCA、Snakehead、Razorback和Knife fish[8]。在美国防部2020财年海上领域预算重点中,无人和自主领域投资37亿美元,开发进攻性无人水面舰艇、无人潜航器和自主后勤平台等装备,加强竞争环境下的机动和杀伤能力;人工智能领域投资 9.27亿美元,通过联合人工智能中心和先进图像识别项目扩大军事优势;投资22亿美元用于增强哥伦比亚级战略核潜艇的战略威慑能力[9]。因此,在水下攻防领域,结合水下 UUV和潜艇的发展,积极应用人工智能技术,是值得关注的重要研究方向。除结合单一的具体问题研究应用人工智能技术外,也可将UUV群作战作为一个整体决策控制问题结合人工智能技术进行研究。本文重点针对水下攻防领域无人潜航器集群和潜艇作战,对人工智能技术的应用指出了一些研究问题或研究方向,具体问题的解决和实现还依赖于工程应用的不断探索和实践。