面向作战体系的生成式对抗网络应用研究*

2020-01-08 03:33殷小静胡晓峰杨镜宇
火力与指挥控制 2019年11期
关键词:神经网络样本体系

殷小静,胡晓峰,杨镜宇

(1.国防大学联合作战学院,北京 100091;2.解放军96941 部队,北京 100085)

0 引言

战争是典型的复杂系统。随着无人技术、人工智能技术、互联网技术等领域的发展突破,集中产生了具有颠覆性作用的武器装备和作战手段,无疑加剧了战争的复杂性,这对作战体系研究提出了新的挑战,基于还原论思想的传统研究方法面临着从模型到结论的不好用、不管用和不可信。深度学习[1-2]的蓬勃发展为战争复杂系统的研究带来了曙光,深度学习通过构建多层神经元网络模型,来描述和表达复杂系统的运行规律,具有良好的非线性能力和涌现特性。鉴于深度学习在作战体系研究方面的巨大潜力,国防大学胡晓峰团队对其在战场态势认知[3]、作战态势评估[4]、装备体系效能预测[5-6]等方面的应用做了很多有益的探索,然而深度学习的重要基础在于有充足的样本,作战数据不足已经成为制约作战体系研究领域发展的瓶颈问题。全方位、全要素、全领域的战争数据非常稀少,加上保密性高、收集困难、规范性差,在大多数问题研究中无法发挥深度学习的最佳效果。生成式对抗网络(Generative Adversarial Networks,GAN)作为一种有效的样本生成技术,为解决深度学习样本不足的瓶颈问题提供了一种新途径。

生成式对抗网络GAN 是Goodfellow 等[7]在2014 年提出的一种生成式模型,以其较好的生成效果和训练效率,成为人工智能学界的一个热门研究方向。GAN 不仅可以生成多样化的样本,帮助解决作战数据不足的问题,还可以拟合数据分布,用于提取作战体系特征。另外,GAN 作为一种蕴含对抗思想的特殊神经网络算法,可以与特征学习、模仿学习、强化学习等技术交叉融合,为作战体系研究提供新思路。

1 GAN 的理论与实现模型

1.1 GAN 的基本思想

生成式对抗网络GAN 的基本思想源自二人零和博弈,由一个生成器和一个判别器构成,生成器的目的是尽量去学习真实的数据分布,而判别器的目的是尽量正确判别输入数据是来自真实数据还是生成数据。通过对抗学习的方式来训练。生成器和判别器各自提高自己的生成能力和判别能力,最后寻找到二者之间的一个纳什均衡[8],达到估测数据样本的潜在分布并生成新的数据样本的目的。

1.2 GAN 的计算结构

GAN 的计算结构如图1 所示。任何可微分的函数都可以表示GAN 的生成器和判别器,由此,用可微分函数D 和G 来分别表示判别器和生成器。x 为真实数据,G(z)则为生成器G 的生成数据。判别器D 的目标是实现对数据来源的二分类判别:真(来源于真实数据x 的分布)或者伪(来源于生成器的伪数据G(z)),而生成器G 的目标是尽量接近真实数据。判别器D 和生成器G 相互对抗并迭代优化的过程使得判别器D 和生成器G 的性能不断提升,当最终判别器D 的判别能力提升到一定程度,并且无法正确判别数据来源时,可以认为这个生成器G 已经学到了真实数据的分布。

图1 GAN 的计算结构

GAN 的框架就对应于两个参与者的极小极大博弈。在所有可能的函数G 和D 中,可以求出唯一均衡解,即生成器G 可以生成与训练样本相同的分布,而判别器D 判断的概率处处为1/2。GAN 的目标函数可以描述如下:

GAN 的整个训练是一个迭代过程,即在给定生成器G 的情况下先最大化f(D,G)以优化判别器D,然后固定判别器D,并最小化f(D,G)而得到生成器G,直到达到均衡后停止循环,如图2 所示。

图2 GAN 的迭代训练

1.3 GAN 的特点

当前主流的生成式模型主要分为3 类:变分自动编码模型(VAE)、自回归模型(Auto-regressive)、生成式对抗网络(GAN)。其中生成式对抗网络GAN 相比于其他生成模型有几个优点:第一,从实际结果来看,GAN 能产生更好的生成样本,生成图片的分辨率高,训练效果好;第二,GAN 的训练效率更高。GAN 的训练过程将两个神经网络的对抗作为训练准则,使用反向传播进行训练,而不需要效率较低的马尔科夫链方法,没有复杂的变分下限,改善了生成式模型的训练效率;第三,能够与其他神经网络算法结合。各种类型的损失函数都可以整合到GAN 模型中,可以扩展应用;第四,GAN 判别器的参数更新并不直接来自于数据,因此,对于所学习数据的概率分布要求非常宽泛,不需要有显式的数学表示,也就是说,当数据概率密度不可计算时,GAN 仍可应用。正是因为这些优点,GAN 受到了越来越多的关注。2018 年2 月21 日,《麻省理工科技评论》“全球十大突破性技术”揭晓,生成式对抗网络GAN 名列榜上,也是当年上榜的唯一的人工智能技术。GAN 虽然解决了生成式模型的一些问题,但是它并不完美。GAN 具有神经网络类模型的一般性缺陷,即可解释性差。另外GAN 比较难训练,判别器D 与生成器G 之间需要很好的同步,否则就难以得到很好的训练效果。

1.4 GAN 的衍生模型

随着生成式对抗网络GAN 的研究发展,出现了很多衍生模型。这些衍生模型都是基于原始GAN[7]存在的训练困难进行的改进,或者针对不同的应用目的进行的变形应用,基本思想没有改变,可以根据作战体系的特点和需要研究构建合适的模型。

GAN 存在两个训练难点,一是原始实现模型要求简单,使得GAN 的自由度非常大,加上深度神经网络自身的难训练和不稳定,直接为GAN 的训练带来了困难。解决方案1:为原始GAN 加上显式的外部信息。2014 年提出的CGAN[9],把原始的生成过程变成基于某些额外信息的生成;2016 年OpenAI 提出的Improved GAN[10],提出了几个训练GAN 的 技 巧;2016 年 来 自UC Berkeley 的i-GAN/GVM[11],利用添加高清纹理的方法改善了图片的生成效果;之后提出了pix2pix[12],用于图像两两“变换”;2017 年出现的GPGAN[13]基于此思想完成了融合图片的工作。解决方案2:将GAN 的生成过程拆解。2015 年Facebook 提出的LAPGAN[14]是第一篇将层次化或者迭代生成的思想运用到GAN中的工作;2016 年提出的StackGAN[15]和PPGN[16]多次体现了迭代和层次化的思想。解决方案3:利用一些特殊结构来改善训练效果。2016 年提出的DCGAN[17]将GAN 成功从MNIST 的多层感知机(MLP)结构扩展到卷积神经网络结构;随后出现的pix2pix[12],指出了U-Net 结构的优势;GPGAN[13]基于编码器加解码器的结构,并在两者中间加入了一个全连接层。

GAN 另一个训练难点是目标函数带来的梯度消失问题[18]。对于原始GAN 模型,优化目标函数等价于优化JS 散度,因此,产生了梯度消失的问题。针对这个问题,文献[7]提出了一个启发性的替代目标函数,将优化目标函数变为优化KL 散度,然而KL 散度是不对称的,只优化KL 散度就会导致模式崩溃[18]的问题。解决方法1:在生成器和判别器之间加上一个自动编码器。比较有代表性的工作就是让真实图片通过编码器得到一个隐空间的表达,在此基础上用生成器生成最后的图片,比如2017 年提出的EBGAN[19]和BEGAN[20]。近期有3 篇想法相似的工作可以从理论上完全避免模式崩溃的问题:CycleGAN[21]、DiscoGAN[22]和DualGAN[23],利用对偶学习并结合GAN 机制来优化生成图片的效果,几乎解决了GAN 使用替代目标函数后模式崩溃的问题。解决方法2:2017 年提出的Wasserstein GAN[24]直接给出了新的目标函数,用Wasserstein距离替代JS 散度和KL 散度。WGAN-GP[25]提出了一种新的方式去满足WGAN 要求的利普希茨连续性,收敛速度更快,训练更稳定,生成结果的质量也更好。

2 GAN 在作战体系中的应用构想

近几年GAN 及其衍生模型快速发展,被应用到诸多领域。从公开发表的文献看,目前还未发现GAN 在作战体系研究方面的应用,但是GAN 应用的有效性和优越性使我们看到其在作战体系研究领域的应用潜力。

2.1 提供作战数据样本

作战体系的复杂性决定了战场数据具有极其巨大的状态空间,按现有深度学习方法对这样巨大的状态空间进行描述,所需要的数据量远超想象。作战数据样本不足和标注困难一直是作战体系研究的瓶颈问题。获取作战数据的一种途径是积累历史数据,即在实战或军事演习过程中留存下来的数据,但由于历史数据往往难以获取且成本昂贵,很难展开系统的研究。另一种途径是通过仿真平台得到数据,但想要得到上万盘真实性高、多样性的样本,特别是通过人在回路的仿真实验,仍然非常困难。

GAN 作为生成模型,最直接的用途就是生成样本数据。与其他机器学习手段所需要的数十万样本来进行训练不同,GAN 仅需数百样本,极大地减少了对于训练数据的需求,可以用于半监督学习和无监督学习。GAN 的样本生成功能在图像处理方面已经得到了广泛应用[26],例如可以生成十分清晰的图像、视频等。中科院自动化所提出双目型GAN,用于人脸图像合成;阿里巴巴用于城市大脑项目,用于生成车牌的自动识别数据集。GAN 可以用于解决图像标注数据不足时的深度学习问题,同样可以解决作战体系研究中作战样本不足的瓶颈问题。例如利用GAN 为作战体系建模解决样本不足和标注难的问题;利用GAN 生成器模型对认知逐渐加深的进化过程进行建模,同时可生成更多的战役级态势样本,解决带认知标签样本的缺乏问题。

2.2 辅助战场态势智能认知建模

战场态势认知是指挥员进行指挥决策的前提与基础。GAN 的魔力在于两个神经网络之间的对抗,从机器理解世界的角度进行建模,有望突破战场态势智能认知的难题:注意力机制和想象力机制。近两年,注意力机制与深度神经网络结合,被引入图像识别、自然语言处理等领域中,并取得了很好的结果[27-29]。近期提出的“自注意力生成对抗网络”(SAGAN)[30]将注意力机制引入到卷积GAN中,SAGAN 允许对图像生成任务进行注意力驱动、长相关性的建模,解决了特征记忆问题,推动了注意力机制建模的发展。另外,GAN 是一种能力惊人的模型造假工具,给模型带来一种类似想象力的能力,使模型的知识来源不再局限于人类,而是通过不断对抗进行学习,提升人工智能认知世界的能力,甚至激发人工智能的创造力。

2.3 作战体系级联效应回溯分析

作战体系级联效应回溯主要针对联合作战行动效果的累积、级联、时延等特点,帮助指挥员理解影响当前态势的直接原因、间接因素、效果的累积过程,以及某种关键状态的形成原因。GAN 能够通过对抗博弈进化生成器,从而提取到一些精细的特征。冯冲等[31]利用GAN 的对抗学习特性,将GAN应用于因果关系抽取任务,通过重新定义生成模型和判别模型,基本的因果关系抽取网络能够与判别网络形成对抗,进而从因果关系解释信息中获得高区分度的特征,证明了GAN 框架在因果抽取任务上的有效性和优越性。基于GAN 的因果关系抽取方法不必依赖知识库,减少了繁琐的特征选择。利用GAN 辅助因果关系回溯,对各级指标体系进行关联分析,可以更好地查找体系指标的异常点、评价体系能力。

2.4 模式识别和预测分析

生成式对抗网络GAN 作为一种特殊的神经网络,通过对抗、发展的过程动态生成结果,有望帮助解决作战体系模式识别和预测分析难的问题。Mathieu 等[32]最先提出将对抗训练应用于视频预测,即生成器根据前面一系列帧生成视频最后一帧,判别器对该帧进行判断。实验结果表明,通过对抗训练生成的帧比其他算法更加清晰。Vondrick等[33-34]利用GAN 在视频生成中取得了突破性进展,能生成32 帧的逼真视频。另外,GAN 的预测功能已经被用于自动驾驶中的半监督学习或无监督学习任务,生成和预测自动驾驶场景[35],并能利用实际场景不断更新的视频帧来实时优化GAN 的生成器。在作战体系研究领域,GAN 优化的判别器模型,可用于作战对抗条件下的敌方意图识别、体系能力预测分析,以辅助指挥员的决策。

2.5 破解作战体系演化机理

研究作战体系演化机理有助于拨开战争迷雾、破解战胜机理。作战体系研究希望进一步得到体系各要素的相互作用机理,而深度学习的黑箱特性,使人们很难得到中间隐含节点——即模型所涌现出的能力指标的军事内涵。清华大学苏杭等[36]对提高神经网络算法的可解释性进行了一系列研究,通过对GAN 框架的输入数据加入细节特征控制,观察判别结果的演化,以分析神经网络的演化机理。有望通过GAN 的辅助对神经元网络黑箱进行探测,在不降低评估模型性能的前提下,提高作战体系指标模型的可解释性。一方面GAN 可以主动构造对抗样本,通过对抗训练的方式,强化神经元响应和人类理解之间的一致性;另一方面GAN 优化判别器判别的是高层次的特征,用以研究体系对抗过程中能力的进化过程,有助于分析影响体系能力的关键指标,进一步挖掘体系能力形成的深层次机理问题。

2.6 其他方面

除以上几点,利用GAN 有望解决作战体系研究中的更多问题。例如GAN 与强化学习相结合完成了离散数据的理解生成任务,用于语音和语言处理[37],同样可用于作战任务语义分析等相关离散数据分析研究;GAN 被成功用于电脑病毒的监测[38],比传统基于黑盒检测模型的方法性能更好,对作战态势检测、态势预警等研究有借鉴意义;近期GAN框架被用于网络特征学习,提出了GraphGAN[39],可以被用于链路预测、节点分类、知识图谱表示、聚类以及社会网络分析等方面。

3 结论

生成式对抗网络GAN 不仅是一种生成式模型,还是一种特殊的神经网络,具有从潜在分布生成“无限”新样本的能力。GAN 及其衍生模型的快速发展和应用,为解决作战体系研究中的诸多问题提供了新的思路。

猜你喜欢
神经网络样本体系
基于神经网络的船舶电力系统故障诊断方法
MIV-PSO-BP神经网络用户热负荷预测
TODGA-TBP-OK体系对Sr、Ba、Eu的萃取/反萃行为研究
基于改进Hopfield神经网络的对地攻击型无人机自主能力评价
用样本估计总体复习点拨
“三个体系”助力交通安全百日攻坚战
基于神经网络的中小学生情感分析
规划·样本
随机微分方程的样本Lyapunov二次型估计
“曲线运动”知识体系和方法指导