甘源滢,刘春桐,李洪才,马世欣
(火箭军工程大学 导弹工程学院,陕西 西安 710025)
在现代化战争中,伪装作为干扰敌军探测、保护我方作战设备及人员的有效手段,一直是国防领域的研究热点[1-3]。层出不穷的高精尖技术侦察设备对伪装技术的发展不仅是挑战,也是促进[4-5]。事先对现役主战装备的伪装效果进行评估,有利于改进我方在现代化作战中所暴露的不足,而客观有效的评估标准则有利于指导、改进伪装技术,从而加快作业速度,提高战场生存能力[6-7]。伪装评估模型根据目标属性不同可以分为静态伪装效果评估和动态伪装效果评估两类。前者是针对伪装目标在固定场景隐蔽性能的评估,后者则是用于综合伪装目标在机动作业状态下的暴露概率。
传统的评价指标线性加权模型凭借其信息易获取、模型易构建以及数据易计算等优点,广泛应用于光学图像伪装效果评估。该方法的核心思想是选取恰当的评价指标描述伪装目标和背景间的相似度[8-20],因计算过程过于简单,缺乏理论基础,王贺等利用容限近集理论[21-24]中的感知容限关系描述伪装目标与背景的不可分辨性,但模型参数的快速确定成为新问题。20世纪末,神经网络的引入[25-30]打破了光学图像伪装评估的传统,凭借其在训练中能改变指标权重的特点,使得评估模型能够在训练学习中不断更新。考虑到现代化战场的生存法则,基于有限时间搜索模型为伪装效果评估开辟了一条新道路[31-38]。由于伪装效果的评估结果为伪装图案的设计提供了可靠依据,因此将伪装评估转换为多属性决策问题[39-46]能够有效选取融合度最高的伪装图案。
以上相关研究均基于静态伪装效果评估,虽然取得了一定的研究进展,但系统的总结和分析仍然相对欠缺。除此之外,无论是作战人员或装备,在战场中都处于机动作业状态,目前对于复杂背景下运动目标的伪装效果评估[47-48]尤其匮乏。有鉴于此,论文系统地阐述了光学伪装效果评估模型,综述了国内外的研究成果,依次对几种典型方法进行分析,并提出静、动态目标基于光学图像伪装效果评估模型未来发展所面临的关键问题。
传统的光学伪装评估方法从三个方面考虑[3],一是伪装目标的视度(能见度)计算,即伪装目标可被探测设备发现的距离阈值;二是伪装目标与四周区域背景之间的相似性度量;三是伪装目标的光学发现概率:由若干名专家在给定观测距离上采用裸眼或光学侦察器材观察目标,经判读得到发现概率,用于伪装效果的评估。其中视度计算与客观天气、大气环境相关,发现概率受观察者主观因素影响,二者的共同点在于可控参数少,一经确定时间、环境及观测人员,视度和发现概率均为定值,即无法有效实现定量的伪装效果评估。为此,专家学者的研究重点旨在定量描述目标与背景之间的相似度。
评价指标是用来描述区别目标和背景的典型性特征,为解决单一指标缺乏客观性的问题[8-9],WANG J.等人开始综合多指标进行伪装效果评估[10],该方法可归纳为评价指标的线性加权模型。该模型针对特定的背景和目标选取具有代表性指标进行加权求和,得到综合评价指标,实现对伪装效果的定量评估,一般表现形式为
(1)
式中:Ie表示综合评价指标;wi为第i个指标Ii对应的权重值。
在线性加权模型中,首先选择具有代表性的目标和背景特征向量,包括颜色、亮度、纹理、形状、空间结构[11-16]等,除此之外,随着成像光谱仪的诞生,基于光谱图像[17]的伪装效果评估顺势占据主导地位,而光谱特征[18-20]则成为评价指标体系中必不可少的成员,将一系列特征指标进行初始量化后,了解各指标间的关系以及不同指标对评估结果的影响程度,采用客观构权法确定各指标的权重。
评价指标体系包含了有限多个描述目标表面属性的指标,不同指标对应的特征物理意义各不相同,且有其特定的变化规律,采用高斯归一化方法对评价指标体系各项进行预处理,将所有特征信息限定在同一变化幅值范围内,在进行相似性度量时确保各项指标具有相同地位等级。在实际应用中,考虑到各指标对效果评估结果的影响力不尽相同,而评价指标体系可以看作是一种描述目标相关信息的运载体,结合信息论与热力学中熵的定义,根据各指标提供给决策者的信息量大小确定各指标权重,这个构权过程即熵权法[12]。该方法确定的权重系数大小体现的是同一层次指标体系内的相互关系及重要程度,并非某项指标在实际意义上的重要性系数,而且这种方法对样本数据的完整性要求过高。
伪装效果评估研究目标与背景的相似度判定,即研究粗糙集理论中的对象不可分辨性,容限近集理论[21-22]就建立在这个思想上。基于容限近集理论的伪装效果评估最重要的是找出所有容限近集类[23-24]。
具体思路如下:首先将待分析图像(单幅或多幅)分割成相同尺寸的若干子图,并用合理的方式选择评价指标分别对每个子图进行描述,反复计算每个子图与其余子图的感知容限关系≅B,ε,最后通过计算ftNM≅B,ε(简记为tNM)得到待测目标与背景之间的近似测量值并对应伪装效果的优劣,tNM值越大,相似度越高[11]。
评价指标之间不止存在横向并列关系,也有可能存在纵向递进关系,简单的线性加权模型无法描述不同评价指标之间的复杂非线性关系,这是影响传统评估方法客观有效性的重要原因。
神经网络在学习及训练过程中改变突触权重值的特点,使其具有较强的自适应和自组织能力。考虑到评价指标的复杂非线性关系,Traven H. G.等专家学者采用神经网络[25]构建评估模型,随后国内学者[26-27]也将融合后的评价指标体系作为神经网络的输入,并将已知对应样本评估结果作为网络的期望输出,传输路径从“输入层→若干隐层→输出层”,得到实际输出并与期望值比较,若误差大于设定阈值则对各隐层的权重值进行反馈修正,如此进行大量训练得到优化后的模型,伪装评估效果真实度和可靠性较高。其评估模型的工作流程如图1所示。
图1 神经网络模型评估流程图Fig.1 Evaluation flow chart of neural network model
如图1所示,神经网络模型用于伪装效果评估分为三个主要阶段,学习阶段和训练阶段是保证评估模型客观准确的关键,神经网络的优势在于可以通过学习和训练使得模型中指标权重参数不断修正和完善,使得评估结果真实可靠。除此之外,Gretzmacher等提出训练神经网络模型的核心因素不止是评价指标的选取,观测者对于感兴趣区域的关注力度也是需要深入研究的一个分支[28]。Sten Nyberg进一步研究了感兴趣区域的大小对模型输出的影响[29]。
神经网络模型的优势在于利用测试数据对模型进行训练,从而评估未知目标的伪装效果。但训练样本的数量和质量与评估结果的准确性成正比,而为模型提供大量可靠的已知样本数据是神经网络伪装评估模型的难点,这样的矛盾关系限制了神经网络评估模型在军事领域的广泛应用[30]。
1.4.1 显著性特征
由于人类视界范围有限,在一定探测范围内,无法直接描述捕获目标的显著性特征的时间顺序,基于人类视觉感知系统的评估模型实现了主观判决和客观分析的有机结合[31-32]。但这一概念的提出抛出了两个问题,一个是显著性特征的提取,一个是有限时间探测。为解决第一个问题,Qi J.等提出了图像分层概念,其核心思想是通过构建高斯低通金字塔式的分层图像,突出每层图像的显著性特征信息,定义中心层和边缘层的映射相似度,加权得到综合评价指标最终显著性映射[33]。
利用金字塔分层图像提取显著性特征时,遍历中心层和边缘层对应的每一个属性的差异度,因为最终的显著性特征指标是通过线性加权归类得到的,可以根据1.1节介绍的线性加权模型来获得适合各项指标的权重系数。
考虑到前景目标内部的特征信息被探测的难易程度也是评估方法的一项重要指标,Feng Xue等计算前景与背景之间的特征直方图,以此获得显著性特征,并将前景与背景之间的差异性和目标内部的特异性进行非线性融合,从而更完整的描述待评估图像的特征信息[34]。但非线性融合的参数需要实验确定,寻找科学合理的方法获取参数值是该方法面临的问题之一。
1.4.2 有限时间发现概率模型
现代化战争遵循“快”吃“慢”的规则,能够在完成作战任务前不被敌方侦察锁定,伪装的作战行动就能得到基本保障。Timothy C.等提出了时间限制搜索(TLS)模型在目标检测中的发展和应用[35],该模型是为了更好地描述观察者在时间约束条件下的搜索行为而建立的。搜索过程的3个主要组成部分是:1) 平均检测时间(图像的特征);2) 与虚警、误警信息相关的出现时间;3) 在进入另一个视场(FOV)之前搜索视场所花费的时间。
Tana Maurer等指出TLS模型描述了观察者在典型视场切换过程中的搜索响应[36],大面积的搜索通常使用宽视场(WFOV),而感兴趣的区域则用窄视场(NFOV)进行探测。宽视场用于探测感兴趣区域,窄视场用于确定潜在目标的属性,若反馈给系统虚警(FA),则返回宽视场探测。这个搜索过程时间线如图2所示。
图2 TLS模型搜索过程时间线Fig.2 Search process timeline of TLS model
采用发现概率表征伪装目标在被探测过程中显著性特征被侦察的先后顺序[37-38]。有限时间搜索模型的概念是建立在经验公式之上,且人眼对伪装目标的发现概率依赖于观测时间,会随时间增加而增加。
基于有限时间搜索模型的伪装效果评估的重要意义在于,它反映了伪装目标暴露可能性在时间域的连续性,且符合人眼判别机制,尤其符合现代化战场的生存法则,为军事目标的评估模型开创了一个新的方向。
上述评估方法建立在单一的目标和背景之间,若已知伪装要求及伪装等级,且存在多个伪装样本,采用不同评价指标评估伪装效果实际上就属于多属性决策问题[39-40]。区别于用综合评价指标描述伪装效果的方法,该模型首先需确定伪装效果等级,定义决策方案集和评价指标组成的属性集,并将两个集合实现多对多组合生成决策矩阵,最后通过计算加权灰关联系数对模型求解,过程如图3所示:
图3 多属性决策模型流程图Fig.3 Flow chart of multi-attribute decision-making model
考虑到属性权重信息的不确定性以及属性对方案的隶属度问题,Atanassov在Zadeh模糊集理论[41]的基础上提出直觉模糊集[42],基本覆盖所研究方案属性的全部信息,在此基础上,Atanassov等又提出了区间直觉模糊集[43],将隶属度限定在[0,1]闭子区间内,进一步增强直觉模糊集处理不确定信息的能力。
方浩等人利用直觉模糊集构建多属性决策模型,将各属性指标对于方案(即伪装效果等级)的隶属与非隶属程度归纳为决策矩阵,并根据伪装等级定义正、负理想方案。多属性决策过程本质上也是一种距离计算,通过计算不同方案与预设正、负理想方案之间的距离,表征二者之间的相似度关系,每个属性遍历后将所有结果进行排序,得到逼近理想解的最优决策方案。从评估流程可以发现,该模型的特点是“自底向上”,用结果匹配待分析方案,将确定伪装等级与决策矩阵中的方案进行接近度计算,即解决伪装等级范围内的凸优化问题[44-45]。
模糊熵用来刻画模糊集的信息量大小,Chen等系统分析了直觉模糊熵的不同测度对属性权重的影响,得出属性数量与属性权重分配之间的关系,并提出基于信息的可信度计算属性权重的方法。因此,下一步可以考虑将模糊熵应用于评估模型中[46]。
综合以上相关研究的进展和动态,静目标伪装评估模型根据不同思路和方法主要可归结为四类(见表1):
1) 线性加权模型:其处理策略基于目标伪装前后的差异,依据不同侧重点,将具有代表性的评价指标以不同权重整合,得到量化后的伪装效果分析。
2) BP神经网络:基于不同特征学习具有差异度的样本,融合训练后求同存异,使得模型具有自适应性。但由于样本不足的问题,其难点在于精确模型的建立。
3) 视觉注意机制:采用显著性特征作为伪装目标属性,然后利用发现时间反映暴露概率,可全面描述不同效果的伪装目标在影像空间上的分布情况和暴露顺序。
4) 多属性决策:计算不同方案与理想正负方案之间的距离描述不同样本之间的伪装效果优劣。不同于上述三种模型,多属性模型的使用前提是已知伪装评估等级,且其适用于多个待评估样本间的分析。
表1 静态光学图像伪装评估模型Table 1 Camouflage evaluation models of static optical image
目前现役主战装备在机动状态下大都处于复杂多变的环境中,而动态场景中目标的伪装效果评估是目前亟待解决的问题。一方面,由于动目标伪装效果评估的先验信息嵌于序列图像中,且运动背景随时间变化,直接沿袭静目标伪装效果评估方法,通过计算前景与变化背景间的相似度来评估动目标不可避免存在一定的困难。另一方面,对动态场景建模是动目标伪装效果评估的核心,而在复杂的模型中真实地反映出数据的内在本质是动目标伪装评估面临的关键性问题。虽然,基于光学图像的静目标伪装效果评估模型已经逐步成熟,并取得了较好的应用效果,但鲜有学者对复杂背景下动目标的伪装效果评估进行建模。
伪装本质是应对侦察设备对特定区域的探测。基于此,在运动背景下检测动目标,将检测结果的好坏程度用于评估伪装效果,不仅使评估结果更客观,而且动目标检测过程耗用的时间也可以作为一项评估指标,使得评估结果更全面。
总体来看,在动态场景中检测动目标的研究主要集中在两个方面,一是通过对全局运动的估计和补偿实现动目标检测,二是基于光流约束方程,分析图像序列中各像素间的时间域变化和特征信息相关性,确定前景和背景。
全局运动模型是采用顽健性估计方法得到完全来自背景区域的特征像素点,用于估计全局运动模型参数,接着利用仿射模型将空间三维运动近似描述为二维平面运动,建立相邻帧间具有近似运动状态的像素间关系,实现相邻帧间的背景匹配,由于仿射模型的有效性依赖于探测设备与目标场景间的距离足够远,所以全局运动模型的建立存在一定的局限性。同时,在模型参数估计的过程中,若存在部分前景目标特征像素点,将严重影响运动模型精确度。
用特征矢量描述图像序列检测空间中的运动目标,可以看作像素点特征信息在时域上的变化率,而这些矢量信息构成了描述各像素点运动状态的光流场。基于光流法的动目标检测的核心在于所建模型的生物合理性以及计算复杂度,根据不同的数学理论基础可分为四种类型,如表2所示。
总体来看,基于光流法的目标检测精度和时效性无法兼得,将不同方法相互融合,取长补短,是未来光流法的应用趋势。并且随着计算机视觉研究的不断深入,神经网络方法也将成为光流法发展的一个重要方向。
表2 光流计算方法Table 2 Optical flow calculation methods
以上所述检测方法均针对单探测源,运动场景由图像序列形式表现,将三维场景投影到二维图像这个过程将导致信息丢失,若考虑立体相机,通过增加视差添加深度信息,可以减少三维到二维目标投影的信息缺失,深度信息的使用能够提高检测的准确性,但同时增加了计算量。由于深度信息的获取是通过两个或多个镜头获取实时同步的图像计算所得,而深度信息的精度和测距密切相关,深度信息的价值随探测源与伪装目标之间距离的增加而减小。
在实际应用中,针对不同的目标和背景选择合适的评价指标需要考虑的因素有很多,而指标融合、构建模型所涉及的方法方式都不是唯一确定的,因此,面临复杂多变的场景,伪装效果评估模型的建立仍旧存在很多关键问题,其中包括:
1) 神经网络模型的先验样本有限且质量不均一。由于实验平台建立在室外,这种做法不仅耗时、操作难度大而且探测仪器的配合及观测人员的主观判断都是影响神经网络模型学习和训练过程中样本准确度的因素。如何获得足够多的有效样本使得神经网络训练达到更接近实际伪装效果的评估结果是该方法面临最大的问题。
2) 合理确定模型待定参数。文中介绍的大部分评估方法都包含有若干个待定参数,而这些参数大部分都是经过重复性实验获得,如何实现模型相关参数的快速确定,以及面临复杂背景下参数自适应成为下一步研究的难点与重点。
3) 运动目标伪装效果评估[47-48]。其背景区域随目标的运动产生变化,考虑到这种情况,基于静态图像的伪装评估模型已无法满足,下一步的研究方向可以考虑以下3个部分:1) 基于动目标检测的伪装效果评估;2) 基于1.4.2小节提出的有限时间搜索模型,考虑如何实现将时间因子加入视频分析,增加模型应用的时效性;3) 采用立体相机获取场景内伪装目标的深度信息,提高目标与背景间的区分度。
伪装效果评估在军事领域具有重要的理论价值和应用前景,是发展伪装技术必不可少的研究内容。论文对国内外现有典型的基于光学图像的伪装效果评估模型进行总结和分析,分析了不同模型的特点与不足,简要阐述了光学图像伪装效果评估模型面临的关键问题及发展趋势,并提出各类伪装模型参数的自适应性,基于神经网络评估模型对样本的依赖性以及针对运动目标伪装效果评估的时效性是下一步评估模型研究的重点。论文对光学图像的伪装效果评估模型的系统性介绍,对于了解目前市场上模型的成长现状和未来发展趋势有一定的指导性意义。