唐俊林,张 栋,王玉茜,刘 莉
(1.西北工业大学航天学院,西安710072;2.江南机电设计研究所,贵阳550009)
随着信息技术的迅猛发展,现代战争具有大纵深、立体化、信息化、体系化等突出特点,交战双方在多维空间的对抗方式也表现出更加强烈和复杂多变的攻防对抗博弈,群目标的饱和攻击、多样化的突防手段、多类型的干扰态势、多种类导弹的交替使用,实现作战信息共享,构建以体系为核心、高度融合、整体联动的多种武器协同的空袭体系,提高突防效能,降低导弹防御系统拦截作战的效率,所以防空导弹系统正面临着严峻的威胁与挑战。新一代导弹防御系统必须进一步满足复杂战场环境中可靠探测高速、高机动、隐身、隐蔽、伪装群目标的迫切需求,亟待提高在复杂战场环境中的自适应任务规划以及群目标协同攻击等方面的能力。
面对新的空袭体系的作战思想与作战模式,多弹协同作战是未来战争中提高体系对抗能力的有效措施之一。如何组织和控制多个导弹来协同完成单枚导弹无法完成的复杂任务是一个亟待解决的问题。
在复杂的防空作战环境中,利用传感器对来袭目标的探测和跟踪是决定防空作战成败的关键。在拦截多批次多类型的来袭目标时,需要为部署在不同位置的传感器规划任务,实现多传感器的协同探测以及跟踪,为防空作战提供连续、稳定、可靠的探测和跟踪信息。因此多传感器的任务规划是防空作战的关键。
文献[1]给出各传感器对各目标的可探测时段,将协同任务分解为按时间排序的若干子任务,由于所考虑的约束条件较少,传感器和目标数量也较小,不需要使用特定的优化算法求解。文献[2]基于多智能体的分布式人工智能技术提出传感器任务规划体系架构,并给出实体层传感器的任务规划流程和算法实例。文献[3]构建了一种基于任务共同体的分层决策框架,通过粒子群优化算法仿真验证了分层决策框架的合理性和有效性。文献[4]总结了多传感器任务规划技术的理论和应用,并概括了集中式、分布式任务规划采用的一些算法,如早期的整数规划、图论、搜索算法以及后来的市场机制和群智能算法。文献[5]从多传感器信息处理技术和多传感器协同部署、跟踪、引导、识别等方面综述了多传感器协同任务规划的关键技术。文献[6]提出一种智能优化技术GSSM 算法来解决多传感器多目标协同跟踪问题。文献[7]用分布式传感器分配方法解决大规模无线传感器网络中多目标跟踪的传感器分配问题,通过反复迭代的子梯度搜索,求得近似优化。
针对大规模空袭问题,需要优化应对众多来袭目标的传感器资源分配方案,因此本文借鉴协同进化的思想,基于多智能体技术,对多传感器任务规划问题展开了研究。
大规模空袭目标对要地防空和区域防空带来了极大挑战,如图1所示,大规模空袭目标包含隐身目标、各类无人机、弹道导弹目标等,采用单一的传感器探测已无法适应复杂的作战环境,因此需要多传感器的协同探测才能满足需求。
图1 大规模空袭要地目标示意图Fig.1 Target of large-scale air attack
针对大规模的空袭问题,来袭目标的数量远远多于传感器的数量,需要为每个目标分配部署于不同位置的传感器,以实现对目标的探测和跟踪。多传感器多目标任务分配优化问题的解往往规模庞大,为了分解问题规模,提高运算效率,基于多智能体系统思想,将所有传感器进行分组,同一个组中的若干个传感器由一个主控Agent 管理。各主控Agent 只负责为其责任范围内的目标分配所管理的传感器,各主控Agent 由上级主控Agent 管理。目标-传感器完整分配方案组成如图2所示。
图2 全局决策向量分配示意图Fig.2 Global decision vector assignment
上级主控Agent 所属的m个探测跟踪传感器集合表示为J={J1,J2,…,Jm},需要跟踪的n个目标用集合表示为T={T1,T2,…,Tn}。建立多传感器跟踪资源分配的决策变量为:
第j= 1,2,…,NA个主控Agent 的mj个传感器集合表示为Jj={Jj1,Jj2,…,Jjm}⊆J,需要跟踪的nj个目标用集合表示为Tj={Tj1,Tj2,…,Tjn}⊆T,其目标-传感器分配的决策变量为:
第j= 1,2,…,NA个主控Agent 的责任区定义如下:责任区中心在以上级主控Agent 为中心的大地直角坐标系下各坐标轴的位置分别表示为责任区半径表示为Rjzr。
上级主控Agent 中,第p(p∈1,2,…,n)个目标只位于第j(j∈1,2,…,NA)个主控Agent 的责任区内,不位于其他任何一个Agent 的责任区内,则表示为S0pj= 1;否则S0pj= 0。
针对大规模空袭问题,目标函数应使目标-传感器分配方案的效能达到最优。目标函数综合考虑目标的威胁顺序、传感器j对目标i执行任务时的价值函数和目标i对传感器j造成的损耗函数,形成一个配对效能函数。
(1)传感器j对目标i执行任务时的价值函数Vij
价值函数Vij一般根据传感器所执行的具体任务需求或当前对目标的跟踪状态定义:
其中;Pfij为传感器j对目标i的发现概率;为传感器j对目标i的跟踪精度度量。
(2)目标i对传感器j造成的损耗函数Cij
损耗函数Cij主要是指进行配对后给整个多传感器系统乃至防御阵地带来的损失。
定义Cij= 0 时损耗最大,Cij= 1 时损耗最小。r表明该传感器的重要程度,r∈[1,9];nj为当前传感器j剩余的目标通道数,nmax为当前所有跟踪制导传感器的总目标通道数量。qfs为状态量,表示该传感器是否有反辐射导弹攻击,qfs= 0 表示有反辐射弹攻击,qfs= 1表示无反辐射弹攻击。
根据以上两条分析,对于主控Agent,多传感器资源协同分配总效能Ef定义为:
其中,α、β为加权系数,且α+β= 1,wi为综合情报态势系统给出的目标威胁排序。
此时,多传感器资源协同分配模型可描述为,在一定约束条件下,求使得Ef最大的目标-传感器协同分配矩阵X,即目标函数为:
针对大规模空袭目标的多传感器规划问题,在任务规划过程中,需要考虑一些实际的约束:
(1)主控Agent责任区约束:
式中,Spj= 1 表示目标p位于第j个主控Agent 责任范围内。
(2)每个传感器最大执行任务能力约束:
式中,ηjq为传感器q的最大可探测能力,≥1 且q= 1,2,…,mj。
(3)每个目标的最大被执行任务容量约束:
式中,为目标p被分配的最多传感器数。
(4)传感器对主控Agent 的无重叠责任区内目标覆盖约束:
当= 1时,
该条件表明在一个主控Agent 中,每个S0pj= 1的目标都至少应分配一个传感器。
(5)传感器对目标的可观测性:
a.雷达阵面限制
对于大多有阵面限制的制导雷达,应选择方位角在当前制导雷达类传感器阵面方位内的目标,分配给该传感器,即
式中,βi为目标i相对于传感器j的方位角,Δβj为传感器j的阵面角度大小。βFPj为传感器j的阵面方位中心。
b.干扰目标的最优观测雷达选择
对于在某个方向上释放干扰的目标,需要优先选择观测条件好的雷达进行观测,一般考虑雷达方位观测角至少大于60°,即:
式中,αmki为雷达方位观测角,其含义如图3所示。同时,优先分配具有针对该类型干扰有对抗能力的传感器。
图3 典型外挂干扰吊舱的水平干扰范围Fig.3 Horizontal interference range of typical external interference pod
(6)被动跟踪目标传感器的选择约束:
若不止两部传感器都被动跟踪上同一个目标i,则计算任意两部传感器对该干扰目标的交叉定位效能E,取E值最大的两部传感器跟踪该目标。E的定义如图4所示,
其中,AB为两部传感器之间的距离,θ为两部传感器与干扰目标形成的张角。
(7)传感器对已跟踪目标的固定分配约束:
若某传感器q已跟踪上某目标p,且需要持续跟踪(如收到“保持精跟”、“严密监视”等命令),则需要增加约束条件:= 1。另外,考虑传感器规划系统与作战指挥人员的交互,当指挥人员通过人工干预的方式或通过上级命令指定传感器q跟踪目标p(或不跟踪目标p)时,也需要增加约束条件:= 1(或= 0)。其中,p= 1,2,…,nj,q=1,2,…,mj。
图4 干扰目标与两部传感器相对位置图Fig.4 Relative position of jamming target and two sensors
协同进化算法改进了传统进化算法的不足,通过多个种群之间的竞争或合作关系,使其相互作用提高各自性能,以达到种群优化的目的[8]。协同进化算法包括竞争型和合作型协同进化算法[9]。Jong提出了合作型协同进化算法的通用模型,其有效性在很多问题中得到证实。文献[10]对合作型进化算法的合作选择方式、适应度分配等合作机制进行了研究。
典型的合作型协同进化算法流程如图5所示,种群中的个体适应度计算需要从其他各种群中抽取一个代表个体来共同放入问题域(选择代表个体的方式也成为算法的合作形式),组成问题的解,然后用问题域中的评估函数计算评估值,以此作为该个体的适应度。各种群在合作型协同进化模型中是以合作的形式发生信息交换的。
本文提出了一种改进的竞争协同进化算法,该算法的完整解由不同种群的代表性个体组成,其信息交互关系如图6所示。
在图6中,各主控Agent分别完成自身的进化争取最大效能值后,将最优多传感器多目标分配方案送上级主控Agent,上级主控Agent 对各主控Agent的最优分配方案进行冲突消解后,将各自新的分配方案反馈给相应主控Agent。
改进型竞争型协同进化模型的算法流程如图7所示。
3.3.1 编码方式
图5 合作型协同进化算法Fig.5 Cooperative coevolution algorithm
上级主控Agent 探测跟踪的目标集合T=(共n个目标),在以上级主控Agent 为中心的大地直角坐标系下各坐标轴的位置分别表示为上级主控Agent下属所有传感器资源集合表示为(共m个传感器)。上级主控Agent 的目标-传感器完整分配矩阵表示为Xn×m,其元素定义如下:
上式中p= 1,2,…,n和q= 1,2,…,m。
图6 竞争型协同进化模型的信息交互关系示意图Fig.6 Information interaction of competitive coevolution model
图7 竞争型协同进化模型的流程图Fig.7 Competitive coevolution model
第j= 1,2,…,NA个主控Agent的mj个传感器集合表示为Jj={Jj1,Jj2,…,Jjmj}⊆J,需要跟踪的nj个目标用集合表示为Tj={Tj1,Tj2,…,Tjnj}⊆T,其目标-传感器分配矩阵的元素定义如下:
上式中p= 1,2,…,nj和q= 1,2,…,mj。
3.3.2 可行解的生成、交叉和变异
(1)可行解的生成
对目标-传感器分配矩阵的每一个元素,在满足传感器有剩余通道、分配传感器未达到限制、传感器作用距离和阵面范围内、传感器类型符合需求等约束条件下,若该目标施放干扰,优先分配对该干扰有对抗能力的传感器,其次是雷达方位观测角大于60°的传感器。在其他情况下,则将该元素随机置为0 或1,若不能满足以上任何一条约束条件则将该元素置为0。
(2)可行解的交叉
交换两个目标-传感器分配矩阵的对应行,即交换对应传感器对每个目标的分配情况。如交换两个矩阵的第三行:
图8 交叉过程示意图Fig.8 Crossover process
对交换后的两个矩阵进行可行性检查,若目标q没有传感器分配,则为该目标分配一个满足所有约束条件的传感器。若没有满足所有约束条件的传感器,则分配一个有剩余通道,满足固定分配约束,在该主控Agent责任区范围内的传感器。
(3)可行解的变异
目标-传感器分配矩阵的元素在满足所有约束的条件下以某一概率变异,原来为0 则变为1,原来为1 则变为0。如第2 行第4 列元素,第3 行第3 列元素由1 变为0,第3 行第1 列元素由0变为1。
若存在目标没有传感器分配,与个体生成中的处理方式相同,保证每一个目标都有分配传感器。变异概率取0.6,个体的每个基因以0.6 的概率变异。
图9 变异过程示意图Fig.9 Mutation process
3.3.3 上级主控Agent冲突消解
与各主控Agent的目标-传感器分配矩阵相比,上级主控Agent 的目标-传感器完整分配矩阵Xn×m的约束条件只有约束条件(4)不同。在上级主控Agent 的目标-传感器分配矩阵中,条件(4)为传感器对目标的覆盖约束:
其中,p= 1,2,…,n。每个目标都必须至少分配一个传感器。
当由各主控Agent 独立完成自身的进化后,得到使得各自目标函数达到最优的目标-传感器分配矩 阵,并 传 递 给 上 级 主 控Agent,上 级 主 控Agent 对全部的组合解Xn×m进行可行性判断,当不满足约束条件时消解各主控Agent独立进化争取自身效能而与其它主控Agent之间冲突的问题。
图10 冲突消解Fig.10 Conflict resolution
为了消解冲突,需要对部分目标进行解除分配关系的操作,一方面避免传感器资源分配过甚,另一方面为没有传感器分配的目标腾出传感器资源;还需要对没有传感器资源分配的目标或者有剩余传感器资源可分配且分配传感器资源未达上限的目标进行添加分配关系的操作,尽可能使得整体效能优化。
由此,对冲突消解模型的每一步展开设计。
第一步:梳理出传感器资源分配过甚的目标及其分配关系。
第二步:梳理出没有传感器分配的目标及其可分配的传感器和相应传感器的所有分配关系。
第三步:按威胁度由小到大的顺序依次为传感器资源分配过甚的目标进行解除分配关系操作,解除分配关系时按整体效能衰减值由小到大的顺序依次进行,直至无多余的分配关系为止。
第四步:按威胁度由大到小的顺序依次为没有传感器分配的目标先腾出可分配的传感器资源,再进行添加分配关系操作,腾出可分配的传感器资源时按整体效能衰减值由小到大的顺序依次进行解除分配关系操作(当有剩余传感器资源可分配时不需要此过程,当解除分配关系后另一目标无传感器分配则禁止解除此分配关系),直至目标有可分配的传感器资源为止,添加分配关系时每个目标按整体效能增益最大的原则仅添加一个传感器分配。
第五步:循环判断是否存在有剩余传感器资源可分配且分配传感器资源未达上限的目标,若存在则梳理出所有这样的目标及其全部可分配的传感器,按整体效能增益最大的原则进行添加分配关系的操作,并进入下一轮循环;若不存在这样的目标,则停止循环。
假设敌方使用2 架预警机、2 架隐身轰炸机、6 架联合攻击机、16 架战斗轰炸机、空基巡航导弹、联合防区外发射武器、联合直接攻击弹药、反辐射导弹等。大规模空袭时的空袭方案(如图1所示)和空袭武器数量(部分见表3)。仿真将100个目标分配给15 个传感器。15 个传感器交由3个Agent 管理,每个Agent 管理5 个传感器。各主控Agent,各传感器,各目标的参数由下面的表格列出:
表1 各主控Agent的参数Table1 Parameters for Agents
表2 传感器的参数Table2 Parameters for sensors
表3 目标的参数Table3 Parameters for targets
各主控Agent 分别采用遗传算法进化,种群规模取200,最大进化代数取400。α取0.6,β取0.4。为了提高运算效率,采用变种群规模的策略,每进化5 代,种群规模减2。在保证寻优能力的前提下,适当减小种群规模能够缩短计算时间。
采用竞争型协同进化算法,各主控独立进化后再经过冲突消减。由于最终的目标-传感器分配矩阵十分庞大难以列出,以下仅列出各个传感器所分配到的目标:
传感器1:[2,3,4,7,9,11,12,14,15,16,17,18,20,41,47,64,69,92,95,96,97,98,99]
传感器2:[10]
传感器3:[1,5,6,8,10,13,19,91,93,100]
传感器4:[1,5,94]
传感器5:[6,8,13,19]
传感器6:[21,22,24,26,27,28,29,30,32,38,39,40,42,43,44,45,46,48,49,50,73,74,75,76,78,80]
传感器7:[2,3,4,7,11,12,14,15,16,17,18,20,21,22,24,26,27,28,29,30,32,38,39,40,42,43,44,45,46,49,50,73,74,75,76,78,80,92,95,96,97,98,99]
传感器8:[31,33,34,35,36,37]
传感器9:[23,25,71,72,77,79]
传感器10:[77]
传感器11:[51,52,55,59,60,62,63,65,66,67,68,70,83,84,86,89]
传感器12:[51,52,55,59,60,61,62,63,65,66,67,68,70,83,84,86,89]
传感器13:[53,54,56,57,58,85]
传感器14:[81,82,85,87,88]
传感器15:[81,82,87,88,90]
各主控Agent的目标函数随着进化过程的变化趋势如图11所示,各主控Agent 的目标函数随着进化过程逐渐增大最后趋于稳定,算法的寻优能力效果显著。
各主控Agent 的目标-传感器分配如图12所示,三角形表示目标,六边形、圆形、五角星、菱形、正方形依次表示各个传感器。
图13为所有目标-传感器的分配图。红色表示Agent1 的传感器和目标,黄色表示Agent2 的传感器和目标,绿色表示Agent3的传感器和目标。
图11 目标函数变化趋势Fig.11 Change trend of objective function
传感器任务规划中,来袭目标往往数量众多,用来表示问题解的目标-传感器分配矩阵规模庞大。将传感器分组,由若干主控Agent分别管理,有利于加快进化效率。
图12 各主控Agent的目标-传感器分配图Fig.12 Target-sensor assignment
图13 目标-传感器分配Fig.13 Target-sensor assignment
竞争型协同进化算法适用于规模较大的优化问题。将大规模优化问题分解,有利于提高运算效率,同时又具备较好的寻优能力。各主控Agent 独立进化达到最优后,再进行冲突消解,造成了全局寻优能力下降。合作型协同进化算法避免了大量信息在各主控Agent和上级Agent之间传递,具有一定的优势。