基于基因表达式编程的多星成像任务规划算法*

2020-07-13 07:13明卫鹏马广彬章文毅

中国科学院大学学报 2020年4期

明卫鹏，马广彬，章文毅

(1 中国科学院遥感与数字地球研究所，北京 100094； 2 中国科学院大学，北京 100049) (2018年11月30日收稿； 2019年3月4日收修改稿)

对地观测技术的优势在于能够快速准确地获取人类地表活动信息[1]，而遥感作为对地观测技术的一种，其应用范围越来越广泛，不仅在环境灾害防治、城市建设规划、气象预报等领域发挥重要作用[2]，而且在考古遗址[3]、遥感卫星车辆检测[4]、气溶胶辐射观测[5]等方面的应用也越加普遍。虽然对地观测卫星的数量和成像能力已得到巨大提升，但由于各行各业对遥感影像数据的大量需求，使得成像卫星的资源仍相对稀缺。因此，研究如何充分利用卫星资源，以经济快捷的方式获取较高质量的遥感数据，就成为必要之举，也是本文要研究的多星成像任务规划问题。它是指考虑星上传感器成像能力、传感器的侧摆能力等因素，合理安排卫星，对区域目标制定成像方案[6-7]。

多星成像任务规划是一类极其复杂的组合优化问题[8],同时在数学上也是一种NP—完全问题[9]。这类问题，国内外已有大量研究[10-11]，通常包括模型建立和求解两部分。如Wolfe和Sorensen[12]将卫星成像任务规划问题映射为带时间窗约束的背包问题，建立整数规划模型；Song等[13]对单星成像规划问题建立非线性规划模型；贺仁杰等[14]对成像规划问题建立约束满足问题模型。而模型求解的方法多采用启发式算法，如模拟退火算法[14]、蚁群算法[15]、遗传算法[16]等。这些算法大都从解的邻域搜索最优解，容易陷入局部最优，得到次优解。虽然模拟退火算法对陷入局部最优有所改善，但计算效率不高。因此，为增强全局最优解的搜索能力，并兼顾计算效率，本文采用基因表达式编程来求解多星成像规划问题。

1 基因表达式编程算法简介

基因表达式编程(gene expression programming,GEP)起源于遗传算法，但又结合了遗传编程的优点，是二者融合的产物[17]。它的染色体是由一个或多个基因组成，用固定长度的线性符号串来表示。每个基因也是由固定长度的线性符号串构成，包括头部和尾部两部分。表1为染色体的构成。

表1 染色体的构成Table 1 Chromosome composition

基因头部符号串包含函数符号和终止符；尾部符号串只包含终止符。长度为t的尾部和长度为h的头部满足公式

t=h×(n-1)+1，

(1)

式中：n为函数符中的最大操作数目[18]。例如，“+”，“-”，“×”的操作数目都为2；Q代表平方根，它为一目运算符。对于函数符号集{+，-， ×，Q}中最大操作数目为2，则n=2。

此外，基因表达式编程的多基因家族染色体中可以包含多个基因家族，基因家族之间按某种规则相互作用，而基因家族又可以包含多个基因。GEP的遗传算子有变异、逆串、插串、根插串、两点重组等，丰富的遗传算子和灵活的染色体结构使得GEP具有强大的应用功能。

2 多星成像模型的建立

在研究区域目标多星成像时，需要进行卫星轨道的预报计算，本文采用应用广泛的SGP4(simplified general perturbations)模型，即简化常规摄动模型[19-20]求解卫星的位置和速度。然后再根据目标区域，结合过境卫星的侧摆能力和过境时间计算成像条带。在选取条带组成成像方案时，需要考虑约束性。

2.1 模型的约束条件分析

模型的约束主要考虑卫星的成像约束，表2是本文考虑的卫星成像的约束规则。

表2 卫星成像的约束规则Table 2 Constraint rules of satellite imaging

卫星过境时，所携带的传感器的不同成像模式都有可能参与成像，本文将传感器以不同的成像模式过境称为逻辑轨道。所以逻辑上来讲，一颗有多种模式传感器的卫星过境一次就会产生多个逻辑轨道。如果传感器不同的成像模式不能同时参与成像，就只能选取其中之一的逻辑轨道产生的条带参与成像，否则，便不满足表2卫星约束中的1)、2)约束条件。同一逻辑轨道产生的多个条带，只能选择其中一个参与成像，否则便不满足表2卫星约束中的3)、4)约束条件。如果参与成像的条带之间重叠范围过大，会造成极大的资源浪费。所以需要检查选取的条带是否满足成像覆盖约束。通常设定一个阈值OverLap为一个常数，两个条带分别为Stripx, Stripy，二者的重叠部分为

Intersection=Stripx∩Stripy.

(2)

设重叠区域的面积为Aintersect，条带Stripx的面积为AStripx，条带Stripy的面积为AStripy，则应满足约束条件

Aintersect/AStripx

和

Aintersect/AStripy

(3)

2.2 建立约束满足性模型

为便于模型的建立及求解，本文将一条成像条带看作是一个元任务，作为模型的数据输入[14]。它包含卫星、传感器、成像范围、成像模式、成像时间等重要信息。决定成像任务规划方案优劣的因素有多个，主要包括：目标区域的覆盖率；成像方案的起止时间；参与成像的传感器个数；成像过境的轨道数；成像的条带数。其中任意因素皆可作为成像任务优化的目标，多星成像任务规划是一个多目标优化问题。其数学模型一般描写为如下形式：

(4)

(5)

式中：X=[x1,x2,…,xn]T为决策变量的向量,Z=F(X)为目标向量，Φ(X)≤G为约束向量。

(6)

(7)

(8)

(9)

2.3 模型的复杂性分析

假设有L颗卫星,Li(i=1,2,…,L)为第i颗卫星过境次数，si为第i颗卫星载有的传感器数，Mji为第j个传感器成像模式数；设第i颗卫星的第j个传感器第k个成像模式产生LSMPi,j,k个条带。则所有卫星过境产生的逻辑轨道数为

(10)

逻辑轨道产生的可能成像的总条带数为

(11)

进一步简化分析，将经过预处理后得到的过境逻辑轨道数设为n,设每一过境轨道可能的成像条带个数分别为s1,s2,…,sn。设成像方案数为F(n,s),一般地可以推断出[16]

(12)

3 算法求解

3.1 解的编码设计

本文设计了包含两个基因家族的染色体，每一个基因家族包含多个基因。基因的头部h=0，由式(1)可得尾部t=1，故基因长度等于1。

本文首先将产生的所有逻辑轨道划分为不同的集合，逻辑轨道集合的数量即是基因家族包含的单基因的数量，每个逻辑轨道集合包含的多个逻辑轨道相互冲突，不能同时参与成像。第一个基因家族中单个基因代表从逻辑轨道集合里被选中的逻辑轨道，另一个基因家族中的单个基因代表由上一个基因家族中相对应的逻辑轨道产生的条带集中被选中的参与成像的条带。这样的设计就可以满足表2中卫星约束的相关条件。图1 为染色体的结构。

图1 染色体结构Fig.1 Chromosome structure

3.2 引入知识库

倒置这一遗传算子能够增强算法对于解空间的搜索能力，同时对于染色体结构的破坏性也较大，不利于保留优良基因。为此本文引入知识库，该知识库包含了种群在进行迭代操作前的较优的小部分个体。设每次迭代产生的种群中最优个体为X，知识库中最优个体为Y，若X的适应度函数值(自适应值)大于Y，则将种群中比Y优的个体加入到知识库，替换掉知识库中次于Y的个体；若X的适应度函数值小于Y，则用知识库中所有优于X的个体置换掉种群里最差的一部分个体。此操作保证了参与迭代计算的种群个体始终是较优的，也有利于保留每次迭代产生的最优个体，避免最优解丢失。

3.3 算法求解过程

在算法流程中染色体的自适应值也就是优化目标的收益函数值，收益函数可见式(6)～式(9)。具体遗传算子如下：

1)交叉：先用轮盘赌注的方法选择个体，然后采取两点重组的方式进行交叉。当第1条染色体的逻辑轨道和第2条染色体的逻辑轨道进行交换时(交换的逻辑轨道必须属于同一逻辑轨道集，如逻辑轨道集B中的B1、B2), 相应的条带也得进行交换，这样保证了染色体始终满足表2中卫星约束的相关条件。

2)变异：当执行变异操作时，先进行逻辑轨道的变异，再从变异的逻辑轨道产生的条带中选取新的条带。

3)倒置：在第1个基因家族中随机选取2个基因，将二者内的基因片段倒置，相对应的第1个基因家族中的基因片段也进行倒置。这一操作可能使基因非法，所以需要对倒置的基因片段进行检验，如果条带号超出对应的逻辑轨道产生的条带范围，则基因非法，重新选取条带，使基因合法。

此外，为了防止条带之间的重叠率过大而造成重复拍摄，还应做重叠率约束性检验。本文的做法是：

1)在染色体所包含的所有条带集{S1,S2,…，Sn}中，按顺序遍历条带Si(i=1, 2，…，n)，若遍历完所有条带，遍历结束，转4)；否则转2)。

2)依次查验条带Si与第i个之前的所有条带Sj(j=1,2，…，i-1)是否满足重叠率约束条件，满足转1)；不满足，在Si对应的逻辑轨道里产生的条带集里重新选取条带，若选取的条带Si与Sj(j=1,2，…，i-1)满足重叠率约束条件，转1)；否则，转3)。

3)比较条带Si，与Sj(j=1,2，…，i-1)对目标区域覆盖率的大小，若Si的较小，将Si设置为空，转1)；若Sj的较小，将Sj设置为空,继续比较剩余的条带Sj，直至j=i-1时，比较结束，转1)。

4)检验结束，输出结果。

基因表达式编程与遗传算法的流程[22]类似，综合上文可得图2为本文的算法流程图。

图2 算法流程图Fig.2 Flow chart of the algorithm

4 仿真实验

本文的仿真实验，采用NetBeans软件以及java语言编程，在World Wind Java基础上实现了多星成像任务规划算法，规划方案显示等功能。为验证本文算法的性能并与文献[16]中的遗传算法作对比，首先选取多个行政区，作为目标观测区域。同一目标观测区域调用两种算法时，输入参数相同，即选取的卫星、规划起止时间，收敛条件均相同，以成像方案的条带数最少作为优化目标。为了更直观地对比调用两种算法得出的成像方案的覆盖率、条带数，分别将结果整理为图3、图4。

图3 观测次数对比Fig.3 Comparison of the observation times

图4 成像覆盖率对比Fig.4 Comparison of the imaging coverage

由图3、图4可知，基因表达式编程GEP相对于遗传算法GA所得的观测方案，不仅条带数均少于后者，而且覆盖率大于后者。从观测次数(条带数)以及目标区域覆盖率两项指标而言，基因表达式算法得出的成像方案是较优的。在计算耗时上，对于大多数目标区域GEP计算用时均比GA要长，这是因为遗传算法在迭代过程中出现种群退化或停滞，然后过早地结束迭代计算；再者，在GEP的迭代计算过程中，本文引入倒置这一遗传算子，增加了计算量。但总体而言，GEP对大多数目标区域的计算用时在90 s内，是一种较为理想的结果。

图5 覆盖率变化趋势Fig.5 The coverage changes

继续选取内蒙古作为观测区域，每两天作为时间间隔，逐渐增加观测天数，并追踪目标区域观测情况。将结果整理成图5，可知GEP算法对观测区域随观测天数的增加，其覆盖率增加得较快，且约两周后达到顶峰，即覆盖率为99.782%，并处于稳定状态。而GA算法对观测区域的覆盖率虽然也在随观测天数的增加而增加，但起伏较大，达到最优解的周期较长，而且不稳定。另外，GA算法求得最优解的覆盖率为96.442%，低于GEP的最优解。以上说明，GEP应用于多星成像任务规划问题，具有全局搜索能力强、鲁棒性较佳等优点,并极大提高了解的精度。

对广东、云南、四川等区域进行成像规划仿真显示。图6直观显示了基因表达式编程所得的成像任务规划方案较佳。

图6 观测方案的仿真显示Fig.6 Simulating display of the observation schemes

5 结语

多星成像规划问题的研究对于卫星资源的充分利用及快速获取区域数据具有重要意义。本文结合实际应用，对面向区域目标的多星成像规划进行研究，首次用基因表达式编程GEP进行求解，并在算法过程中引入知识库保证参与迭代计算的种群是较优的。结果表明，本文算法求解精度高，鲁棒性较佳，相比遗传算法性能显著。但是，理论上讲，GEP计算效率是较高的，本文用于求解多星成像规划问题时，计算效率并未完全挖掘出来；此外，对于卫星的侧摆，只考虑了左右侧摆，未考虑卫星的前后侧摆，这些有待于进一步研究和探索。