王文竹 李智 来嘉哲 方宇强
1.航天工程大学北京101416
随着空间目标数量不断增加和空间环境日益复杂,空间态势感知领域(Space Situational Awareness,SSA)面临着越来越大的挑战[1].SSA 的主要任务是对影响空间行动的空间态势要素进行识别、描述和理解,并结合相关情报信息对空间态势的发展趋势进行预测和分析.其中,空间目标特性分析是空间态势感知的重要内容之一,主要完成目标属性特征的分类识别,从而支撑身份确认、异常预警和行为预测等指挥控制,对空间态势的理解和掌握发挥着重要作用[2−3].
空间目标特性数据是利用雷达和光学等设备获取的目标探测数据,与目标形态、状态和轨道等特征密切相关,因而可以利用目标特性数据对其特征进行分析.聚类算法是一类重要的机器学习算法,能够对海量数据进行无监督分类和识别[4−5],从中获得有价值的信息和结论.尤其是在缺少训练样本和先验知识的情况下,聚类算法也能有效实现空间目标的分析和识别,对目标类型、身份、行为等特征的初步判断发挥重要作用.因此,随着新进空间目标数量的不断增加,利用聚类方法进行目标特性分析将成为判断目标基本特征的重要手段.
然而,由于目标特性数据具有类型维度多样、特征不易辨识等问题,给聚类分析带来了一定的挑战,造成类别特征不明显、聚类结果准确率低等问题[6].随着卷积神经网络技术的快速发展[7−8],在实现海量数据高效识别分类的同时,也为数据特征提取带来了新的方法和手段[9].本文利用卷积神经网络的特征提取能力,首先对空间目标特性数据进行特征提取,从而提高其特征的辨识度,有利于进行聚类分析;而后,利用K-means 聚类算法对特征数据开展聚类分析和研究工作;最后,对原始数据和特征数据的聚类分析结果进行实验验证和对比.实验结果表明,本文提出的基于卷积神经网络聚类分析方法,能够大大提高目标分类识别的准确率和性能,从而有效增强指挥决策的计划和制定能力.
空间目标特性是指空间目标自身的属性和特点,包括形状、材质、姿态和轨道等.在不考虑复杂环境因素影响的前提下,基于雷达、光学和电子等设备获取的目标特性数据,加之可行的分析技术手段,就能够反演、计算或模拟得到目标的相关属性,从而在客观上反映其不同的属性和特征[10−11].
图1 空间目标特性数据曲线
目前,较为常用的空间目标光电特性数据有光学散射截面(Optical Cross Section,OCS)和雷达散射截面(Radar Cross Section,RCS)两种.其中,OCS 是用于表征目标对照射光波散射能力的物理量,其结果取决于目标的表面材质、几何结构、姿态以及太阳光方位和探测器接收方位等诸多因素.RCS 表征了雷达目标对照射电磁波散射能力的物理量,根据电磁波传播时电场矢量的不同,RCS 又包含垂直极化(RCS-VV)和水平极化(RCS-HH)等.图1所示为在一个时间序列内,某一空间目标OCS、RCS-VV 和RCS-HH 的特性数据曲线.
一般而言,每个目标的特性数据都有其自身的规律和特点,通过反演和计算目标特性数据,能够有效分析得到其相关的特征属性.但由于空间目标数量不断增加和空间环境日益复杂,目标特性数据的特征辨识度不断降低,给相关特征的分析也带来了新的挑战.
由于OCS 和RCS 特性数据具有维度低、特征不明显和受环境影响等因素,往往不太容易直接进行目标特性的识别和确认.聚类分析是一类无监督机器学习算法,能够实现数据的智能划分和识别.例如,当给出样本空间{xi}(i= 1,2,···,n)时,通过计算可以将每个样本划分到1,2,···,k中的不同簇内.划分完成后,同一簇内的样本之间具有相似属性,而不同簇之间的样本之间属性相差较大.
图2所示为基于聚类分析方法的空间态势感知指挥与决策技术框架.其中,一个时序内的特性数据,作为目标特性分析的基本数据单元.由于空间目标具有其自身的属性特征,因此,聚类方法能够将具有相似特征的目标划分到同一簇内,将特征差异较大的目标划分在不同的簇,进而能够对目标特征进行类别的初步判断和分析,在一定程度上弥补了直接分析所带来的挑战,能够支持空间态势感知的指挥控制与辅助决策.
图2 基于聚类分析的空间态势感知指挥与决策技术框架
近年来,人工智能技术取得了快速发展,在图像识别、金融和自然语言处理等领域取得了成功应用.基于机器学习的数据分析也成为了研究热点之一,相关学者和机构在空间态势的智能分析领域开展了诸多研究,包括目标机动行为识别预测研究[12]、目标行为变化和翻滚率等行为指示告警[13]、以及空间态势智能感知模型[14]等.在军事应用方面,DARPA 的Hallmark 项目提出了“太空态势与智能化”的基本架构[15],通过专家知识、人工智能和大数据处理等先进技术,完成态势感知、快速评估、辅助决策等功能.2019年8月,BAE 系统公司取得了Hallmark 的第2阶段合同,大幅增加了机器学习和人工智能技术,让空间操作员能够识别异常活动和预测可能的威胁,从而在日益复杂的太空环境中快速评估、规划和执行作战行动.可见,智能分析方法在未来空间态势感知指挥领域将发挥越来越重要的作用.
由于空间目标体积小、距离地基探测设备远、以及受环境影响等因素,目标特性数据之间特征相互重叠,较难进行辨识.而如果对特性数据进行人工特征提取,对于庞大且复杂的数据体系来说,存在定义难度大、准确率不高和效率低等问题.可见,在对空间目标进行聚类分析时,如何针对多维融合的目标特性数据进行有效的特征分析,成为聚类分析面临的主要挑战.
卷积神经网络(Convolutional Neural Networks,CNN)在传统神经网络算法上进行了优化和改进,通过局部连接和权值共享等方法,有效解决了经典神经网络算法中参数量过大、过拟合严重和计算复杂度高等问题,大大提高了神经网络的训练性能和识别精度.在训练样本质量和数量都能得到满足的前提下,CNN 能够取得较为理想的识别精度.
CNN 每一层结构都对数据进行卷积、池化和非线性激活等处理,每个卷积核都可以看作是一个特征提取器,整个网络在从底层到高层过程中,能够不断提取和组合越来越显著的高级特征.因此,利用CNN 技术能够对数据进行有效的特征提取.例如,在Alpha Zero 系统中,通过将围棋的棋局特征进行提取和分类,从而对下一步落子位置和局势进行决策判断[16].因此,本文仅利用神经网络的特征提取能力,获取目标特性数据的高级特征,并利用特征数据进行聚类分析.
数据特征提取过程是对数据格式、数值等进行变换,以突出该数据中具有代表性的特征.例如,给出数据集{xi},其中xi为式(1)所示的特性数据矩阵:
用函数ψ 表示特征提取过程,那么{xi}经过特征提取后变为{ψ(xi)},其中ψ(xi)为式(2)所示的特征向量:
基于卷积神经网络的特征提取过程就是构建特征提取模型ψ.因此,本文基于原始数据的矩阵维度、输出特征的维度需求、以及典型卷积神经网络的模型结构特点,设计了如图3所示的特征提取网络结构.
该模型输入数据包含了OCS、RCS-VV 和RCSHH 3 种浮点类型的特性数据,基本构建单元为(1×3)维的[OCS,RCS-VV,RCS-HH]向量,300 组基本单元构成了(30×30)维输入矩阵,表征了一个时序内的目标特性数据集合.
图3 基于卷积神经网络的数据特征提取
输入矩阵经过多个卷积、池化和激活函数等计算后,在第7 层输出(1×64)维的特征向量.由于卷积神经网络模型具有优良的泛化能力,输出特征向量不仅在维度上大幅降低,并且具有更好的特征属性,易于进行相关算法的分析研究.虽然卷积神经网络的训练时间较长,但在数据特征提取时不需要反向传播计算过程,前向计算的特征提取性能较高,能够有效应对数据量不断增加的挑战.
聚类分析又称群分析,是数据挖掘中的一类重要算法.其中,k均值聚类算法(K-means)是一种迭代求解的分析方法,其步骤是随机选取k个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,并把每个对象分配给距离其最近的聚类中心.算法1 为K-means 算法流程,展示了将n个样本{xi}(i=1,2,···,n)划分到k个簇中的过程.
其中,步骤1 是在所有节点中随机选取k个中心节点,并将节点进行初始化.步骤2 是更新节点所归属于的簇标签,这一过程主要是通过计算节点与中心节点之间的相似度完成的.节点之间的相似度可以用多种方法进行计算,包括欧式距离、曼哈顿距离和切比雪夫距离等.由于本文研究的数据为矩阵和向量类型,因此,选择了欧式距离作为相似度的计算方法.步骤3 是在当前划分好的簇内选择新的中心节点,其方法是将簇内所有节点相加后取平均值,结果将作为下一次簇分析的中心节点.步骤4 是算法的完成条件,即在所有簇的中心节点不再发生变化,或达到预定义的收敛精度时,算法将完成计算.
算法1.K-means 聚类算法
1.选择k个簇中心节点,并赋初值µ1,µ2,···,µk.
2.更新样本x1,x2,···,xn对应的簇标签y1,y2,···,yn,其中
3.更新各个簇的中心节点µ1,µ2,···,µk
其中,ny为属于簇y的样本总数.
4.重复步骤2 和3,直到簇标签达到收敛精度.
为了开展空间目标聚类分析研究,首先选取空间目标的原始特性数据,并构建基于时间序列的(30×30)维分析矩阵.而后,利用卷积神经网络特征提取后,获得(1×64)维的特征向量.利用K-means算法分别对原始数据和特征数据分别进行聚类分析.
图4 不同簇内节点的聚类分析对比
图4展示了两个节点的聚类分析对比,其中左侧是原始特性数据,右侧是提取后的特征数据.在实际情况中,两者的外形、材质等存在一定差异,应划分到不同簇内.但由于原始数据特征不易辨识,K-means 算法将其划分到同一簇内,导致分析结果错误.而在对特征数据进行分析时,K-means 算法能够正确地将其划分到不同簇内.从图4右侧可以看到,经过特征提取后原始数据发生了明显的变化,其结果就是放大了数据的主要特征,使向量所表征的特性更明显,同时利用稀疏方法降低了干扰因素的影响.在两组特征数据的对比中,由于圈内的数值存在较大的差异,因此,聚类算法能够正确地计算出特性差异,将其划分到不同的簇内,提高分析结果的正确率.
经过聚类分析后,每个簇代表了空间目标相应的属性特征,因此,能够判断被划分到同一簇内的节点具有相似属性.在指挥过程中,尤其是针对非合作目标,在指挥初期阶段对其进行特征分析和判断时,聚类方法能够给出较为直观的结论和建议.不同于卷积神经网络的不可解释性,聚类方法通过节点之间的相似度差异的计算,在一定程度上能够对分析结论进行解释,这在指挥控制过程中具有非常重要的意义.
为了验证算法的结果和性能,搭建了配置为8 核Intel i7 3.6 GHz 处理器、16 GB 内存和银河麒麟系统的实验环境.利用TensorFlow2.0 搭建用于特征提取的卷积神经网络模型,并利用Python3.7 实现验证程序和聚类算法.
实验数据来自于10 个不同的空间目标,原始数据为OCS、RCS-VV 和RCS-HH 构建的9 000 组(30×30)维浮点型矩阵,相应的特征数据为9 000 组(1×64)维浮点型特征向量.最后,分别使用原始数据和特征数据进行聚类分析,并将实验结果进行对比.
在进行聚类分析时,聚类的收敛指标是旧中心节点与新中心节点之间的欧式距离.当所有簇的中心节点不再发生变化时算法终止,在进行聚类分析时,分别记录了特征数据和原始数据的收敛指标,实验结果如图5所示.
从图5中可以看到,原始数据的收敛速度较慢,这主要是由于原始数据的特征辨识度较低,导致节点归属簇的标签频繁震荡,簇中心节点无法快速确定.相比之下,特征数据的聚类过程能够较准确地计算出节点归属的簇,减少了节点簇标签的震荡,因此,收敛速度较快.总的来说,特征数据的收敛速度比原始数据提高了6.32 倍.
图5 聚类收敛过程对比
聚类算法结果的验证程序分为两组,第1 组使用特征数据进行聚类分析,第2 组使用原始数据进行聚类分析.由于目标特性数据是某一时刻目标对探测设备的反馈信息,由目标的轨道、材质、形状、姿态和周围环境等因素决定,因此,基于分析目标属性的综合考虑,将10 个目标划分为4 种不同类型,即k=4.运算过程中,记录两组聚类算法的准确率和迭代次数,实验结果如图6所示.
图6 聚类分析结果对比
在聚类分析的准确率方面,特征数据准确率为89.7%,原始数据准确率为45.5%,准确率提高了97%.这主要是由于经过特征提取后,数据的特征辨识度更高,因此,提高了聚类分析中相似度计算的准确率.此外,特征数据的迭代次数为22 次,原始数据为139 次,这也说明特征数据质量更高,聚类过程对节点错误划分次数更少.
聚类算法性能的验证程序分为两组运行,第1 组使用特征数据进行聚类分析,第2 组使用原始数据进行聚类分析.运算过程中,分别记录两组程序的运行时间,实验结果如图7所示.
图7 聚类分析时间对比
在算法性能方面,虽然特征提取产生了额外的时间开销,但得到的特征数据却能提高算法的整体性能.一方面是将分析数据进行了降维变换,从而降低聚类分析中相似度计算的算法复杂度;另一方面是提高了数据质量,有效降低聚类分析的收敛速度,提高算法的总体运行效率.总体来说,基于原始数据的聚类算法时间为25.39 s,基于特征提取的聚类算法总时间为13 s,性能整体提高了48.8%.
随着空间环境日益复杂,空间目标聚类分析在空间态势指挥决策中将发挥越来越重要的作用.研究了基于卷积神经网络的空间目标特性聚类分析技术,能够有效解决原始特性数据特征不易辨识的挑战,提取后的特征向量在聚类分析中能够获得更好的分析效果.经过实验验证,该方法在收敛性、正确率和性能上均优于原始数据聚类分析,从而为快速、精准的空间目标聚类分析提供有效解决方案,能更好地支撑指挥决策的计划与制定.