面向不确定性数据的雷达预警建模方法研究

2022-08-18 08:07程光权胡星辰廖世江周玉珍
郑州大学学报(理学版) 2022年5期
关键词:数目不确定性聚类

李 妍, 陈 超, 程光权, 胡星辰, 廖世江, 周玉珍

(国防科技大学 系统工程学院 湖南 长沙 410073)

0 引言

现代战争中,对抗博弈无处不在,合理的效能评估能够帮助指挥员获得信息和决策优势。情报获取是效能评估的重要前提,也是OODA(observation, orientation, decision, action)中的首要环节,直接关系到整个作战决策流程能否顺利进行[1]。雷达探测作为情报获取的重要手段,在目标侦查、火力打击等领域发挥着重要的作用。然而,由于真实战场环境的复杂性、变化性、动态性等特点,传统的雷达威力图的查阅或专家经验得到的雷达有效探测与实际探测值有较大偏差,难以满足实际战场的要求。因此,针对雷达探测过程中存在的不确定性因素,在采集难度大、数据量较少的情况下,利用少量已有数据分析其结构特征对实现高效准确的雷达预警能力建模具有重要意义。

近些年来,雷达探测性能的研究发展迅速。文献[2]基于大量实测数据,将动态环境参数与静态技术参数相结合,实现雷达实际探测距离的估算,并给出了雷达威力图修正方法。文献[3]基于复杂计算机兵力生成(CGF)系统,提出了一种模块化的雷达功能仿真方法,分析了不同干扰区域的雷达信息。文献[4]从概率的角度出发,建立基于目标特性的雷达探测能力模型,并通过修正最大探测距离对实际探测距离进行调整。这些传统的非线性模型由于自身的局限性,噪声数据会极大影响其性能,从而导致最终预测的结果无法有效拟合真实探测距离,对后续的作战决策造成影响。此外,作战过程中的数据数量有限且特征繁多,数据获取和采集难度较大,深度学习模型依赖大量训练数据支撑,现有的数据量难以支撑模型的学习训练[5]。针对以上问题,面向不确定性数据的模糊规则模型的研究显得尤为重要。

规则是人工智能中知识表示的主要方式,基于规则的模糊系统已被广泛应用,并在数据挖掘、模式识别等工程领域获得了不同程度的成功。例如,基于Larsen reasoning[6]的模糊模型已被用于深色图像增强的颜色不变性算法;基于Zadeh[7]的模糊规则模型解决了虹膜识别中的定位问题;基于层次聚类的Mamdani模糊模型[8]可以预测工业制造中的故障严重性;Takagi-Sugeno(TS)模糊模型[9]可以用来预测季节性时间序列。根据模糊规则的不同形式,基于规则的模糊模型主要能够分为TS模糊模型、Mamdani模糊模型和模糊关系模型。作为模糊模型中两种典型的拓扑结构,Mamdani和TS体系结构在其条件和结论部分都包含了信息粒,进而在输入、输出空间形成了非线性映射,这使得这两种模型针对非线性系统的辨识和控制过程中呈现出独特的优越性[10-11]。与Mamdani模型相比,TS模型的规则结论部分由输入变量的局部线性函数组成,而非模糊集合的形式,对动态非线性系统的处理更加高效。此外,TS模糊模型在去模糊过程中具有较高的计算效率[11-12],基于此,本研究采用TS模糊模型。

在TS模糊模型的构建过程中,捕获数据集中的内部关系是知识表示和处理的关键任务。此问题可以通过经验选择和数据驱动两种方法进行处理。经验选择方法在高维数据中适用性有限。因此,通过模糊聚类的方法从数据入手变得尤为重要。基于数据的模糊聚类为挖掘输入、输出空间结构的潜在关系提供了框架。模糊聚类[13-14]通过考虑类内相似性和类间差异,将样本划分为具有一定隶属度的特定类别,确定从数据集到多维空间的映射,在数据的基础上构建更加抽象的实体(信息粒)。作为将不确定性描述转换为数字信息的手段,模糊聚类方法生成与模型作用相关的模糊集,为建模过程中应对数据的不确定性问题提供了一种切实的方法。因此,本文立足于数据驱动的模糊规则建模方法,将训练数据的空间结构与模糊集相结合来建立TS模糊规则模型。将模型聚焦于模糊建模支持的核心组件中,以聚类算法增强建模过程中的数据表示,提高应对不确定性数据的能力。兵棋推演平台中获取的雷达相关数据的实验结果证明了本模型的鲁棒性和准确性。

1 TS模糊模型的框架

TS模糊模型主要由规则描述的定性知识和局部线性模型表示的定量知识两部分组成[10-11]。在数据驱动的方法中,模糊规则是从数据集中获得的。从实际应用的角度出发,挖掘数据输入和输出空间的潜在关系对面向不确定性数据的模型更为有益。因此,本节的目的是通过聚类算法增强模糊建模的数据表示,以建立针对不确定性数据的合理有效的TS模糊规则模型。具体来说,主要包括以下两个阶段:从数据角度出发,利用聚类技术确定结构;建立规则结论部分的线性函数并实现参数估计。

我们将标准化处理后的雷达有效探测距离的影响因素以及有效探测距离分别作为输入特征向量和结果向量,形成训练集X={x1,x2,…,xN}。TS体系结构根据规则、模糊推理和输出决策执行数据分区以表示复杂的非线性关系,我们建立“IF-THEN”规则来映射输入数据与输出数据之间的关系,每个规则代表一个雷达有效探测距离的影响因素的子空间[13,15],

其中:k=1,2,…,N,N是输入数据的个数;xk是n维的输入变量;c是模糊规则的数目;Ai(xk)是通过聚类算法得到的第i条规则的多变量隶属度函数;yi是在不同规则下的第i条输出;fi(xk)是与输入变量xk相关的局部线性函数。

(1)

要建立一个模糊模型,有必要在规则的条件部分和结论部分进行结构辨识和参数估计。在建模过程中,基于模糊聚类的方法用“IF-THEN”模糊规则对训练集进行处理,以较小的代价获得简化的数据结构特征。聚类方法作为模型的独立结构,将数据特征投影到模型参数中,从而完善了模型的功能模块并进一步改善了概念框架。因此,可以利用聚类在数据空间中实现数据驱动的建模。在众多模糊聚类算法中,模糊C均值算法(FCM)应用最为广泛[16-17]。它融合了模糊理论的精髓,通过不断迭代优化目标函数更新样本点对聚类中心的隶属度函数,得到更加灵活的聚类结果(信息粒),因此对处理含噪声的数据具有很好的效果。我们将FCM作为结构辨识的手段。通过迭代的方式使得目标函数最小化以确定输入、输出空间Rn+1中的聚类中心(原型)[vi,wi]以及分区矩阵,具体为[17]

规则数目与聚类中心的数目相等,且隶属度函数Ai作为规则的条件部分,是由输入数据的分区矩阵描述的。计算为

其中:m为模糊化系数。

定义规则的条件部分中模糊分区矩阵Ai由隶属度函数来表征,并且确定模糊规则的数目。接下来规则的结论部分由各种形式的线性函数定义

此时,公式(1)可以写作

zi=Ai(x)(x-vi),

(2)

本文通过以下形式简明地对所提出的模型进行表述,

令s=[y1-h1,y2-h2,…,yN-hN]T,且Z=[z11,z12,…,z1c,z21,a22,…,z2c,…,zN1,zN2,…,zN],则函数可以写作

利用最小二乘法最小化公式(2)可以得到参数斜率

aopt=(ZTZ)-1ZTs。

2 实验分析

2.1 应用案例

在兵棋推演中,红蓝双方在指定的想定下进行攻防作战。双方的兵力配置均包括空中作战单元(歼击机和轰炸机)和地/海面作战单元(地防设施和防卫舰艇)。在已知雷达参数数据的支持下,可以通过本模型快速计算出未测试新型雷达对各种型号单元的探测能力,一方面帮助推演方快速评测与适应新想定,另一方面更快帮助指挥员评估战场整体态势,从而为评估敌我双方探测与打击能力提供快速准确的指导。

2.2 实验数据介绍与处理

本文收集了兵棋推演平台上10种型号雷达在不同参数配置下的雷达探测距离信息,并通过参数相关性检验筛选出对雷达有效探测距离有重要影响的5个特征,如表1所示。

从表1可以看出不同特征的数值范围差别过大,对后续的分析或建模有所影响。为了消除不同因素之间存在的不同量级的影响,有必要将表中不同的特征依据特定标准转化为无量纲的数值数据。首先采用离散标准化的方法,以不同特征的最大、最

表1 雷达有效探测距离的影响因素简要介绍

小值为基础,对原始数据进行比例缩放,将不同的特征映射到区间[0,1]内,具体计算为

2.3 模型的训练与检验

本节根据前述的设计方法,对雷达有效探测距离进行了预测。在实验中,采用十字交叉验证法将250组数据随机划分为训练集(90%)和测试集(10%)。为了验证模型针对不确定性数据的鲁棒性和有效性,依次生成服从正态分布的不同强度的噪声(范围分别为±5%、±10%、±20%),对影响雷达有效探测距离的特征中所有训练数据进行扰动。为了避免单次实验带来的误差,选取十次交叉验证的RMSE的平均值作为最终结果。

实验主要设置参数如下:模糊化系数m=2;目标函数的最小变化率设置为1e-5;最大迭代次数为200;聚类中心的数目与规则的数目相关,分别设置为3、5、7、9、11进行分析,其他均为matlab中的默认参数。

将含有不同比例噪声数据和无噪声数据分别带入所构建的模糊规则模型,输出预测值如图1所示。可以观察到,无论是否对数据添加噪声,通过模糊规则模型得到的结果都能够很好地拟合实际输出。通过观察表2中平均RMSE值,可以发现当c逐渐增加时,预测输出与实际输出之间的差距逐渐减小。

图1 不同规则数目c下不同数据的模型输出与实际输出示意图

图2和图3分别显示了不同数据下基于模糊规则模型的训练集和测试集的RMSE结果。随着c的增加,RMSE在不断减小。在训练集中添加不同强度的噪声对训练结果有一定影响,且随着聚类数目的增加这种影响开始明显。而在测试集中,同一聚类数目下的不同噪声强度数据的RMSE结果变化并不明显。

图2 不同数据下训练集的RMSE的箱线图

图3 不同数据下测试集的RMSE的箱线图

表2列出了不同噪声强度下的影响雷达探测的特征数据通过模糊规则模型计算的RMSE结果,可以观察到,无论数据是否被加入噪声,随着聚类中心数目的增加,模糊规则模型的预测有效探测距离的结果都会提高。但是,过大的规则数目可能造成模型的过拟合。观察表3,我们对相同规则数目下的不同数据结果进行统计分析,发现RMSE变化率均不超过所添加噪声的强度。这证明模型对不确定性数据的干扰具有好的鲁棒性。观察增加噪声后的RMSE结果,一般来说,噪声强度越大,测试集的结果越差。但是部分数据产生了比原始数据更优的结果,这可能是某些随机噪声使得数据移动至更接近原型的位置,产生了偶然性的结果。

表2 针对不同数据不同规则数目下的模糊模型的平均RMSE

总体而言,通过比较无噪声数据与含噪声数据的RMSE的结果,本算法具有良好的抗噪能力。同时,当模糊规则取值较大时,模型对较高噪声强度的数据集处理性能提升。因此,本文提出的针对不确定性数据的雷达有效探测的建模方法被认为是有效的。

3 结论

针对实际作战中数据不确定性问题,我们提出了一种基于数据驱动的TS模糊规则模型,可以一定程度上克服不确定因素对数据的影响。该方法从数据的角度出发,利用聚类算法生成信息粒以捕获隐藏在数据空间中的结构信息,实现非线性模型的拟合。由于信息粒在表达不确定性描述上性能良好,模型对数据噪声的处理具有优越性。我们将模型运用于仿真平台上的雷达有效探测距离的实验中,研究结果从现实角度证明所构建的TS模糊规则模型的有效性以及对不确定性数据的鲁棒性。在未来的工作中,可以将粒度的概念引入模型以增强模型的泛化性。

猜你喜欢
数目不确定性聚类
法律的两种不确定性
随机不确定性影响下某航炮发射动力学仿真
一种傅里叶域海量数据高速谱聚类方法
基于知识图谱的k-modes文本聚类研究
移火柴
一种改进K-means聚类的近邻传播最大最小距离算法
基于模糊聚类和支持向量回归的成绩预测
中国银行业的未来:不确定性与希望并存
牧场里的马
广义直觉模糊软集的格结构