(电子工程学院 合肥 230037)
反辐射无人机作战目标威胁评估是对通过选取用以表征反辐射无人机作战目标对我威胁程度的某些特征值,然后依据符合实战应用的某些原则和标准,判定它们的威胁等级。目标威胁等级是评估目标价值以进行目标选择的重要因素。雷达的类型受雷达技术参数的约束,通过对雷达信号参数的分析,可以推断雷达的类型。但这种分析工作是耗时的,在战时情况下显然不符合时效性的要求。因此一般通过查询雷达对抗情报数据的方法,可以迅速获得关于目标的类型信息。但这种做法存在一些问题。
1)在战时情况下,敌方在信号参数约束条件范围内改变雷达的信号参数发射电磁波,雷达对抗情报数据库并没有提供关于某类雷达信号参数约束的一般规律,因此,很可能无法查询到对应的雷达型号。
2)敌方启用新的雷达或新的雷达工作模式。由于很少使用,我方平时可能并未侦察到该雷达的基本信号参数,因而无法得到关于该雷达类型的情报。
3)假如只需要关于雷达类型的信息以确定威胁等级,只需某种分布的信号参数确定某类雷达的一般性的规则,而不需要精确到每种型号雷达的具体信号参数,逐条查询数据库进行对比印证的方法是相对低效的。
基于上述情况,本文提出一种基于条件熵约简与粗糙集规则匹配的方法来进行威胁识别。粗糙集可以对数据库中的数据进行训练,以产生反映信号参数分布与信号类型关系的规则,条件熵可以反映信号各参数对规则的贡献程度。首先用产生的规则确定雷达的威胁等级,当发现已有规则未覆盖的该雷达信号的特征时,以属性重要性作为权重度量该信号与每一条规则的接近程度,以接近程度最高的规则作为判断依据。
粗糙集理论认为知识是对对象进行分类的能力,在不可分辨关系的基础上引入上、下近似等概念来刻画知识的不确定性,度量属性的重要性和知识的依赖性,通过属性约简和值约简等过程完成不精确、不确定和不完备数据的分析与处理,以从原始数据集中获取规则和知识。
定义1(信息系统和决策表) 一个信息系统S是一个系统(U,A),其中U={u1,u2,…,u|U|}是有限非空集,称为论域或对象空间,U中的元素称为对象;A={a1,a2,…,a|A|}也是一个有限非空集,A中的元素称为属性;对每个a∈A,有一个映射a:U→a(U),则a(U)={a(u)|u∈U}称为属性a的值域。如果A=C∪D,且C∪D=Ω,则称信息系统(U,A)为一个决策表,其中C中的属性称为条件属性,D中的属性称为决策属性。
定义2(等价类) 设R是U上的一个等价关系,与U中的一个元素x满足关系R的所有元素的集合称为x的R等价类,简称等价类,用[x]R表示,U/R表示R的所有等价类。
定义3(不可区分关系) 若P⊆R,且P≠Ω,则P中所有等价关系的交集∩P也是一个等价关系,称为P上的不可区分关系记为ind(P),且有
这样,U/ind(P)表示与等价关系组P相关的知识,称为K中关于U的P基本知识。
事实上,也可以定义当K=(U,R)为一个知识库,ind(K)定义为K中所有等价关系的族,记作
粗糙集理论需要解决的一个重要问题就是属性约简,属性约简是粗糙集理论核心,但已证明寻找信息系统最小属性约简是NP-hard问题,实际应用中往往采用启发式约简算法搜索最优或次优约简,本文将采用一种基于信息观点的启发式约简算法,下面先对条件熵的概念及其性质进行说明。
熵起源于经典热力学,通常用来度量系统的无序程度。而Shannon熵则被广泛应用于不确定性的度量。在信息系统中,许多学者引进Shannon熵或其变形来度量知识的信息粒度,进而反映知识的不确定性,下面给出现有文献中基于等价关系的条件熵的定义[4~5]。
完备信息系统S=(U,A)中,Q,P⊆A,令等价关系ind(P)和ind(Q)对应的划分分别为X,Y,其中X={X1,X2,…,Xm}和Y={Y1,Y2,…,Yn},则P,Q在U的子集组成的σ代数上的概率分布为
定义4 知识Q关于知识P的H条件熵为
由文献[4~7],关于条件熵有以下定理:
定理1H(Q|P)=H(Q∪P)-H(P)。
定理2 设U是一个论域,P,Q是U上的两个属性集合,若ind(Q)=ind(P),则H(Q)=H(P)。
定理3 设U是一个论域,P,Q是U上的两个属性集合,且P⊆A,若H(Q)=H(P),则ind(Q)=ind(P)。
定理4 设U是一个论域,P是U上的一个属性集合,P中的一个属性r是不必要的,其充分必要条件为H({r}|P-{r})=0。
推论1P中的一个属性r是必要的充分必要条件为H({r}|P-{r})>0。
定理5 设U是一个论域,P是U上的一个属性集合,Q⊆P是P的一个约简的充分必要条件为H(Q)=H(P),且对任意的q∈Q都有H({q}|Q-{q})>0。
定理1~5表明,对一般信息表的约简问题,可以从条件熵的角度来研究,对于决策表的相对约简问题,有以下定理。
定义5 设S=(U,A),其中A=C∪D,C是条件属性集合,D={d}是决策属性集合,且对X⊂C,则对于任意属性a∈C-X的重要性SGF(a,X,D)定义为[4]
SGF(a,X,D)的值越大,说明在已知X的条件下,属性a对于决策D越重要。通过计算SGF(a,X,D),可以用来处理冲突数据以及规则,同时,对规则未能覆盖的数据的判断,可通过求SGF(a,X,D)基础的最小相似度进行决策。
识别属性包括进行识别的条件属性和决策属性。对实时性要求高的反辐射无人机作战目标威胁识别任务来说,能否筛选出能够准确反映雷达威胁等级的识别属性,决定了威胁识别工作的科学性。反辐射无人机作战威胁识别的实质是类型识别。因此为满足实时或者近实时评估的需要,目标威胁评估的程序简化为“信号侦察—威胁识别”,将雷达的威胁等级作为决策属性,考虑实际情况,将雷达威胁等级划分如表1。
表1 雷达威胁等级的划分
进行威胁评估的主要依据是所侦测到的雷达信号。综合考虑反辐射无人机作战目标技术特征以、文献[2~3]的论述以及实践经验,选择射频、重频、脉宽、波束形状、天线扫描方式五个雷达信号参数作为条件属性。
粗糙集理论也不能直接处理取连续值的属性,因此,需要连续取值的属性的取值划分到不同的区域或类中,即进行离散化。条件属性的划分如下:
1)射频
射频采用通用的雷达工作频段命名方法进行划分,该方法作为一种标准被电气和电子工程协会正式接受,这里只列出与反辐射无人机作战目标有关的频段范围以及标识值,详见表2。
表2 射频划分
2)重频
重频的划分详见表3。
表3 重频划分
3)脉宽
脉宽的划分详见表4。
表4 脉宽划分
4)天线扫描方式
天线扫描方式的划分详见表5。
表5 天线扫描方式划分
5)波束形状
波束特征的划分详见表6。
表6 波束形状划分
假设雷达对抗数据库中已有n个雷达,用U={u1,u2,…,un}表示。属性集为A=C∪D,其中C={c1,c2,c3,c4,c5}为条件属性,分别表示雷达的射频、重频、脉宽、波束形状和天线扫描周期,D={d}为条件属性,表示雷达的威胁等级。则信息系统S=(U,A)=(U,C∪D)为反辐射无人机作战目标威胁识别的决策表。
确定决策表框架后,则进行属性值的特征化,即将数据库中雷达对应的射频、重频、脉宽、波束形状、天线扫描周期按照3.2节的规则转换成其标志值,将雷达类型按照表7转换成威胁等级的标识值。最终形成如下形式的决策表。
表7 威胁识别决策表
属性约简是粗糙集理论的核心,各条件属性对确定反辐射无人机作战目标的威胁等级的重要性是不同的,有些属性甚至是不必要的。条件熵可较好地用于度量属性的重要程度以及是否必要,这里采用一种基于条件熵的方法进行属性约简。
假设决策表的约简集B,这里将采用文献[4]的CEBARKNC算法进行约简,算法如下。
算法1
输入:决策表S=(U,C∪D),其中,U为论域,C和D分别为条件属性集合决策属性集。
输出:决策表S的一个约简B
Step 1.计算决策表S中决策属性D相对于条件属性C的条件熵H(D|C)。
Step 2.计算决策属性ci相对每个条件属性的条件熵H(D|{ci}),其中ci∈C,将ci按H(D|{ci})降序排列。
Step 3.令B=C,按H(D|{ci})递减的顺序对ci重复操作:
1)计算属性集B在删除ci后的条件H(D|{ci});
2)如果H(D|C)=H(D|B-{ci}),则属性ci应约简;
3)如果H(D|C)≠H(D|B-{ci}),属性ci不能约简。
确定关于决策表S的约简B后,形成新的决策表S0=(U,B∪D),威胁评估规则是基于新的决策表S0产生的。对包含ci1,ci2,…,cik属性的约简B,若取值分别为v1,v2,…,vk,决策值为ds,生成的规则的形式为:
若决策表不是一致的,则会产生冲突规则。为防止漏掉威胁等级高的目标,这里采用最大威胁等级的原则处理冲突规则,即采用威胁等级高的标识值作为决策属性的取值。
规则的生成算法如下。
算法2
输入:决策表S0
输出:规则集R
Step 1.对决策表S0的第一条数据,直接产生形式如Rule i的规则,加入规则集R。
Step 2.从第二条数据开始遍历决策表,每条数据进行如下操作:
1)将该条数据的各属性的标识值减去第一条数据的对应属性的标志值,若各属性的结果均为0,则删除该条数据,跳至下一条数据;若条件属性的结果不为0,则直接跳至下一条数据;若条件属性的结果均为0,决策属性结果不为0,则进行以下判断:
(1)若结果大于0,则用该条数据替换第一条数据,并删除该条数据,用该条数据形成的规则替换R中对应该条数据的的规则,然后跳至下一条数据;
(2)若结果小于0,则删除该条数据,跳至下一条数据。
2)遍历结束后,删除第一条数据,将剩下的数据更新决策表S0。
Step 3.以更新后的决策表S0重复Step 1与Step 2的操作。
Step 4.当决策表S0只剩下最后一条数据时,算法结束,输出规则集R。
生成规则后,进行威胁识别就是规则匹配的过程,即将待评估目标的条件属性的标识值与规则进行逐条比较的过程,若条件属性的标识值与某条规则完全符合,则完成该目标的规则匹配,并将该条规则的决策属性标识值作为该目标的威胁等级。但其中存在待评估目标的条件属性标志值与所有规则都不相符的情况。解决该问题需要对一个目标的条件属性标识值与某条规则的符合程度进行描述。这里给出规则符合度的概念。
定义6(相对重要性) 对约简后的属性集C={c1,c2,…,ck},属性ci的相对重要性可表示为
其中,λ为使SGF(ci,Ω,D)为正的修正因子。
定义7(规则符合度) 对形式如下的规则
若条件属性c1,c2,…,ck为取连续值的属性,离散化后分别为w1,w2,…,wk的目标s与该规则的规则符合度为
在目标与规则不相符的情况下,可以通过逐条计算规则符合度,选取规则符合度最大的规则确定威胁等级。
以下使用雷达知识库数据作为训练集。分别用c1~c5对应射频、重频、脉宽、扫描方式、波束形状五个条件属性,用u1~u18代表表中的18个雷达目标,d代表威胁等级这一决策属性,建立雷达目标威胁识别决策表如表8所示。
表8 雷达目标威胁识别决策表
用表8作为训练集产生规则,先用算法1进行约简,得到决策表9的一个约简为{c1,c2,c3,c4}。
由算法2可产生规则如表9所示。
计算各条件属性的重要性为:SGF(c1)=-2.1944,SGF(c2)=-2.7347,SGF(c3)=-3.2893,SGF(c4)=-2.2542。
取λ=4,则各条件属性的相对重要性为:S(c1)=0.3267,S(c2)=0.2289,S(c3)=0.1286,S(c4)=0.3158
但c4不是连续属性,因此用于计算规则符合度时不考虑。
表9 由训练集产生的规则集
为验证规则,将部分雷达目标信号参数作为测试集,并将测试集转换为决策表如表10所示。
表10 雷达目标威胁识别决策表
将测试集非决策属性作为输入,使用公式进行规则匹配。同时作为比较,对训练集用同样以熵度量属性重要性的ID3决策树算法分类,构建树如图1所示。
图1 ID3决策树算法分类模型
对测试集用本文的方法以及ID3决策树算法验证得到的结果如表11所示。
表11 威胁等级验证结果
模型仿真结果表明,本文方法的正确识别率达到86.7%,ID3算法的正确识别率则只有66.7%。这说明本文的方法对从训练数据中提取的规则具有较好的扩展性,具有识别未知信号威胁的功能。另外,本文对u8识别错误的原因是要按最大威胁度的原则处理冲突规则而将该类目标赋予值为2的威胁等级。综上,本文的威胁识别方法是有效的。
本文针对常用威胁识别方法的不足,提出一种基于条件熵约简与粗糙集规则匹配的方法,该方法能够较好地解决一般模式识别方法准确性较低,无法识别未知信号以及隶属度函数法主观性过强的问题,实例分析表明,该方法能够有效地应用于反辐射无人机作战目标威胁识别,具有较强的科学性和可行性。
[1]张文修,吴伟志,等.粗糙集理论与方法[M].北京:科学出版社,2001
[2]姜宁,胡维礼,等.辐射源威胁等级判定的模糊多属性方法[J].兵工学报,2004,25(1):56~58
[3]罗小平,姜宁,等.辐射源威胁排序模糊综合评判[J].火力与指挥控制,2005,30(4):66~68
[4]王国胤,于洪,杨大春.基于条件信息熵的决策表约简[J].计算机学报,2002,25(7):759~765
[5]滕书华,周石琳,等.基于条件熵的不完备信息系统属性约简算法[J].国防科技大学学报,2010,32(1):90~94
[6]祁立,刘玉树.基于条件信息量的快速粗集约简算法[J].北京理工大学学报,2007,27(7):604~608
[7]钱进,叶飞跃.一种新的条件信息量的属性约简算法[J].系统工程与电子技术,2007,29(12):2154~2157
[8]关欣,孙迎丰,何友.不完备信息系统的辐射源识别方法研究[J].电子科技大学学报,2008,37(1):8~10