唐文杰,程远国
(海军工程大学,湖北 武汉 430032)
雷达辐射源识别是电子对抗领域的关键技术之一,其目的在于根据截获的雷达辐射源信号,得到能够描述辐射源的特征参数,从而获取该雷达辐射源的体制、用途和型号等信息。传统的识别方法是根据载频(CF)、脉冲宽度(PW)、脉冲幅度(PA)、到达时间(TOA)、到达角(AOA)等构成的脉冲描述字(PDW)对辐射源进行识别[1]。随着技术的发展,复杂体制雷达的应用越来越广泛。由于复杂体制雷达工作模式较多,信号参数变化大,PDW不能很好地描述雷达辐射源信息。研究人员转而向雷达辐射源脉内特征进行挖掘[2-3]。例如文献[4]根据模糊函数(AF)主脊切片特征对不同辐射源进行唯一表示,然后通过奇异值分解降噪,实现了辐射源的识别。文献[5]将属性测度与D-S证据理论相结合,并通过属性测度计算方法构造证据理论中的基本概率赋值函数,实现了雷达辐射源的用途和体制识别。
除此之外,当前信号环境越来越复杂,侦察数据库逐渐庞大,但其中数据价值参差不齐,其中不乏存在潜在价值的信息,对这些潜在价值的挖掘势在必行。频繁模式挖掘是指通过Apriori等算法对数据库中频繁出现且具有突出性质的模式(如项集、序列等)进行挖掘,从而获取有价值的信息[6-7]。在辐射源识别领域,不管信号样式、参数如何多变,但目标平台所搭载的辐射源种类、数量是固定的,各信号间必然存在强关联规则。对这些关联规则的挖掘能够为辐射源识别提供支持。本文以侦察数据库中信号的几项常规参数为基础构建特征向量,通过Apriori算法对特征向量库进行处理,从而实现了基于特征参数向量的频繁模式挖掘。结合其他来源的数据信息,可生成信号与信号之间以及与辐射源之间的关联规则。将侦获信号与关联规则相匹配,可为辐射源的识别提供依据。模拟数据的仿真实验表明,该方法具有一定的可行性和有效性。
将侦察数据库中各信号的参数进行整合处理,由于载频、脉宽、脉幅和脉冲重复间隔(PRI)能够较为明显地反映雷达用途,而且参数获取较容易,故采用CF、PW、PA、PRI 4个参数组成特征向量Si:
Si={Fci,Wpi,Api,fPRIi}
(1)
式中:脚标i为序列号,即每一组参数构成一个特征向量。
根据复杂体制雷达的实际情况,即每种工作模式对应多种不同的信号,构建辐射源信号组成模型:
Rk={Sk1,Sk2,…,Skj},1≤k≤m,1≤j≤n
(2)
式中:k为辐射源编号;m为辐射源数量;j为辐射源所包含信号编号;n为信号数量。
本文使用经典的Apriori算法进行关联规则挖掘。Apriori算法是Agrawal和R.Srikant于1994年提出的,是布尔关联规则挖掘频繁模式的原创性算法。该算法使用逐层搜索的迭代方法从数据库中找出项目的关系。使用k项集用于搜索(k+1)项集(其中k=1,2,…),循环迭代至无法生成更高的频繁k项集为止。
对特征参数向量关联规则挖掘的具体步骤如下:
(1) 根据实际情况,设置好最小支持度(min_sup)和最小置信度(min_conf),支持度-置信度框架是评价关联规则是否有价值的标准。扫描侦察数据库,第1次迭代,数据库中的每个项都是候选1-项集的集合C1的成员,即所有信号特征参数向量均存入候选1-项集C1。算法记录每个项出现的次数,即每个项的支持度,大于min_sup的项组成频繁1-项集L1。
(3) 剪枝步:根据性质“任何非频繁的(k-1)项集都不是频繁k项集的子集”对候选频繁k项集Ck进行修剪。即如果1个候选k项集的(k-1)项子集不在Lk-1中,则该候选也不可能是频繁的,从而应在Ck中删除。
(4) 扫描数据库,记录Ck中各项集的频度,即支持度。支持度大于min_sup的项集组成频繁k项集Lk。循环运行(2)、(3)至无法生成更高的频繁k项集时,输出产生的频繁项集∪Lk。
(5) 由频繁项集产生关联规则。对每一个频繁项集L产生其所有非空真子集,对于每个真子集s,当满足式(3)时,输出规则“s→(L-s)”,并给出置信度。
(3)
式中:count()表示包含对应项集的事务数。
算法伪代码略。
为便于进行示例分析且尽可能模拟实际情况,式(2)中m取值为3,n分别取值2,3,4,即共有3部雷达辐射源,分别拥有2,3,4种工作信号。而在侦察数据库中,由于信号所属雷达未知,故采用Sx(x=1,2,…,9)表示。表1为模拟侦察数据库,其中事物T代表以实时态势为依据划分的不同时间段。信号种类模拟以雷达工作情况和潜在逻辑关系为依据。
表1 侦察数据库
以时间段作为事务,特征向量作为项集,运用Apriori算法进行频繁模式挖掘,根据所得频繁项集L和其他来源的辐射源信息可生成所需的信号与辐射源之间的关联规则。
根据模拟的侦察数据库,设置最小支持度为20%,最小置信度为80%,运行Apriori算法可产生不同项目数的频繁项集。由于频繁1-项集参考价值较低,这里不做论述。表2、表3、表4分别为所得频繁2-项集、3-项集、4-项集以及其对应的支持度。
表2 频繁2-项集及支持度
表3 频繁3-项集及支持度
表4 频繁4-项集及支持度
分析上述3个表格的数据结果,可以看出,S1和S2,S3、S4和S5,S6、S7、S8和S9具有一定的布尔规则关联性,结合数据库中的方位信息以及其他来源的数据信息,在一定的支持度-置信度水平下,可认为这3组信号分别来自于3个不同辐射源,即满足如下规则:
R1={S1,S2}support=26.67%
(4)
R2={S3,S4,S5}support=20.00%
(5)
R3={S6,S7,S8,S9}support=20.00%
(6)
在最小置信度80.00%的水平下,算法共生成29条关联规则。表5所列为包含4项的关联规则。
表5 产生的4-项关联规则
以“S6,S7,S9→S8”为例,表示当S6,S7,S9信号存在的情况下,置信度为85.71%的水平下可认为会有S8信号存在。结合信号特征分析,这能够为辐射源可能进行的行为预测提供支持。
本文提到的通过关联规则识别辐射源能够进一步挖掘现有信息数据库的潜在价值,是对海量数据信息有效处理运用的体现。首先整合侦察数据库中信号的参数信息,形成特征向量。然后对特征向量运用Apriori算法进行关联规则挖掘。将信号间的布尔关联规则同其他来源的雷达辐射源信息进行匹配并建立关联规则数据库,可为侦获信号的雷达辐射源识别提供支持。但是算法对设备运算能力和存
储能力要求较高,进行工程实现还需要进一步提高算法的时间-空间效率。另一方面,通过聚类等其他方式对数据进行预处理也是必要的,对压缩后的数据进行挖掘能够更快速有效地获得关联规则。
[1] WILEY R G.Electronic Intelligence:The Analysis of Radar Signals[M].New York:Artech House,1993:36-37.
[2] 周志文,黄高明,陈海洋,等.雷达辐射源识别算法综述[J].电讯技术,2017,57(8):973-980.
[3] 沈家煌,黄建冲,朱永成.雷达辐射源信号快速识别综述[J].电子信息对抗技术,2017,32(5):5-10.
[4] GUO Q,NAN P L,ZHANG X Y,et al.Recognition of radar emitter signals based on SVD and AF main ridge slice[J].Journal of Communications and Networks,2015,17(5):491-498.
[5] 何友,关欣,衣晓.基于属性测度的辐射源识别方法研究[J].中国科学E辑:信息科学,2004,34(12):1329-1336.
[6] HAN J,KAMBER M,PEI J.数据挖掘:概念与技术[M].3版.范明,孟小峰译.北京:机械工业出版社,2017.
[7] 张一梅.基于数组的关联规则挖掘算法的改进研究[D].太原:太原理工大学,2008.