刘志鹏,张国毅
(1.中国人民解放军93993部队,甘肃 兰州 730100;2.空军航空大学,吉林 长春 130022)
·技术前沿·
一种新的雷达信号实时分选方法
刘志鹏1,张国毅2
(1.中国人民解放军93993部队,甘肃 兰州 730100;2.空军航空大学,吉林 长春 130022)
针对现有实时分选方法依赖滑动窗(单次处理脉冲数)的选取、分选效率低以及分选结果存在严重增批现象等缺陷,将脉冲串的接收视为数据流过程,从而设计了一种基于进化数据流聚类的雷达信号实时分选框架。该框架分为在线处理和离线分析两个阶段,通过引入时态密度特征避免了主观上对滑动窗长度的选取,并利用衰变检测和噪声点检测来提高在线聚类的效率。离线阶段通过对历史快照的分析可以判明雷达的活动情况,并将属于一部雷达的脉冲批组进行关联。仿真实验表明了该框架的有效性和可行性。
信号分选;数据流;时态密度;放射传播聚类;离线分析
在实时侦察中,侦收机不断接收到新到达的脉冲串,为了对这些不断到达的脉冲进行分选,传统的做法是利用滑动窗去积累一定数量的脉冲,再对这些由滑动窗分割成一段一段的脉冲串进行处理。此种方法的分选结果受滑动窗的影响,而滑动窗长度的选取依赖经验设定,并没有完整的理论作为支撑。为此,本文提出基于进化数据流[1-2]的新的分选框架,引入脉冲数据的时态密度特征[3],从而避开了滑动窗选取对分选结果的影响。
由于电磁环境中不断有辐射源消失和新的辐射源活跃,因此,本文提出的分选框架首先发掘出活跃批组(批组就是由若干脉冲形成的聚类),利用活跃批组来对新到达的脉冲进行优先关联,大大提高了分选的实时性。此外,由于算法实时给出当前电磁环境的分选结果而不考虑历史影响,可能会造成增批的情况。为解决这个问题,本文提出的分选框架的在线部分负责更新分选的实时概要信息,发现新的辐射源并给出聚类的结果;离线部分则对分选结果的历史演化进行深度分析,完成跟踪合批,并为用户提供更为准确的辐射源侦察信息。
本文建立的基于进化数据流的分选框架分为两阶段,即在线处理部分和离线处理部分[4]。其中,在线处理部分完成聚类并提取数据流的特征向量,形成概要数据[5];离线处理部分依据概要数据的历史演化[6],给出更为精确的分选结果。
该框架利用到衰变因子、时态密度特征、批数据概要特征、活跃批组等概念,现进行说明如下。
1.1衰变因子及时态密度特征
若把数据流看做是随时间变化的过程,则距现时刻越近的数据,重要程度越高,越久远的历史数据,相对的重要程度就越低。
定义衰变因子为[7]:
(1)
衰变因子随时间的增加而递减,其值的大小反映了数据出现时间的先后,这里以衰变因子作为权值来表征数据的重要程度,衰减的速率可通过λ的取值进行调节。
1.2时态密度特征
1)脉冲的时态密度特征
设x是数据流中的一个脉冲,t0为脉冲到达时刻,则该脉冲的时态密度为:
(2)
2)批组的时态密度
设bc为由n个脉冲聚类形成的批组,则批组bc在时刻t的时态密度特征定义为:
(3)
1.3批组的概要特征
假设批组bc中包含带有到达时间戳为ti1,ti2,…,tin的脉冲串xi1,xi2,…,xin,定义批数据的概要特征BF为:
(4)
式中,Ci为代表批组的聚类中心;Tbci为批组的时态密度,表示批组在时间上的密度;maxi为批组内距离中心点最远的脉冲;tn为批组最后更新时间;∑i为批组内的脉冲相似性,定义为:
(5)
1.4活跃批组与稀疏批组
批组时态密度的最大值为:
(6)
式中,v为数据流的流速,故任意批组的平均时态密度不超过v/(N(1-e-λ)),N为脉冲总数。
为提高分选的效率,新到达的脉冲将优先与检测到的活跃雷达关联,设定阈值:
(7)
式中,μ>1,当批组bc的时态密度Tbc(t)≥Tthred时,认为该批组为活跃批组,否则为稀疏批组。
1.5时态密度的更新
假设时刻tl为批组bc上一次更新的时刻,由式(3)可得:
(8)
根据时态密度定义得:
(9)
如果该批组在时刻tn接收到新的脉冲,则其在时刻tn的时态密度更新公式为:
(10)
1.6活跃批组和稀疏批组可被增量的维护
某一批组bc{Ci,Tbci,∑i,maxi,tn},在Δt内没接收到新的脉冲,则bc概要特征变为{Ci,e-λΔtTbci,∑i,maxi,tn+Δt};若在Δt时间内接收到脉冲P,则bc的聚类中心不变,其他信息变更为:
(11)
(12)
(13)
maxi=Idx(dmax(xi,ci))
(14)
式中,maxi取更新后脉冲数据中离聚类中心最远的脉冲。
2.1初始聚类
对数据流中首先到达的N个脉冲利用仿射传播聚类算法[8-9]进行初始聚类,并依据聚类结果将脉冲分成若干初始批组,对任意初始批组bc,若其时态密度大于阈值Tthred,则标记为活跃批组,否则为稀疏批组,取所有活跃批组的最大半径作为初始半径r。
2.2在线聚类
初始化聚类完成后,新到达的脉冲p将首先与活跃批组相比较,若活跃批组不能吸收,再尝试将p置于稀疏批组中。批组吸收脉冲要同时满足的条件为:新到达脉冲参数与聚类中心Ci最近且小于初始半径r。如果活跃批组与稀疏批组均不能吸收脉冲p,则将其存入缓存盒中,并监测个数变化;当缓存盒内的脉冲数到达门限n_max时,利用仿射传播聚类发掘出新模式,并将整体模型重建。
2.3衰变检测和离群噪声的检测
若活跃批组长时间未接受新的脉冲,则随着时间推移,其时态密度将发生衰减,直至低于阈值Tthred,此时活跃批组蜕变为稀疏批组,需要从活跃批组队列中移入稀疏批组队列中,因此,需要定期检测活跃批组的时态密度。由等式e-λTdTthred+1=Tthred得出最短蜕变时间为:
(15)
所以选择Td为衰变检测时间。
同时,随着时间的演进,数目不断增多的活跃批组与稀疏批组将不断增加系统的负担,需要对离群的噪声点进行删除,而对于新产生的批组,其时态密度较低,又要为其成长为活跃批组保证一定的成长时机。因此,采用最低阈值淘汰机制,即每隔Td对稀疏批组进行检测,如果时态密度小于阈值下限,则几乎不可能成长为活跃批组,于是将其视为离群噪声删除。阈值下限设为:
(16)
式中,t0为批组首次出现时刻。易知当t=t0时,ξ(t,t0)=1;当t→∞时,ξ(t,t0)=Tthred。
活跃批组与稀疏批组相互转化及离群噪声剔除机制如图1所示,t1时刻,存在活跃批组bc1及稀疏批组bc2。经过n1Td时间后,批组bc1的时态密度低于式(7)所设门限Tthred,蜕变为稀疏批组;而批组bc2由于不断接受新脉冲,时态密度大于Tthred,成长为活跃批组。再经历n2Td时间后,批组bc1的时态密度已低于式(16)确定的阈值下限ξ(t,t0),被视作离群噪声而被剔除;批组bc2由于有新的脉冲加入仍保持活跃;此时缓存盒内发现新模式bc3,但时态密度较低被判为稀疏批组。
图1 检测机制示意图
2.4离线处理
1)批组关联
如果两个活跃批组bci{Ci,Tbci,∑i,maxi,tn}和bcj{Cj,Tbcj,∑j,maxj,tn}满足密度可达,即‖ci-cj‖≤‖maxi-ci‖+‖maxj-cj‖,则认为两个活跃批组相关联。于是用户可依据某一时刻的快照,以深度优先搜索为准则找到所有相关联的活跃批组,从而得到更准确的聚类结果。
2)演化分析
用户可指定分析时间差h和时刻tp,利用快照S(tp)和S(tp-h)相减的结果得到tp和tp-h的批组集差H,并根据H得出新增的活跃批组、消失的活跃批组和保持活跃的批组,进而分析脉冲流的演化情况。分选框架模型流程如图2所示。
图2 进化数据流分选框架模型
为验证进化数据流聚类分选框架的可行性,分别用仿真数据和实际数据对算法进行测试,仿真环境:Windows 7, AMD CPU A6, 4GB 内存,编程工具为Matlab 7.10.1。
3.1仿真信号
实验所用雷达数据见表1,生成一段50ms的脉冲流,加入3%的噪声脉冲,并按下式模拟脉冲散失:
TOAi-1+PWi-1+tp≤TOAi
(17)
式中,tp为接受机反应时间,设为1μs;当脉冲到达时间TOAi不满足式(17)时,则被认定为散失脉冲,从脉冲流中去除,雷达出现和消失的时间亦见表1。
采用本文提出的基于进化数据流聚类的分选方法,分选参数为{RF,PRI,DOA,PM},衰减的速率λ设为0.5,阈值系数μ设为5,得到的在线处理结果如图3所示。
图3 在线处理结果示意图
雷达编号RF/MHzPRI/μsDOA/(°)PW/μs脉內调制类型出现时间/μs消失时间/μsR13200~3400单脉冲捷变2110固定105~1071.1固定CON990044500R23300~3500脉冲组跳变129~134抖动101~104.73.5~17.5捷变LFM450014500R33170/3390频率分集177/183/193三参差103~1054.7固定BPSK35350持续R43390频率固定145/155/165/170脉组参差104.1~104.311.2~15.2捷变Costas1001持续
由图3可见,由于雷达R1的脉冲间隔较大,开始被识别为稀疏批组,随着新脉冲的加入,6ms(吸收三个脉冲)后,成长为活跃批组,在45ms后,批组蜕变为稀疏脉冲,随即又被视为噪声点剔除。雷达R2在5ms成为活跃批组,在15ms左右蜕为稀疏批,由于未接收新脉冲,随即被剔除。雷达R3和R4分别在1.5ms和36ms左右形成活跃批,并一直延续到脉冲流结束。每隔10ms进行一次离线分析,统计分选正确率,并与模糊C-均值聚类算法及修正PRI算法的分选效果进行比较,两种算法的参数设置参见文献[10~11],滑动窗设为1024,结果如表2所示。
表2 离线分析记录
通过比较表1和表2可知,基于进化数据流聚类的分选框架可以准确地反应出辐射源的活动情况,具有较高的分选正确率,有效抑制了增批,有效性明显优于已有算法。
表3 实验数据参数及雷达活动情况
3.2实际信号测试
利用实际信号对数据流聚类分选框架进行验证,分选特征参数的选取和算法参数设置同3.1节,实验数据为某次航空侦察得到的一段长度为14.6s的全脉冲数据,共91700个脉冲,经反复人工分析后,认为该时间内先后出现了共14部雷达,主要参数及具体情况见表3,这里仅给出部分雷达大致范围和变化类型。
采用基于进化数据流聚类的分选框架,分选参数为{RF,PW,DOA,PM},衰减的速率λ设为0.5,活跃批组阈值系数μ设为5,得到的离线分析结果仍与模糊C-均值聚类算法及修正PRI算法的分选效果进行比较,最终结果见表4。
表4 离线分析结果及与其他算法对比
从表4可看出,基于进化数据流的实时分选框架对实际侦察环境具有良好的适应性,可以正确分析出辐射源的活动状况,有效抑制增批,并且平均分选正确率高于90%,明显优于其他分选算法。
针对当前实时分选技术存在的分选效率低及增批现象严重的问题,本文设计了一种基于进化数据流聚类的实时分选框架,即利用聚类算法和时态密度建立在线模型,通过衰变检测来提高分选效率,最后利用离线分析进行合批和历史数据分析。仿真实验证实了该方法的实用性和高效性。■
[1]Ntoutsi I, Zimek A, Palpanas T, et al.Density-based projected clustering over high dimensional data streams[C]∥Anaheim, USA:proc.of the 12th SIAM interna-tional Conference on Data Mining,2012: 987-998.
[2]Kranen P, Kremer H, Jansen T, et al.Stream data mining using the MOA framework[C]∥Busan, Republic of Korea:Proc.of the 17th International Conference on Database Systems for Advanced Applications,2012:309-313.
[3]孙大为, 张广艳, 郑纬民.大数据流式计算:关键技术及系统实例[J].软件学报, 2014, 25(4): 839-862.
[4]牛新征, 佘堃.面向大规模数据的快速并行聚类划分算法研究[J].计算机科学, 2012, (1): 67-71.
[5]徐文华, 覃征, 常扬.基于半监督学习的数据流集成分类算法[J].模式识别与人工智能, 2012(2): 117-119.
[6]Xu Ye, Shen Furao, Zhao Jinxi.An incremental learning vector quantization algorithm for pattern classification[J].Neural Computing and Applications, 2012 (6):439-442.
[7]Cormode G, Hadjieleftheriou M.Methods for finding frequent items in data streams[J].The VLDB Journal, 2010 (1): 39-43.
[8]Frey BJ, Dueck D.Clustering by passing messages between data points[J].Science, 2007, 316(5814): 972-976.
[9]王开军, 张军英, 李丹,等.自适应仿射传播聚类[J].自动化学报, 2007,33(12): 1242-1246.
[10]尹亮, 潘继飞, 姜秋喜.基于模糊聚类的雷达信号分选[J].火力与指挥控制, 2014, 39(2): 52-57.
[11]罗长胜, 吴华, 程嗣怡.一种对重频调制与抖动信号的PRI变换分选新方法[J].电讯技术, 2012, 52 (9): 1491-1496.
A novel deinterleaving method in real time of radar signal
Liu Zhipeng1, Zhang Guoyi2
(1.Unit 93993 of PLA, Lanzhou 730100,Gansu,China; 2.Aviation University of Air Force, Changchun 130022,Jilin,China)
In view of the existing real-time sorting methods having defects of relying on sliding window (the pulse number to be conducted one time), low sorting efficiency and serious phenomenon of increased number, pulse sequence is regarded as a data flow process, thus a real-time signal sorting framework based on online clustering of evolution data stream is designed.The framework is divided into two stages as an online part and an offline analysis part.With the utilization of temporal density characteristics, the subjective selection of sliding window length is avoided.And the disintegration detection and noise detection are used to improve the efficiency of online clustering.Off-line stage with the analysis of the historical snapshot can determine the movements of the radar, and merge groups of pulses which come from the same emitter.The simulation experiment shows the validity and feasibility of the framework.
signal deinterleaving;data stream;temporal density;affinity propagation cluster;off-line analysis
2015-12-03;2016-03-09修回。
刘志鹏(1990-),男,硕士研究生,主要研究方向为雷达信号分选与识别。
TN971+.1;TN974
A