电离层相位污染分类识别方法研究

2017-01-05 06:42鲁转侠李吉宁郭晓彤
中国电子科学研究院学报 2016年5期
关键词:自动识别电离层聚类

鲁转侠,李吉宁,李 雪,郭晓彤,白 桦

(1.中国电波传播研究所,山东 青岛 266107;2.63898部队,河南 济源 454650)

电离层相位污染分类识别方法研究

鲁转侠1,李吉宁1,李 雪1,郭晓彤1,白 桦2

(1.中国电波传播研究所,山东 青岛 266107;2.63898部队,河南 济源 454650)

电离层的非平稳特性使得经电离层传播的雷达回波信号相位扰动,长时间相干积累后杂波频谱展宽,影响舰船等目标信号检测.通过电离层回波信号相位分析统计,建立了电离层相位污染分类准则,基于该准则能够有效地将电离层污染划分为四类具有典型特征的电离层相位污染.基于数据挖掘技术中的聚类分析算法,提出了一种电离层相位污染类型自动识别算法,能够自动识别探测数据的相位污染类型,自动识别结果与相位统计分类结果匹配率平均达30.6%.在电离层相位污染分类研究的基础上,采用已有典型解污染算法,开展了不同类型污染的适用性抑制方法研究,结果最大熵谱估计法对“小幅度慢变化”和“大幅度慢变化”污染的抑制有效率分别达55.6%和60%;相位梯度法对“大幅度快变化”污染的抑制有效率达77.4%.因此证明合理实时的电离层相位污染类型识别能够为解污染算法创造较优越的使用条件,从而有效提高电离层解污染的性能,对提高天波超视距雷达舰船等目标检测性能具有重要意义。

电离层;数据挖掘;斜向探测;返回散射

0 引 言

天波超视距雷达(OTHR)利用电磁波经过电离层折射、后向返回散射路径下视传播从而实现目标探测,电离层是OTHR的主要传播介质[1]。电离层的非平稳特性使得电离层回波信号附加一个随机的相位扰动,使得经电离层传播的雷达回波信号相位非相干,长时间相干积累使得杂波频谱展宽,淹没舰船等目标信号,降低OTHR目标检测性能[2]。

目前针对该问题已提出的多种解决方法,可分为两类:一是采用短时相干积累来避免电离层的非平稳性,但较短的积累时间不能提供足够的频率分辨力;二是时域估计补偿方法,其以电离层相位污染的瞬时频率估计为重点[3-6]。第二类方法中的算法均不能很好的解决这一问题,其原因主要有三个:一是各种算法本身存在一定使用局限条件,仅针对某种相位污染类型适用;二是尚未对电离层相位污染类型进行合理分类,目前已有的解污染算法未覆盖全部污染类型,部分实测数据采用已有的解污染算法均不能获得好的解污染效果;三是尚未有人研究回波数据相位污染分类、类型识别算法,即对某一实测受污染回波数据,其污染类型是未知的,无法进行有针对性的处理。

本文基于相位分布特性统计和数据挖掘技术[9-11],开展了电离层相位污染分类、自动类型识别方法研究。鉴于短时相干积累会带来频率分辨力降低,严重影响海杂波信号识别和目标信号检测,因而进一步采用时域估计补偿方法中的典型解污染算法(最大熵谱估计法[3]、相位梯度法[4]、时频分析法[5]、特征分解法[6]和分段多项式建模法[7-8])开展了不同类型的相位污染抑制处理,研究不同类型污染的适用性抑制算法。

1 电离层相位污染分类研究

1.1 数据选取

电离层斜向探测是电波斜向入射经电离层反射到指定地点接收的探测方式,回波信号仅经历了一次电离层反射,没有地面、海面的的散射、反射影响,完全反映了反射点电离层的传播特性和污染程度,因此本文选取收发大圆距离为1 004 km电离层斜向探测链路的定频、扫频历史试验数据,作为电离层相位污染分类技术研究的基础数据源。试验数据中电离层回波信号的频率范围为5~28 MHz,电波斜向入射角范围约为6°~60°。斜向探测扫频与定频数据是同时段分时录取的,扫频数据用于定频频谱数据中电离层模式信息的确定,定频数据用于电离层相位污染分类技术研究。

1.2 相位污染分类方法

使用斜向探测定频、扫频试验获取的电离层频谱数据和传播模式描迹数据,结合电离层电波传播特性,统计分析了电离层相位扰动周期、时域相位扰动幅度、频域相位扰动幅度等特征参数(这里频域指对统计的相位数据进行经典的傅里叶变换[14]处理得到的结果),基于此建立了电离层相位扰动分类准则。

相关定义有:时域相位扰动幅度最大值为Ab,时域相位扰动幅度最小值为As,时域相位扰动幅度范围尺度门限为A;频域相位扰动周期尺度门限为T,频域大幅相位扰动尺度门限为D,频域小幅相位扰动尺度门限为X,频域大于门限D的极值数为ND,频域大于门限D的极值序列中第一个值对应周期为TD,频域大于门限X的极值数为NX,频域大于门限X的极值序列中第一个值对应周期为TX。电离层相位污染分类准则具体为:

a.小幅度慢变化的电离层相位污染满足式(1)的两条准则之一

(1)

b.大幅度慢变化的电离层相位污染满足式(2)准则

|Ab-As|≥A,ND>0,TD≥T

(2)

c.小幅度快变化的电离层相位污染满足式(3)准则

|Ab-As|0,TX

(3)

d.大幅度快变化的电离层相位污染满足式(4)的两条准则之一

(4)

针对选取的数据,电离层相位污染分类方法的具体实现流程为:

a.参照斜向探测扫频数据中的传播模式信息,提取斜向探测定频数据中相应电离层传播模式(E层、F层)的双时响应C(tc,tp),其中tc表示时间,tp表示群时延,C(tc,tp)是一个复数矩阵;

b.通过提取的双时响应获取相位信息,具体表达式为:

(5)

其中Im(C(tc,tp))和Re(C(tc,tp))分别为双时响应的虚部和实部;

c.将获取的相位信息拉伸成一条连续的相位曲线;

d.对拉伸的相位信息使用多项式拟合得到一条斜线来拟合线性相位变化(要求拟合得到的斜线的斜率和初相使相位非线性部分均值为零且均方差最小[12]);

e.用拉伸的相位信息减去以上拟合的线性部分,得到相位的非线性部分,并经低通滤波器去除相位曲线上的杂波分量,获得最终的非线性相位分布[12];

f.预置A值:根据原始的相位统计数据,融合实际应用需求,具体确定时域相位扰动幅度范围尺度门限A,这里设定A为1弧度;

g.预置T值:根据原始的相位统计数据,融合考虑理论和实际情况,设定相位扰动周期尺度门限T值范围为(10±5)秒;

h.预置D、X值:D和X是频域的相位扰动尺度门限,根据选取数据相位统计情况,设定频域大幅相位扰动尺度门限D值范围为34~37 dB,频域小幅相位扰动尺度门限X值范围为27~31 dB;

i.基于步骤(7)~(8)设定T、D、X值,使用上述式(1)~(4)的电离层相位污染分类准则,通过每组分类结果的分析和设定值的调整,最终确定T、D、X值。

1.3 分类结果

使用以上电离层相位污染分类方法,对选取数据提取相位并分类,最终确定的D、X和T值见图1和图2所示。

图1 相位统计数据频域幅度分布

图2 相位统计数据周期分布

对选取数据提取形成共319组数据,该分类方法有效地将电离层相位污染区分为小幅度慢变化(55组,见图3)、大幅度慢变化(121组,见图4)、小幅度快变化(21组,见图5)和大幅度快变化(122组,见图6)四类具有典型特征的电离层相位污染。

图3 “小幅度慢变化”相位污染

图4 “大幅度慢变化”相位污染

图5 “小幅度快变化”相位污染

图6 “大幅度快变化”相位污染

2 相位污染类型自动识别研究

2.1 基于数据挖掘的相位污染类型自动识别方法

采用数据挖掘中的聚类分析(k-mean算法)[9-11],从电离层斜向探测定频频谱幅度角度,研究电离层相位污染的自动类型识别。电离层相位污染类型识别方法的具体流程为:

a.根据1.3节的电离层相位污染分类结果,将聚类数设定为4(相关距离采用欧几里得距离);

b.采用最大最小距离算法,从待聚类的样本中确定4个初始聚类中心;

c.计算每个样本数据到聚类中心的“距离”,将每个样本聚类到距离其最近的聚类中心的类型中去(相关距离采用动态时间弯曲距离,DTW);

d.计算所有聚类的均值作为新的聚类中心(相关距离采用欧几里得距离);

e.迭代执行(2)~(3),直到满足迭代终止条件。

上述流程中欧几里得距离具体表达式为:

(6)

2.2 迭代终止条件

迭代终止条件是在当前选择聚类个数k和初始中心条件下,使聚类有效性BWP指标(类间类内划分,Between-Within Proportion,BWP)达到最大。因此当迭代进行时,随着迭代次数的增加BWP指标值应逐渐增大,当达到最佳聚类后,BWP值开始下降,因此确定迭代终止的条件为BWP指标值达到最大。

令K={X,R}为聚类空间,其中X={x1,x2,…,xn},假设n个样本对象被聚类为c类,BWP指标及相关概念定义如下:

a.第j类的第i个样本的最小类间距离b{j,i}为该样本到其它每个类中样本平均距离的最小值,具体表达式为:

(7)

b.第j类的第i个样本的类内距离w(j,i)为该样本到第j类中其它所有样本的平均距离,具体表达式为:

(8)

c.第j类的第i个样本的聚类距离baw(j,i)为该样本的最小类间距离和类内距离之和,具体表达式为:

baw(j,i)=b(j,i)+w(j,i)

(9)

d.第j类的第i个样本的聚类离差距离bsw(j,i)为该样本的最小类间距离和类内距离之差,具体表达式为:

bsw(j,i)=b(j,i)-w(j,i)

(10)

e.第j类的第i个样本的BWP指标为该样本的聚类离差距离和聚类距离的比值,具体表达式为:

(11)

2.3 初始中心选择方法

采用基于最大最小距离算法实现初始中心选择。最大最小距离算法是模式识别领域中的一种基于试探的算法,其基本思想是取尽可能离得远的对象作为聚类中心,避免了初值选取时可能出现的初始聚类中心过于邻近的情况,不仅能够自动确定初始聚类中心,而且提高了样本划分的效率。

具体实现流程为:

a.根据样本集的特征,选取距离所有样本中心(均值)最近的一个样本作为第一个初始聚类中心C1;

b.当搜索的聚类数为2时,从待分类的样本中选出距离C1最远的样本作为第二个初始聚类中心C2,输出2个初始聚类中心;

c.当搜索的聚类数为3时,计算未被作为聚类中心的各样本与已确定类中心C1、C2之间的距离,并求出它们之中的最小值di,根据Dt=max{di},选择第t个样本作为第三个初始聚类中心,输出3个初始聚类中心;

d.依次确定第k个聚类初始中心,选择样本距离已确定中心所有距离中最大的作为第k个初始聚类中心,输出k个初始聚类中心。

上述实现流程中相关距离采用动态时间弯曲距离(DTW)。

2.4 类型自动识别结果

使用以上相位污染类型自动识别方法,自动识别选取数据的相位污染类型。共319组提取相位数据,通过最大最小距离算法选定4个初始中心,进行K-mean聚类,用BWP标准检验是否为最佳分类。

图7 “大幅度慢变化”类型相位污染自动识别结果

类型自动识别结果见图7~图10所示,绿色粗实线表示每类的类中心,其它细实线表示样本数据,第一类共87组数据,第二类共31组数据,第三类共82组数据,第四类共119组数据。将类型自动识别结果与第1.3节按照相位分布特性统计分类的结果对照,第一类为大幅度慢变化,自动识别匹配率为31.4%,第二类为小幅度快变化,自动识别匹配率为14.3%,第三类为小幅度慢变化,自动识别匹配率为36.4%,第四类为大幅度快变化,自动识别匹配率为40.2%。

图8 “小幅度快变化”类型相位污染自动识别结果

图9 “小幅度慢变化” 类型相位污染自动识别结果

图10 “大幅度快变化”类型相位污染自动识别结果

3 不同类型污染抑制算法研究

基于1.3电离层相位污染分类结果,采用已有典型解污染算法(最大熵谱估计法[3]、相位梯度法[4]、时频分析法[5]、特征分解法[6]和分段多项式建模法[7-8])分析研究不同类型污染的适用性抑制算法。

3.1 “小幅度慢变化”类型相位污染抑制

按照相位分布特性统计符合“小幅度慢变化”相位污染的斜测数据共55组,从中选取18组频谱展宽较大的数据,采用已选算法解污染处理后,经比较最大熵谱估计法的效果较好。其中,8组数据抑制后与抑制前无太大差别;10组数据抑制后,展宽变窄,频谱锐化度明显提高,如图11所示。也就是说最大熵谱估计法针对选取数据55.6%均有明显的污染抑制效果。

图11 最大熵谱估计法解污染结果(“小幅度慢变化”类型)

3.2 “大幅度慢变化”类型相位污染抑制

按照相位分布特性统计符合“大幅度慢变化”相位污染的斜测数据共121组,从中选取35组频谱展宽较大的数据,采用已选算法解污染处理后,经比较最大熵谱估计法的效果较好。其中,11组数据抑制后与抑制前无太大差别;3组数据抑制后结果反而变差;21组数据抑制后,展宽变窄,频谱锐化度明显提高,如图12所示。也就是说最大熵谱估计法对选取数据60%均有明显的污染抑制效果。

图12 最大熵谱估计法解污染结果(“大幅度慢变化”类型)

3.3 “小幅度快变化”类型相位污染抑制

按照相位分布特性统计符合“小幅度快变化”相位污染的斜测数据共21组,从中选取3组频谱展宽较大的数据,采用已选算法解污染处理后效果均不太佳,与抑制前均无太大差别。

3.4 “大幅度快变化”类型相位污染抑制

按照相位分布特性统计符合“大幅度快变化”相位污染的斜测数据共122组,从中选取62组频谱展宽较大的数据,采用已选算法解污染处理后,经比较相位梯度法的效果较好。其中,10组数据抑制后与抑制前无太大差别;4组数据抑制后结果反而变差;48组数据抑制后,展宽变窄,频谱锐化度明显提高,如图13所示。也就是说相位梯度法针对选取数据77.4%均有明显的污染抑制效果。

图13 相位梯度法解污染结果

4 结 语

使用试验获取的斜向探测电离层频谱数据,结合电离层电波传播特性,统计分析了回波数据相位变化快慢特性,依据相位时域、频域相关特征参数建立了电离层相位扰动分类识别准则。基于该准则,通过参数区域搜索的方式能够将电离层相位污染有效区分为“小幅度慢变化”、“大幅度慢变化”、“小幅度快变化”和“大幅度快变化”四类具有典型特征的电离层相位污染,该研究为不同类型电离层相位污染抑制处理算法的建立提供了重要数据支撑。

采用数据挖掘技术中的聚类分析算法对电离层相位污染开展了类型自动识别研究,分析了聚类算法中最常用的k-mean算法,并在此基础上,结合电离层电波传播特性,依据不同相位污染类型引起频谱展宽程度、谱峰分裂程度等显著特性,按照相位统计划分的四种典型电离层相位污染类型,建立了污染类型自动识别算法,使用该算法对试验获取的斜向探测电离层频谱数据进行了相位污染类型自动识别处理,结果显示“大幅度慢变化”、“小幅度快变化”、“小幅度慢变化”、“大幅度快变化”四种典型污染的自动识别率分别为31.4%、14.3%、36.4%、40.2%,平均识别率达30.6%.证明利用数据挖掘中的聚类分析算法对电离层相位污染进行自动类型识别具有一定的可行性。该研究可为OTHR及相关天波探测系统回波信号电离层污染的实时自适应分类提供技术支撑,对于进一步实时的电离层解污染研究具有重要意义。

基于电离层相位污染分类结果,采用已有典型解污染算法,开展了不同类型污染的适用性抑制方法研究。结果最大熵谱估计法对“小幅度慢变化”和“大幅度慢变化”类型污染具有较好的抑制效果,选取数据中分别有55.6%和60%的数据抑制后展宽变窄,频谱锐化度明显提高;相位梯度法对“大幅度快变化”类型污染具有较好的抑制效果,选取数据中有77.4%的数据抑制后展宽变窄,频谱锐化度明显提高。因而可见合理的电离层污染分类为进一步的解污染算法创造了较优越的使用条件,能够有效提高电离层解污染性能,从而提高OTHR及相关天波探测系统的能力。

进一步应深入研究的工作有:一是电离层相位污染分类的完整性,即上述四种分类是否就能够完全涵盖所有或绝大多数的相位污染类型;二是改进算法提高相位污染类型自动识别率;三是分析、验证已有解污染算法的适应条件、适用污染类型,并对其尚存问题进行改进,提高算法的解污染性能;四是对目前尚无解决方法的相位污染类型,从电离层电波传播和信号处理两方面,研究具体的解污染思路。

[1] 周文瑜,焦培南.超视距雷达技术[M].北京:电子工业出版社,2008.

[2] 凡俊梅,焦培南,肖景明.海洋杂波对高频雷达检测海面上低速目标的影响[J].电波科学学报,1997,12(2):205-210.

[3]BOURSILLONA,GAUTHIERF,PARENTJ.Useofmaximumentropyspectralanalysistoimproveshipdetectionbyover-the-horizonradar[J].RadioScienc-e,1987,22(2):313-320.

[4]PARENTJ,BOURDILLONA.“AmethodtocorrectHFskywavebackscatteredsignalsforionosphericfrequencymodulation”,IEEETrans.onAntennasandPropagation[J], 1988,Vol.36,No.1,pp.127-135.

[5]HOWLANDPE,COOPERDC.UseoftheWigner-Villedistributiontocompensateforionosphericlayermovementinhighfrequencyskywaveradarsystems[J].IEEEProceedings-F,1993,140(1):29-36.

[6]ANDERSONSJ,ABRAMOVICHYI.Aunifiedapproachtodetection,classificationandcorrectionofionosphericdistortioninHFskywaveradarsystems[J],RadioSci.1998, 33(4):1055-1067.

[7]LUKun,WANGJiong,LIUXingzhao.Apiecewiseparametricmethodbasedonpolynomialphasemodeltocompensateionosphericphasecontamination[C]//ProofICASSP.HongKong,2003:405-409.

[8] 李雪,邓维波,焦培南,等.多项式建模解电离层相位污染阶数选择新方法[J].电波科学学报,2009,24(6):1094-1098.

[9] 姜园,张朝阳,仇佩亮,等.用于数据挖掘的聚类算法[J].电子与信息学报,2005,27(4):655-662.

[10]田森平,吴文亮.自动获取k-means聚类参数k值的算法[J].计算机工程与设计,2011,32(1):274-276.

[11]周世兵.聚类分析中的最佳聚类数确定方法研究及应用[D].江南大学,博士学位论文,2011.

[12]陈罡,赵正予,王烽.应用武汉电离层斜向返回探测系统测量回波相位[J].电波科学学报,2007,22(2):271-275.[13]张贤达.现代信号处理[M].北京:清华大学出版社,2002年第2版.

鲁转侠 (1978—),女,陕西人,高级工程师,主要研究方向为电离层模式识别、传播特性分析及回波信号处理;

E-mail:zhuanxialu@163.com

李吉宁 (1982—),男,山东人,工程师,主要研究方向为电离层电波传播、高频雷达和信号处理;

李 雪 (1981—),男,黑龙江人,高级工程师;主要研究方向为电离层回波信号处理、雷达信号处理;

郭晓彤 (1989—),女,河北人,主要研究方向为电离层电波传播、雷达信号处理;

白 桦 (1981—),男,内蒙古人,工程师,主要研究方向为复杂电磁环境。

Research on Classification and Recognition Method of Ionospheric Phase Contamination

LU Zhuan-xia1, LI Ji-ning1, LI Xue1, GUO Xiao-tong2

(1.China Research Institute of Radiowave Propagation, Qingdao Shandong 266107, China; 2.Group 63898,henan jiyuan 454650)

The non-stationary characteristic of the ionosphere makes the phase disturbance of the radar echo signal of the ionosphere, long time coherent accumulation leads to the spread of clutter spectrum,this affects the ship and other target signal detection.By phase analysis of the ionospheric echo signal,the classification criterion of the ionospheric phase contamination are established.Based on this criterion, the ionospheric contamination can be divided into four types.An automatic recognition algorithm for ionospheric phase contamination is proposed based on the clustering analysis algorithm in data mining,this algorithm can automatically recognize the contamination type.The matching rate of the automatic recognition result and the phase statistical classification result is 30.6% on average.On the basis of the classification of ionospheric phase contamination, the correction algotithms has been studied by using the existing typical algorithms for different types of ionospheric contamination.the results are that success rates of the maximum entropy method are 55.6% and 60% respectively for the two kinds of small-amplitude-slow-hange contamination and large-amplitude slow-change contamination, the success rate of phase gradient method is 77.4% for large-amplitude-fast-change contamination.Therefore, it is proved that the reasonable real-time type recognition of ionospheric phase contamination can be used to create more favorable conditions for contamination correction, so as to effectively improve the performance of contamination correction, this has important significance for improving the performance of OTHR ship target detection.

ionosphere; data mining; oblique sounding; backscattering

��理论

10.3969/j.issn.1673-5692.2016.05.009

2016-01-10

2016-09-06

国家自然科学基金项目(61302006);国家自然科学基金项目(61331012)

:A

1673-5692(2016)05-503-07

猜你喜欢
自动识别电离层聚类
基于数据挖掘的船舶航迹自动识别系统
一种电离层TEC格点预测模型
Kalman滤波估算电离层延迟的一种优化方法
基于卫星遥感图像的收费站位置自动识别与校核
基于K-means聚类的车-地无线通信场强研究
船舶自动识别系统对船舶救助的影响
自动识别系统
电离层对中高轨SAR影响机理研究
基于高斯混合聚类的阵列干涉SAR三维成像
基于Spark平台的K-means聚类算法改进及并行化实现