改进模板匹配的通信目标识别技术

2018-10-29 01:39于小红程嘉远

现代防御技术 2018年5期

于小红,程嘉远

(1.江苏自动化研究所，江苏连云港 222006；2.长春理工大学电子信息工程学院，吉林长春 130022)

0 引言

在军事通信对抗中，只有识别出敌方目标并采取正确的应对措施，才能取得主动权。所以说通信信号的识别是通信对抗的前提和关键。

历史上人们曾经普遍采用口令、暗号、图符等目标识别方法，水面舰艇则采用旗语、信号灯等识别方法。这些识别方法主要依靠视听手段来识别近处目标的外部特征，不能识别远距离目标、小目标和电磁频谱等无形目标。随着技术的发展，电子侦察能够发现的目标距离远远超过了目视范围，上述识别方法已不适用。人们不断研究和提出新的目标识别方法，技术越来越复杂，识别的目标距离越来越远，识别出的目标类型也越来越精确。

通信目标识别是指根据通信侦察设备侦测到的目标通信信号参数，识别、确定通信目标的类别、种类和属性的过程。它是通信对抗要解决的首要问题，同时也是通信干扰的前提和基础。近年来，通信目标识别受到通信对抗人员的高度重视，相继提出了多种识别方法，如模式识别、模糊模式识别法[1]、DS证据理论目标识别法[2-6]、模板匹配法[7-8]等。将观测到的目标模式与已知的模式进行比较、配准，判断目标类属的过程就是模式识别。模糊模式识别即模式识别的模糊集方法，是在模式识别中引入模糊数学理论对目标进行更为有效的分类与识别方法。DS证据理论是基于基本概率分配函数的一种不确定性推理方法。

模板匹配法是一种最基本的模式识别方法。它是一种基于统计的识别方法，将直接观测到的数据与数据库中的原始数据进行对比，计算输入模式与数据库中各个模式的匹配度据此进行目标识别。对通信对抗来说就是识别出敌方可能的通信设备型号。模板匹配法因为相对简单，在实际工作中得到了较为广泛的应用。但在实际的通信对抗中，侦察数据基本上都存在误差或不完整，对基于模板匹配的通信目标识别带来了很大困难。为此，本文提出了一种改进的模板匹配方法，提高了数据误差或参数缺失情况下的通信目标识别率。

1 通信目标识别基本思路

图1为基本的通信目标识别过程。

图1 通信目标识别过程Fig.1 Communication object recognition process

图中各部分说明如下：

(1) 通信对抗目标参数：通信侦察设备获取的目标通信参数。

(2) 粗分类器：根据通信侦察设备侦测到的目标参数，识别该通信信号的工作体制，进行通信目标信号的粗分类。

(3) 数据库匹配：根据粗分类器的识别结果，把侦测到的目标参数与数据库中该体制下所有的通信特征参数进行比对分析，计算每个特征参数的匹配度，选取大于阈值的匹配度对应的模式作为一个证据。当证据有多个时，形成证据集，为后续的不确定性推理服务。

(4) 不确定性推理：采用不确定推理技术对多个证据进行推理及组合。若系统不进行不确定性推理而直接进行决策，可将具有最大匹配度的模式作为最终的识别结果。

(5) 决策：确定通信目标识别的最终结果，一般选取最大可信度的通信型号为最终识别结果。

2 改进模板匹配的通信目标识别方法

2.1 参数归一化

为了发挥数量级差别较小的目标参数在目标识别中的作用，通常需要对目标参数进行归一化处理。目标参数归一化主要对参数进行从有量纲到无量纲的一个处理，保证每个参数在同一个区间上取值。常用的参数归一化方法有线性归一化、非线性归一化。非线性归一化又分为对数法、指数法等。

(1) 线性归一化

(1)

(2) 对数法

(2)

式中：C=lnγ，γ为满足αγ≥1的常数。对数中的常数γ是为了保证小数据取对数后为正值。因为自然对数函数是增函数，所以可以保证比α大的小数据取对数后为正值。

(3) 指数法

(3)

式中：γ须满足βγ≤k，k为常数，一般取k=20。

线性归一化对小数据的区分能力不强；指数法对大数据的区分能力不强；只有对数法归一化后的数据分布较均匀，易于数据的分离[9]。

2.2 模板匹配法

把测量模板与样本模板进行比对的过程，称为模板匹配。测量模板即侦测数据，样本模板即数据库中的特征参数。侦测数据与数据库中的特征样本匹配的好坏，取决于侦测数据各单元与数据库中对应的各特征参数匹配的好坏。

为了使模式空间中的点X,Y,Z的距离能作为这些样本之间相似度的度量，所选的距离函数应满足下列条件：

(4)

这里列举出若干种满足以上距离条件的函数[10]：

(1) Manhattan 距离

(5)

(2) Euclidean 距离

(6)

(3) “City-Block”距离

(7)

式中：ωi为第i个特征参数在识别中所占的权重。

2.3 改进的模板匹配法

经过理论计算，使用City-Block距离比使用Manhattan距离和Euclidean距离有更高的目标识别率，因此通常选择City-Block距离作为通信目标识别的数据库匹配方法。但是，由于City-Block距离不能很好地解决通信参数误差大或缺失情况下的目标识别问题，本文提出了一种修正“City-Block”距离方法。

文献[9，11]也提出了一种改进的“City-Block”距离方法，如式(8)所示。但对式(8)进行分析发现：①当侦测数据或模板数据为0时，并不能保证归一化后的数据在[0,1]之间；②当xi>2,yi>0时，归一化后的数据大于1；③当xi-yi相同时，不论xi>yi或yi>xi，结果却完全不同。

(8)

本文提出的修正“City-Block”距离方法，通过对数归一化，并选择最大的特征参数值进行归一化，解决了上述问题。

根据先对数归一化然后计算距离误差的原理，根据式(2)和式(7)可得到下列公式

(9)

(10)

式(9)中的d越大，说明两者之间的差异越大，相似程度越小；反之d越小，说明两者之间的差异越小，相似程度越大。其中，d(X,Y)为待匹配测量模板数据与数据库中模板数据之间的距离，X为通信侦察设备的测量数据，xi为测量数据中第i个特征参数；Y为数据库中的模板数据，yi为模板数据中第i个特征参数，maxyi为第i个特征参数的最大值；ωi为第i个特征参数在识别中所占的权重。

通信信号特征参数有频率、带宽、电平、调制方式[12]等，由于通信频率、信号调制方式、信号带宽、频点个数、频率范围等各类通信参数对目标的区分能力不同，因此它们对目标识别的贡献率也有所不同，不同的贡献率赋予不同的权重。权重的计算方法有专家经验法[13]、层次分析法[14]、熵值计算法[15]等。专家经验法主观性强，不同的专家经验不同，选择的权重系数不同，造成的识别结果也不同。层次分析法通过比较两两特征参数对目标识别的重要性，建立判断矩阵，通过计算判断矩阵的特征值求解权重系数。熵是信息论中的一个重要概念，熵值的大小用来表示该特征参数的影响系数。熵值越大，越不能很好地区分目标之间的差异，识别结果越不稳定，对识别结果的贡献就越小。反之熵值越小，识别结果就越趋于稳定，对识别结果的贡献就越大。熵值计算法算法简单、实现速度快。

设数据库中共有m个通信目标型号，有n个特征参数，P为数据库归一化的特征参数矩阵，则第i个特征参数的熵值可以用式(11)计算。

(11)

式中：k>0。

定义第i个特征参数的权重系数为

(12)

令S表示侦察数据X与Y数据库中模板数据之间的相似度，如式(13)所示，S越大，相似程度越大；反之，则相似程度越小。

S(X,Y)=1-d(X,Y).

(13)

3 仿真分析

3.1 仿真条件

由于在通信侦察过程中，参数很难完全获得，往往会出现参数不完整的情况。因此仿真计算过程分参数完整和参数不完整2种情况分别进行仿真。分别假设识别数据库有30个和200个通信目标类型，每个目标类型的通信参数包括设备的常用频率、最小频率、最大频率、频点个数、信号调制方式、信号带宽、信号电平等。

3.2 仿真结果

(1) 参数完整时4种识别方法的识别正确率比较

当参数完整时，各特征参数匹配法在不同误差下的识别率如图2，3所示。图2为数据库有30个通信目标类型的识别率，图3 为数据库有200个通信目标类型的识别率。

图2 数据库有30个通信目标类型的识别率 Fig.2 Recognition rates with 30 types of communication object in database

图3 数据库有200个通信目标类型的识别率Fig.3 Recognition rates with 200 types of communication object in database

从图2，3可以看出，测量误差为3%时，Manhattan 匹配法和Euclidean匹配法识别率下降明显，前者的识别率为88%，而后者的识别率为83%左右；测量误差为8%时，Euclidean 匹配法识别率下降更快，识别率只有70%左右，City-Block识别率达到了85%，修正City-Block在2种情况下，识别率都达到90%以上。在4种方法中，修正City-Block识别率最高。

(2) 参数不完整时4种识别方法的识别正确率比较

在通信对抗中，往往存在着侦察反侦察、对抗反对抗的交锋。通信环境复杂、交错、多变。因此在现实情况中，很难完全获得敌方的通信参数，经常会出现通信参数不完整的情况。

当待识别的参数数据有一个特征参数缺失时，这4种特征参数匹配法在不同测量误差下的识别率如图4，5所示。图4是频点个数缺失下4种方法的识别率，图5是信号调制方式缺失下4种方法的识别率。

图4 频点个数缺失下的识别率Fig.4 Recognition rates with missing number of frequency points

图5 信号调制方式缺失下的识别率Fig.5 Recognition rates with missing signal modulation modes

从图4，5可以看出，测量误差大于3%时， Manhattan 匹配法和Euclidean匹配法识别率下降明显，前者识别率为84%，后者识别率为77%；测量误差为8%时，Euclidean 匹配法识别率下降更快，识别正确率只有35%。而City-Block和修正City-Block方法在测量误差为3%时，识别率分别为88%和92%。随着测量误差不断增大达到8%时，City-Block方法的识别率为64%，而修正City-Block方法识别率为76%。

总之，无论参数完整还是部分缺失，修正City-Block方法在4种方法中识别率都最高。但该方法仅适用于识别数据库里已存有通信目标类型的目标识别情形，对新增通信目标类型的目标识别有待提高。

4 结束语

在信息化作战条件下，作战环境十分复杂。作战双方都会采用伪装、隐蔽、欺骗和干扰等手段和技术，进行识别和反识别的交锋，从而造成目标识别信息的不精确、不完整、不可靠等。本文针对实战条件下可能出现的侦察数据误差大和通信参数缺失的情况，提出了一种修正City-Block模板匹配方法。通过仿真计算，无论参数完整或缺失，修正City-Block匹配方法都实现了较高的通信目标识别正确率，同时还具有较好的容错性。