沈文杰
(福建农业职业技术学院 信息工程学院, 福建 福州 350119)
为了提高对多目标的检测和参数识别能力,采用集成的多传感信息处理方法进行目标数据采集和跟踪,并结合对目标的探测回波模型进行目标检测.通过对多目标分布状态的特征检测和信息重构,可以建立非平衡环境下多目标智能检测模型.这样可以提高对目标信息的检测识别和方位估计能力.因此,研究相关的非平衡环境下多目标智能检测方法对目标信号检测识别具有重要意义[1-3].
对非平衡环境下多目标特征量的检测是建立在对数据的优化聚类和统计特征提取基础上,通过提取非平衡数据多目标特征量的统计特征量,结合大数据信息采样和特征提取方法进行非平衡环境下多目标检测.传统方法中,对非平衡环境下多目标检测的研究较多.文献[4]提出类别混叠度对非均衡数据分类的有效性分析方法.首先,在不同类数据非均衡率,不同边界形状、不同特征类型和不同概率分布的非均衡仿真数据上研究类别混叠度的有效性,其次,在实验研究的基础上,分析数据的非均衡性对类别混叠度的影响规律,找出类别混叠度指导非均衡分类的有效方法,最后,在真实的非均衡数据上验证类别混叠度指导非均衡分类的实际效果;文献[5]提出舰船通信系统非平衡数据多目标自动检测算法,该算法通过计算通信数据集内各数据点的欧几里得距离,剔除带有明显维度特征的非平衡数据减少计算量,将剩余通信数据降维并建立一维空间映射,最后对空间映射内的一维数据集特异值进行统计计算,实现非平衡数据检测.但是以上两种方法进行目标检测时,检测时间开销较大;文献[6]中提出基于NKSMOTE的非平衡数据集分类算法,该算法首先利用一个非线性映射函数将样本映射到一个高维的核空间,然后在核空间上计算少数类样本在所有样本中的K个近邻,最后根据少数类样本的分布对算法分类性能的影响程度赋予少数类样本不同的向上采样倍率,从而改变数据集的非平衡度;文献[7]提出基于广义极值分布的非平衡数据分类算法,该算法在广义线性模型的框架下,结合广义极值分布作为链接函数,校准损失函数作为目标优化函数,形成凸优化问题,利用广义极值分布的非对称性解决非平衡数据分类问题.文献[8]针对不平衡数据分类问题,提出基于统计信息聚类边界的不平衡数据分类方法.首先去除数据集中的噪声点,然后计算数据集中每个样本的边界度,通过判断样本点边界度与领域值的大小区分出边界集与非边界集.在一定程度上该算法增加了数据集的分类效果.但是以上三种方法在对非平衡环境下多目标进行检测时,检测精度较低.文献[9]提出基于改进SMOTE的非平衡数据集分类算法,将新样本的产生限制在一定区域,使得样本集分布趋于中心化,用更少的正类样本点人为构造样本,从而达到限制样本区域和降低算法复杂度的目的.文献[10]提出基于混合采样的非平衡数据分类算法,该算法首先利用SVM算法得到分类超平面,然后迭代进行混合采样,主要包括删除离分类超平面较远的一些多数类样本和对靠近真实类边界的少数类样本用SMOTE过采样,使分类超平面向着真实类边界方向偏移.但是以上两种方法的检测误差较大,导致目标跟踪性能较差.
针对上述问题,本文提出基于机器学习的非平衡环境下多目标智能检测算法.为了优化非平衡环境下的多目标智能检测算法设计,提出了一种建立多目标跟踪识别的非平衡数据采集模型.该模型采用空间网格聚类方法对非平衡数据进行多目标特征量分类挖掘,并结合机器学习方法进行非平衡数据多目标智能检测过程中的寻优控制.通过这种方法,实现了非平衡环境下多目标智能检测算法的优化,并得出有效性结论.
首先,对非平衡数据的多目标信息进行融合.其次,建立一个非平衡数据样本采集模型,以便采集数据.最后,可以采用模糊度辨识方法进行非平衡数据的分布式重建[11-12].定义多目标特征回波样本数据分布矩阵为C,结合窄带分布式重组方法,得到非平衡数据多目标检测样本分布集C2(m,n)的表达式为
其中C4s表示非平衡数据多目标样本信号;e-ji表示少数类样本j的采样倍率;i表示多维数据集中的数据点;d为数据集维度.对非平衡数据多目标信息进行融合,结合特征优化重组方法进行非平衡数据多目标检测[13-14].通过非平衡数据的回波样本数据分布,得到非平衡数据的参数融合矩阵为4P×4P矩阵,描述为
Se=E∑EHC×L,
(3)
其中E=[e1,e2,…e4P]为对非平衡数据多目标特征分布的酉矩阵;∑=diag[σ1,σ2,…σ4P]为特征值组成的对角矩阵.
在多传感网络模型中进行目标数据检测,得到各个传感器节点测量值,目标检测的先验概率Sx分布的表达式为
Sx=E[x3(t)]+b[se(t-τ0)],
(4)
其中E[x3(t)]为对目标跟踪预测的衰减特征,t为目标跟踪预测时间;b为抽头延迟线;τ0为动态加权因子.引入非平衡数据多目标特征量的模糊集l和模糊度属性值k,采用传感器节点测量的方法,得到非平衡数据多目标特征量的模糊度函数.
其中a(Hac)表示数据权值.对传感器节点所获得的信息进行分析检验,把规模为∂的数据集 X 划分到C个聚类簇中,得到非平衡数据多目标特征量的分布式重构模型为
对具有wji(k)个分类属性的非平衡数据多目标特征量进行回归分析,构建非平衡数据多目标特征量分布的标量时间序列为x(t),t=0,1,…,n-1.基于Grubbs准则得到非平衡数据多目标特征量的统计属性和分类属性,非平衡数据多目标特征量的模糊关联规则分布序列为x1,x2,…xn∈Cm(m维复数空间),在模糊聚类中,采用协同滤波方法进行相似性特征提取和模糊度特征提取,建立状态转移矩阵和过程噪声协方差矩阵,得到非平衡数据多目标特征量的模糊隶属度函数为
(7)
其中x(τ)为非平衡数据多目标特征量时域分布集,τ为空间采样时间尺度.将监测区域分为多个小区域,采用关联规则挖掘方法,对非平衡数据多目标特征βd进行提取,其表达式为
βd=(y(t)-d+1)/y(t),d∈[2,y(t)],
(8)
其中y(t)表示非平衡数据多目标特征量的关联维特征.先建立多目标跟踪识别的非平衡数据采集模型,然后采用关联规则挖掘方法进行非平衡数据多目标特征提取,最后结合近场源回波检测方法进行多传感网络下非平衡数据多目标特征检测.
在建立多目标跟踪识别的非平衡数据采集模型和采用关联规则挖掘方法进行非平衡数据多目标特征提取的基础上,将数据集推送到下一维空间,保证数据空间的方差为最大值.假设空间维度为1,数据集维度d的维量为u1,在数据集 X中的每个数据点i会产生一个高维原始空间数据标量值xi,则需建立数据集X的协方差公式
在过滤非平衡数据多目标特征量中的干扰成分分量,把Es分成四个P×L的矩阵E0、Ex、Ey和Ez,Es=[e1,e2,…eL]=[E0,Ex,Ey,Ez]H.设目标源级声压等参数为Γ、Ψ和Υ,传感器节点中的非平衡数据特征值估计分别为wi、φ和φi,则非平衡数据多目标特征量检测的参数估计值分别为
fi=angle(wi)/2π,
(12)
其中λi=c/fi为非平衡数据多目标特征量的聚类特征分布值,如果λi>0,则进行检测;如果λi<0,则重新采集非平衡数据.在信源中,对非平衡数据多目标特征量进行融合聚类和机器学习,实现多目标特征量检测,提高非平衡数据多目标检测能力.综上分析,得到算法的实现流程如图1所示.
图1 实现流程
由图1可知,对非平衡数据多目标样本信号提取采集到的非平衡数据多目标特征,并用流形学习方法对非平衡数据中的数据集做降维处理得到非平衡数据多目标特征量,再用空间网格聚类的方法对非平衡数据多目标特征量进行分类挖掘,最后根据挖掘结果对多目标特征量检测的参数进行估计,如果λi>0,则进行检测;如果λi<0,则重新采集非平衡数据.
为了测试本文方法在实现非平衡环境下多目标检测中的应用性能,采用Matlab,CPU双核2.53 GHz操作系统,内存为4.0 G,64位Windows10的开发环境进行仿真实验分析.实验中所使用的数据来源于机器学习数据集知识库(网址:https://archive.ics.uci.edu/ml/index.php),共采集数据5000个,进行50组实验,每次使用100个数据.
本文以非平衡数据的均方根误差、检测时间和检测精度为实验指标,采用文献[6]方法、文献[7]方法、文献[8]方法和本文方法进行对比实验.
(i)检测误差:均方根误差越低,目标跟踪性能就越好,检测结果越准确,所以以均方根误差为测试指标,其公式如下.
其中di为非平衡环境下参量估计与真值的偏差,Ne为实验次数.
(ii)检测时间:非平衡数据在检测过程中产生的时间对检测效率会产生影响,检测时间越快,检测效率越高.采用本文方法与文献[6]方法、文献[7]方法和文献[8]方法对非平衡数据的检测时间进行对比.
(iii)检测精度:精度为验证测试值的准确性.由于非平衡数据多目标特征量中的数据存在干扰现象,导致检测精度较低,由此,采用本文方法与文献[6]方法、文献[7]方法和文献[8]方法进行对比分析.
假设目标的初始位置为(2,40,60),采用200次Monte -Carlo实验进行目标检测,机器学习的迭代步数为120,目标信号能量为500 KJ,目标移动速度12.5 m/s,进行跟踪性能测试,得到目标节点分布图,如图2所示.
图2 目标节点分布图
根据图2的目标节点分布,采用本文方法与文献[6]方法、文献[7]方法和文献[8]方法测试在2组不同的观测噪声下的非平衡数据多目标检测误差如图3所示.
分析图3可知,在不同观测噪声下采用本文方法进行非平衡环境下多目标检测的误差较低,目标跟踪性能较好.为了验证本文方法的有效性,对本文方法、文献[6]方法、文献[7]方法和文献[8]方法的非平衡环境下多目标智能检测时间进行对比分析,得到对比结果见表1.
表1 时间开销对比(ms)
分析表1可知,随着迭代次数的增加,四种方法的检测时间逐渐增加,而本文方法进行非平衡环境下多目标检测的时间开销比其他方法检测的时间开销小.
根据目标节点分布进行数据采集,分别用本文方法、文献[6]方法、文献[7]方法和文献[8]方法对采集到的非平衡数据进行检测,将检测结果与实际检测结果进行对比,对比结果如图4所示.
图4 四种方法的检测精度对比
分析图4可知,本文方法对非平衡数据进行检测的数据量与原始数据量几近相同,而文献[6]方法、文献[7]方法和文献[8]方法对非平衡数据进行检测的数据量与原始数据量相差较大,说明本文方法进行非平衡环境下多目标检测的精度较高.
通过对多目标分布状态的特征检测和信息重构,建立非平衡环境下多目标智能检测模型,提高对目标信息的检测识别和方位估计能力,本文提出基于机器学习的非平衡环境下多目标智能检测算法.根据非平衡数据回波样本数据的分布特征,结合统计分析的方法,对非平衡数据进行优化结构重组.该过程中,采用协同滤波方法来检测相似性特征和提取模糊度特征,同时结合近场源回波检测方法,在多传感网络下实现非平衡数据多目标特征检测,实现了非平衡环境下多目标智能检测算法的优化设计.分析得知,采用本文方法进行非平衡环境下多目标检测的精度较高,检测时间开销较短,提高了目标检测性能.由于对非平衡数据进行检测时,没有考虑多目标检测中的数据关联性,导致数据关联质量较低,需要进一步对其研究.