基于粗糙集与覆盖算法的概率模型的通信信号分类方法

2012-07-02 00:51
兵器装备工程学报 2012年6期
关键词:概率模型约简粗糙集

林 伟

(陆军军官学院,合肥 230031)

通信信号的识别与分类关系密切,信号分类是信号识别的基础。然而,现代电磁环境日趋复杂,新的通信体制通信信号不断涌现,信号分类和识别难度越来越大。“分类问题”已成为人工智能中的一个重要研究方向。如何根据现代通信信号的特点,选择合适的分类方法识别通信信号已经成为一个迫切需要解决的难题。

关于分类问题,国内外许多专家都进行了广泛、深入的研究,并取得了一些可喜的成果,如贝叶斯分类、决策树分类法等。但是,贝叶斯分类必须已知先验概率和类别个数,不便用于通信信号分类[1];由于通信信号存在不便量化的非数值型特征参数,有时不便进行神经计算,神经网络分类方法有时受到限制[2];支持向量机是目前分类效率较高的方法,但算法复杂度相应提高,对非数值型数据处理也不合适[3];决策树的训练耗费很大,运算复杂度太高[4]。所以,用以上一种单纯分类方法对通信信号分类不能最优。

根据通信信号特征参数的特点,给出了一种将粗糙集理论与覆盖算法的概率模型结合起来的模式分类方法,这种方法实际上是将粗糙集和覆盖算法的概率模型相结合的两级复合分类方法。第1 级分类利用粗糙集进行粗分,该理论在属性约简、消除冗余信息等方面有优势,能针对特征参数中非数值型参数简化信号属性,提取其核心属性,针对核心属性,根据分类目的进行粗分;第2 级分类借助覆盖算法概率模型细分,用覆盖算法构造神经网络,引入高斯有限混合模型,对数值型特征参数,具有良好的分类性能,能实现精确分类,对粗分后的子集进行精确分类。

1 粗糙集与覆盖算法概率模型相结合的分类方法的实现

粗糙集理论与覆盖算法在模式分类中各有优势。粗糙集方法能简化规则,消除冗余信息;覆盖算法的概率模型能提高分类精度。在解决实际问题时,可以根据决策属性选择解决方法。设决策属性为D,条件属性C =C1∪C2,其中C1是非数值型条件属性,C2是数值型条件属性,有3 种方法供选择:

方法1 若D=f(C1),即D 只由C1决定,可用粗糙集方法;

方法2 若D=f(C2),即D 由C2唯一决定,可用覆盖算法的概率模型;

方法3 若D=f(C1∪C2),即D 由C1和C2共同决定,则采用二者相结合的方法。

例如,一信息表是一个班的学生基本情况表,若D =性别,则用方法1;若D=全体学生平均成绩,则用方法2;若D=男女学生的平均成绩,则用方法3。

方法3 具体实现步骤:

1)基于粗糙集的非数值型条件属性约简:

①求出决策属性D 的非数值型条件属性C 的正区域POSC(D);

②对每一个非数值型条件属性ci,计算POSC-{ci}(D),若POSC-{ci}(D)=POSC(D),则ci是可约去的,否则,ci不可约去,从而得非数值型条件属性的核CORE(C);

③求含CORE(C)的最小集合P,使得POSP(D)=POSC(D),得C 的最小约简P。

2)将输入空间的学习样本约简为只含core[]中核值属性的样本,得简化的学习样本。

3)对数据粗分类,根据需求筛选出满足非数值型条件属性的子集。

4)基于覆盖算法的概率模型的海量数据挖掘算法的分类。

给定m 类分类的训练样本集K={K1,K2,…,Km},算法实现具体步骤:

①利用覆盖算法,求出各类的覆盖组{C1,C2,…,Cm}:

a)将所有点投影到Sn上(中心在原点,半径为R,R >

b)若K1(开始时i =1)非空,作一覆盖m,j=1,2,…,gi,它只覆盖K1的点,被Cij 覆盖Ki的子集为Kij(j=1,2,…,gi);

c)若Ki被覆盖完,i=i+1,若i >m,则转至h,否则,任取Ki中尚未被覆盖的一点ai;

e)求C(ai)所覆盖点的重心,将其映射到球面上,设投影点为,按④中公式求,求得球形领域C);

g)求ai的平移点,并求对应的球形领域C),若C)覆盖的点数大于C(ai)所覆盖的点数,转到e),否则,得到C(ai)的一个覆盖,转步c);

h)样本学习结束,得到覆盖组。

②以覆盖的中心为高斯核函数的均值,取半径为方差,对每覆盖引入高斯核函数;立有限混合概率模型;

④利用文献[5]中给出求解最大似然的迭代EM 算法进行最大似然拟合;

⑤训练结束将得到p 个球形领域,所有训练样本被分成m 类不同覆盖集合K={K1,K2,…,Km},其中Ki=Ki1∪Ki2∪…∪Kij(i=1,2,…,m,p≥m)。

方法3 的步骤1 和2 降低了输入数据的维数,步骤3 减少后续覆盖算法的样本个数,步骤4 具有较高的分辨能力,因此方法3 既快速又准确。

2 通信信号分类实验

实验用某型号接收机接收并采集通信信号,提取其特征参数,如表1 所示,信号U1、信号U2 和信号U3 的特征是从采集广播电台的数据中提取的,信号U4 和信号U5 是自己用某型号电台发射信号,经接收和采集而提取的。表1、2 中,U为论域,即信号个体;Xi(i=1,2,…)为信号属性,其中X1为调制样式,X2为信号的频率波段,X3为频率(kHz),X4为强度(信号归一化功率),X5为带宽(kHz),X6为调制参数,X7为信号应用领域;Y 为决策属性,即结果。

C={X1,X2,…,Xn}为条件属性集,∩(C -X7)=∩C,所以X7为C 中可省略的,同理约简其他冗余属性,得到约简后的属性集Score={X1,X2,…,X6},如表2 所示。

表1 通信信号的部分特征

表2 是完备属性集,因为∩(C -{Xi})≠∩C,即Xi是不可省略的(i =1,2,…,6)。与表1 相比,信号的属性个数减少了,即输入数据维数降低了。因此,可以根据需求,利用非条件属性进行粗分类。若需求为X1=“AM”,X2=“中波”,经过粗分类,只有信号U1 和信号U2 满足要求,接着对这2 个信号用覆盖算法概率模型细分,其他3 个信号就不再作细分的考虑。因此减少了进行覆盖计算的样本数,对大规模模式分类具有重要的意义。

实验在不同时间分别大量接收并采集表1 中的所有信号,提取其特征向量,用方法1、方法2 和方法3 比较,结果如表3 所示。

表3 通信信号分类与识别结果

通过表3,可以发现采用粗糙集和覆盖算法覆盖模型相结合的方法比单独使用粗糙集或覆盖算法概率模型,在所用时间和正确率上都有大幅度的提高,说明这种方法是有效的。

3 结束语

分类是识别的基础,是人工智能研究的一个重要课题。关于分类问题,国内外许多专家都进行了广泛、深入的研究,并取得了一些可喜的成果,但是,没有一种分类方法对所有事物的分类都适用,没有一种方法对任何分类问题都最优。本文分析了常用的分类方法的优缺点,根据通信信号的特点,提出了基于粗糙集和覆盖算法的概率模型的通信信号分类方法。首先利用粗糙集能够进行属性约简、消除冗余信息等方面有优势,简化特征参数中非数值型参数的信号属性,提取其核心属性;然后再借助覆盖算法概率模型具有良好的分类性能,对数值型参数细分,对粗糙集约简后的最小属性子集进行分类。最后给出了算法的实现步骤,对实际信号进行了分类实验,实验效果证明提出的方法是适用的。

[1]Heckman D,Geiger D,Chickering D.Learning Bayesian networks:the combination of knowledge and statistical data.Machine Learning[J].1995,20(3):197-243.

[2]张铃,张钹.人工神经网络理论及应用[M].杭州:浙江科学技术出版社,1997.

[3]崔伟东,周志华,李星.支持向量机研究[J].计算机工程与应用,2001(1):58-61.

[4]Hunt E B,Marin J,Stone P T. Experiments in Induction[J].Academic Press,1966,63:227-230.

[5]Dempster A P,Laird N M,Rubin D B.Maximum likelihood from incomplete data using the EM algorithm(with discussion)[J].R Stat Soc Ser B,1977,39:1-38.

[6]陈敏. OPNET 网络仿真[M]. 北京:清华大学出版社,2004.

[7]王文博,张金文.OPNET Modeler 与网络仿真[M].北京:人民邮电出版社,2003.

[8]刘建国,柯钰,钟京立.军事通信网络基础教程[M].北京:北京航空航天大学出版社,2001.

[9]张玉,杨晓静.地域通信网网络性能的计算机仿真研究[J].计算机工程,2004(8):51-54.

[10]何非常.军事通信[M].北京:国防工业出版社,2000:24-75.

[11]岳伟甲,刘昌锦.一种基于VC ++的通信信号仿真软件设计[J].四川兵工学报,2011(5):92-95.

猜你喜欢
概率模型约简粗糙集
粗糙集与包络分析下舰船运行数据聚类算法
基于混合增量式属性约简的中医甲状腺结节诊疗规律分析
在精彩交汇中,理解两个概率模型
基于Pawlak粗糙集模型的集合运算关系
基于0-1规划的最小属性约简算法
多粒度犹豫模糊粗糙集*
直觉模糊序决策系统的部分一致约简*
近似边界精度信息熵的属性约简
一种基于粗糙集理论的社交网络潜在路径研究
一类概率模型的探究与应用