敖培++赵四方++冯志鹏++李延强
摘要:为了克服采用基于Boosting算法和Bagging算法生成的个体网络时难以满足误差独立条件的问题,本文提出一种基于局部分类精度估计的自适应ELM集成的方法,即通过估计各个体ELM在未知样本邻域内的分类精度,选择具有最大局部分类精度的个体ELM输出作为分类结果。实验表明,采用本文方法进行情感识别可以获得较好的效果。
关键词:ELM集成算法 局部分类精度 情感识别
中图分类号:TM715 文献标识码:A 文章编号:1007-9416(2014)12-0093-02
1 引言
基于Boosting算法和Bagging算法生成的个体网络很难满足误差独立的条件,通过简单的平均法或投票法难以获得满意的性能。为了避免误差独立性假设,本文提出一种基于局部分类精度估计的自适应选择ELM(Extreme Learning Machine, ELM)[1]集成方法,并对人类情感进行识别[2],获得较好的识别效果。
2 局部分类精度估计
在为每一个测试模式选择个体分类器时,其分类精度可以通过定义在测试模式周围的属于校验样本集的k近邻领域进行估算,即所谓的局部分类精度。假设已设计得到K个分类器Cj(j=1,…,K),每个分类器均用来解决一个M类(wi,i=1,…,M)的模式分类问题,对任一未知测试模式X*,给定模式X在X*的邻域内,分类器Cj的局部分类精度可由下式来估算:
(1)
式中,是X被分类器Cj划分到类别wi的概率,Wn=1/dn为考虑不同样本的分类重要性给赋予的权重,dn是邻域内第n个模式样本Xn到测试模式X*的欧式距离。
3 自适应选择ELM集成算法
本文通过估计测试模式周围局部特征空间区域的各个体网络分类精度,为待分类的测试模式自适应选择具有最高局部分类精度的个体ELM分类器。具体算法如下:
输入:测试模式X*,校验集及其类别,邻域规模k,拒绝阀值thd_rej,选择阀值thd_sel
输出:测试模式X*的分类
Step 1:如果所有的分类器对测试模式X*的分类相同,则直接输出X*的类别;
Step 2:按式(1)计算局部分类精度CLAj(X*)(j=1,…,K);
Step 3:如果CLAj(X*) Step 4:确定具有最大局部分类精度CLAj(X*)的分类器Cmax; Step 5:对每个分类器Cj计算差值Dj=CLAmax(X*)-CLAj(X*); Step 6:如果,j≠m,Dj>thd_sel,则选择分类器Cmax;否则,在Dj 邻域规模k的取值根据不同的数据样本经过试验选定,拒绝阀值thd_rej一般取0.5,选择阀值thd_sel一般取0.02~0.1。 4 实例分析 实验采用了CohnKandade的人脸表情库作为表情测试数据库,并从中随机提取了403个人脸表情样本,对每个样本提取33个情感特征作为人脸数据集。采用Chinese Linguistic Data Consortium作为语音测试数据库,并对其中的1200条语音分别提取37个带噪音的语音情感特征作为语音数据集。每个数据集除了包含高兴、悲伤、害怕、生气、惊讶、厌恶6种表情外,人脸数据集还包含了中性人脸表情,如表1所示。 将所有数据集采用随机抽样的方法选取60%作为训练集,20%作为校验集,其余20%作为测试集,分类结果是重复运行20次的情况下测试集分类精度的平均值。采用本文算法进行分类时,选择thd_rej=0.5,选择阀值thd_sel=0.05。这里选取基于Boosting个体ELM生成+投票法集成和Bagging个体ELM生成+投票法集成两种方法与本文算法进行识别效果比较,如表2所示。从表2中可以看出,与其他两种方法相比,本文方法具有较高的分类精度,可以有效提高情感识别率。 5 结语 为了避免误差独立性假设,本文提出一种基于局部分类精度估计的自适应选择ELM集成方法,并对人类情感进行识别。与基于Boosting算法和Bagging算法生成个体ELM的方法相比较,本文方法可以获得较好的识别效果。 参考文献 [1]YU Q, MICHE Y, EIROLA E, et al. Regularized extreme learning machine for regression with missing data [J]. Neurocomputing,2013,102:45-51. [2]上官鹏超.曲线拟合及蜂群算法用于皮肤电信号的情感识别[D].西南大学硕士学位论文,2014.