曹磊
(淮北师范大学 计算机科学与技术学院,安徽 淮北 235000)
一种三维空间手写数字的融合识别方法
曹磊
(淮北师范大学 计算机科学与技术学院,安徽 淮北 235000)
在三维空间手写数字识别研究中,特征的选取和融合直接决定最终的识别率.空间手写数字特征一般包括时域特征和频域特征两大类,时域特征又包括加速度相关特征、旋转特征及短时能量特征;频域特征又包括DCT变换特征及FFT变换特征.针对这一特点,文章提出一种融合多种特征的识别方法.首先,对三维空间手写识别的各种子特征进行提取;然后选取最能反映字符特点的两种子特征进行融合并对融合后的特征向量进行降维处理;最后进入分类器进行识别.实验结果表明,本方法相比采用单一特征进行识别时,其识别率有显著提升.
特征融合;旋转特征;DCT变换特征;三维空间手写识别;支持向量机
平面联机手写及脱机手写识别技术已经非常成熟,并且应用的范围也比较广泛,但受到书写平面的制约,用户使用时不太方便.三维空间手写识别技术是一种全新的人机交互方式,利用加速度传感器来采集空间书写的特征,摆脱手写板的束缚,用户使用时更加快捷、方便,是手写识别技术的发展趋势.
此前,由于受到传感器发展的制约,这项技术没有得到充分发展,但随着微电子机械系统(MEMS)技术的不断发展成熟,并出现价格低廉、灵敏度高的MEMS加速度传感器,为空间手写识别技术的研究提供硬件保障[1].关于识别算法有两类,一类是利用传感器采集各类特征进行识别;另一类是利用摄像头拍摄手势动作,将视频图像处理后进行识别.两者相比,第二类方法由于算法复杂、计算量大,没有受到关注;而第一类方法中用到的加速度传感器由于灵敏度高且成本低,越来越受到重视.
三维空间手写识别流程如图1所示,首先要对采集的特征数据进行预处理,使特征数据标准化;然后利用PCA方法对时域RF特征及频域DCT变换特征进行融合并降维处理;最后送入分类器,利用SVM进行分类识别.
图1 三维空间手写识别流程
利用加速度传感器采集的空间手写特征数据首先要进行预处理,因为在采集时会有多种噪声干扰,比如手抖及温度的干扰.另外,书写习惯的不同也会造成特征数据的差异[2].所以不仅要对噪声进行过滤,还要用归一化的方法将最能反映数据特征的分量提取出来,进而消除特征数据的差异.
特征提取及融合是三维空间手写识别最关键的一步,直接决定三维空间手写识别的性能.文章所采用的特征提取方法是首先提取空间手写的时域特征中的旋转特征RF(Rotation Feature),然后利用离散余弦变换DCT(Discrete CosineTansform)来提取其频域特征,最后利用主成分分析法PCA(Principal Com⁃ponent Analysis)进行特征融合及降维处理.
3.1 旋转特征RF
基于加速度传感器的三维空间手写能获得手势运动时由三轴加速度传感器测得的三个轴向的加速度信号,利用这些加速度信号进行识别.由于不需要采集用户的书写笔迹,所以可以摆脱由书写角度、速度及力度的差异所带来的影响.
当时间t从0变化到l-1时,加速度信号会有顺时针和逆时针的旋转变化,由于每个字符的书写运动变化过程都不同,所以可以提取这种旋转变化的特征进行有效识别.文章选取垂直于书写平面上的加速度信号作为主要二维特征,所以要将A()t投影到下述3个投影平面,然后分别从3个投影平面提取二维旋转特征:
3.2 离散余弦变换特征DCT
DCT变换经常用在图像编码中.其含义是特征数据有一定损失的情况下,可以用较少数目的点数来表示原点数,所以一个高维的特征数据经过 DCT变换后可以用较少数目的维数来表示,而且数据的本质特征不会发生变化.DCT变换的优点有两个:(1)减少特征数据的噪声影响;(2)可减少后续降维过程的复杂性.基于以上两点,文章采用DCT变换对三维加速度特征数据进行频域变换,进而取得频域特征[3].
DCT变换是一个线性的可逆变换,一维离散余弦的变换形式如下:
其中,xn是输入的离散数据,也就是时域中的N点序列,XK为余弦变换系数,k为广义频率分量[4].
图2是DCT变换结果示意图,由于DCT具有很强的“能量聚集”特性,关键的数据信息主要是聚集于一些 DCT的低频区域,所以文章采集DCT变换的前128个幅值作为频域特征.
图2 DCT变换结果
3.3 基于PCA的时频特征融合方法
信息融合是一种交叉型、多学科的综合理论方法,涉及的研究领域包括人工神经网络、贝叶斯规则、模糊集理论、模糊积分理论、D-S证据理论、黑板结构、不确定推理理论等.信息融合技术对多个信息源提供的信息能够合理进行整合,使各种数据信息互为补充,从而提高系统的整体性能.信息融合根据处理对象层次的不同可划分为三个层次:像素级融合,特征级融合和决策级融合[5].
特征融合是在数据处理的中间阶段对信息进行整合,文章采用基于PCA(主成分分析法)的融合方法对时域及频域特征进行融合并对融合后的特征向量进行降维处理,不仅能最大程度地保留用于识别的特征信息,而且数据信息量也得到压缩,从而有效降低数据处理的复杂性.基于PCA的特征融合流程如图3所示:
图3 基于PCA的特征融合流程
首先选择样本库里任意样本ξ,提取其RF特征向量及DCT变换特征向量,分别记为χ和y,χ和y的维数分别为m和n,则融合后的特征向量为z∈(x,y)T,z的维数为m+n.可以看出融合后的向量维数增加很多,增加识别算法的复杂性,所以采用PCA方法对融合后的特征向量进行降维处理[6].
PCA目标函数定义:
支持向量机(SVM)是结合统计学习、核函数方法和最优化方法的一种机器学习算法,已经在图像处理及模式识别方面有较广泛的应用.它把特征向量通过非线性变换映射到高维特征空间,在这个空间中创建一个最优分类超平面[7],使分类器具有较强的泛化能力,能够根据有限的样本信息找到学习能力与学习精度之间的最佳平衡点.SVM的基本原理如下所示:
5.1 样本采集
实验对0~9十个阿拉伯数字进行识别,由于书写习惯的不同会造成特征数据的差异,为验证本文方法的有效性,专门组织40人使用MEMS加速度传感器对0-9十个数字分别书写10次,得到各个数字的400个样本.随机选取各个数字的320个样本作为训练样本,其余的80个样本作为测试样本.
首先将训练样本送入SVM分类器进行学习,然后将测试样本送入SVM进行分类识别,分别做3次实验,取3次试验结果的平均值.
5.2 性能分析及对比
图4显示选择不同特征下的0-9十个数字的识别率:
图4 不同特征下数字的识别率
从图4可以看出,对于10个阿拉伯数字,采用融合特征的识别率最高,同时也反映出时域特征与频域特征结合的有效性.
为了凸显本文方法的有效性,将测试样本的RF特征和DCT变换特征分别送入SVM分类器进行训练和识别,连做3次实验,分别取其识别率的平均值.将采用不同特征进行识别的结果进行对比,由于采用的是同一种分类识别算法,所以平均识别率高的,其性能更优越.识别结果如表1所示:
表1 采用不同特征的识别率
从表1可以看出,采用融合特征进行空间手写识别,其识别率比采用单一特征进行识别分别提升了7.98%和13.35%.所以采用本文方法的识别性能有显著提高.
文章提出一种基于PCA的特征融合方法对三维空间手写数字进行识别.实验结果表明,采用本文方法的识别率有显著提高,但是对于空间数字识别中的连笔消除效果不佳,应将其作为今后工作的研究重点.
[1]孔俊其.基于三维加速度传感器的手势识别及交互模型研究[D].苏州:苏州大学,2009:1-14.
[2]谭啸峰.空间手写识别预处理算法研究[D].浙江:浙江大学,2009:4-5.
[3]HE Zhengyu.A new feature fusion method for gesture reeognition based on 3d accelerometer[J].Applied Mechanics and Materials,2010:44-47.
[4]胡永刚,吴翊.高维数据降维的DCT变换[J].计算机工程与应用,2006,32:21-22.
[5]韩崇昭,朱洪艳,段战胜.多元信息融合[M].北京:清华大学出版社,2006.
[6]MARTINEZ A M,KAK A C.PCA Versus LDA[J].IEEE Trans on Pattern Analysis and Machine Intelligence,2001(23):229-238.
[7]ANDREW R W.Statistical Pattern Recognition[M].Publishing House of Electronics Industry,2004:5-6,106-111.
[8]刘晶,郭雷,聂晶鑫.基于SVM的一种新的分类器设计方法[J].计算机应用研究,2006(7):181-182.
Fusion Recognition Method on 3D Space Handwriting Digit
CAO Lei
(School of Computer Science and Technology,Huaibei Normal University,235000,Huaibei,Anhui,China)
The extraction and fusion of the features determine the final recognition rate in the research of 3D space handwriting digit.Space handwriting digit features mainly include time-domain features and frequency-domain features.Time-domain fea⁃tures are typical of acceleration related features,rotation features and short-time energy;frequency-domain features are typical of DCT transform features and FFT transform features.This paper proposes multi-feature fusion method.The various sub-fea⁃tures were extracted and two sub-features which can reflect characters′features were chosen and fused to reduce the dimen⁃sion of the fused feature vectors.Then the classifier was introduced to categorize and recognize.The experimental results show that the multi-feature fusion method can significantly improve the recognization performance compared with the single featurebased method.
feature fusion;rotation feature;DCT transform feature;3D space handwriting recognization;support vector machines
TP 391
A
2095-0691(2013)04-0056-05
2013-07-10
安徽省高等学校省级优秀青年人才基金项目(2012SQRL078);安徽省教育厅自然科学基金项目(KJ2012Z354)
曹 磊(1979- ),男,安徽宿州人,副教授,硕士,研究方向:信息融合、模式识别.