李翠 王小妮 刘园园
摘要:为了增强人机交互的人性化和多样化,设计了一种基于SIFT算法的手势实时控制系统。本系统只需普通PC机与摄像头就能对手势进行准确的识别。并且还可以进一步对采集到的图像进行选择,这一选择主要是依据肤色检测得来的,另外我们还可以采用SIFT算法找到与待测图像相应的图像,充分发挥手势识别技术的优势,利用输出信息完成实践应用的控制工作。该系统不需要建立大容量的样本库,运行速度较快,对手势的识别具有较高的准确性。
关键词:手势识别;SIFT算法;肤色检测;特征点
中图分类号:TP391.4 文献识别码:A 文章编号:1001-828X(2016)015-000-01
引言
伴随着全球信息技术的飞跃式发展,人们对计算机的使用提出了更高的要求,手势交互方式具有较多的推广优势,如生动形象、具体等,因此手势交互方法被普遍应用在人机交互工作中。
一般情况下,手势控制系统可以被分为两大类,主要依据就是输入设备的差异,第一类是针对数据手套的手势控制体系,第二类是针对视觉的徒手手势控制体系。后者的控制体系通常需要较大容量的样本库为后续工作奠定基础,还应该确切的描绘出不同手势的具体范围,对周围环境的要求非常高[3]。
在上述问题的基础上,下面文章中创建了一种SIFT算法的手势控制体系。
一、针对手势控制系统的相关设计
文章中的相关研究都是通过Windows操作系统平台来完成的,利用Matlab开发工具设计和开发了手势控制系统,借助普通摄像头和家用PC机,对手势进行识别,并成功控制了具体应用。我们可以大致把使用体系粉尘两大类:第一类是针对手部肤色的检测,第二类是针对SIFT算法的手势识别技术。
1.基于肤色的手部区域检测
不同的手势不会改变皮肤自身的颜色,在所有的图像中,手部肤色图像是比较稳定的。不仅如此,人们的手部在太阳光的照射下色彩几乎相同,并且色彩不会受到被检测者的年龄、性别、种族的影响,可以通过手部肤色收集手部区域的基础信息。
因为普通摄像头收集到的图片是RGB彩色空间的,因此无法对其直接处理,一定要把其转换成YCbCr彩色空间,才能提升处理效果。
文章中把收集到的图片进行图像锐化处理,然后在YcbCr空间中提取肤色区域,最后对处理得到的二值图像进行形态学运算,只有这样才能得到较为满意的手部区域图像。
2.基于SIFT算法的手势识别
经上一步的判断后,若摄像头采集到的图像中包含有足够面积的手部区域,则对其进行识别。本文采用SIFT算法对无背景干扰的手势进行识别。
这种新型的算法的雏形是在上个世纪被人们发现的,随后人们又对其进行了总结创新。运用这种算法收集到的SIFT特征向量属于图像的一种普遍特征,如果我们可以确保其亮度保持不变、尺度缩放比例不变,就能够确保其噪声、视角变化比例等的稳定性[1]。
SIFT算法主要有以下几点:
首先,我们需要认真落实尺度空间的极值点。要想准确得到图像尺度空间,我们需要利用高斯函数来获取。
其次,我们需要科学选择稳定的关键点。通过认真选择那些计算出的极值点,去掉其中的不稳定因素,进而提升关键点的稳定性能极其自身抵抗噪声的能力,为此我们可以参考文相关文献[2]。
第三,我们应该把选好的关键点搭配相应的方向。要想确保SIFT自身的旋转不变特征,就应该准确找到特征点的主方向。然后结合不同的特征尺度选择相近的高斯平滑图像L,准确计算L上每一个点的梯度和方向,随后进行相邻窗口的采样分析,选用直方图直观呈现给人们所有点的梯度方向。
二、实验结果与分析
为了验证系统的有效性和准确度,本文选用了2种简单手势进行实验,对2种手势各采集1张,作为样本图像。两种手势对应的命令分别为开始、前进。
经过相应的研究我们不难看出,手势控制体系的样本图像识别结果不会受到手指不同动作、手势缺失以及光照差异的影响。
使用Matlab编写了简单的图像播放器、音频播放器,通过手势控制系统对两播放器进行操作。对每个播放器每种手势各使用50次,统计两播放器被正确控制的次数。
三、结束语
本文提出的方法对少量的手势识别效果较佳,如要求识别大量手势,则随着各手势间SIFT特征差异变小,识别结果容易出现错误。如果想取得比较好的效果,必须对现在采用的特征点匹配方法加以改进,提高特征点匹配准确率。同时,识别大量手势需增加样本图像的数量,将增加计算量和识别耗时,为解决这一问题需要对手势进行归类,识别时对待测图像进行粗分类,然后将待测图像与其对应类别中的样本图像进行匹配。下一步将研究上述两个问题的具体解决方案。
参考文献:
[1]Darid G. Lowe. Object recognition from local scale-invariant features [C].International Conference on Computer Vision, 1999: 1150-1157.
[2]Darid G. Lowe. Distinctive Image Features from Scale-invariant Keypoints [J].International Journal of Computer Vision, 2004, 60(2):91-110.
[3]刘寅,滕晓龙,刘重庆. 复杂背景下基于傅立叶描述子的手势识别[J].计算机仿真;2005,22(12):158-161.
现代经济信息2016年15期