梁娜
摘 要:随着计算机性能的逐步提高和图像处理技术的不断发展,基于计算机视觉的手势识别技术成为研究热点。本文介绍了手势识别的主要分类,并详细介绍了基于视觉的手势识别技术的工作原理和工作流程。阐述了手势分割、特征提取和手势识别的技术方法。
关键词:计算机视觉;手势识别;手势分割;特征提取
目前,人机交互的主要方式有基于文本方式的键盘交互和基于图形的鼠标交互,这些交互方式都以机器为中心,使人去适应机器的输入输出设备,因此,在交互过程中存在诸多不便。随着计算机科学的快速发展,人机交互的研究已经从以机器为中心转移到以人为中心,研究符合人类习惯的交互方式成为热点。手势是人类最常用的沟通媒介,它生动形象、直观易懂,而且蕴涵着丰富的信息,是一种高效的沟通方式,基于手势识别的人机交互技术将为用户提供种简易、高效的人机交互界面,极大地方便人类的生活。因此,基于手势识别的人机交互技术具有重要的研究价值。
1 手势识别的主要方法
根据手势图像的输入方式不同,手势识别系统主要可以分为两类:基于数据手套的手势识别系统和基于视觉的手势识别系统。
基于数据手套的手势输入(Glove—based Gesture Input)是利用数据手套获取手势在空间的运动轨迹和时序信息。它能够高效、快速、实时地获得手在空间的三维信息和手指的运动信息,并且能够识别多种手势信息。但是这种输入方式需要用户穿戴复杂的数据手套和位置跟踪器,给操作者带来很大不便,而且输入设备昂贵,很难在市场上进行推广。
随着计算机性能的逐步提高和图像处理技术的不断发展,基于计算机视觉的手势识别技术成为研究热点。这种方法通过摄像头采集手势图像信息并传输给计算机,系统对视频进行分析和处理,提取出手的形状、位置和运动轨迹,然后选择手势进行分析,然后根据模型参数对手势进行分类并生成手势描述。最后,系统根据生成的描述去驱动具体应用。这种方法无需购买昂贵传感设备,仅需要摄像头和PC机即可,并且在操作时更加自然、方便是手势识别未来发展的趋势。因此,本文重点研究基于视觉的手势识别技术。
2 基于视觉的手势识别技术
2.1 手势输入及手势图像预处理
手势输入是通过摄像头采集手势图像信息并传输给计算机的过程。通过手势输入将视频转换成计算机能够处理的数字图像,为了防止图像在生成、传输或变换过程中会受到干扰而发生畸变,需要先对图像进行预处理,去除手势图像中的噪声,过滤掉不需要的部分,同时保留并强化图像中的有用信息。
2.2 手势分割
手势分割就是将有手势从图像视频中划分出来,仅保留手势部分。手势分割的好坏直接影响后面的特征提取和手势识别的结果。主要方法有肤色模型法和轮廓跟踪法。
在手势图像中,肤色信息最为有效,是占主导地位的像素色彩值。肤色虽然因人而异,但它在色彩空间中的呈聚类特征,肤色模型法就是根据肤色在色彩空间中的分布特点,快速地找到手可能的候选区域。
轮廓跟踪法中最为著名的是基于Snake模型的手势分割方法,它利用Snake模型对噪声和对比度的敏感性来有效跟踪目标的形变和的复杂运动,从而将目标从复杂背景中分割出来。
2.3 特征提取
手势图像经过分割,会得到手势的边缘和区域,从而能够获得手势的形状。定位了手势之后就可进行手势特征的提取。手势特征提取与手势分割是密不可分的,在基于视觉系统的手势识别系统中,二者是同时进行的。
用来描述手势的形状特征的属性包括手的长短、面积、距离、凹凸等,它们反映了手的骨架和所在的区域。通常把区域内部或边界的像素赋予“1”值,而背景和其他不感兴趣像素赋予0值,形成二值图像,通过对区域的内部或外部形状进行各种变换即可提取区域特征。
2.4 势识别
手势分为静态手势和动态手势,静态手势通过手的形状表达某种信息,对应着模型参数空间里的一个点,而动态手势则通过手的运动表达相应的信息,对应着模型参数空间里的一条轨迹。手势识别就是把模型参数空间里的轨迹或点分类到该空间里某个子集的过程。静态手势识别是指手势处于静止状态的识别方法,识别过程比较简单,相对独立,它和时间及空间上的图像序列无关。主要采用的方法有神经网络法、模板匹配法、基于统计的方法等。动态手势对应参数空间里的一条轨迹,由于不同用户在做手势时的速度不同、熟练程度不同,因此不但涉及到时间及空间的相关信息,还涉及到手势定位的问题。动态手势识别方法主要有三种:神经网络识别法、基于隐马尔可夫模型(Hidden Markov Models,HMM)的识别法,基于动态时间规整(DynamicTime Warping,DTW)的识别法。
3 结束语
本文论述了基于视觉的手势识别技术的工作原理和主要流程。討论了手势分割的方法、特征提取以及手势识别的技术关键。基于视觉的手势识别技术是人机交互领域的一大研究热点,将手势识别技术应用于自动控制、智能家居、智能交通等领域,利用手势对设备进行控制将极大地方便人类的生产和生活。因此基于视觉的手势识别技术的研究在人机交互系统中具有更加广泛的社会意义和实际应用前景。
[参考文献]
[1]王两颖,张习文,戴国忠.一种面向实时交互的变形手势跟踪方法[J].软件学报.2007,V01.18(10):2423-2433.
[2]高君.基手势识别的虚拟宠物系统的研究与开发[D].沈阳:东北大学.2006.
[3]姚文君.基于Freeman链码二维图像轮廓的提取与匹配[J].宁波职业技术学院学报.2006(10):24-26.