摘 要: 当前我国人工智能技术水平有了长足的进步,给人民群众的日常生活带来了较大的便利,故而在人机交互技术方面的需求也不断上涨。手势是人类使用频率最高的肢体语言之一,运用手势进行沟通显得直观有效、自然简洁,而在机器学习背景之下,结合人工智能技术完成对人体手势的识别就成了当前的重要研究问题。基于此,本文概述了机器学习的基本内涵及种类,并分析了手势识别技术中的要点,以求为人工智能的发展提供理论上的支持。
关键词: 人工智能;机器学习;手势识别
中图分类号: TP301 文献标识码: A DOI:10.3969/j.issn.1003-6970.2020.10.032
本文著录格式:徐琛玥. 机器学习背景下手势识别技术探究[J]. 软件,2020,41(10):132134
【Abstract】: At present, the level of artificial intelligence technology in China has made great progress, which brings great convenience to people's daily life, so the demand for human-computer interaction technology is also rising. Gesture is one of the most frequently used body language. Using gesture to communicate is intuitive, effective, natural and concise. Under the background of machine learning, the combination of artificial intelligence technology to complete the recognition of human gesture has become an important research issue. Based on this, this paper summarizes the basic connotation and types of mechanical learning, and analyzes the key points of gesture recognition technology, in order to provide theoretical support for the development of artificial intelligence.
【Key words】: Artificial intelligence; Machine learning; Gesture recognition
0 引言
当前诸如模板匹配、人工神经网络以及隐马尔科夫模型这类背景下的手势识别算法有着较为广泛的饮用,但其计算显得较为复杂,相比之下基于机器学习的手势识别有着较为现主要的优势,能够提取多层网络简化的高价值信息,所取得的识别效果更佳。
1 机器学习的基本内涵及种类
机器学习涉及到了不同领域的相关知识,且将这类知识进行了有效的整合,主要是研究计算机怎样对人类的学习行为进行正确的模拟,并根据人类的经验来掌握相应的技能及知识,再经过不断学习之后改良与优化人类的知识结构。在进行机器学习时,人类所拥有的经验基本上能够类比于及计算机中的数据信息、人类所掌握的学习水平则能够类比于计算机中的学习算法,人类所具备的知识结构则能够类比于计算机中的模型。那么便能够得知,机器学习主要是指在计算机中深入分析海量数据信息,根据自身的学习算法来明确数据信息中所蕴含的基本特点及规律,并在持续的学习过程之中获得相应的经验及知识模型,进而能够预测未知的数据信息。
根据机器学习的训练数据信息是否已经完成标准,可以划分成半监督学习、无监督学习以及监督学习三种类型。其中监督学习主要是指所标注的数据信息与训练数据信息之间能够达成某种统一,一般划分成分类及回归两种种类。诸如KNN算法、SVM算法、逻辑回归算法以及决策树等属于分类算法的范畴;多项式回归、线性回歸以及岭回归则属于回归算法的范畴。而无监督学习主要是指并不依赖与标注信息,而是直接分析相应的训练数据信息,并对其中所体现出来的规律进行总结,明确其分布情况,进而将这类数据信息划分成不同的簇。诸如主成分分析法(Principal Component Analysis,PAC)以及K-means算法都是无监督学习中的关键算法,能够有效聚类相应的数据信息。半监督学习则是将监督学习以及无监督学习之间的基本特征进行了有机的融合,这主要是因为在实际统计相应数据信息时,无法确保所有数据信息都能够具备相应的标签,为了让所有数据信息的作用能够得到最大化地发挥,半监督学习算法应运而生。诸如半监督支持向量机算法(SVMs)以及graph-basedmethods图论算法都是半监督学习中的常见算法。
2 基于肤色的多手势图像精准分割算法技术要点
肤色作为人类较为鲜明且直观的特点,与其余手势特点有所不同,它不会受到来自大小、方向以及形状这类因素的干扰,在对相关手势进行旋转、缩放以及平移时,肤色特点具备了较强的鲁棒性,因此采取多手势图像能够对肤色进行精准的分割,实现手势识别的根本目的。这一算法的技术要点如下:
2.1 手势图像预处理
当获取了相应的手势图像之后,很容易会受到来自噪声的不利影响,让分割与识别手势图像的精准程度有所降低,故而在分割与识别手势图像之前应当进行相应的预处理。应用较为广泛的预处理方式有去噪方法以及形态学处理方法。
第一,去噪方法。当试用图像采集设施来对手势图像进行采集时会出现数量众多的噪声,这样一来所获取图像的质量无法得到保障,因此對其进行去噪的操作势在必行。要想实现去噪的目的,可以选择两种滤波器来进行去噪处理。首先是高斯滤波器,在对图像进行采集时,高斯白噪声是出现频率最高的噪声,通过高斯滤波器的应用能够实现良好的去噪目的。高斯滤波器是一种线性滤波器,根据高斯分布原理能够明确采集图像的像素数值,这样一来就能够有效避免各类噪声的产生。高斯滤波器所遵循的二维高斯函数如下:
其中h(x, y)主要是指高斯滤波器在(x, y)这一坐标中的实际数值,σ则表示了标准差。
其次是中值滤波器,它是一种非线性滤波器,能够统计并排列组合周围所产生的像素点,并选择其中值来当做最佳的像素值,进而让孤立无援的噪声点得以消除,进而实现去噪的目的。
第二,形态学处理方法。当完成对手势图像的去噪操作之后,所获取图像之中会出现一定的残缺以及空隙,通过形态学处理方法的应用,就能够让图像之中的毛刺、孤立点、填充小孔得以消除。形态学处理方法主要有以下几种操作方式:
一是膨胀。这一操作的目的主要是让物体能够与其背景点进行有效的合并,使得目标物体的面积得以增大,从而实现对目标区域中相应缝隙及空洞得以填充。二是腐蚀。这一操作的目的主要是消除物体周围的边界点,使得目标物体的面积得以减少,从而实现对目标区域中的孤立点得以消除。
2.2 明确收拾图像最小面积外接矩形
进行手势分割操作主要是为了让手势不受到背景的干扰,有效提升识别结果的准确程度。一般而言手势图像存在着个凸多边形的凸包,而其外接矩形则主要包含了最小面积外接矩形MABR(Minimum Area Bounding Rectangle)以及最小绑定矩形MBRMBR(Minimum Bounding Rectangle)。针对最小绑定矩形应当充分考虑到其轮廓基本特征来明确矩形顶点,进而建立相应的矩形手势来完成分割,但通过这一方式所获得的手势图像依然会包含一定的背景,且手势面积远远小于矩形面积。针对最小面积外接矩形应当在沿用上述手段的前提之下,尽可能地增加手势面积。
2.3 做好手势图像轮廓提取工作
当完成对手势图像的预处理之后,工作人员就可以对其中的轮廓数据信息进行提取,轮廓信息有着较为丰富的手势特点,能够对手势的角度进行获取,对前景以及背景进行有效的区分。当前应用较为广泛的手势图像轮廓提取方式主要是八邻域检测法,其模板如图1所示。
这一方法的主要步骤如下:
对手势图像进行全面的扫描,直至寻找到完美地前景像素点;对搜索方向进行初始化;根据这一方向将前景像素点移动到下一个区域的像素点之中;如若确定这一像素点属于轮廓点的范畴,那么就能够对这一手势图像的轮廓进行提取,如若并不属于,那么就要进行下一步的工作;继续对搜索方向进行更新,直至确定像素点属于轮廓点的范畴;停止工作。最终获得的手势图像轮廓如图2所示。
3 结语
综上所述,人工智能在实际生活中的不同领域都有着较为广泛的应用,为各行各业带来了较大的便利。机器学习便是人工智能中的重要组成部分,在机器学习背景之下,通过手势识别技术的应用,能够让人民群众在进行人机交互时更为简便,不再依赖于键盘、触摸屏以及鼠标这类与终端直接接触的设备,进而有效提升人机交互的效率及质量。要想让手势识别结果足够精准,相关工作人员就必须明确该技术中的相关要点,采取合理的措施来减少手势识别结果受到各类因素的干扰。这样一来就会让手势识别技术得到良好的发展,有效推动社会科学技术水平的不断进步。
参考文献
[1]江元, 杨波, 赵东来, 等. 基于时间序列分析及机器学习的移动网络业务量预测技术[J]. 物联网技术, 2020, 10(6): 42-45.
[2]戚天梅, 过弋, 王吉祥, 等. 基于机器学习的外汇新闻情感分析[J]. 计算机工程与设计, 2020, 41(6): 1742-1748.
[3]蒲晓蓉, 陈柯成, 刘军池, 等. COVID-19中国诊疗方案的机器学习智能分析方法[J/OL]. 生物医学工程学杂志: 1-8[2020-06-19]. http://kns.cnki.net/ kcms/detail/51.1258.R. 20200611.1510.018.html.
[4]赵天伟, 林莉, 张东辉, 等. 机器学习在无损检测中的应用案例浅析[J]. 无损探伤, 2020, 44(3): 1-4+11.
[5]曾路, 汪浩. 基于机器学习的虚拟仪器软件缺陷预测模型研究[J]. 自动化与仪器仪表, 2020(5): 59-62.
[6]甘天江, 傅友华, 王海荣. 毫米波大规模MIMO系统中基于机器学习的自适应连接混合预编码[J]. 信号处理, 2020, 36(5): 677-685.
[7]余传明, 李浩男, 安璐. 基于深度学习的领域知识对齐模型研究:知识网络视角[J]. 情报学报, 2020, 39(5): 521- 533.
[8]欧俊臣, 沙玲, 杨淞文. 基于MCTS和卷积神经网络的五子棋策略研究[J]. 软件, 2020, 41(4): 160-164.
[9]石桐歌, 孟祥宇, 王朋娇. 我国机器人教育现状分析与发展趋势研究[J]. 软件, 2020, 41(2): 113-118.
[10]王雪, 郭佳伟, 郝天琦, 等. 依托大数据、人工智能技术的医工科研平台创业项目研究[J]. 软件, 2019, 40(11): 49-51.