◎丁思源
基于NAO机器人的面部和语音识别
◎丁思源
人造智能在1955年首次被人们所认识,是一个历史悠久,前景辉煌的学科。 21世纪,由于计算机运算能力的提高,人工智能得到了长足的发展。 由于目前声音识别技术已经比较成熟,本文将重点研究NAO人脸识别的能力,特别是身份识别的能力。
人工智能有很长的历史,涉及到很多学科。 面部识别和声音识别是在其发展过程中发明的。 图1显示了人工智能演变的简单历史。
面部识别:图像识别是人工智能的主要研究领域之一。 它可以分为两部分:2D和3D。
图像的常规空间单位是RDB,HSV和YUV。 捕捉图像的常见方式是通过相机,这意味着图像的质量很大程度上取决于镜头和传感器的质量。 而且,捕获二维图像和三维图像最重要的区别之一就是镜头的数量:两个镜头水平放置,以获得两个二维图像,这可以用来计算目标物体的纹理,结构。同样,捕获的方向和角度越多,最终的3D图像就越精确。
图1 人工智能开始进入第四次发展浪潮
表1
人脸识别是图像识别的一个分支,已经可以通过计算两个二维图像之间的相似度来实现。 然而,由于人们可以使用图像而不是真实的人脸进行识别(这是人脸识别的最重要和最有用的应用),所以需要用于区分图像和人脸的技术,这导致了3D面部识别。在创建这个思想的时候,计算机缺乏支持包含人脸所有特征点的基础数据的能力。 因此,这个思想才刚刚被重新考虑,因为计算机的计数能力有了很大的发展。
为了更好地理解人脸识别的进展和存在的问题,我将NAO机器人用于捕获图像的实验对象,并将其带回计算机进行计算.NAO机器人支持C ++和Python实例。为了验证NAO的身份识别能力和分析能力,我在其官方网站上采用了编码实例。
算法主要用于:
ALFaceDetection/
ALVideoDevice/
ALVisionRecognition/
实验:(见表1)
通过对NAO机器人的实验表明,Python的声音识别和1:1面部识别已经成熟,可以正确识别我和我的脸部信息,而基础数据只包含我的脸部图像。 然而,所有这些失败的例子都带来了成功识别身份的重要因素:成功识别的可能性在很大程度上取决于互联网与机器人之间的连接程度有多强,这造成了相对不稳定的工作过程。
武汉外国语学校)