西南交通大学电气工程学院 铁俊波 朱俊星 黄 进 唐兰君
基于轮廓检测的眼睛定位方法
西南交通大学电气工程学院 铁俊波 朱俊星 黄 进 唐兰君
此文是西南交通大学2009年国家创新性实验计划项目研究成果,受全国大学生创新性实验计划项目资金资助,项目名称:人脸识别相关核心技术研究及系统实现,项目编号091061309
人脸识别是模式识别学科的一大研究热点,广泛地应用于保密系统、可视电话系统以及人机交互系统等领域。眼睛定位是人脸识别中一个重要的信息,本文根据人脸中眼睛的灰度及形状信息,提出了一种新的,基于轮廓检测的眼睛定位算法。实验结果表明此算法具有较好的准确性和可行性。
人脸识别 眼睛定位 算法
人脸识别在保密系统、可视电话系统以及人机交互系统等领域有着广泛的应用前景。
眼睛作为人脸的重要特征,在人脸检测和识别中都发挥着重要的作用。目前人脸识别常用方法大致分为基于几何特征、基于代数特征的识别和基本神经网络的识别方法。近年来,研究眼睛定位算法较多,主要有区域分割法、灰度投影法等,区域分割法首先对人脸的二值图像进行区域分割, 然后设定一系列经验值和支持函数定位眼睛; 灰度投影法对人脸图像进行水平和垂直方向的投影,根据波峰、波谷的分布信息来定位眼睛;边缘提取法首先对人脸图像进行边缘提取, 然后用霍夫变换检测眼球,构造一个眼部模板,用一系列函数从能量角度找出眼睛;统计学习法将人眼区域看作一类模式,使用大量不同条件下的人眼与非人眼样本, 借助统计分析理论和机器学习方法提取人眼共有的一些特征, 实现人眼检测。上述方法都取得了一定的成功,但普遍存在收敛速度慢、计算量大、定位不够准确等缺陷。
本算法根据眼睛的两大结构特征:①在人脸中具有对称性;②其灰度值集中在某个区域,提出了一种结合人脸中眼睛的灰度及面积信息的人眼定位新算法,并具体实现。
1. 滤除噪声
通过摄像头得到的图像中,一般含有一定的噪声,为了在后面的眼睛定位中得到更好的效果,在一开始,使用了canny滤波,滤除了一定的噪声。
2. 基于整个图像的灰度值对图像进行二值化
图像二值化的目的是使眼部区域凸显出来,而图像二值化处理的关键是阈值的选择,阈值选择的原则是选择和眼睛较为接近的灰度值,本文选择一种可变的阈值。
如果将整幅灰度图像的灰度值从大到小排成数列:
其中,“T-N,”代表最小的灰度值,“TN,”代表最大的灰度值,我们定义T0为整幅图的平均灰度值,则为