柳露艳,王直杰
(东华大学 信息科学与技术学院,上海 201600)
目前交通事故中有相当一部分是由于司机疲劳驾驶所造成的,因此对驾驶员的疲劳状态进行检测,对减少由疲劳驾驶引发的交通事故,有着重要的现实意义。在疲劳驾驶检测中,对人眼高效、实时、准确的检测是其关键的步骤之一。到目前为止,人眼检测用到的方法主要有以下几种:基于模板匹配法、Hough变换法、灰度投影法、基于统计学习的方法和特种光源法。虽然这些方法在不同的场景下均取得了不错的效果,但由于眼睛在人脸所占比例不是很大,同时受到眉毛、眼镜框、眼睛大小、倾斜、光线等多种因素的影响,要精确的定位人眼不是一件容易的事情。本文提出一种改进的人眼定位算法,该算法的核心是基于顶点链码和离散格林[1]相结合的最小外接矩形算法,实验结果证明本文的该进算法可以有效的提高人眼检测的精度和速度。
由图1所示的本文的算法流程图可知,在进行人眼精确定位之前,要对图像进行人脸定位和人眼粗定位。本文选用YCbCr空间的肤色分割[2]和灰度积分投影相结合的算法来实现人脸定位和人眼粗定位。图像处理中最常用、最基础的颜色空间是RGB空间,摄像机采集的图像也是在RGB空间存储的。由RGB空间向YCbCr空间[3]的转换如式(1)所示:
图1 算法流程图Fig.1 Algorithm flowchart
转换好颜色空间之后,我们需要为肤色建立数学模型,从数学角度来推出阈值,根据此阈值将肤色和非肤色分离。本文采用了基于相似度的方法检测输入图像的肤色像素。定义 r=R/(R+G+B),b=B/(R+G+B), 这样就把三维的 RGB 降为二维。相似度的计算公式如式(2)所示:
在得到肤色区域后,本文利用垂直灰度投影和水平灰度投影,并结合人脸的几何特征[4]分别确定出人脸的左右边界和上下边界,依此定位出人脸区域;然后,对人脸区域进行水平灰度投影便能确定出人眼的大致搜索范围,从而实现了人眼的粗定位。本文在人眼精确定位部分,提出了一种利用顶点链码与离散格林理论相结合的快速提取目标图像的最小外接矩形算法,为了能将该算法较好的应用于人眼精确定位,本文根据实际应用需求提出了一系列约束条件。最后,将本文的算法与其他算法进行了比较,证明本文的算法在速度和准确度上都有很大的改进。
本文重点研究图1中的人眼精确定位。本文提出了一种顶点链码与离散格林理论相结合的最小外接矩形算法,并利用该算法改进了一种人眼精确定位方法,最终提高了人眼定位的速度和准确度。
图2 人眼定位效果图Fig.2 Effect drawings of eye coarse location
顶点链码[5]就是沿着图像边界像素的顶点行走一周,依次记录图像边界像素顶点的代码。图像f(x,y)的像素顶点矩阵 M 为像素顶点(u,v)的链码值 g(u,v)所构造成的(w+2)×(h+2)矩阵。本算法在获取图像顶点矩阵[6]的基础上同时获取了图像的边界坐标链和行走方向链,然后,通过将目标曲面积分转变为目标曲线积分的方式减少了求取目标图像的形心、面积、图像主轴的计算量,从而大大提高了下文中人眼精确定位的速度。设图像大小为H×W,顶点矩阵为M;第i个顶点的行走方向为∈{0,1,2,3},顶点码值 ci∈{6,l,2,3},凸链存放凸点的坐标值。 假设当前顶点 Pi(xi,yi),在 Pi的行走方向为,下一顶点Pi+1的编码为Ci+1,行走方向变化规则为:
方向链的坐标迁移规则如为:
根据离散格林,在垂直方向即Direction=l,Direction=3上有:
目标图像的主轴为:
其中,u11=M11-y×M10,u20=M20-x×M10,u02=M02-y×M01;α 为主轴与X轴所成的方向角。
在本文中我们以形心为坐标原点,围绕主轴旋转X轴,旋转大小为方向角α,则新旧坐标系的转换关系为:
图3 求取MER的算法流程图Fig.3 Algorithm flowchart of calculating the MER
本文通过分析统计样本和训练样本,给出了能够精确定位人眼的约束条件,并在VS2008上仿真实现。通过分析眼睛的候选区域我们可以发现,定位眼睛的主要干扰项来自于与眼睛位置接近的眉毛区域,对于戴眼镜的个体还需要区分眼镜边框。为剔除眼睛边框和眉毛区域,精确定位人眼,本文根本人脸面部的几何特征进行样本训练[7],制定出以下约束规则:
1)眼睛形心在人脸图像中的位置范围:
横坐 标:0.15~0.82 W (W 为 图 片 的 宽 度 ), 纵 坐 标 :20.284~/2(H 为图片的高度)
2)眼睛最小外接矩形所含像素的个数:5~724;
3)眼睛最小外接矩形的宽高比:0.95~7.24;
4)眼睛最小外接矩形的面积:13~1 100;
5)眼睛的宽度应小于所在候选人脸区域宽度的1/3;
6)在满足以上条件下,若两个最小外接矩形满足:形心横坐标之差<14,纵坐标之差>0.077 L,则这两个矩形中纵坐标较小的为眉毛区域需剔除。
其中,图4中的8副图分别为不戴眼镜时人正脸、侧脸、旋转、低头和戴眼镜的情况下人正脸、侧脸、旋转和低头时的检测情况。实验结果显示,本算法对于头部有一定偏转和侧移的情况也有较好的识别效果。
图4 人眼精确定位效果图Fig.4 Effect drawings of eye precise location
测试在自用PC机上,采用 C++语言编程并用VS2008仿真实现。表1为本文在ORL数据库和自建人脸数据库的180副人脸图像中对以往的算法(表中称算法1)和文中采用的算法(表中称算法2)进行人眼检测测试的测试结果对比。
表1 不同算法人脸识别率和计算速度的对比Tab.1 Comparisons of average recognition rate and calculation speed of different methods
图5 ORL数据库和自建人脸库的部分图像Fig.5 Partial images of ORL library and self built database
人眼定位是构建疲劳驾驶检测系统的前提条件。为了提取有用的人眼状态信息,经常要求能够精确的定位人眼。本文在传统人脸识别YCbCr模型基础上,进行了由粗到精的两次人眼定位,并提出了一种基于最小外接矩形的快速人眼定位算法。虽然只是在最小外接矩形人眼定位方法的基础上,进行了一个小的改进,但是实验表明,该方法有效的提高了图像处理的速度,并且在戴眼镜的情况下也有很好的定位效果,可以实时准确地定位人眼。
[1]Brlek S,Labelie G,Lacasse A.The discrete green theorem and some applications in discrete geometry[J].Theoretical Computer Science,2005,346(2):200-225.
[2]唐立峰,何东健.基于肤色分割的人脸检测算法研究[J].计算机工程与设计,2009,30(19):4461-4464.TANG Li-feng,HE Dong-jian.Research on face detection algorithm based on complexional segmentation[J].Computer engineering and design,2009,30(19):4461-4464.
[3]何庆楠,张雪峰.一种基于YCbCr色彩空间的人脸检测方法[J].软件导刊,2011(10):162-164.HE Qing-nan,ZHANG Xue-feng.Research on face detection technology based on YCbCr color space[J].Software guide,2011(10):162-164.
[4]张强.基于几何特征的目标识别及跟踪技术的研究[D].长春:长春理工大学,2008.
[5]陈优广.边界跟踪、区域填充及链码的应用研究[D].上海:华东师范大学,2006.
[6]Bribiesca E.A new chain code[J].Pattern Recognition,1999(32):235-251.
[7]杨环.人脸检测及人眼定位算法的研究[D].山东:山东大学,2010.YANG Huan.Research on face detection and eye location algorithm[D].Shandong:Shandong University,2010.
[8]袁佐云.基于最小外接矩形的稻米粒型检测方法[J].粮食与饲料工业,2006(9):7-8.YUAN Zuo-yi.A study on inspection of rice kernel with minimum enclosing rectangle method[J].Cereal and Feed Industry,2006(9):7-8.
[9]李太白,唐万梅.一种改进的SVM多类分类算法在入侵检测中的应用[J].重庆师范大学学报:自然科学版,2012(5):63-66.LI Tai-bai,TANG Wang-mei.An improved multi-class SVM classification algorithm in intrusion detection[J].Journal of Chongqing Normal University:Natural Science,2012 (5):63-66.