王秀丽++韩怀阳
摘 要:基于人眼状态检测机动车驾驶员疲劳状态是一种具有可操作性强的检测方式,该技术关键在于判断睁眼状态,常用技术有Hough查找圆法、模板匹配法以及灰度投影法。根据人眼外形特点,基于椭圆拟合的人眼状态分析结果符合人眼真实状态。检测人眼状态后,还需要利用Perclos判断眨眼频率,最后根据设定的疲劳状态评价标准评价驾驶员的品老状况。
关键词:人眼状态 疲劳检测 识别技术
中图分类号:TP274.4 文獻标识码:A 文章编号:1672-3791(2016)10(b)-0168-03
为减少疲劳驾驶引发的交通事故,研究人员对驾驶员疲劳状态监测技术作了大量研究,并且部分研究得到实践应用。当前疲劳状态监测技术主要分为基于眼部特征和非眼部特征两类,基于非眼部特征的疲劳状态检测技术需要将检测设备与人体直连,该方式容易影响驾驶员的操作,不适合实际应用[1]。基于人眼状态特征检测疲劳属于非接触式识别技术,该技术不仅也可以实时识别驾驶员的疲劳状态,并且不影响驾驶员的行车操作,具有更强的操作性和适用性。
1 人眼状态识别方法
1.1 Hough查找圆
Hough查找圆检测方法主要根据人眼虹膜状况进行判断。睁眼状态下,眼区内可见虹膜,也可被检测到圆。眼睛闭合状态下,虹膜被眼睑遮挡,只能检测圆的一部分或无法检测到圆。该技术虽然可用于判断眼睛开闭情况,但是也存在巨大缺陷。首先,该方式在检测睁眼状态的效果较好,并且虹膜信息应比较完善,对图像的分辨率要求也更高。此外,对人眼虹膜要求也更高,如眼区域较大且清晰。但是图像采集视为USB摄像头,图像文本分辨率为640×480,分辨率无法满足要求,系统也难以获得完整的虹膜轮廓[2]。此外,获取眼部虹膜轮廓图像后,系统需要将数据放于高维参数空间处理,数据计算量更大且缺乏实效性,因而该技术不适用于实时监测驾驶员的疲劳状态。
1.2 模板匹配法
模板匹配法是指对比位置眼睛与眼睛模板的相似度,根据相似度结果进行评价。在该技术中需要设定固定人眼状态模板,收集眼睛状态信息后,系统将信息与模板信息进行比对。但是人眼开闭合情况存在显著差异,容易导致对比结果存在较大误差。例如:单眼皮和双眼皮、大眼睛和小眼睛,单眼皮、小眼睛人群的上下眼睑距离小,其睁眼状态与双眼皮、大眼睛人群的闭眼状态难以区分。
1.3 水平灰度投影法
该方法主要根据眼睛开、闭状态下的水平灰度投影特征识别眼睛状态。睁眼时,眼睑位于瞳孔上方,水平灰度投影在瞳孔位置形成低谷,且投影图低谷区域范围较广。闭眼时,水平灰度投影的低谷宽度狭窄。根据水平灰度投影的低谷宽度识别眼睛状态。该识别方法对图像分辨率要求较高,因而检测结果受光照条件影响较大。采集眼部图像后,需要先进行去噪处理,使用邻域平均处理投影曲线,定量确定谷底宽度。否则,谷底图像不明确,或出现多个谷底,导致错误识别人眼状态。
2 基于椭圆拟合的人眼状态分析
从以上3种人眼状态识别方法可以看出,任何识别方法都存在优点和缺陷,并且识别效率和识别质量属于负相关,提高识别效率容易导致检测结果准确性下降,增加误检情况。基于以上3种检测方法的优点和缺点,研究大多从综合角度入手,改进或融合多个检测方式。眼睛轮廓与椭圆相似,可利用椭圆相关参数描述人眼状态。Hough变换和最小二乘法是椭圆拟合常用方法,其中最小二乘法可用于复杂对象模型,且拟合度更高。
2.1 基于最小二乘法的椭圆拟合
基于最小二乘法的椭圆拟合是指计算边缘点到理想拟合椭圆距离的平方和的最小值确定拟合参数。平面内椭圆曲线可描述为:
Ax2+Bxy+Cy2+Dx+Ey+F=0 (1)
假设α=(A,B,C,D,E,F ),X=(x2,xy,y 2,x,y,1),则椭圆方程可表示为:
F (α,x)=α·x=0 (2)
设,为拟合点i坐标。点到拟合椭圆代数距离平方和为:
E (α)=2 (3)
最小二乘法进行椭圆拟合是指将根据参数α使拟合点与拟合椭圆的偏差平方达到最小:
=argmin{} (4)
根据椭圆性质,椭圆等式中参数α需要符合要求:
B 2-4AC>0 (5)
由于在不等式约束条件求解过程难度较大,为简化计算,按照固定比例缩放参数不影响结果,因而可将椭圆参数α的不等式约束条件表示等式约束条件:
B 2-4AC=1 (6)
使用约束条件使椭圆存在唯一解,再构建矩阵,使矩阵满等式
E (α)=(Aα)T(Aα)=αT(ATA)α=αTDα (7)
可将约束条件等式(5)表示为:
αTCα=1 (8)
最终等式(4)和等式(6)的约束条件问题转化为等式(8)约束条件下求解等式(7)的条件极值问题,并可求解获得
Dα=λCα (9)
ΑTCα=1 (10)
等式(9)可求得广义特征值及特征向量,(λi,αi),对于任意常量ki,(λi,kiαi)为等式(10)的解,带入等式(10)可求得ki=,即=ki。根据国外研究,该等式有且仅有一组特征值大于0。
2.2 人眼状态识别
椭圆拟合处理人眼轮廓后,可以将椭圆拟合参数作为人眼轮廓信息。根据最小二乘法进行椭圆拟合计算后,可分别求得椭圆长轴a和短轴b的长度:
a=,b=
θ=(θ为长轴相对水平坐标的偏转角)
由于数据属于拟合计算结果,因而长轴和短轴数据为图像只存,而非人眼上下眼睑真实间距。另外,驾驶员与摄像头距离、头部转动都可能导致短轴长度低于闭眼,因而不能直接将b值作为判断标志,而需计算其长轴和短轴比值,pe=。国内研究人员发现,当pe>0.24,眼睛处于睁开状态,否则眼睛处于闭合或半闭合状态,可判定驾驶员处于疲劳状态。并且该研究显示睁眼状态、半睁眼状态和闭合状态检测准确率分别为91.6%、84.2%、90.5%。实验结果表明基于椭圆拟合的人眼状态识别方法的效果显著,但实验效果受环境影响较大。光线条件较好情况可获取清晰的眼部图片,识别准确率高。如若眼部图片分辨率或清晰度较低,闭眼状态识别效果不佳,并且半睁开和闭合状态判断存在较大的主观性,误差率高。
3 基于PERCLOS和眨眼频率的识别技术
3.1 PERCLOS检测原理
计算PERCLOS后,根据系统设定的阈值判断疲劳状态。判断原理见图1。实际测量方式分为3种:(1)P70。是指眼皮盖过眼球面积超过70%所占时间比;(2)P80。眼皮蓋过眼球表面积超过80%的所占时间比;(3)Em。眼皮盖过眼球面积超过50%所占时间比。以P70为例,该原则设两个眼睛张开程度阈值:P1和P2,如若数数据低于P2,表示眼睛处于闭合状态。根据原理分别测量t 1、t 2、t 3、t 4,并根据P1和P2公式计算占比:f=,t1和t2分别为针眼最大位置达到阈值P1、P2所需时间;t3和t4分别为针眼达到阈值P2和再次达到阈值P1所需时间。使用PERCLOS检测驾驶员疲劳状态需要获取驾驶员脸部图像,再分析眼部状态,测量PERCLOS值,判断驾驶员是否处于疲劳状态。
3.2 疲劳驾驶测量
为方便计算,眼睛闭合帧数占总帧数比值作为PERCLOS值,即PERCLOS=×100%。n和N分别为人眼闭合帧数和图片总帧数。根据PERCLOS原理,疲劳状态下而人眼眨眼时速度慢,时间长,再设定眨眼时间阈值作为评价标准。
绝大多数人在不同状态下的眨眼时间存在明显差异,一般情况下单次闭眼时间为0.2~0.3 s,而疲劳状态下单次闭眼时间有所增加,且通常超过0.5 s。如若单次闭眼时间超过0.5 s,可判断驾驶员处于疲劳状态。但是眨眼次数变慢可能因驾驶员走神引起,如驾驶员目光呆滞且眼睛处于张开状态;如若眨眼次数降低由驾驶员疲劳引起,可通过计算单位时间内闭眼状态帧数的判断,即根据PERCLOS原理判断;如若由第二种原因引起,PERCLOS原理计算结果会出现PERCLOS值偏小问题;如若系统判定驾驶员眨眼频率过低,表明驾驶员眼睛也处于异常状态,也应提高注意力。
目前多数研究显示,根据PERCLOS值检测疲劳状态使,疲劳状态阈值可取40%,再计算单位时间内PERCLOS值即可检测并判断驾驶员状态。如若PERCLOS超过40%,提示驾驶员可能处于疲劳状态;如若PERCLOS未超过40%,需要结合眨眼频率进行判断;如若眨眼频率不超过5次/min,则认为驾驶员处于走神状态。具体检测过程见图2。
第一步,识别人眼状态,并将睁眼和闭眼分别用“+1”“-1”表示,驾驶员眼睛状态为“+1”“-1”的时间序列,系统自动保存人员状态序列,用于计算眨眼次数和眨眼频率。
第二步,计算PERCLOS值。以30 s为间隔,计算单位间隔时间内闭眼帧数及眨眼帧数,PERCLOS值为“-1”出现次数,眨眼次数为“+1”变为“-1”次数。由于处理单位时间内每一帧的工作量极大,因而挨次用隔帧抓取方式,每秒抓取15张图片。
第三步,结合PERCLOS值和眨眼频率判断疲劳状态。PERCLOS>40%表示疲劳;PERCLOS≤40%且眨眼频率未超过5次/min为疲劳状态。
4 结语
相比较而言,基于椭圆拟合的人眼状态分析技术以及根据PERCLOS眨眼频率判断疲劳状态具有较高的准确率。但是驾驶人员的视觉特性受许多因素影响,如,年龄、经验、道路环境、车速等,都对驾驶员的视觉行为带来不同程度的影响。虽然存该技术有许多不完善之处,但是随着研究不断深入,驾驶员眼部特征及其研究成果必然在道路安全领域得到广泛应用。
参考文献
[1] 蒋建国,王雷,齐美彬,等.基于眼睛状态检测的驾驶员疲劳驾驶分析[J].合肥工业大学学报:自然科学版,2015(2):175-180.
[2] 吴政南.基于人眼特征的驾驶员疲劳检测方法分析[J].电子世界,2014(14):369-370.