基于图像变换的递归式行人错检校验算法

2018-06-06 09:25杨大伟大连民族大学机电工程学院辽宁大连116605
大连民族大学学报 2018年3期
关键词:检测器校验行人

张 静,杨大伟,毛 琳(大连民族大学 机电工程学院,辽宁 大连 116605)

随着自动驾驶、智能辅助驾驶等技术的快速发展,对行人检测的需求也越来越大。在人车混行区域,除了行人运动目标外,还包含复杂多变的环境背景。行人目标姿态变化、杂乱背景等信息对行人目标检测算法造成不同程度的影响,导致出现偏离实际情况的行人目标框,降低了行人检测器的检测效率。给后续辅助驾驶系统和视频监控等应用造成混乱。降低检测时的错检率已经逐渐成为热点话题。

目前的行人检测方法,可大致分为基于运动特性、基于模板匹配以及基于统计学习的行人检测方法。基于统计学习的行人检测方法主要是以分析图片的描述特征信息为主要入手点,对特征信息分类,实现对图像中有无行人目标的判断。其中具有代表性的行人特征有Haar特征[1]、LBP特征[2]、HOG(Histogram of Oriented Gradient)[3]、SIFT[4]特征等,其中,HOG特征是目前广为使用的特征。对这些特征信息进行分类主要采用支持向量机(Support Vector Machine,SVM)、级联分类器以及极限学习机等分类算法。卷积神经网络(Convolutional Neural Networks,CNN)与传统HOG+SVM算法相结合[5]、优化核函数支持向量[6]以及改进的卷积神经网络[7]等行人检测方法,对算法进行优化,加强对待检测图片的分类识别功能。

为使行人检测器的检测效果更好,文献[8]对HOG特征实施降维处理后与LBP进行融合;文献[9]提出兼容像素信息和梯度信息的GSRLBP纹理特征提取方法。上述两种方法是对图像特征进行处理,提高特征本身的可辨识度。但对待检测图像特征的处理较为复杂,对算法种类的依赖性较高,通用性差。

本文提出一种基于图像变换的递归式行人错检校验算法(Recursive False Positive Check algorithm base on image transformation,RFPC)。在保持现有HOG特征行人检测器原有结构不变的基础上,将行人检测器的检测结果经图像变换后,作为行人检测器新的输入图像,将原有行人检测器构成一个递归式校验处理系统。为保证行人检测器能够重新处理前一次的检测结果,采用尺寸归一化、均衡和锐化三种图像变换方式,用以确保行人检测器能够不断递归校验新的输入内容。RFPC能够有效分辨出错误的检测结果,降低错检率。

1 RFPC原理

本文提出的RFPC算法以行人检测器作为递归式结构的基础,将输出结果经图像微小变换后,反馈至检测器作为输入,重复检测过程以达到错检校验的目的,使最终的输出结果趋于稳定合理。递归决策以同一个行人目标邻近两次检测结果的面积比例关系为依据,判断是否终止递归循环。算法逻辑图如图1。

图1 RFPC算法逻辑图

(1)

1.1 递归决策

递归式行人错检校验算法,充分利用“检测”这一基本功能,通过多次递归赋予“检测器”一个“校验者”的身份,对检测结果进行重新判断,减少图像中行人目标错检的发生。引入行人检测框模糊判决终止条件作为整个递归的决策控制,限制递归校验次数的同时,实现对检测结果准确校验。

图2 n≥2时递归工作状态

递归决策使用终止判决条件对整个递归错检校验结构进行控制,避免递归层次过多,增加计算复杂度。设输出目标F(n)中任一矩形框的像素高度和宽度分别为HF(n)和WF(n),则矩形框的像素面积计算公式为

SF(n)=HF(n)·WF(n),i=1,2,…,n。

(2)

定义递归相邻两层次的矩形框面积比值

(3)

引入标准Mamdani模型的模糊逻辑系统,将R作为输入模糊语言值,C作为输出模糊语言值,采用π型隶属函数:

(4)

式中:x为指定变量的论域范围;[ac]用以指定π型函数形式,输入输出均以像素为单位。

为了精确控制模糊模型,使用“绝对不是(AN)”“应该不是(SN)”“可能不是(MN)”“不确定(UN)”“可能是(MY)”“应该是(SY)”“绝对是(AY)”来调整输入和输出模糊语言变量集。上述输入和输出集合的相应模糊规则见表1。

表1 模糊控制规则

隶属度函数的设定与输入/输出关系曲线如图3。

递归模糊决策终止判决条件为:

(1)当C=1时,目标框经校验为行人,保留当前目标框。如图2中(A)-(A′)、(B)-(B′),检测器给出的检测结果确定是行人,该行人目标框应该予以保留。

(2)当C=-1时,目标框经校验为非行人目标,删除当前目标框。如图2中(C)-(C′),检测器的检测结果不属于完整行人,该行人目标框应该予以删除。

(3)当C∈(0,1)时,目标框内容不确定,需保留当前目标框,进入下一层次递归。

图3 隶属函数的设定与输入/输出曲线

1.2 图像变换模块

图像分辨率归一化实际上是一种对原始图像采用坐标变换的处理手段,以此改变原始图像尺寸,进而实现对行人检测器输入图像分辨率的改变,在保证校验质量的同时,实现对行人目标的验证;同时,为了能够更加有效地从图像获取所需信息,利用均衡处理对图像进行增强处理,增加数字图像的动态范围,提高对比度。图像较为明显的边缘或梯度信息是正确圈选行人目标的一个重要影响因素,而图像的锐化能够增加图像中像素信息的对比度,凸显图像中的边缘信息,适当的锐化可以滤除纹理等一些低频的细节干扰信息,使图像特征信息更加的清晰有效。

均衡锐化前后检测结果的对比如图4。

图4(a)为一幅输入图像(分辨率为375×500)直接进入检测器的输出结果,三个实线框为行人检测框,两个虚线框为错检结果;图4(b)为经过尺寸归一化(分辨率变为96×128)处理后的检测结果,两个行人检测框仍保留,其中一个错检框被剔除,这说明合理的尺寸变化能够去除错检结果;图4(c)为输入图像经过均衡、锐化处理后的结果,采用均衡处理,能够增强图像的动态范围,提高对比度,锐化处理则能提高图像中的聚焦程度,丰富图像细节信息,使图片内容突出化。微量改变输入图片的颜色、纹理等特征,有效地去除原图像中的重框和错检目标框,增加校验机制的有效性。

(a) (b) (c)

2 仿真分析

仿真实验在Matlab R2014a和Windows 7操作系统下进行测试。选用目前主流数据库中的INRIA数据库和实地拍摄图像进行测试。在进行实际仿真时,以实际检测出的目标检测框数量为参照,对比实际检测出的行人目标个数和校验后的个数,验证递归式行人错检校验算法的有效性。选用INRIA数据库进行测试,测试结果如图5。其中(a)、(b)、(c)为室外场景,(d)、(e)、(f)为室内场景。

与行人检测器本身的检测结果相比,RFPC算法能够有效去除冗余和错检的目标检测框。选用INRIA数据库中1 000张图片对上述的两种情况进行测试,行人检测算法检测后产生1 793个检测结果,其中包含了1 520个行人目标及273个错检目标。检测器本身的正确检测率达到84.7%,经RFPC算法后,正确检测率达到92.3%,提高了7.6%。

为进一步验证错检的去除效果,拍摄不同场景的室内外图片进行仿真,测试结果如图6。说明本文所提RFPC算法能够有效降低检测器的错检。

(a) (b) (c) (d) (e) (f)

(a) (b) (c) (d) (e) (f)

3 结 论

本文针对室内外复杂环境中,行人检测器经常出现错检的问题,提出RFPC算法,将原有行人检测器的检测结果输出作为新的输入,反馈至行人检测器进行重新检测,形成一种新的具有校验功能的检测机制。为确保此时待检测的输入图片区别于原始图片,新的输入图片在送入行人检测器前,经图像变换模块,增加图片内容的可识别性,实现错检去除的功能。经过INRIA数据库的测试,该算法将原行人检测算法的准确率由84.7%提高到92.3%,有效去除了由于复杂背景环境干扰造成的错检问题。该算法为移动机器人轨迹规划、行人目标检测等应用提供必要的实验依据。

参考文献:

[1] PAPAGEORGIOU C, POGGIO T. A trainable system for object detection[J]. International Journal of Computer Vision. 2000, 38(1): 15-33.

[2] DOLLAR P, WOJEK C, SCHIELE B, et al. Perona P. Pedestrian detection: A benchmark[C]. 2009: 304-311.

[3] DALAL N, TRIGGS B. Histograms of oriented gradients for human detection[C]. Computer Vision and Pattern Recognition, 2005 CVPR IEEE Computer Society Conference, 2005,881: 886-893.

[4] LOWE D G. Distinctive image features from scale-invariant keypoints[J]. International Journal of Computer Vision. 2004, 60(2): 91-110.

[5] 高琦煜, 方虎生. 多卷积特征融合的HOG行人检测算法[J]. 计算机科学,2017(b11): 199-201.

[6] 杨萌, 张葆, 宋玉龙.基于优化核函数支持向量机在行人检测中的应用[J]. 激光与光电子学进展, 2018:1-16.

[7] 谢林江, 季桂树, 彭清, 等. 改进的卷积神经网络在行人检测中的应用[J]. 计算机科学与探索,2017:1-10.

[8] 陈锐, 王敏, 陈肖. 基于PCA降维的HOG与LBP融合的行人检测[J]. 信息技术,2015(2): 101-105.

[9] 张阳. 结合纹理特征和深度学习的行人检测算法[J]. 辽宁工程技术大学学报,2016(2): 206-210.

猜你喜欢
检测器校验行人
毒舌出没,行人避让
路不为寻找者而设
炉温均匀性校验在铸锻企业的应用
我是行人
车道微波车辆检测器的应用
曝光闯红灯行人值得借鉴
一种雾霾检测器的研究与设计
大型电动机高阻抗差动保护稳定校验研究
基于加窗插值FFT的PMU校验方法
锅炉安全阀在线校验不确定度评定