张溪樾
(哈尔滨市第九中学,黑龙江哈尔滨,150028)
行人检测( Pedestrian Detection)是指在道路旁的监控仪器、或是在行驶的汽车上建立一个智能系统,利用计算机视觉技术判断图片或是视频中是否存在行人,若存在,则返回行人的位置和大小。该技术被广泛应用于车辆辅助驾驶、智能视频监控、智能交通、人体行为分析等领域,对提高驾驶的安全性、保障生命安全,具有重要意义。
行人检测中存在的难点主要有以下几点:(1)个体差异性。(2)道路交通工具的遮挡以及行人的重叠。(3)背景。(4)成像条件。光照条件和成像设备等影响。因此,行人检测成为了计算机视觉领域中一个既具有研究价值同时又极具挑战性的热门课题。
行人检测算法可以分为背景建模算法和统计学习算法两类。其中,背景建模算法是利用图像与背景的差异来提取目标,该算法鲁棒性比较差。而统计学习法包括了神经网络、支持向量机(SVM)和Adaboost算法,将行人作为正样本进行分类器训练。该类算法鲁棒性较好。
因此,本文系统地分析了Adaboost弱分类器和强分类器的迭代,描述了Haar特征的提取和积分图的计算方法,最后给出了Adaboost分类器的训练过程和完整分类流程,并总结了该算法的优缺点。
AdaBoost是迭代算法。它的原理是利用一个训练样本进行特征提取,从而训练出各个不同的弱分类器,然后将这些弱分类器组合成一个能力很强的强分类器。具体流程:
(1)初始化每一个训练样本的权值
(2)迭代,其中m= 1,2 ……M表示迭代次数
a.得到基本分类器
b.计算分类误差
c.计算Gm在最终的强分类器当中的权值mα
d.重新更新训练样本的权值分布,用于下一轮迭代:
其中,
(3)组合成为强分类器
行人的分辨率比较低,无法提取出精确的外观特征,所以我们使用四个对称的矩形特征,和扩充的四个非对称的矩形特征,来表示行人的这些特征。如图1中所显示的这些特征,我们称之为Haar-like特征。
图1 行人的矩形特征
我们利用Haar特征进行分类器训练。将得到的强分类器进行尺度的改变以用来适应不同大小的检测图片。Haar特征池所包含的特征总数通常来说是非常大的。
Haar特征池的总数通常来说是非常大的。我们引入积分图的概念,从而减少计算量,提高运行速度。
积分图的定义为:
I(x,,y,)为图像中坐标为(x,,y,)的像素点的灰度值。
那么,图像I的积分图可以用下式计算:
这样,图像中任意矩形框当中的像素值之和就可以由积分图像迅速地计算出来,具体计算方法如图2所示。
图2 利用积分图计算矩形框内像素值之和
1.4.1 弱分类器
AdaBoost算法当中的每一个弱分类器都是由一个Haar矩形特征构成的。对于弱分类器当中的特征,表达为:
其中,pj=±1 ,代表着不等式的方向。fi(x)代表x图像中第j个特征的特征值。θj为阈值。
其中,N1为行人个数,N2为非行人个数,m1为当前特征在所有行人当中的平均特征值,m2为当前特征在所有非行人当中的平均特征值。
1.4.2 强分类器
若干个强分类器级联构成了最终使用的级联分类器。具体级联如图3所示。
1.4.3 训练过程
具体流程:
图3 级联分类器结构
(2)权值初始化
(3)迭代
a.归一化权值
其中t表示某个特征,j表示样本数。
b.计算分类器误差
其中ih为只是用某个单一特征的分类器。
c.选择分类器,并更新权值留作下一个迭代中使用
其中,xt分类正确的话,vt取值0,否则取值1。
d.直到t等于特征数T。
(4)强分类器计算:
其中
行人检测具体流程如图4所示。
在预处理阶段,一个辅助图像Ii,被称作从原始图像I0计算得来的积分图像或区域求和表,可以提高计算速度。之后,对于每个候选的窗口w,我们将其所有位置和尺度送入一个级联分类器。在每个阶段,分类器响应h(w)是一系列的特性的总和的反映。
图4 完整AdaBoost流程图
fj(w) 是第j个Haar特征值,αj1和αj2是特征权重系数。如果h(w)小于阈值t,那么候选窗口w被认为没有行人,被丢掉,否则被送入下一个分类器。在最后一步,行人的多个检测被非极大值抑制进行修理。
随着社会公共安全的必要性进一步凸显,行人检测已逐渐成为公共场所的紧要功能。本文详细分析了行人检测的应用领域以及行人检测目前面临的难点。选取了Adaboost算法进行具体分析。包括了弱分类器的构建、强分类器的级联、Haar特征的选取以及积分图的运用。并且给出了分类器训练和行人检测两部分的完整流程。
就算法而言,虽然AdaBoost算法的准确性和适应性能比较好,但是真正面对光照强度不同、衣着、身形不同的行人,其检测的正确性确实会有所影响。那么就需要对Haar特征进行改进,使其更加符合行人的鉴别。就训练分类器而言,面对特定环境下的行人检测,我们可以选取该环境图片作为负样本,提高检测的正确性。