HOGG:基于Gabor变换与HOG特征的人体检测*

2016-12-02 09:35:12范国娟范国卿柳絮青
网络安全与数据管理 2016年21期
关键词:直方图尺度人体

范国娟,范国卿,柳絮青

(1.山东传媒职业学院,山东 济南 250200;2.丝路卫星通信有限公司,江苏 南京 210012;3.江南大学,江苏 无锡 214122)



HOGG:基于Gabor变换与HOG特征的人体检测*

范国娟1,范国卿2,柳絮青3

(1.山东传媒职业学院,山东 济南 250200;2.丝路卫星通信有限公司,江苏 南京 210012;3.江南大学,江苏 无锡 214122)

针对实际监控中人体目标轮廓的多尺度特性,提出一种用于人体目标检测的多尺度方向特征描述子(HOGG)。首先采用Gabor滤波器提取人体图像对应不同尺度、不同方向的多个Gabor幅值域图谱,然后将相同尺度不同方向的幅值域图谱融合以降低特征维数,并对每幅融合图像提取梯度方向直方图(HOG)特征,最后将这些HOG特征联合起来作为人体图像表征。利用支持向量机(SVM)对描述特征进行分类,在CAVIAR数据库中进行了实验,结果表明,该算法对人体目标检测具有较好的性能。

人体检测;Gabor变换;分块直方图;多尺度

0 引言

人体检测被广泛地用于计算机视觉领域,如公共安全、智能机器人、视觉监控、行为分析等[1]。目前人体检测多采用基于统计分类的方法,常用Gabor小波变换和Haar小波变换提取人体特征。DALAL N[2]等人提出梯度直方图(Histograms of Oriented Gradient,HOG),利用图像块内的方向统计进行人体检测,对解决局部形变与视角变化等问题,该检测算法具有较高的精度。Mu Yadong[3]等人将局部二值模式(Local Binary Patterns,LBP)作为人体特征描述算子,具有旋转不变性和光照不变性,是一种有效的描述特征。Wang Xiaoyu[4]等人提出了HOG与LBP相结合的算法,达到两种特征互补的效果,对解决人体检测中部分遮挡问题有显著的提高。

上述轮廓特征一般都是在固定尺度上计算,没有考虑实际监控中复杂背景下人体目标轮廓的多尺度特性,当这些算法应用到真实场景中时,其性能会急剧下降。本文提出一种Gabor变换与HOG特征相结合的人体检测算法(简称HOGG),利用Gabor变换多方向多尺度的特性,增强了人体的轮廓信息。该方法首先对图像进行规一化处理,然后使用Gabor滤波器提取图像多尺度、多方向的幅值域图谱,并将同尺度不同方向幅值域图谱融合以降低特征维数,最后按顺序提取各个尺度上融合图谱的HOG特征,串接组成整幅图像的描述特征。在CAVIAR数据库下的大量实验表明,该方法能较好地提取人体描述特征,有较高的检测率。

1 Gabor特征提取

在提取人体Gabor特征之前需要对图像进行规一化处理,本文实验中所用人体图像为灰度图像,大小为32×64像素。为了获取多尺度的Gabor特征,选取5个尺度和8个方向的Gabor滤波器组,则一幅人体图像的多尺度、多方向特征表示为:

{Gu,v(z) :(u=0,1,…,7),(v=0,1,…,4)}

(1)

通过Gabor变换后,每幅图像会转化成40个不同尺度与方向的图像,特征维数为原图像的40倍,造成特征数据冗余,增加了计算的复杂度。本文将Gabor特征同一尺度不同方向的特征进行融合,有效地降低了Gabor特征间的数据冗余,保持了有效的决策信息,并可以对人体图像进行多尺度分析。

2 HOGG描述子

本文对融合图像进一步提取HOG特征,并将其联合起来作为人体图像的HOGG表征。HOGG的构建过程主要分为以下几个步骤:

(1)计算梯度幅值和方向

利用一阶模板算子(-1,0,1)分别从横向和纵向对融合图像进行梯度提取操作,求得融合图像的梯度图像。

(2)构建梯度方向直方图

把梯度图像分成同等大小的正方形小块(block),这些小块是相互重叠的并且每个小块被分为更小的正方形单元(cell,n×n像素)。利用梯度幅值和梯度方向在每个单元中进行直方图投票,其中梯度方向作为直方图投票区间,而梯度幅值作为直方图投票权重,这样对于每个小块(block)都能得到一个维度为m×m×b的直方图向量。

(3)梯度强度归一化

以block为单位进行L2-norm标准化,减少局部光照以及前景、背景对比度的变化对直方图特征的影响。设vn是对应的block向量,则标准化的向量fn为:

(2)

其中:ξ为接近0的正数。

(4)形成特征向量

把一幅融合图像的所有块中的HOG特征连接起来就得到了该融合图像的HOG特征。再将各尺度融合图像的HOG顺接起来作为一幅人体图像的HOGG描述子。

3 实验分析

3.1 实验环境与数据库

在Core(TM)2.00 GHz的CPU,2.00 GB内存,Windows下MATLAB R2010a的计算机上进行仿真实验。实验采用MIT和INRIA数据库作为训练集,包括1 126个正样本与1 218个负样本;采用CAVIAR[5]数据库作为测试集。

3.2 实验步骤

本文采用滑动窗口方式获取检测窗口,用HOGG描述子对检测窗口进行描述,再利用支持向量机[6]进行判别。由于在检测过程中,对同一个人体进行多重检测会直接导致计算效率下降。为此,本文将检测窗口从大到小进行遍历。在遍历过程中,如果待测区域已经被标记为人体,则跳过该区域。

3.3 实验结果与分析

Gabor能对图像进行多尺度、多方向的分解,实验首先研究不同尺度数对检测算法的影响。从CAVIAR四个序列中各随机选取200张图片作为测试集。实验结果如表1所示。

表1 不同尺度数下的人体检测结果

实验中采用综合评价指标(F1-measure,F)[7]评估算法的性能,其中:precision为准确率,recall为查全率;tp表示被正确检测人数,fp表示错误检测的人数,fn表示漏检的人数。

由于不同尺度子带间冗余信息较大,简单地增加尺度数不一定能提高性能,由表1可以看出,取尺度数为4效果最佳。

为了进一步验证本文提出的算法,选取Gabor尺度为4,在CAVIAR行人数据库上提取HOGG特征,参照文献[4]与HOG、LBP+HOG算法做了对比实验,如表2所示。

表2 CAVIAR数据库中不同算法的结果

从图1可以看出,本文算法的F-measure优于当前其他方法,具有较好的性能,证明了HOGG方法的有效性。

图1 算法比较

4 结论

本文提出了一种基于Gabor变换和HOG的人体目标检测的新特征表达,可以多层次、多分辨率地表征人体目标。在CAVIAR数据库中的实验数据表明,Gabor多尺度的变换能够增强HOG算子对人体纹理细节特征和全局特征的表示能力,有效地提高了人体检测的性能。

[1] HARITAOGLU I,HARWOOD D,DAVIS L S. W4:real-time surveillance of people and their activities [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,(S0162-8828),2000,22(8) : 809-830.

[2] DALAL N, TRIGGS B. Histograms of oriented gradients for human detection [C]. In: IEEE Computer Society Conference on Computer Vision and Pattern Recognition,CVPR IEEE 2005:886-893.

[3] Mu Yadong,Yan Shuicheng, Liu Yi,et al. Discriminative local binary patterns for human detection in personal album [C]. Computer Vision and Pattern Recognition,Anchorage,AK,2008:1-8.

[4] Wang Xiaoyu,HAN T X,Yan Shuicheng. An HOG-LBP human detector with partial occlusion handling [C]. Computer Vision, Kyoto,2009:32-39.

[5] CAVIAR. Benchmark Data [EB/OL].[2016-07-01]. http://homepages.inf.ed.ac.uk/rbf/CAVIAR/.

[6] KIM S K,PARK Y J,TOH K A, et al. SVM-based feature extraction for face recognition [J]. Pattern Recognition,2010,43(8): 2871-2881.

[7] bluepoint2009. 准确率(Precision)、召回率(Recall)以及综合评价指标(F1-Measure)[EB/OL].(2012-09-18)[2015-06-21].http://www.cnblogs.com/bluepoint2009/archive/2012/09/18/precision-recall-f_measures.html.

HOGG: Gabor and HOG-based human detection

Fan Guojuan1,Fan Guoqing2,Liu Xuqing3

(1.Shandong Communication and Media College, Ji’nan 250200, China;2.SilkRoad Satellite Communications Co., Ltd., Nanjing 210012, China; 3.Jiangnan University, Wuxi 214122, China)

Aiming at the multi-scale characteristic of human body in visual surveillance, the multi-scale orientation features (HOGG) for pedestrian detection are put forward in this paper. Firstly, the multi-orientation information corresponding to human body image are extracted, and then fusing the original Gabor features of the same scale in different directions into a single feature in order to reduce the dimension of the features. Then histograms of oriented gradients of each fused image is extracted and combined as human image features. Support vector machine (SVM) is adopted to sort the features, and experimental results on CAVIAR database show that the proposed method has a better performance for human body target detection.

human detection; Gabor transform; block histogram; multi-scale

山东省高等学校科技计划项目(J15LN53)

TP277

A

10.19358/j.issn.1674- 7720.2016.21.004

范国娟,范国卿,柳絮青. HOGG:基于Gabor变换与HOG特征的人体检测[J].微型机与应用,2016,35(21):14-15,19.

2016-07-04)

范国娟(1974-),通信作者,女,硕士,副教授,主要研究方向:模式识别,数字图像处理。E-mail: fgjmqs@163.com。

范国卿(1989-),男,硕士,主要研究方向:数据处理。

柳絮青(1989-),男,硕士,主要研究方向:模式识别与智能系统。

猜你喜欢
直方图尺度人体
统计频率分布直方图的备考全攻略
高中数理化(2024年1期)2024-03-02 17:52:40
符合差分隐私的流数据统计直方图发布
人体“修补匠”
人体冷知识(一)
排便顺畅,人体无毒一身轻
基层中医药(2021年5期)2021-07-31 07:58:34
财产的五大尺度和五重应对
用直方图控制画面影调
奇妙的人体止咳点
特别健康(2018年3期)2018-07-04 00:40:10
宇宙的尺度
太空探索(2016年5期)2016-07-12 15:17:55
基于直方图平移和互补嵌入的可逆水印方案
计算机工程(2015年8期)2015-07-03 12:20:21