雷永俊
【摘 要】基于计算机视觉的行人检测,由于其在智能视频监控系统、车辆辅助驾驶系统、以及智能机器人等方面的广泛应用,成为当前计算机视觉中最为活跃的研究课题。对行人检测相关专利的发展历程进行了回顾,结合专利申请的现状分析了行人检测的主要技术,并简要分析了行人检测技术的发展趋势。
【关键词】行人检测;计算机视觉
【中图分类号】TP391.4 【文献标志码】A
一、行人检测相关专利发展历程
计算机视觉中的行人检测技术,通俗来讲,是指对于给定的图片或视频帧,计算机判断出图片或视频帧中是否包含行人,如果包含行人,给出行人的位置信息。行人检测技术广泛地应用于智能视频监控系统,车辆辅助驾驶系统,智能机器人,人体行为分析等领域。由于行人具有多样性,如人体姿态各异、着装多样变化,同时场景具有多样性,如天气和光线变化、景物遮挡等,使得行人检测技术成为计算机视觉领域中的一个研究热点和研究难点。
行人检测技术的发展经历了早期发展阶段和快速发展阶段。最早的行人检测专利是US3462692(公开于1969年)公开的一种行人检测系统,其也可以检测物体,该系统包括感觉器,振荡器,一个平衡电容桥,补偿控制电路等,其中感觉器是一个导电平板,其通过行人或者物体处于导电平板上,与地面之间形成的电容值导致平衡电容桥不平衡来检测行人或者物体的存在。JPH10247297A(公开于1998年)公开一种行人检测器,其通过一对相机采集斑马线区域的图像并输出图像信号,处理单元将所述图像信号进行傅立叶变换,通过对傅立叶变换后的扩展频谱检测确定行人是否存在。这些专利可以视为早期的行人检测,特别是JPH10247297A,已经具备了计算机视觉中行人检测技术的雏形,其处理单元处理的信号为图像信号,经过对图像信号的处理进而判断是否有行人。
随着时间的推移,计算机的性能有了很大的提高,当其可以处理如图像这样的大规模数据时,计算机视觉才得到了正式的关注和发展,进而作为其一个重要分支的行人检测也得到了相应的关注和发展。这可以从行人检测的专利申请量的快速递增中得以充分的体现。计算机视觉中的行人检测技术在2000年以后逐渐从早期阶段进入了发展阶段,特别是在2010年以后进入了快速发展阶段,相关的专利申请量逐年递增。
二、行人检测中的分类技术
现有行人检测方法有多种分类方式,有的将行人检测方法分为:基于全局特征的方法,基于人体部件的方法,基于立体视觉的方法[1];有的将行人检测技术分为特征提取和目标检测。每一种分类方式都有其如此分类的原因。下面针对第一种分类方式中涉及的主要专利技术进行一一介绍。
1.基于全局特征的方法
1)基于小波特征
基于小波特征的方法,主要是基于小波模板概念,将图像中小波相关系数子集定义为目标形状的小波模板,将待检测图像中每个特定大小的窗口进行一定范围的比例缩放后进行小波变换,然后利用支持向量机检测变换的结果是否与小波模板匹配,进而检测行人是否存在。典型的专利申请CN101630369 A(公开于2010年)公开一种基于小波分形特征的行人检测方法,该方法具有稠密采样信息量大的优点,又具备稀疏采样简洁性的优点;在降低计算效率的同时,提高了检测率。
2)基于HOG特征
基于HOG特征的方法,刻画的是图像的梯度特征,其是最为广泛使用和成功的行人特征,可采用积分图技术快速计算。典型专利申请CN102609716 A(公开于2012年)公开一种基于改进的HOG特征和PCA的行人检测方法,该方法采用样本图像中行人梯度信息集中区域的HOG特征级联PCA主元分析的特征提取算法来提取样本特征;利用训练样本提取的上述特征训练SVM分类器;对于检测样本利用上述特征提取方法提取特征向量,并利用训练得到的SVM分类器进行行人检测。该方法能够有效减少训练速度、降低误检率和漏报率。
3)Shapelet特征
Shapelet特征是利用机器学习的方法自动得到的特征。典型的专利申请CN104020845 A(公开于2014年)公开一种基于Shapelet特征的加速度传感器放置无关化运动识别方法,通过处理加速度传感器的运动信号识别人体运动。本方法分为数据训练和运动识别两个部分,在数据训练部分中首先将原始的三维加速度信号处理成和放置方式无关的一维信号,然后抽取一维信号中与放置位置无关的Shapelet特征,建立识别模型;在运动识别部分中对实时采集的三维加速度信号进行处理得到和放置方式无关的一维信号,然后利用数据训练部分训练出的识别模型识别出运动。该方法可提供准确的运动识别结果。
4)轮廓模板特征
基于轮廓模板特征的方法是利用图像中行人的轮廓构建模板,通过模板匹配来检测是否有行人。优点检测方法简单,缺点需要大量的模板才能取得好的检测效果。典型的专利申请CN105678347 A(公开于2016年)公开了一种行人检测方法及装置,解决了相关技术中对行人进行检测的方法没有考虑到目标边缘的边缘图导致检测结果不准确的问题,进而达到了检测结果较为准确的效果。
2.基于人体部件的方法
基于人体部件的方法是把人体分为几个部分,对每个部分分别进行检测,然后将检测结果进行整合,来判断是否有行人。典型的专利申请为CN104361327 A(公开于2015年)公开了一种行人检测方法,对采集到的图像进行头肩检测、人脸检测以及全人检测,可以得到正面头肩、背面头肩或者侧面头肩的特征、正面全人特征信息、背面全人特征信息以及左侧全人特征信息和右侧全人特征信息中的一个或多个,这样,对于人脸遮挡或伪装的目标行人,也可以获得正面、背面和侧面头肩特征、以及多个角度的全人特征,对于实时处理违法行为以及事后分析都会有很大的帮助,可以极大减少相关人员的后继工作量。克服了现有技术中基于人脸检测的人员卡口系统的缺陷,不但适应正面人脸检测,还进行背面和侧面的行人检测,一个人的人脸快照加上全人快照就基本包含了一个人的全部信息,便于后期进行一些深入分析。
3.基于立体视觉的方法
基于立体视觉的方法,是根据立体场景信息,估算出地面后结合身高约束或者根据深度图进行分割检测,其优点是对环境变换的鲁棒性高,缺点是计算速度较慢。典型专利申请为CN103020606 A(公开于2013年)公开了一种基于双层时空上下文信息的行人检测方法。该方法是在基于表观特征的基础行人检测器基础上,自动提取与行人检测相关的双层时空上下文信息,并利用时空上下文模型对表观特征和双层时空上下文信息进行结合。通过引入双层时空上下文信息,有效的解决了复杂背景和局部遮挡对检测性能的影响,提高了行人检测的召回率和检测精度。
三、总结
本文回顾了计算机视觉中行人检测专利技術的发展历程,结合专利申请的现状分析了行人检测的主要分类技术专利,特别是针对全局特征的方法进行比较详细的分析。由以上分析可知,上述各个行人检测方法均有优缺点,因此未来行人检测技术的发展趋势将是:多种检测方式融合,使得行人检测准确率高,实时性好,对环境的鲁棒性高,检出效率高。
【参考文献】
[1]张春凤,宋加涛,王万良,行人检测技术研究综述[J].电视技术,2014, 38(3).