基于改进YOLO算法的车位自动检测系统

2020-06-19 08:45陈俊松何自芬张印辉
软件导刊 2020年4期
关键词:机器视觉卷积神经网络

陈俊松 何自芬 张印辉

摘要:随着社会汽车数量的急剧增加,停车难已成为城市发展过程中的难题之一。针对这一问题,提出一种基于改进YOLO算法的停车场车位检测系统。通过网络获取、相机拍摄、三维建模3种方式分别获取不同场合、不同时间段及不同光照环境下的数据集。通过改变YOLOv3网络输入分辨率、增大动量、增大权值衰减值、增大批尺寸、减小抖动、选择合适的ignore_thresh值等6种不同措施对原网络进行改进,得到相对原网络检测效果更好的新网络YOL0-288x288。当IOU=50时,改进网络的平均检测精度由原来的86.5%提升到90.5%,查准率虽然降低了3%,但查全率提高了10%,平均IOU提高了1%。实验结果表明,新的YOL0-288x288网络优于原网络,其具有更高的检测精度、查全率及可靠性,能满足停车场的车位检测需求。

关键词:YOLO网络;车位检测;机器视觉;卷积神经网络

DOI: 10. 11907/rjdk.191974

开放科学(资源服务)标识码(OSID):

中图分类号:TP303

文献标识码:A

文章編号:1672-7800(2020)004-0037-05

Automatic Parking Space Detection System Based on Improved YOLO Algorithm

CHEN Jun-song, HE Zi-fen . ZHANG Yin-hui

(Faculty of Me.chanical and Electrical Engineering,Kurzming Univer.sity of Science and Teclznology , Kunming 65 05 00.China )Abstract: The numher of cars iii today ' s society has increased dramatically and parking difficulties have become one of the problemsin urban development. To solve this prohlem, a parking lot parking detection system based on the improved YOLO algorithm is pro-posed in this paper. The data sets in diff'erent occasions. different time periods and different illumination environments are obtained bythree methods: network acquisition. camera shooting and three-dimensional modeling. By changing the input resolution of YOLOv3network. increasing momentum. increasing weight attenuation. increasing batch size, reducing jitter and selecting appropriate ig-nore_thres value. a YOL0-288x288 network with better detection ef'fect was obtained. When IOU=50. the average detection accuracyof the improved network was increased from 86.5% t0 90.5%. Although the precision rate was reduced by 3c7e . the recall rate was in-creased by 10% and the average IOU was increased by l%. The experimental results shoWthat the new YOL0-288x288 network is su-perior to the original network, with higher detection accuracy , recall and reliahility and can meet the detection requirements of parkingspaces.Key Words : YOLO network ; parking space detection ; machine vision ; convolutional neural network

O引言

“智慧城市”是许多城市的建设目标,但由于汽车数量的急剧增加,停车难已经成为“智慧城市”建设中的难题之一[1-2]。

目前有多种车位检测方法,主要分为两大类,一类是基于雷达与传感器的车位检测方法[3-8],另一类则是基于机器视觉的车位检测方法[9-11]。利用雷达与多传感器对车位进行识别相对于机器视觉方式具有独特优势,例如对环境变化的适应能力较强、检测精度较高等。但该方法也有诸多缺点,例如传感器与雷达对周围环境敏感度很高,容易把其它物体判定为汽车,从而造成误检或错检;雷达与传感器造价相对昂贵,且安装施丁过程繁琐、成本较高,因此大多数中低端停车场并没有资金预算对停车场车位进行改造,难以全面推广使用。通过机器视觉方法对车位进行识别检测,不仅不易受到其它物体干扰而产生误检情况,而且目前市场上的图像采集设备价格比较经济实惠;大多数停车场都有监控设备,不需要再次安装图像采集装置;卷积神经网络的性能越来越强大,其具有多层结构,可有效学习与反映输入和输出的复杂关系[12-13]。因此,基于机器视觉的车位检测是目前的研究热点之一[14-15],

针对基于雷达与传感器的车位检测,庞家成等“。提出一种以AMR磁阻传感器采集车位节点信号,通过ZigBee无线传感组网,以STM32F10X微控制器为协调器收集并分析处理信号装置以检测车位占用情况的检测方法;祁海禄[2]设计一种基于地磁与雷达检测的无线车位检测器,通过将地磁静态检测与雷达动态检测相结合实现对空闲车位的检测;宋向前等[3]设计基于NB-IoT与地磁传感器的车位检测模块,以MAG3110三轴地磁传感器作为感知单元完成车位检测;Abad等[4]提出一种传感器三维建模方式,并通过对比计算出来的两车位之间距离与本身车长判断是否有空闲车位。

针对基于机器视觉的车位检测,张一杨等[9]提出基于KL变换( Karhunen-Loeve Transform,KL)与支持向量机的空闲车位检测方法,首先对经过灰度化和滤波处理后的车位图像进行KL变换,将车位图像从图像空间映射至特征子空间,从而提取出用于检测的特征参量,在此基础上利用训练后的支持向量机完成空闲车位检测;安旭骁等[10]提出基于迷你卷积神经网络的停车场空车位检测方法,对传统卷积神經网络结构进行改进,通过减少网络层数以缩短网络训练与识别时间;王梨等[11]提出基于视觉分析的室内停车场车位检测,对采集到的实时图像先进行分块处理,通过灰度共生矩阵提取图像块O。、45。、90。、135。的能量、对比度、熵3个纹理特征参数,构建特征向量,并利用支持向量机(SVM)[16]方法对其进行分类,从而实现车位检测。

为了解决传统停车场车位检测存在的问题,弥补基于传感器与雷达检测方法的不足之处,实现对车位的智能管理,本文提出一种基于改进YOLO(You Onlv Look Once)的停车场车位检测方法,通过对YOLO算法的改进,得到一个检测效果更好的检测模型,以进一步提高停车场的智能化水平。

1相关研究工作

1.1YOLO介绍

YOLO算法是由Redmon等[17]于2015年首先提出的,其主要采用直接回归的思路,对输入图像进行S*S的网格划分,物体中心在哪个网格,哪个网格就负责对该物体进行预测,每个网格需要预测B个边界框以及C个类别概率。YOLO通过设置阈值过滤掉概率低的候选框,再对保留的候选框进行非极大值抑制,即得到最终检测结果。YOLO存在诸多缺点,如对于密集的小目标种群以及近距离目标检测效果不理想、检测结果定位误差较大等。

2016年,Redmon等[18]。针对YOLOvl的缺点进行改进,提出YOLOv2网络模型。YOLOv2网络主要是在分类准确度不变的情况下,提高网络的查全率及定位精度。YO-LOv2模型通过提高训练图像分辨率、在网络中加入an-chor hox结构,以及利用卷积层替代YOLO vl中输出层的全连接层等措施进行改进。YOLOv2网络包含19个卷积层以及5个最大池化层,所以也被称为Darknet19,最终YOLOv2模型在识别精度、定位精度、查全率等方面都得到了较大提升。

针对两个近距离的同类或异类目标检测问题,很多新算法不断被提出,YOLOv3便是其中之一。YOLOv3网络在近距离目标与小目标检测上有很好的鲁棒性,在一定程度上解决了这一问题。YOLOv3网络是在YOLOv2模型基础上,针对YOLOv2模型的一些问题作出改进,连续使用3x3和lxl卷积层;参考残差网络,在新网络的一些层之间添加快捷链路,形成一个深度达到53层的网络;利用多尺度特征进行对象检测,通过获得不同尺度的感受野,加强对不同尺度对象的检测;用能够支持多标签对象的Logistic分类器替换YOLOv2模型中softmax[19]分类器。经过改进,最终提出了YOLOv3模型[20],也被称Darknet53。

1.2 改进YOLO算法

本文通过减小YOLOv3网络输入分辨率、增大动量、增大权值衰减值、增大批尺寸、减小抖动、选择合适的ig-nore_ thresh值等6种不同措施对原网络进行改进,通过vo-lov3.conv.81预训练权重进行加速训练,并对各组参数用网络搜索方法进行实验,最终得到相对原网络具有更高平均精度、查全率、查准率及平均IOU( Intersection over Union.IOU)的新网络YOL0-288x288。

在损失函数中加入一些正则项可以防止网络过拟合。在随机梯度下降(SGD)中加入正则项对损失函数进行规范化。

由式(1)可知,权值衰减参数入越大,权重w则会不断衰减。由式(2)可知权重w的衰减使得Z值不断减小,实际上Z的取值范围很小,因此激活函数呈相对线性,整个神经网络会计算离线性函数近的值,该线性函数相对简单且不会发生过拟合。权值衰减参数入越大,对过拟合的抑制能力越强。本文通过网络搜索方式对0.0005(基准)、0.0010、0.0015、0.0020等4组参数进行训练,结果显示,当权值衰减取0.0015时,平均检测精度最大,达到72.23%。

利用数据抖动可产生更多数据,防止过拟合。抖动是裁剪参数,抖动为0.2即在0-0.2中进行裁剪。在本文中,当抖动为0.2时,平均精度达到最大值72.32%,此时裁剪前后图像见图1、图2。动量会影响梯度下降到最优值的速度,由式(3)可知,梯度下降法参数更新只与当前梯度有关。但动量梯度下降法是先求每个mini-batch的梯度,然后进行指数加权平均得到新参数Vv与Vv用于更新之前的参数。由于指数加权平均后的梯度中含有之前梯度更新方向的信息,所以利用指数加权平均之后的梯度对参数进行更新得出最终更新方向,是一种较优的梯度下降方法,其过程如式(4)所示。动量梯度下降算法不仅能够增强稳定性,而且还能避免局部最优。若当前梯度与历史梯度一致,则增强该梯度,反之,则梯度衰减以抑制震荡,其作用效果如图3所示。通过实验,当本文动量取0.92时,平均精度达到最大值72.39%。

ignore_thresh是指参与计算的IOU阈值大小。ig-nore_t11-esh大小的选择很重要,其决定参与loss计算的检测框数量,igno-re_thresh值若过大则可能造成过拟合,但若ignore_thresh值过小,义会使参与计算的检测框数量过多,并造成欠拟合现象。ignore_thresh通常会在0.5-0.7之间选取一个值,本文中ignore_thresh值取0.7时,平均检测精度最高。

通常网络输入分辨率越高,对小目标的识别效果越好。由于全卷积网络总共对输入图像进行了5次下采样(步长为2的卷积或池化层),所以原图应为最终特征图的32倍。因此,输入图像大小应为32的倍数关系[21]。本文待检测目标为空闲车位和有车的车位,两者均不是小目标,且在图片中都相对较大,所以通过对不同输入分辨率的对比训练实验发现,当输入图像分辨率为288×288、输出网格尺寸为9x9时检测效果最好,平均检测精度达到75.43%,其网络结构见图4。

批尺寸表示一次迭代训练中输入的图片数量,批尺寸值越大,网络训练时间越长,但能够找到更好的梯度下降方向,收敛的也越精细,因此在电脑显存允许的情况下,需要尽可能地增大批尺寸值。但批尺寸值也不能过大,否则可能会陷入局部最优。综上可知,合适的批尺寸值会使电脑内存利用率以及矩阵乘法的并行化效率都得到提高,一个epoch中迭代次数减少,并找到更好的梯度下降方向。过大的批尺寸值会使得电脑内存不足,训练时间增长,对参数的修正也变得更加缓慢,梯度下降方向也基本不会因为批尺寸值的增大而再发生改变。本文通过增大批尺寸提高了平均检测精度,当批尺寸为160时,平均检测精度达到最优值80.56%。

1.3超参数优化结果

表l中所列为权值衰减、抖动、动量、ig-nore_thresh、网络输入分辨率、批尺寸等6个不同参数的数值组,用vo-lov3.conv.81预训练权重对表1中的不同参数由上往下使用网络搜索方法进行训练,每次训练次数为4000次,使得网络的平均检测精度、查全率、平均IOU、F1-score逐步得到提高,最终得到YOL0-288x288网络模型。

通过网络搜索方式对参数进行筛选,取其中的最优值。当权值衰减增大时,检测效果有一定程度提高。当抖动增加时,检测结果反而不如基准结果,但当抖动减小为0.2时,检测效果义有一定程度提高。当动量与批尺寸值提高时,网络可得到较好的检测效果。网络搜索比较后所确定的最终参数见表2。

2实验与结果讨论

2.1数据集准备

本文数据集主要通过网络获取、相机拍摄、三维建模3种方式获取,其中包括不同时间段、不同光照条件、不同环境等多种情况下的不同图片。本文数据集共包含493张图片。其中355张图片作为训练集,138张图片作为测试集。将数据集标注为A、B两类,其中A是停有汽车的车位,B是空闲车位。数据集如图5所示,其中包括有阳光的室外停车场图像、傍晚室外停车场图像、阴天室外停车场图像、地下停车场图像、三维建模图像等多种不同条件下的图像。

2.2实验平台

实验主要在PC端完成,PC主要配置为:i7处理器,电脑运行内存为16G,GPU(GTX-1060),显存为6G。开发环境为Vi-sual Studi0 2015,需要配置CUDA-9.0、C-UDANN-9.0、OpenCV3.0和YOLOv3物体检测框架。

2.3实验结果与分析

用YOL0-288x288网络对darknet53.conv.7預训练模型进行训练,训练次数为4000次,得到一系列检测模型,训练结果见图6。由图6可知,训练到2200次时,检测模型平均检测精度最高,再分别令IOU=50与IOU=75对最优模型进行检测,检测结果见表3、表4。由表3可知,当IOU=50时,改进后网络平均检测精度提高了4%,达到90.5%,查准率降低了3%,为92%,但是查全率达到88%,相比改进前网络提高了10%,平均IOU提高到75.75%,F1-score提高到0.9。当IOU=75时,改进后网络的平均检测精度、查准率、查全率、平均IOU、F1-score等都有大幅提高。从实验结果可以看出,改进后网络优于原网络,相比改进前模型具有更高的检测精度以及查全率,因此认为改进后的网络更加可靠。

2.4测试结果对比分析

由于当IOU=50时,检测模型的检测精度较高,所以本文对IOU=50时改进后检测模型与原网络检测模型进行测试,结果见图7、图8。在图7(a)中从左往右,两个空闲车位检测精度分别为99%、96%。有车辆停放的车位检测精度为91%,且检测边框位置不够准确,而在图7(b)中从左往右,两个空闲车位检测精度分别为99%、99%,有车辆停放的车位检测精度为100%,且检测边框位置相对来说较为准确;在图8(a)中从左往右,3个空闲车位检测精度分别为95%、72%、91%,对于有车辆停放的车位并没有检测到结果,出现了漏检,且检测边框位置不够准确,尤其是从左往右第二个车位的检测边框位置与实际位置相差较大。在图8(b)中从左往右,3个空闲车位检测精度分别为100%、100%、100%,对有车辆停放的车位检测精度为85%,且车位检测边框位置相对来说较为准确。由对比结果可以看出,由于改进后模型具有更高的平均检测精度、查全率、平均IOU以及F1-score,所以检测效果明显优于

陈俊松,何白芬,张印辉:基于改进YOLO算法的车位白动检测系统改进前模型,不仅检测精度明显提高,而且有更高的查全率以及更好的泛化能力与定位精度,不易发生漏检情况。

3结语

本文提出一种基于改进YOLO算法的停车场空闲车位检测方法,通过改变输入网络的分辨率、权值衰减、抖动、动量、ignore_thre-sh、批尺寸等不同参数进行优化调节,最终得到新的YOL0-288×288网络。然后利用YO-L0-288x288网络对包含不同时间段、不同光照条件、不同环境图片的数据集进行训练,最后得到一个相对改进前模型效果更好的检测模型。当IOU=50时,其平均检测精度达到90.5%,查准率达到92%,查全率达到88%,平均IOU达到75.75%,F1-score=0.9。实验结果表明,该方法能满足停车场空闲车位检测需求,有利于智能停车场建设,进而推动智慧城市建设。在后续研究中将通过改进网络层数、对不同图像进行不同预处理等方法,进一步提高模型泛化能力与检测精度。

参考文献:

[1]史添添,曾洁,赵宏凯,等智能停车场的车位信息检测及管理系统[J]电子设计工程,2017,25(4):185-188

[2]刘婧,关宏志,贺玉龙大城市中心区停车寻位研究[J].公路交通科技,2016,33(1):135-139.

[3]庞家成,徐新民.基于AMR磁阻传感器的无线车位检测设计[J].微型机与应用,2019,35(12):28-30.

[4]]祁海禄基于地磁和雷达检测的无线车位检测器设计[J]智能感知与仪器仪表,2018,37(7):78-81.

[5]宋向前,吕卅,赵蓉基于NB-IoT和地磁传感器的车位检测模块设计[J].中外企业家,2018(8):133.

[6]ABAD F. BENDAHAN R, WYBO S,et al. Parking space detection[EB /OL].[2017-05-10].https://www.researchgat-e.net/puhlication/2287 1 6676_Parking_s-pace_detection.

[7]严晓明.一种基于改进帧差法的运动目标检测[J].莆田学院学报,2011(5):69-72.

[8]李键,丁学明.视频前景提取算法研究[J].软件导刊,2018(2):135-139.

[9]张一杨,姚明林.基于KL变换和支持向量机的空闲车位检测方法[J]机械设计与制造,2018(5):197-199.

[10]安旭骁,邓洪敏,史兴宇.基于迷你卷积神经网络的停车场空车位检测方法[J].计算机应用,2018,38(4):935-938.

[II]王梨,王飞,陈亮杰,等基于视觉分析的室内停车场车位检测[J].软件导刊,2019,18(4):13-15.

[12]俞汝劫,杨贞.基于深度卷积神经网络的航空器的识别和检测[J].计算机应用,2017,37(6):1702-1707.

[13]李玉罐,张婷.深度学习导论及案例分析[M].北京:机械工业出版社.2017

[14]李宇成,李国辉,赵兴彩.基于ARM嵌入式系统的空闲车位检测方法[J].科学技术与工程,2013,13(21):6118-6123.

[15]邹初建,钱正洪,白茹基于三轴CMR传感器的无线车位检测系统[J]仪表技术与传感器,2014(9):62-65.

[16]GHASSABEH Y A. Asymptotic stability of equilihrium points ofmean shift algorithmEJl. Machine Learning, 2015, 98(3):359-368

[17]REDMON J, DIVVALA S, CIRSHICK R. et al. You onlv look once:u nified, real-time object detection[C].CVPR, 2016.

[18]REDMON J, FARHADI A. YOL09000: better, faster, stronger[DB/OL J. https: //arxiv.org/pdf/1506.02640.pdf.

[19]LIU W,WEN Y. YL Z, et al. Large-margin softmax loss for conVolu-tional neural networks[C].Internatinnal Conference on InternationalConference on Machine Learning, 2016: 507-5 16.

[20]REDMON J,FARHADI A.YOLOv3: an incremental improve ment[DB/OL].https: //arxiv.org/pdf/1804.02767.pdf

[21]譚康霞,平鹏,秦文虎基于YOLO模型的红外图像行人检测方法[J].激光与红外,2018,48(11):1436-1442。

(责任编辑:黄健)

收稿日期:2019-07-09

基金项目:国家自然科学基金项目( 61761024,61461022)

作者简介:陈俊松(1996-),男,昆明理工大学机电工程学院硕士研究生,研究方向为计算机视觉、深度学习;何自芬(1976-),女,博士,

昆明理工大学机电工程学院副教授、硕士生导师,研究方向为图像处理;张印辉(1977-),男,博士,昆明理工大学机电工程

学院教授、博士生导师,研究方向为图像处理、模式识别。本文通讯作者:何自芬。

猜你喜欢
机器视觉卷积神经网络
基于卷积神经网络温室智能大棚监控系统的研究
基于深度卷积神经网络的物体识别算法
大场景三维激光扫描仪在研究生实践教学培养中的应用