余泳 齐运书 杨浩恩 郭磊
摘 要:现如今,随着监控系统的大面积覆盖和计算机视觉的大规模崛起,视频处理的重要性和必要性日益凸显。交通由于大量视频监控的存在和情况复杂人手相对不足等问题,对于视频检测的需求更加迫切,交通视频检测也是近几年相关的研究的热点问题。在交通问题中,高速公路更是其难点,我们根据其车速快,数据量大等特点,提出了基于动量的高速公路视频检测算法,其在保证了准确性的同时,还基本保证了实时性。
关键词:高速公路;视频检测;动量;人工智能
中图分类号:TP391 文献标识码:A 文章编号:1671-2064(2019)14-0017-02
0 引言
在高速公路中,出现异常情况一般需要尽快处理,恢復道路畅通,而众多的视频监控装置,很难有足够的人力去实时处理这些这些数据,所以视频处理和检测也是智慧交通的重要组成部分。在人工智能算法的影响下,现在基本可以保证识别的精准度,但是仍然存在着不能保证实时性,计算量大等问题。
为了解决这一问题,本文提出了基于动量的高速公路视频检测算法,在保证了算法准确性的情况下,大幅减少了计算量,保证其实时性。
1 算法概述
自AlexNet之后[1],深度学习算法一直以极高的精度霸占各类计算机视觉比赛的榜单,但是其在贡献着最高的精度的同时也同样有个更高的计算量要求,这使得落地变得比较困难。高速公路由于本身要保证车辆快速通行的特点对于实时性要求更高,这就与深度学习算法产生了矛盾。相比于深度学习算法,传统算法计算量普遍小很多,但是精度就要低于深度学习算法。针对于高速公路的具体特点,为了平衡计算量和精度,本文假设:
(1)高速公路车辆不会无故停车;
(2)高速公路很少出现除车辆以外的移动物体。
由实际情况和交通法规我们知道这些假设合理,基于这个假设,我们提出基于动量的高速公路视频检测算法(Mome- ntum-based highway video detection algorithm,MHVD)。根据假设(1)我们可是使用动量去衡量移动车辆的存在,如果车辆保证高速移动,那么大概率不会出现各类事故。同时我们使用假设(1)判断是否出现事故,并向工作人员发出信号。
2 算法设计
2006年,Hinton等人基于深度置信网络(DBN)提出非监督贪心逐层训练算法[2],随后深度学习在各个领域都得到了大幅度的改进,特别是在图像识别,语音处理等领域展现了里程碑式的大跃进。之后在目标检测方向,Faster R-CNN[3],SSD等算法的提出为人工智能在实际生产中的应用带来了更多可能[4]。Faster R-CNN在各种视频图像中取得很多优秀的结果,在交通领域也有着广泛的应用[5-7]。本文中我们采用Faster R-CNN作为保障单元,使用动量保证在大多数时间中不会使用到Faster R-CNN算法,以此保证实时性。
这里的动量不同于物理中的动量,而是用于表述由于位移产生的图像差,由于其是在图像意义下描述了运动,所以将其命名为动量。结合上一节中的两个假设,我们设计算法如下:
3 性能评价
3.1 数据准备及测试
对于上一节的算法,thed 和change_thed相应的阈值,在我们的测试中取thed=20,change_thed=0.1。Video_next()是读取下一帧的函数,faster_rcnn()是根据Faster R-CNN得到的交通情况的函数,这里我们使用Tensorflow的object _decetion库中的faster_rcnn_inception_v2_coco模型并重新训练后得到结果。这在各类相关论文中都能轻易得到Faster R-CNN在各类视频图像中的相关应用,在这里就不赘述了,效果如图1所示。
本文得到试刀山隧道的相关监控视频数据。于1996年建成并投入使用的试刀山隧道,左、右净宽10米,原设计仅为双向四车道通行。但是由于近年来交通量增加迅猛,特别是重大节假日期间,车流量更是持续高位运行,平均日交通流量突破6万辆的试刀山隧道是拥堵等交通问题的频发区,对于这类算法的需求更加迫切。我们选取堵车,正常行驶,无车辆行驶三种情况,抽取几段视频进行测试,测试结果为路况异常记为1,路况正常记为0。
如图2所示,在三种情况中,本文算法都能很好地加以区分,在更多复杂路况中的效果也得到了很好的效果,在个别帧的误报可以略微放大帧间距,或者多帧平均的方式处理,即采取一个滑动平均的窗口,对多个帧的输出进行平滑处理,以此来防止个例的发生。
3.2 实时性测试
为了对比算法对于实时性地提升,我们对比了采用Faster R-CNN和只采用本文算法的程序运行时间,如表1所示,通过分析九组运行情况的平均值,我们发现MHVD在50帧基本能保证实时运行,而Faster R-CNN的实时性就难以保证,参考论文所给的处理速度为58ms和本文测试数据差距很大,原因是硬件成本投入不同,考虑分辨率和图片大小,MHVD在视频监控领域仍然有Faster R-CNN难以企及的实时性。
4 结语
人工智能算法在为我们带来超高的准确率的同时,也带来大量的资源要求,本文采用传统的算法逻辑,提出了基于动量的视频检测算法,通过过滤掉大概率没有出现各类异常的情况,避免了大量的计算量需要。
参考文献
[1] Krizhevsky A,Sutskever I,Hinton G.ImageNet Classification with Deep Convolutional Neural Networks[J]. Advances in neural information processing systems,2012,25(2).
[2] G. E. Hinton,S. Osindero,and Y.-W. Teh. A fast learning algorithm for deep belief nets.Neural Comput.,18(7):1527-1554,July 2006.
[3] Ren S,He K,Girshick R,et al.Faster R-CNN:towards real-time object detection with region proposal networks[J].2015.
[4] Liu W, Anguelov D,Erhan D,et al.SSD:Single Shot MultiBox Detector[J].2016.
[5] 韩凯,张红英,王远,et al.一种基于Faster R-CNN的车辆检测算法[J].西南科技大学学报(自然科学版),2017,32(4):65-70.
[6] 桑军,郭沛,项志立,等.Faster-RCNN的车型识别分析[J].重庆大学学报,2017,40(7):32-36.
[7] 韩凯,张红英,王远,et al.一种基于Faster R-CNN的车辆检测算法[J].西南科技大学学报(自然科学版),2017,32(4):65-70.