高速公路场景下基于深度学习的数据集建立

2020-05-11 12:24张向清杨锐白涛王金妮
数字技术与应用 2020年2期

张向清 杨锐 白涛 王金妮

摘要:本文拟建立道路交通中视频目标检测所使用的数据集,用通用的样本标注规则,完成高速公路场景中小车、卡车、大巴车和行人4类目标的标注,对不符合要求的数据进行删选,创建的数据集在不同场景下具有很好的鲁棒性。

关键词:自制数据集;样本标注;标注规则

中图分类号:TP181 文献标识码:A 文章编号:1007-9416(2020)02-0035-01

在视频目标检测领域,数据集的质量好坏对检测结果起着至关重要的作用,当前,各种通用数据集由于涉及的应用领域多、覆盖面广,致使对于特定的道路场景并不适用。现有通用数据集包括ImageNet、Microsoft COCO、Pascal VOC等[1],其中ImageNet数据集包含各类目标共600万张,是当前大数据领域最全最完整的数据库,并且每个目标数据经过标注和处理,但其大多数样本采集源于国外的道路场景且目标形状与国内的大相径庭。另外,Microsoft COCO数据集主要应用于图像分割和对场景中目标进行加字幕标注,微软公司实现的核心功能是完成图像中目标的分割和场景语义描述等功能,这样标注的数据集显然并不适用目标检测领域。其次,Pascal VOC数据集[3]是最早应用于视频目标检测领域,VOC数据集因其具有图像质量好、标注完备、样本量适中的特点,作为自制数据集的标注和评估的基准数据集,但其所包含每一类样本较少,容易发生过拟合现象。因此,结合目前流行的数据集的标注方法,制定特定场景下的专用数据集势在必行。

1 现有交通数据集的优劣

通用数据集由于其适用场景较多,致使对每一类目标的检测精度并不高。因此,一些研究机构建立了专有的数据集满足部分应用场景,比如应用于自动驾驶领域的KITTI数据集[2],它所包含的数据样本大多来源于行车记录仪的视频或者采用平行视角方式获取样本资源,其标注样本的格式和规则并不适用于摄像机角度较高的样本;另外,Udacity数据集和CityScape数据集等优化了样本的多样性,但其标注的样本大多应用于目标分割和语义分析,如果将其应用于目标检测领域,需要重新进行样本的标注,额外增加了工作量。因此,对于复杂的交通场景,建立自己的专用数据集是必不可少的。

2 数据集的制作方法

2.1 摄像机采集样本

为了实现在高速公路场景下采集样本,需要在高速路边架设相对较高的摄像机装置(通常约为10米左右),并利用远程控制来拍摄视频或图像。在采集视频中目标时,可以通过软件来控制摄像机的角度和方向。安装好摄像机装置后,可以在云端等间隔时间段内获取视频流,这些视频流可以分为:不同时段的视频流、不同天气状况下的视频流、不同比例的视频流和交通异常下的视频流。获取的视频流,将其转换为不同时间帧,其中对于一些无效的帧进行剔除,保留那些目标清晰可见的帧,挑选好的样本需统一格式,并进行可行性测试和分析,最后选出场景丰富、样本特征明显的数据。

2.2 虚拟仿真样本

目前,随着大数据和虚拟现实技术的日趋发展,可以对已有样本数据进行分析,并将其转换为不同特征的样本。尤其是深度学习模型的训练需要大量的样本,由于设备和技术的不成熟,短暂时间内无法采集到更多可靠有效的样本。因此,可以利用现有的网络资源和编程开发平台,合成一些不常用或者现实生活中不存在的样本分布特征,并对图像中的颜色纹理特征进行修改,增加样本的丰富性。

2.3 目标选取范围

整理好的数据样本需要进行目标的标注,对于不同的应用场景,其标注方法和规则不尽相同。本文为了提高检测的准确度,需对高速公路场景下对样本进行精细标注,在划定的区域内将同一目标进行大小分类,具体实施方法如图1所示:

(1)为了能从摄像机采集的视频中分出时间和地点,加入一些标记信息,但会造成目标样本的遮挡,因此1号场景内不选取样本。

(2)选取的样本尽可能大、清晰,将相机角度转到合适位置,如图1所示的2号区域,标记此区域的所有样本。

(3)不同的文献中对于远处的小目标有不同的标注方法,本文着重检测近场景的目标,因此3号区域的小目标暂不进行标注。

(4)另外选取的部分视频流中目标较拥堵,影响最后的检测效果,所以提前剔除包含拥堵场景的样本。

3 实验结果

本文起初标注样本采用photoshop软件选取目标矩形框,并将矩形框的位置信息保存,然后利用算法实现标注文件的生成,但由于选取矩形框容易出现反选的错误,致使在训练模型时很难发现问题。因此,后期采用LabelImg标注工具,直接在选中目标后生成标注文件,提高了标注的效率和成本。

4 结语

本文以高速公路场景为研究对象,针对场景内的数据样本,实现样本的获取,样本的标注以及样本的扩充。创建的数据集,经过训练模型,其检测的平均准确率达到92%,但是由于目标样本分辨率为1920×1080,导致训练过程十分缓慢,检测速率只能达到6.8fps。因此,后期主要研究方向为如何将样本分辨率降低提高检测速度,并对数据集做进一步的优化,形成统一标准的文档。

参考文献

[1] 张向清.高速公路场景下基于深度学习的车辆目标检测与应用研究[D].西安:长安大学,2018.

[2] 宋焕生,李莹,杨瑾,等.基于高速公路场景的车辆目標跟踪[J].计算机系统应用,2019,28(6):82-88.

[3] 张向清.基于深度学习方法的复杂场景下车辆目标检测[J].计算机应用研究,2018,35(4):1270-1273.

Construction of  Datasets Based on Deep Learning in Highway Scenarios

ZHANG Xiang-qing,YANG Rui,BAI Tao,WANG Jin-ni

(School of  Mathematics and Computer Science, Yan'an University, Yan'an  Shaanxi  716000)

Abstract:This paper intends to establish a data set used for video target detection in road traffic, and use common sample labeling rules to complete the labeling of 4 types of targets: cars, trucks, buses, and pedestrians in highway scenes. Deletion, the created data set is very robust in different scenarios.

Key words:homemade data set; sample labeling; labeling rules