陈欣佳 刘艳霞 洪晓斌 王慧芳
摘要:针对目前目标检测和目标跟踪算法对无人艇运算配置要求高、速度慢等问题,该文一种提出基于SSD-CF的无人艇目标检测跟踪方法。利用MobileNets结构结合SSD目标检测算法构建轻量级卷积神经网络,实现无人艇的水面目标检测。目标检测结果作为相关滤波CF目标跟踪算法的初始输入,并在目标跟踪过程的保障其有效性。通过MODD水面船只视频数据实验表明,SSD-CF方法融合目标检测与目标跟踪算法,可有效地降低对运算力的要求,提升目标检测跟踪速度和目标位置的稳定连续性。
关键词:无人艇;目标检测;目标跟踪;SSD;MobileNets;相关滤波
中图分类号:TN212
文献标志码:A
文章编号:1674–5124(2019)02–0145–06
0 引言
水面无人艇实际应用广泛,如水质检测、海面巡逻监控等。随着人工智能技术的发展,现代无人艇海面自主航行领域的各项技术也在不断完善。水面目标准确检测跟踪是无人艇的核心技术。但其目前较好的目标检测都依赖于深度学习卷积网络,检测速度较慢,且对于运算环境要求高。目标跟踪算法在给出目标之后能较好地稳定跟踪目标,但目标丢失后无法重新追踪目标。目前目标检测算法主要分为3类:1)传统的检测算法,主要有Cascade+Harr[1]、SVM+HOG[2]、DPM算法等利用手工特征结合机器学习类算法,以及在此类算法上的改进和优化;2)候选窗选择算法结合深度学习分类的二阶段检测算法,主要有RCNN、SPP-net[3]、Fast-RCNN、Faster-RCNN[4]等系列方法;3)基于一阶段的深度学习回归方法,主要算法有YOLO、SSD[5]等,一次性对目标位置以及目标类别进行学习计算。二阶段的算法相对于一阶段的目标检测算法精度高但速度慢。结合深度学习的算法大大提高了目标检测的准确度,但运算环境的要求比较高,速度也有些下降。
传统的目标跟踪算法有光流法[6]、卡尔曼滤波、粒子滤波[7]、Mean-Shift[8]。随着机器学习的兴起,近几年在目标跟踪中的成果基本都是使用机器学习的方法。目前跟踪算法可以被分为生成式和判别式两大类别。生成式模型的思想是提取目标特征学习出代表目标的模型,搜索图像进行模式匹配,匹配度最大的区域即为目标结果[9]。判别式模型的思想是将目标跟踪问题作为分类问题,区分目标和背景。目标区域和背景区域分别为正、负样本,通过机器学习算法训练分类器判别目标和背景,使用分类器搜索最匹配区域。判别类模型中目前最突出的发展是相关滤波和深度学习方法的应用。自2010年Bolme等[10]提出MOSSE算法,首次将相关滤波应用到目标跟踪领域中,由于其计算速度快、准确度高等特点,吸引了大批研究者,相关滤波与传统算法的各种结合尝试从不同的角度对算法进行提升。后续在MOSSE算法基础上相继提出了CSK[11],KCF[12]、DSST、STC、SAMF、CN、SRDCF、Deep-SRDCF、C-COT、ECO等拓展算法。其中部分算法结合了深度学习算法,利用卷积网络自动提取特征,提升了目标跟踪效果,但也导致运算速度下降。
针对海面障碍目标的实时准确检测跟踪需求,使用深度学习类目标检测可以达到比较好的结果,但对于无人艇上位机运算环境要求较高,因此本文通过MobileNets进一步改进SSD目标检测网络模型,降低运算要求,加快检测效率。同时结合CF相关滤波目标跟踪算法,实现目标实时跟踪,最终实现目标的准确检测与实时跟踪。
1 基于SSD-CF目標检测跟踪方法
1.1 SSD目标检测算法
为了实现无人艇对水面目标的实时检测跟踪,首先需要检测出目标。本文采用SSD(singleshotmultiboxdetector)目标检测算法进行目标检测。SSD算法的主要思路是均匀地在图片的不同位置进行密集抽样,同时采用不同尺度和长宽比,利用卷积网络提取特征后直接进行目标分类与位置回归,整个过程一步完成检测,因此算法速度较快。
SSD算法中采用密集取样生成目标位置候选框。在不同分辨率的特征图上按不同比例生成固定大小的单元格。对于所有单元格再按{1,2,3,1/2,1/3}不同的长宽比增加候选框。在不同分辨率的特征图上只考虑一个尺度的候选框。如用m个特征图来做预测,每一个特征图中候选框的尺寸大小计算公式:
其中,smin为0.2,smax为0.95,意味着最底层的尺度是0.2,最高层的尺度是0.95。根据不同长宽比ar∈{1,2,3,1/2,1/3},则可计算出每一个候选框的宽wk和高hk:
对于长宽比为1时,另外增加了一个尺度s′k=√sksk+1的候选框。最终每张特征图上的单元格都有6个候选框。候选框与标注框进行匹配,如果面积交并比大于0.5为正例,其他为反例。
SSD算法目标损失函数包含位置损失和置信损失。位置损失是候选框l和标注框g位置参数之间的平滑L1损失函数。置信损失是softmax损失对多类别置信c和权重项α设置为1的交叉验证。其中N是匹配的默认框数量,其中x∈{1,0},为指示函数,表示标注框与候选框匹配与否。
SSD算法中使用两种策略提升算法性能:1)难例挖掘,根据上面的候选框生成策略会产生大量的负训练样本,通过选择置信损失较大的候选框作为反例,使得反例不超过正例的3倍;2)数据增广,对原图进行随机裁剪和在目标周围裁剪,随机翻转来增加训练集。这两个策略都有效提升了算法的准确度。
1.2 MobileNet-SSD轻量级目标检测算法
由于无人艇体积有一定的限制,通常需要装备各式各样的感应设备(如雷达、声呐、摄相机等),无人艇上工控机需要运行大量计算,如果直接使用SSD算法检测目标,将会耗费大量的计算资源,并且耗时较长。因此需要对SSD算法网络结构进行改进,减少运行时间和参数数量。利用MobileNets结构结合SSD算法,可以实现轻量级的目标检测。MobileNets是基于一个流线型的架构,它使用深度可分离的卷积来构建轻量级的深度神经网络。MobileNets的核心思想是将普通的卷积操作分解为深度可分离卷积和1*1逐点卷积两个步骤。可以在基本保证准确率的前提下大大减少计算时间和参数数量。
實验得出MobileNet-SSD在MODD数据集上的平均检测速率为0.8f/s,CF目标跟踪的平均检测速率为22f/s。CF跟踪算法提升了视频目标处理速度。MobileNet-SSD目标检测算法与CF目标跟踪的融合可以有效地实现实时对海面目标的检测跟踪。
实验三在目标存在遮挡图像范围的情况下进行SSD-CF目标检测跟踪算法验证。通过试验无人艇拍摄障碍物视频,无人艇摄像机移动速度较快,可能会将目标移出图像范围,从而导致跟踪过程中目标丢失。
实验三中视频序列的初始目标位置通过目标检测算法获取,由目标跟踪算法实现实时跟踪。如图6所示,在视频第53帧,目标部分遮挡的情况下,SSD-CF算法仍能够准确定位,在71帧,目标超出图像范围并在第79帧可以通过检测算法重新定位目标位置,由跟踪算法进行接下来的持续跟踪,体现算法的有效性。实验结果表明SSD-CF目标检测跟踪算法在目标部分遮挡和完全丢失的情况下,通过MobileNet-SSD目标检测算法可以快速地为CF跟踪算法提供初始目标位置信息,并且在目标跟踪过程中,如果目标丢失,检测算法能够重新定位目标位置,实现无人艇对海面障碍物持续跟踪。3结束语
无人艇的自主航行依靠于目标的准确检测和快速跟踪,采用传统的深度学习算法耗费的运算资源比较大。MobileNet-SSD目标检测算法,在一定程度上提高了检测速度,降低运算环境要求;同时,检测算法对视频的每一帧都独立检测,可能存在位置漂移,提出使用CF目标跟踪对于目标检测结果进行后续跟踪,并利用MobileNet-SSD在跟踪过程目标丢失,重新定位目标位置,降低运算量。因此,本文提出的SSD-CF算法提高目标位置跟踪速度,可避免直接使用目标检测算法进行目标定位,节约运算资源,提高跟踪目标的位置稳定性,实现无人艇的水面目标持续跟踪需求。下一步工作将结合图像检测跟踪结果与其他传感器信息,分析目标运动状态,进行无人艇避障决策研究。
参考文献
[1]VIOLAP, MICHAELJ.Rapidobjectdetectionusingaboostedcascadeofsimplefeatures[C]//Proceedingsofthe2001IEEEComputerSocietyConference, 2001.
[2]DALALN, BILLT.Histogramsoforientedgradientsforhumandetection[C]//IEEEComputerSocietyConference,2005.
[3]HEKM, ZHANGXY, RENSQ, etal.Spatialpyramidpoolingindeepconvolutionalnetworksforvisualrecognition[C]//Europeanconferenceoncomputervision.Springer, 2014.
[4]RENSQ.Fasterr-cnn: Towardsreal-timeobjectdetection
withregionproposalnetworks[J].IEEETransactionsonPatternAnalysisandMachineIntelligence.2015,39(6): 1137-1149.
[5]LIUW.Ssd: Singleshotmultiboxdetector[C]//Europeanconferenceoncomputervision, 2016.
[6]鲁永杰,王思明.一种改进的运动目标跟踪方法[J].中国测试,2015(7):95-98.
[7]BREITENSTEINMD.Robusttracking-by-detectionusingadetectorconfidenceparticlefilter[C]//IEEE12thInternationalConferenceonComputerVision, 2009.
[8]COMANICIUD, VISVANATHANR, PETERM.Real-timetrackingofnon-rigidobjectsusingmeanshift[C]//ProceedingsIEEEConferenceonComputerVisionandPatternRecognition, 2000.
[9]朱文青,刘艳,卞乐,等.基于生成式模型的目标跟踪方法综述[J].微处理机,2017,38(1):41-47.
[10]BOLMEDS.Visualobjecttrackingusingadaptivecorrelationfilters[C]//2010IEEEConferenceonComputerVisionandPatternRecognition, 2010.
[11]HENRIQUESJF.Exploitingthecirculantstructureoftracking-by-detectionwithkernels[C]//Europeanconferenceoncomputervision, 2012.
[12]HENRIQUESJF, CASEIROR, MARTINSP, etal.High-speedtrackingwithkernelizedcorrelationfilters[J].IEEETransactionsonPatternAnalysisandMachineIntelligence, 2015, 37(3): 583-596.
[13]KRISTANM, SULICKV, KOVACICS, etal.Fastimage-basedobstacledetectionfromunmannedsurfacevehicles[J].IEEETransactionsonCybernetics, 2016, 46(3): 641-654.