面向智能航道巡检的水面目标检测算法

2024-05-20 16:08任思羽黄琦麟左良栋吴瑞蔡枫林
重庆大学学报 2024年4期
关键词:注意力机制

任思羽 黄琦麟 左良栋 吴瑞 蔡枫林

doi: 10.11835/j.issn.1000-582X.2024.04.010

收稿日期:2023-08-22

基金項目:2021年重庆市本科院校与中国科学院科研院所合作项目(HZ2021015);重庆市教委科学技术研究重点资助项目(KJZD-K202305201)。

Foundation:Supported by Scooperation Project between Chongqing Municipal Undergraduate Universities and Institutes Affiliated to the Chinese Academy of Sciences in 2021 (HZ2021015) and Key Project of Science and Technology Research of Chongqing Education Commission (KJZD-K202305201).

作者简介:任思羽(1971—),女,硕士,副教授,主要从事计算机网络技术、信息安全、计算机视觉等方向研究,(E-mail)505700782@qq.com。

通信作者:黄琦麟(1998—),男,硕士研究生,(E-mail)2021208059@cqust.edu.cn。

摘要:为解决多场景复杂内河背景下水面目标检测存在环境噪声大、水面目标分布情况繁杂、特征微小模糊等问题,提出一种融合多尺度特征和注意力机制,增强类激活映射的水面目标检测算法,称UltraWS水面目标检测算法。在典型检测网络上设计空间注意力模块与多头策略,融合多尺度特征,提高对微小目标的检测能力。其次,提出UltraLU模块增强类激活映射,减小环境因素与分布因素对检测目标的影响。最后,设计对模型进行Tucker张量分解,实现模型轻量化,增强模型的可解释性与推理速度。实验结果表明,所提出的UltraWS算法提高了对背景噪声的抗干扰能力,更好捕捉微小目标,满足边缘化部署的检测速度和准确率均衡性需求。在WSODD数据集上,算法的mAP值取得了最高的84.5%,相较于其他主流方法存在较大提升。基于提出的算法建立航道安全巡检体系与评估方法,有利于推动内河智慧航运的发展。

关键词:水面目标检测;注意力机制;类激活映射;张量分解

中图分类号:TP391.4          文献标志码:A             文章编号:1000-582X(2024)04-114-13

A novel water surface target detection algorithm for intelligent waterway inspection

REN Siyu1,2, HUANG Qilin3, ZUO Liangdong4, WU Rui3, CAI Fenglin3

(1. School of Information Science & Engineering, Lanzhou University, Lanzhou 730000, P. R. China;

2. Teaching Department of the Open University of Chengdu, Chengdu 610051, P. R. China; 3. School of Intelligent Technology & Engineering,  Chongqing University of Science and Technology, Chongqing 401331, P. R. China; 4. Chongqing Nearspace Innovation R&D Ceater, Shanghai JiaoTong University, Chongqing 401135, P. R. China)

Abstract: To address the challenges posed by environmental noise, complex water surface target distributions, and the blurring of small-scale features in water surface target detection against complex river backgrounds, this paper presents UltraWS, an enhanced water surface target detection algorithm that integrates multi-scale features and attention mechanisms. Firstly, a spatial attention module and multi-head strategy are incorporated into a standard detection network to fuse multi-scale features and improve the detection capability of small targets. Secondly, the UltraLU module is introduced to enhance class activation mapping and reduce the influence of environmental and distribution factors on target detection. Finally, a Tucker tensor decomposition method is applied to achieve model lightweighting, enhancing model interpretability and inference speed. Experimental results demonstrate that the proposed UltraWS algorithm improves resistance to background noise, enhances small target detection, and achieves a balance between detection speed and accuracy suitable for edge deployment requirements. On the WSODD dataset, the algorithm achieves the highest mAP value of 84.5%, outperforming other mainstream methods by a considerable improvement. This proposed algorithm, coupled with the established channel safety inspection system and evaluation method, contributes significantly to the advancement of intelligent river transportation.

Keywords: water surface target detection; attention mechanism; class activation mapping; tensor decomposition

航道安全是水上交通运输与物流贸易的重要保障,确保船舶来往畅通与航行环境稳定。航道安全的管理正趋于向数字化、自动化、智能化的全新范式进行转变[1]。近年来,计算机视觉技术广泛应用于航道管理的各种场景,包括航道安全监控[2],船舶自主导航[3],港口集装箱识别[4]等。同时,在基于计算机视觉的航道巡检方面也引发广大学者的研究[5?6]。无人船设备借助目标检测算法,进行周期巡逻作业是当前智能航道巡检的主流解决方案。然而,多场景复杂内河背景下,天气、水面光照反射、水波、植被遮挡等环境因素带来的影响明显(如图1所示),且水面目标分布情况繁杂、外观微小、纹理特征模糊[7]。因此,水面目标检测被认为是一个困难且有价值的研究工作。

为实现对安全隐患、异常行为的智能化识别,众多学者研究基于双阶段和基于单阶段的目标检测方法。基于双阶段的目标检测方法以R-CNN[8](regions with CNN features)检测网络为代表,该方法在检测过程中通过感兴趣区域提取相当数量的候选框,每个候选框通过独立的CNN通道进行分类预测。R-CNN网络具备精确目标定位和强大的目标识别能力,通过多阶段训练过程提供了高度准确的目标检测性能,尤其适用于小样本数据[9?11]。基于单阶段目标检测网络以密集采样策略模型为代表,YOLO[12](you only look once)模型以及众多基于YOLO的密集采样策略模型通过对输入图像中每个位置都产生一个固定数量的预测结果,同时完成目标分类和位置回归,不需要显示候选框生成过程。YOLO网络作为目标检测模型的优势包括:1)实时性高:YOLO能够在图像中快速检测多个目标对象,使其适用于实时应用,如自动驾驶和视频监控[13?14];2)准确性高:YOLO能够在不牺牲准确性的前提下检测多种不同大小和形状的目标[15?16];3)简单高效:YOLO的网络架构相对简单,易于训练和部署,使其在各种计算资源有限的场景中具备竞争力[17?18]。

在水面目标检测的相关研究中,童小钟等[19]基于特征金字塔网络,融合注意力和多尺度特征实现了海况背景下无人艇的高效环境感知能力。王一早等[20]针对水面垃圾检测问题改进了YOLO v3网络,加强了小目标的特征信息。冯俊健等[21]提出了基于多视图交叉一致性学习的水面目标检测算法,缓解了半监督学习有限标注样本过拟合的问题,提高无标注样本中目标提取的有效性。冯辉等[22]基于YOLO v3网络融合残差密集模块,提升了水面目标的检测精度。周治国等[23]研究融合时空信息来增强水面目标跟踪精度。Bovcon等[24]构建了海面目标检测的基准并提出基于编解码器架构的水障分离和细化网络。Zust等[25]学者的研究从弱监督注释中训练障碍物检测分割网络,降低关键目标的标注成本。

本研究对多场景复杂内河背景的水面目标检测任务进行分析。内河水面目标检测任务中存在环境噪声(如:天气、光照、水波、植被遮挡)影响大,目标外观及纹理特征微小,目标分布情况类型多(如:密集分布、重叠分布、稀疏分布)等问题,之前的方法无法有效对潜在安全隐患目标进行准确识别。此外,常规目标检测模型参数量大,对算力要求高,导致算法响应时间长,且无法在边缘端设备进行部署,大大阻碍无人船智能化的研究进展。

面向内河航道安全巡检的水面目标检测任务,针对水面环境噪声大、目标特征难以提取,设计提出一种融合多尺度特征和注意力机制,增强类激活映射的水面目标检测算法,称作UltraWS算法。该算法在典型检测网络上设计注意力模块与多头策略,融合多尺度特征,提高对极其微小目标的检测能力。研究提出UltraLU模块增强类激活映射,减小环境因素与分布因素对检测目标的影响。此外,基于无人艇环境感知边缘化部署目的,设计对模型进行Tucker张量分解,增强内河目标检测模型的可解释性与推理速度,实现模型轻量化。实验表明,模型性能与当前主流算法相比取得领先,所提出的算法能够满足检测速度和准确率的均衡性需求。内河目标检测模型在达到稳定性要求的同时,参数量大幅减少,实现了在边缘端设备部署的可能。在内河水面目标检测算法的基础上,对航道水面环境与潜在安全隐患的关联性进行分析,提出了内河航道安全巡检的智能化方法。

1 UltraWS水面目標检测算法

为实现多场景复杂内河背景下的水面目标检测任务,针对无人船感知的水面物体视觉数据进行深入分析,提出UltraWS水面目标检测算法,整体算法框架如图2所示,重点包含3个步骤:第一步,改进典型的目标检测网络;第二步,提出UltraLU模块进行类激活映射增强;第三步,设计Tucker张量分解轻量化目标检测模

型,减少模型参数量以及浮点运算量。在建立目标检测网络过程中,首先在大规模的计算机视觉通用数据集上进行预训练,以增强模型的泛化推理能力。面向无人船感知的水面物体视觉数据集上对典型目标检测网络进行改进,为更好检测微小目标、水面重叠、融合注意力模块增加额外预测头,完成构建内河背景下关键目标检测模型。研究提出UltraLU模块,增强模型对环境噪音的抗干扰能力。最后,设计Tucker张量分解极大减少算法整体参数量。

1.1 改进目标检测网络

为保证检测精度与速度的均衡性,基于典型单阶段检测网络进行改进,设计适用于水面隐患目标的检测网络。如图3所示,改进后的网络主要由3部分构成:主干特征提取部分(Backbone)、特征处理脖颈部分(Neck)和检测头部分(Head)。

CBS模块由卷积层、标准化层以及SiLU激活函数层组成,是网络中一个高效的基本模块。CBAM模块为融合注意力模块,在网络中替换了原始结构中的前两层CBS模块,且在Backbone部分与Neck部分之间也增加了注意力模块。Head部分的CBM模块与CBS相似,差异之处在于由Sigmoid激活函数层代替了SiLU激活函数层,在特征头使用Sigmoid将输出映射值限制在0~1之间,便于概率解释,以及设定正负类别阈值。在改进的网络中增加了一个额外的检测头,增强网络对微小目标的检测能力。

在Head部分的REP模块分为训练与推理2个类别。训练过程主要内容是叠加3个分支,分别是:特征提取、平滑特征以及恒等函数。推理过程是对训练的重参数化。MP模块的作用是下采样,在Backbone部分和Neck部分均有出现。ELAN和ELAN-W模块通过控制极端长度的梯度路径,使网络能够学习到的特征更多,鲁棒性更强。SPPCSPC模块将输入特征图划分为不同的网格,并分别应用最大池化操作。SPPCSPC模块通过引入多个尺度的池化层,以及不同的池化窗口大小,来捕获不同感受野的特征,以帮助模型更好理解输入数据的多尺度信息。这个模块的增加,增大了网络的感受野,加强网络在不同分辨率图像下的适应能力。

1.2 融合注意力模块

在水面应用场景中,存在天气条件恶劣、背景噪声大和物体分布复杂等特殊情况,导致算法无法有效提取输入图像的语义特征信息,出现误检和漏检情况。因此,笔者提出在网络结构中加入CBAM(convolutional block attention module)[26]注意力机制的方法,提高算法应对特殊水面场景的特征提取能力,降低无关水面目标和复杂背景对潜在水面隐患目标检测的干扰,同时提高识别准确率。CBAM对输入的特征图沿2个独立维度分别计算出注意力图,将其与输入特征图进行自适应特征融合,模块结合了通道注意力和空间注意力,以进一步细化特征信息。其结构如图4所示。

通道注意力模块通过考虑特征图通道之间的相互关系,利用平均池化和最大池化方式来汇聚特征图的空间信息,减少信息丢失。由此生成的通道注意图主要关注提取水面隐患检测目标的轮廓信息特征,通道注意图计算公式如下

(1)

其中:为多层感知机层;为平均池化层;为最大池化层;与分别代表平均池化特征与最大池化特征。

在通道注意力模块之后,引入空间注意力模块。模块利用卷积操作,同样结合池化方法来聚合位置信息,该模块的输入是通过将通道注意特征图与初始输入相乘得到。之后,将这些特征拼接,利用卷积和Sigmoid激活函数得到带有空间注意力的空间矩阵,最终,将这个矩阵与通道注意特征图相乘,得到新的特征图。其计算公式为

(2)

1.3 增加额外预测头

内河航道水面数据集包含许多外观特征微小的实例,使得水面小目标检测变得异常棘手。为实现UltraWS算法对水面目标多尺度检测,笔者提出增加额外预测头,不同于原始网络的3个探测头,UltraWS算法的4个探测头可以探测到微小的水上垃圾和浮球,特别是对在图像中相对较远位置上的目标进行捕获。此4探测头结构可以提高检测稳定性,减少目标尺度变化所带来的严重负面影响。添加的预测头如图3中所示,从低级别、高分辨率的特征图中生成,虽然计算和内存成本增加,但对于极小对象检测性能更佳。

1.4 UltraLU模块

为提高模型对环境噪声的抗干扰能力以及解释性能与预测性能,笔者提出UltraLU模块。在背景噪声过大时,模型对图像的理解容易受到假阴性的干扰。这种干扰主要表现为相对较高的归因分数下降,而整体空间结构保持不变。为此,UltraLU模块设计了一个分段线性函数,以增加受损高归因分數的比例,提高其在部分标签训练模型中高于某个阈值的归因得分。

,  (3)

其中,模块引入了缩放因子和阈值参数,式子中1。UltraLU模块的目标是确定一个适当的值和,使得排名靠前的归因得分对正面标签的贡献较大,对负面标签的贡献较小。通过搜索零附近的值来实现这个目标。在实验中,观察到对于不同的值,模型的性能表现没有明显差异。因此,选择了最简单的情况,即0。基于这些考虑,将等式重写为类似于ReLU[27]的形式

。  (4)

通过将UltraLU应用于类激活映射的每个元素,如图5所示,UltraLU将积极归因得分提高了倍,这是被假阴性损害的主要目标,同时保持消极得分不变。

1.5 Tucker张量分解

UltraWS算法主要针对水面目标检测网络的Backbone部分设计Tucker张量分解。作为主成分分析的高阶版本,Tucker分解在深度学习领域应用十分广泛,其分解张量为一个核张量与每一维度上对应矩阵乘积,常被用于轻量化模型。以三阶张量为例,Tucker分解过程可以表示为

,  (5)

其中:是核张量;,,是因子矩阵。,,是,,的成分数。因子矩阵属于不同维度上的主成分,不同成分之间的交互程度用核张量来表示。

从元素的角度可以表示Tucker分解为

,  (6)

其中:;;。

从矩阵化理解Tucker分解可以表示为

。  (7)

2 实验与结果分析

为证明所提出的UltraWS算法用于内河航道水面目标的检测性能,采用WSODD数据集[7]进行实验验证,该数据集由7 000余张不同环境条件、天气条件和拍摄时间的水面图像组成,其中水面图像中存在超过20 000个关键对象,且包括船舶、航标以及垃圾等14个常见对象类别,具体内容描述如表1所示。在实验中UltraWS与目前主流检测算法进行对比,验证算法在多场景复杂内河背景下对水面多尺度目标表现出良好的检测性能。

2.1 实验环境

UltraWS水面目标检测算法实验所使用计算机的中央处理器型号为Intel Core i5-12400F,图形处理器型号为NVIDIA GeForce RTX 3060Ti,算法程序框架选用PyTorch框架。具体实验中,输入的图像被随机裁剪成640×640的大小,采用传统图像处理方式对训练数据进行增强以及归一化处理。模型训练使用SGD优化器,初始学习率和权重衰减分别设置为0.01和0.000 5。

2.2 评价指标

为了验证提出的UltraWS水面目标检测算法的有效性,使用精确率(Precision),召回率(Recall),F1值,以及平均精度均值(mean average precision,mAP)作为评价指标。这些评价指标的计算公式如下

,  (8)

,  (9)

,  (10)

其中:代表真阳性;和分别代表假阳性与假阴性。

平均精度(average precision,AP)评估了精确率与召回率之间的动态变化,其定义为

。  (11)

在实验中,平均精度均值mAP为模型在识别各个类别目标所取得平均精度AP的整体平均值,最能反映模型的性能。

2.3 训练过程

目标检测网络的训练与验证过程如图6所示,评估指标平均精确率(mAP)曲线如图7所示。训练与验证过程的损失曲线显示,模型在训练过程中逐渐收敛。在曲线的末尾,训练损失和验证损失之间的差异很小,只存在微小的泛化差距。平均精准率曲线展示了模型在140~150轮之间表现最佳,同时满足检测效率与准确率的均衡性目标。

2.4 消融实验

为了验证提出的UltraWS算法各个模块的有效性,采用消融实验对各个改进部分进行验证[28-31]。在相同实验条件下,将注意力模块、额外检测头、UltraLU模块分别加入到YOLO V7检测算法中,评估各个模块对检测结果的影响,结果如表2所示。表中A方法表示YOLO V7算法;B方法表示增加的注意力模块;C方法表示增加的额外检测头;D方法表示增加的UltraLU模块。从表中可以看出,增加注意力模块后,mAP提高了2.94%;增加一个额外检测头后,mAP提高了1.56%;引入设计的UltraLU模块后,mAP提高了3.02%。可见,所提出的方法以及改进模块都提升了网络检测性能。UltraWS算法融合注意力模块后减少了漏检与错检几率,能够提升监测网络特征提取能力。增加额外一个检测头后,算法对多尺度特征的检测效果有所增强。笔者设计的UltraLU模块,能够强化检测网络的抗干扰能力。

2.5 对比实验

笔者提出的算法在测试集上取得精确率AP值在各个类别上的表现如图8所示,算法平均精确率mAP为84.5%。如表3所示,将提出算法与当前主流目标检测模型进行对比[33-35]。改进过后的水面隐患目标检测网络与原始网络效果对比如图9所示,同一场景下检测效果的左侧为原始网络,右侧为改进算法。图9(a)左侧为原始网络检测效果,检测原始算法遗漏了重叠的船只目标以及微小的远处浮球目标。图9(a)右侧为改进后的算法检测效果,无论重叠或是微小的目标均被检测标识。图9(b)中,原始网络因为船只重叠,未能判断出正确目标,改进后算法不仅识别出了所有船只,还正确区分了小划船与轮船。图9(c)中,相较于原始算法,改进后的算法能识别出远处更微小、模糊的轮船目标。图9(d)与图9(e)改进后的算法将细小的动物目标与浮球目标额外的识别检测出来。图9(f)中在背景噪声不大且分布情况不复杂的情况,原始网络与改进后算法都有良好表现。

Tucker张量分解在模型的应用前后对比情况如表4所示。运用Tucker张量分解后,模型参数量、乘加运算量以及浮点运算量均减少接近半数。减少参数量和浮点运算量提高了模型的计算效率,加速训练和推理过程,在资源受限情况下,使模型能够在边缘端的设备上运行。此外,减少参数量可以降低模型复杂度,从而减少过度拟合的风险。

3 算法在航道巡检的应用

内河航道的安全保障任务主要存在意外事故、自然灾害和违法行为3种风险挑战。为应对内河航道的潜在安全隐患,已完成设计构建UltraWS内河水面目标检测算法,基于目标检测算法,建立航道安全巡检体系以及航道安全评估方法。

研究将算法搭载在无人船平台进行内河场景下的实际应用。提出UltraWS水面目标检测算法部署在NVIDIA Nano边缘化计算平台上进行,该边缘化计算平台具有性能优异的GPU和CPU计算资源,稳定性能够满足工业要求,能快速传输数据资源。图10展示了部署在无人船平台的NVIDIA Nano边缘化计算设备的实物图。

3.1 航道安全巡检体系

以智能化、数字化的航道管理为目标,以无人船、无人机为主体建立航道安全巡检体系,将提出的Ultra内河水面目标检测算法部署在无人智能设备上,实现高效智能的安全巡检系统。智能安全巡检系统包括无人设备作业管控、安全隐患目标检测、数据统计分析等多部分。如图11所示,安全风险巡检系统的安全隐患目标检测内容主要包括:航标检测、船舶违规停泊检测、浮标球检测、水产养殖设施检测、漂浮垃圾检测、大型船舶检测等。

3.2 航道安全评估方法

航道安全风险描述了危险和安全状态间的关系度量,航道安全风险可用函数拟合如下

,  (12)

其中:表示某特定的客观状态;表示在状态下航道安全风险指数;表示某一安全事件发生的概率值;表示安全事件发生的结果;表示实验函数。

针对航道体系在某状态下引发体系内人员、船舶、环境等多个层面出现险情的概率及险情程度,使用航道安全风险指数来表达。经过内河航道的安全巡检及水面目标检测算法,对内河航道的潜在安全风险进行识别,确定潜在安全风险事件。对不同航道安全风险事件進行风险评估,确定航道安全等级,作为开展风险管控的依据。

4 结  论

针对多场景复杂内河背景下水面目标检测任务,提出UltraWS水面目标检测算法。该算法在典型检测网络上设计空间注意力模块与多头策略,融合注意力与多尺度特征,提高对极其微小目标的检测能力。为减小环境因素与分布因素对检测效果的影响,算法提出UltraLU模块增强类激活映射,面向无人艇环境感知边缘化部署目的,设计了对模型进行Tucker张量分解,增强内河目标检测模型的可解释性与推理速度,实现模型轻量化。

實验结果表明建立UltraWS水面目标检测算法具有良好的安全隐患目标识别与推理能力,实现水面潜在安全隐患检测的多结构可解释性框架。在WSODD数据集上UltraWS算法表现出较高性能,取得84.5%的mAP最高值。提出UltraLU模块提高了算法对背景噪声的抗干扰能力,更好捕捉微小目标。笔者提出的算法能够满足检测速度和准确率的均衡需求。以无人船为主体建立航道安全巡检体系,将所提出的算法部署在边缘化设备上,实现高效智能的安全巡检系统。未来的研究将聚焦在环境更加恶劣的海洋背景下,进一步关注算法在不同场景的鲁棒性和泛化性。

参考文献

[1]  阳建云,黄纯.长江口智慧航道的初步构想[J].水运工程,2017(11):7-11.

Yang J Y, Huang C. The preliminary conception of the smart waterway in the Yangtze River Estuary [J]. Port & Waterway Engineering, 2017(11):7-11. (in Chinese)

[2]  史明.内河航道4G无线视频监控系统设计[J].数字技术与应用,2022,40(02):183-185.

Shi M. Design of 4G wireless video monitoring system for inland waterway [J]. Digital Technology and Application, 2022, 40(02):183-185.(in Chinese)

[3]  朱明秀.图像处理技术在船舶导航过程的应用[J].舰船科学技术,2019,41(08):187-189.

Zhu M X. Application of image processing technology in ship navigation [J]. Ship Science and Technology, 2019,41(08):187-189.(in Chinese)

[4]  王雪,张根荣.基于机器视觉的港口集装箱卸船定位识别系统[J].中国水运(下半月),2015,15(11):138-140.

Wang X, Zhang G R. Port container unloading location recognition system based on machine vision [J]. China Water Transport (Second Half), 2015, 15(11):138-140.(in Chinese)

[5]  严荣慧,谢海成,花敏恒,等.基于运动与表象特征的广域船舶目标识别方法[J].中国舰船研究,2022,17(01):227-234.

Yan R H, Xie H C, Hua M L,et al. Wide-area ship target recognition based on motion and appearance feature method [J]. Chinese Ships Research, 2022(01):227-234. (in Chinese)

[6]  光睿智,安博文,潘胜达.基于无锚框网络的航拍航道船舶检测算法[J].计算机工程与应用,2021,57(15):251-258.

Guang R Z, An B, Pan S D. Ship detection algorithm for aerial photography Channel based on frameless network [J]. Computer Engineering and Applications, 2021, 57(15):251-258.(in Chinese)

[7]  Zhou Z, Sun J, Yu J, et al. An image-based benchmark dataset and a novel object detector for water surface object detection[J]. Frontiers in Neurorobotics, 2021, 15: 72333.

[8]  Girshick R, Donahue J, Darrell T, et al. Rich feature hierarchies for accurate object detection and semantic segmentation[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. July 23-28, 2014, Columbus, OH, USA: IEEE, 2014: 580-587.

[9]  李学军,权林霏,刘冬梅,等.基于Faster-RCNN改进的交通标志检测算法[J/OL].吉林大学学报(工学版):1-10[2023-09-01].DOI:10.13229/j.cnki.jdxbgxb.20230553.

Li X J, Quan L Fi, Liu D M, et al. Improved traffic sign detection algorithm based on Faster-RCNN [J/OL]. Journal of jilin university (engineering science) : 1-10 [2023-09-01]. (in Chinese)

[10]  蒋占军,吴佰靖,马龙,等.多尺度特征和极化自注意力的Faster-RCNN水漂垃圾识别[J/OL].计算机应用:1-8[2023-09-01].http://kns.cnki.net/kcms/detail/51.1307.TP.20230613.1820.004.html

Jiang Z J, Wu B J, Ma L, et al. Faster-RCNN identification of floating garbage with multi-scale features and polarized self-attention [J/OL]. Computer Application: 1-8 [2023-09-01]. HTTP: / / http://kns.cnki.net/kcms/detail/51.1307.TP.20230613.1820.004.html. (in Chinese)

[11]  王殿伟,胡里晨,房杰,等.基于改进Double-Head RCNN的无人机航拍图像小目标检测算法[J/OL].北京航空航天大学学报:1-10[2023-09-01].DOI:10.13700/j.bh.1001-5965.2022.0591.

Wang D W, Hu L C, Fang Jet al. Small target detection algorithm of UAV aerial image based on improved Double-Head RCNN [J/OL]. Journal of Beijing University of Aeronautics and Astronautics :1-10[2023-09-01].DOI:10.13700/j.bh.1001-5965.2022.0591.(in Chinese)

[12]  Redmon J, Divvala S, Girshick R, et al. You only look once: unified, real-time object detection[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. June 26-July 1, 2016, Las Vegas, NV, USA: IEEE, 2016: 779-788.

[13]  劉辉,刘鑫满,刘大东.面向复杂道路目标检测的YOLOv5算法优化研究[J/OL].计算机工程与应用:1-11[2023-09-01].http://kns.cnki.net/kcms/detail/11.2127.TP.20230629.1435.002.html

Liu H, Liu X M, Liu D D. Optimization of YOLOv5 algorithm for complex road target detection [J/OL]. Computer engineering and application: 1-11 [2023-09-01]. HTTP: // http://kns.cnki.net/kcms/detail/11.2127.TP.20230629.1435.002.html.(in Chinese)

[14]  刘刚,冯彦坤,康熙.基于改进YOLO v4的生猪耳根温度热红外视频检测方法[J].农业机械学报,2023,54(02):240-248.

Liu G, Feng Y K, kang X. Thermal infrared video detection method of pig ear root temperature based on Improved YOLO v4 [J]. Transactions of the Chinese Society for Agricultural Machinery,2023,54(02):240-248.

[15]  张天峰,冉秉东,王楷.基于压力容器裂纹图像检测及识别算法研究[J].重庆大学学报,2022,45(07):103-111.

Zhang T F, Ran B D, Wang K. Image detection and recognition algorithm based on pressure vessel crack research [J]. Journal of chongqing university, 2022, (7) : 103-111.(in Chinese)

[16]  徐晓光,李海.多尺度特征在YOLO算法中的应用研究[J].电子测量与仪器学报,2021,35(06):96-101.

Xu X G, Li H. Multi-scale feature in YOLO algorithm application [J]. Journal of electronic measurement and instrument, 2021, 35 (6) : 96-101.(in Chinese)

[17]  卢俊哲,张铖怡,刘世鹏,等.面向复杂环境中带钢表面缺陷检测的轻量级DCN-YOLO[J].计算机工程与应用,2023,59(15):318-328.

Lu J Z, Zhang C Z, Liu S Pet al. Lightweight DCN-YOLO for strip surface defect detection in complex environment [J]. Computer Engineering and Applications, 2019,59(15):318-328.(in Chinese)

[18]  单美静,秦龙飞,张会兵.L-YOLO:适用于车载边缘计算的实时交通标识检测模型[J].计算机科学,2021,48(01):89-95.

Shan M J, Qin L F, Zhang H B. L-YOLO: real-time traffic sign detection model for in-vehicle edge Computing [J]. Journal of Computer Science, 2019,48(01):89-95.(in Chinese)

[19]  童小钟,魏俊宇,苏绍璟,孙备,左震.融合注意力和多尺度特征的典型水面小目标检测[J].仪器仪表学报,2023,44(01):212-222.

Tong X Z, Wei J Y, Su S J, Sun B, Zuo Z. Multi-scale feature fusion attention and typical surface of small target detection [J]. Journal of instruments and meters, 2023, 44(01): 212-222. (in Chinese)

[20]  王一早,马纪颖,罗星,王书哲.基于SPMYOLOv3的水面垃圾目标检测[J].计算机系统应用,2023,32(03):163-170.

Wang Y Z, Ma J Y, Luo X, Wang S Z. Surface waste target detection based on SPMYOLOv3 [J]. Computer System Application, 2023, 32(03):163-170. (in Chinese)

[21]  馮俊健,李彬,田联房,董超.多视图交叉一致性学习的半监督水面目标检测[J].哈尔滨工业大学学报,2023,55(04):107-114.

Feng J J, Li B, Tian L F, Dong C. Semi-supervised surface target detection based on multi-view cross-consistent learning [J]. Journal of Harbin Institute of Technology, 2023,55(04):107-114.(in Chinese)

[22]  冯辉,郭俊东,徐海祥.面向精准目标定位的水面目标检测算法[J/OL].华中科技大学学报(自然科学版):1-8[2023-05-25].

Feng H, Guo J D, Xu H X. Water surface target detection algorithm for precise target location [J/OL]. Journal of Huazhong University of Science and Technology (Natural Science Edition): 1-8[2023-05-25]. (in Chinese)

[23]  周治国,荆朝,王秋伶,屈崇.基于时空信息融合的无人艇水面目标检测跟踪[J].电子与信息学报,2021,43(06):1698-1705.

Zhou Z G, Jing C, Wang Q L, Qu C. Surface target detection and tracking of unmanned craft based on spatio-temporal information fusion [J]. Journal of Electronics and Information Technology, 2021,43(06):1698-1705.(in Chinese)

[24]  Bovcon B, Kristan M. A water-obstacle separation and refinement network for unmanned surface vehicles[C]//2020 IEEE International Conference on Robotics and Automation (ICRA). May 31-June 4, 2020, Paris, France: IEEE, 2020: 9470-9476.

[25]  ?ust L, Kristan M. Learning maritime obstacle detection from weak annotations by scaffolding[C]//Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision. June 19-23, 2022, New Orleans, LA, USA: IEEE, 2022: 955-964.

[26]  Woo S, Park J, Lee J Y, et al. Cbam: Convolutional block attention module[C]//Proceedings of the European conference on computer vision (ECCV). September 8-14, 2018. Munich, Germany: Springer Science+Business Media, 2018: 3-19.

[27]  Xu B, Wang N, Chen T, et al. Empirical evaluation of rectified activations in convolutional network[J]. arXiv preprint arXiv:1505.00853, 2015.

[28]  Redmon J, Farhadi A. Yolov3: An incremental improvement[J]. arXiv preprint arXiv:1804.02767, 2018.

[29]  Li Y, Chen Y, Wang N, et al. Scale-aware trident networks for object detection[C]//Proceedings of the IEEE/CVF international conference on computer vision. October 27-November 2, 2019. Seoul, Korea: IEEE, 2019: 6054-6063.

[30]  Duan K, Bai S, Xie L, et al. Centernet: Keypoint triplets for object detection[C]//Proceedings of the IEEE/CVF international conference on computer vision. October 27-November 2, 2019, Seoul, Korea: IEEE, 2019: 6569-6578.

[31]  Bochkovskiy A, Wang C Y, Liao H Y M. Yolov4: Optimal speed and accuracy of object detection[J]. arXiv preprint arXiv:2004.10934, 2020.

[32]  Jiang Y, Tan Z, Wang J, et al. GiraffeDet: A heavy-neck paradigm for object detection[J]. arXiv preprint arXiv:2202.04256, 2022.

[33]  Zhou F, Zhao H, Nie Z. Safety helmet detection based on YOLOv5[C]//2021 IEEE International conference on power electronics, computer applications (ICPECA).January 22-February 4, 2021. Shenyang, China: IEEE, 2021: 6-11.

[34]  Han X, Zhao L, Ning Y, et al. ShipYolo: an enhanced model for ship detection[J]. Journal of Advanced Transportation, 2021, 2021: 1-11.

[35]  Wang C Y, Bochkovskiy A, Liao H Y M. YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors[J]. arXiv preprint arXiv:2207.02696, 2022.

(編辑  侯湘)

猜你喜欢
注意力机制
基于注意力机制的行人轨迹预测生成模型
基于注意力机制和BGRU网络的文本情感分析方法研究
多特征融合的中文实体关系抽取研究
基于序列到序列模型的文本到信息框生成的研究
基于深度学习的手分割算法研究
从餐馆评论中提取方面术语
面向短文本的网络舆情话题
基于自注意力与动态路由的文本建模方法
基于深度学习的问题回答技术研究
基于LSTM?Attention神经网络的文本特征提取方法