焦李成,高新波,韩军伟,李云松,白翔,杨淑媛,孟德宇,任文琦,石争浩,陈秀妍
1.西安电子科技大学,西安 710071;2.重庆邮电大学,重庆 400065;3.西北工业大学,西安 710021;4.华中科技大学,武汉 430074;5.西安交通大学,西安 710049;6.中山大学,深圳 518107;7.西安理工大学,西安 710048;8.《中国图象图形学报》编辑部,北京 100190
图像目标检测在区域监控、被动导航、抢险救灾、飞行器制导等方面具有重要应用,是计算机视觉和图像处理领域研究中的关键性核心问题和挑战性难题,也一直是该领域的研究热点,并受到领域内广大学者的高度关注。近年来,得益于深度学习等人工智能技术在图像处理和计算机视觉中的广泛应用,图像目标检测技术研究已取得重大进展。但现有研究大多是在引入了很多相关假设的简化场景中,对简单场景下的目标进行检测。由于缺乏恰当的知识表示和推理方法,从而大大限制了其所能应用的问题规模和场景复杂性。针对复杂场景下的图像目标检测依然有很多问题需要人们去研究和解决。
为了更好地推动复杂场景图像目标智能检测技术与应用的发展,及时记录我国学者在相关领域的最新研究进展,促进学术交流和技术创新,《中国图象图形学报》邀请业内专家共同策划推出“复杂场景图像目标智能检测”专栏,主要收录国内学者在相关领域具有创新性、突破性的研究成果。以期为相关领域的研究人员提供参考。
经过严格评审,“复杂场景图像目标智能检测”专栏共收录9 篇论文,包括5 篇综述和4 篇算法论文:
《无人机视角下的目标检测研究进展》(作者:冷佳旭,莫梦竟成,周应华,叶永明,高陈强,高新波*)介绍了无人机视角下的目标检测概念,并总结无人机视角下目标检测所面临的目标尺度、空间分布、样本数量、类别语义以及优化目标等5 大不均衡挑战;重点阐述并总结分析从数据增强策略、多尺度特征融合、区域聚焦策略、多任务学习以及模型轻量化等方面来提升无人机视角下目标检测性能的方法;全面介绍基于无人机视角的目标检测数据集,并对已有算法在两个常用公共数据集上进行性能评估;对无人机视角下目标检测技术的未来发展方向进行展望。
《小目标检测研究综述》(作者:潘晓英,贾凝心*,穆元震,高炫蓉)综述了国内外小目标检测的研究现状及成果,归纳分析了常用的小目标数据集,从数据增强、超分辨率、多尺度特征融合、上下文语义信息、锚框机制、注意力机制以及特定的检测场景等方面系统总结了小目标检测方法,并对未来研究方向进行了分析与展望。
《航空遥感图像深度学习目标检测技术研究进展》(作者:石争浩*,仵晨伟,李成建,尤珍臻,王泉,马城城)对航空遥感图像深度学习目标检测算法,特别是近三年国内外的研究方法,进行了系统梳理和总结分析,并指出现阶段航空遥感图像目标检测研究中存在的问题,对未来研究以及发展趋势进行了展望。
《图像级标记弱监督目标检测综述》(作者:陈震元,王振东,宫辰*)介绍了弱监督目标检测的问题定义、基础框架和面临的主要难题;按核心网络架构将现有典型算法归纳为基于优化候选框生成的算法、结合分割的算法和基于自训练的算法,并分析了各种算法的特点及其优缺点;在多个公共数据集和多种指标上对主流算法进行了效果验证和比较;根据现有算法的不足,并以进一步解决主要难题为目标,提出了该领域有价值的未来研究方向。
《Transformer 驱动的图像分类研究进展》(作者:石争浩,李成建*,周亮,张治军,仵晨伟,尤珍臻,任文琦)分类总结近年来Transformer 驱动的深度学习图像分类方法和模型,介绍各类方法的核心思想,分析存在的问题及可能的解决方案;梳理Transformer驱动的深度学习图像分类任务需要解决的关键性科学问题,并对未来研究方向及发展趋势进行展望。
《夜间多场景的临近感知实时行人检测算法》(作者:龚安,李中浩*,梁辰宏)将低光增强算法添加到夜间行人检测任务中进行联合训练,并引入临近感知模块NOH,提出了一种改进的夜间监控场景下的临近感知行人检测算法NSPDet。NSPDet 提升了基线模型夜间行人检测的精度,具备实时推理性能,在夜间复杂场景下表现出良好的鲁棒性。
《结合旋转框和注意力机制的轻量遥感图像检测模型》(作者:李朝辉,安金堂*,贾红雨,方艳)以光学遥感图像为实例背景设计了一种端到端的轻量级旋转框目标检测模型YOLO-RMV4,使模型精度和参数量达到强平衡。
《结合环状原型空间优化的开放集目标检测》(作者:孙旭豪,沈阳,魏秀参*,安鹏)提出了一种基于环状原型空间优化的开放集目标检测框架。实验证明,在不改变模型封闭集识别性能的情况下,本文提出的框架具有更强的开放集类别检测能力。
《外观和运动模式感知的有丝分裂细胞检测》(作者:林凡超,谢洪涛,刘传彬*,张勇东)提出基于外观和运动模式感知的检测框架,通过两阶段预处理和对细胞状态模式的判别性学习,能够实现复杂场景下的精准预测。
我们期待广大读者和科技人员通过“复杂场景图像目标智能检测”专栏,能够更深入、更全面地了解该领域的最新方法和应用,吸引更多学者从事相关研究并产生具有国际影响力的优秀成果,为本领域发展做出新的贡献。
专栏编委会:
焦李成,欧洲科学院外籍院士、俄罗斯自然科学院外籍院士、西安电子科技大学教授,研究领域为智能感知与图像理解、深度学习与类脑计算、进化优化与遥感解译。
高新波,重庆邮电大学教授,研究领域为人工智能、机器学习、计算机视觉、模式识别。
韩军伟,西北工业大学教授,研究领域为人工智能、模式识别、类脑计算、遥感影像解译。
李云松,西安电子科技大学教授,研究领域为遥感图像编码、处理、高性能计算以及芯片设计。
白翔,华中科技大学教授,研究领域为模式识别、计算机视觉、文档分析与识别。
杨淑媛,西安电子科技大学教授,研究领域为智能目标感知与解译。
孟德宇,西安交通大学教授,研究领域为机器学习、人工智能、计算机视觉。
任文琦,中山大学副教授,研究领域为图像/视频处理与增强。
石争浩,西安理工大学教授,研究领域为机器视觉、医学图像处理及机器学习。
专栏编辑:
陈秀妍,编辑,主要研究方向为学术出版和媒体传播等。E-mail:chenxy@aircas.ac.cn