辛云龙
摘要:太赫兹(Tera Hertz,THz)技术是新兴科学产业之一,与X射线的作用相似,但其辐射能量小,可以对非金属物品进行成像,且对目标物体特别是人体没有伤害,在安检等领域有广阔的发展空间。在物流行业蓬勃发展的今天,数以千万计的快递包裹带来的不仅是经济效益,还有巨大的安全隐患,对包裹中的危险物品,如刀具、枪支、可燃油等的自动检测已成为迫切需求。基于此,利用THz辐射,实现了基于卷积神经网络(CNN)的包裹危险品检测识别系统,能够对THz成像中的危险物品进行位置检测并给出类别分析。系统还提供了历史识别图像查看和本地视频模拟识别的功能,用户能够进一步对图像进行查看分析。经过测试,提出的模型在测试集图像上达到了92.17%的平均分类准确率与93.36%的检测召回率,具有较高的实用价值。
关键词:太赫兹;卷积神经网络;包裹危险品;位置检测;类别分析
中图分类号:TP311.52文献标志码:A文章编号:1008-1739(2021)17-61-4
0引言
太赫兹(Tera Hertz, THz)[1]辐射是0.1~10 THz的电磁辐射,从频率上看,在无线电波和光波、毫米波和红外线之间;从能量上看,在电子和光子之间。与耗资较高、作用距离较短、能量较大的X射线相比,THz成像具有独特优势,使得探测材料内部信息成为可能。目前,相关技术已应用于邮件检查、识别炸药和无损探伤等领域。
THz辐射不仅对人体没有伤害,而且可以对非金属物品进行透视和成像,在包裹危险品检测的应用中可以发挥巨大的作用[2]。对THz成像进行图形分析,并经过运算获得危险物品的位置和类别、置信度,基于卷积神经网络(CNN)的图像检测识别技术等提供了解决方案[3]。在Yolo模型的基础上,提出改进的深度学习模型,在增强网络表达的同时,满足危险物品检测的实时性需求,包括基于THz辐射的成像技术和基于CNN的图像识别技术两方面。
基于CNN的图像识别技术[4]在近几年获得了高速发展,并在计算机视觉、语音识别、自然语言处理等领域取得了惊人的成就。CNN可以有效提取原图像的代表特征,能够从原始像素信息中直接获得视觉规则,而不需要繁杂的预处理步骤。通过局部感知和参数共享的特点,CNN可以有效降低参数量,且能够保留输入的局部空间特征和关联规则,对目标的检测和识别有重要意义[5]。
本文所做的主要工作是将2种技术结合起来,使CNN工作在THz辐射所成图像上,并进行具体的工程化实现,设计完成包裹中的危险物品自动检测识别软件系统[6]。
1系统架构与关键模块设计
1.1概述
系统的开发基于THz成像技术,应用现有的THz辐射源和信号接收设备,通过其驱动程序完成信号从硬件到软件系统的传输,并通过对采集信号的处理完成成像[7]。系统通过驱动程序从THz信号接收设备中采集THz信号并进行不断地读取与处理,形成RGB格式的图像并显示在软件界面中。同时,系统提供了对读取图像中危险物品的识别功能,通过配置相应参数,可识别图像中符合要求的危险物品并保存原图像和识别结果。
1.2系统架构
系统按照功能可划分为主程序模块、功能配置模块、信号采集模块和图像识别模块。功能配置模块主要为采集、识别过程提供参数。信号采集模块对THz设备所接收到的信号进行采集与处理,并实现太赫兹信号到RGB格式的图像转变并提供图像。图像识别模块完成对图像中危险物品的位置和类别的识别并返回识别结果字符串,同时将疑似图像保存至本地,将识别结果保存至数据库。主程序模块用于接收图像和识别结果,完成显示原图像及在图像上绘制识别结果的任务,并控制整个采集过程的开启和关闭。
1.3图像识别算法
对包裹危险品进行识别主要使用基于CNN[9]的神经网络模型———Yolov2,并基于现有的数据集和硬件条件对网络参数和结构进行了改善,最终形成Network类所应用的网络模型。Yolo作为一种全新的工作方法,Yolo基本思想[8]如图1所示。
1.3.1性能指标
目标检测性能[10]的衡量指标包括平均准确率(mAP)、召回率(Recall)、交并比(IOU)、模型检测速度的指标“帧/秒”(FPS)以及模型的损失(Loss)。mAP即所标注物体的平均分类正确率,该期望值接近于1。Recall则是指被正确识别出来为某类的样例占所有该类样例的比例,在危险品识别中则表现为漏检率。IOU是指目标物体的检测框与真实标记框之间的面积交并比。
1.3.2网络结构设计与实现
在上述網络结构中,基本保留了如图3所示的“瓶颈型”卷积结构,降低了网络的下采样率使最终特征图输出维度为26×26×55,并使用了直通层获得更高分辨率的特征图,合并特征图可以有效检测小目标。
1.3.3损失函数与训练
Yolov2的Loss主要包括背景的置信度误差、先验框与预测框的坐标误差以及预测框与对应的标记框之间的坐标误差、类别误差、置信度误差[13],其抽象公式可表示为:
1.4信号采集模块
信号采集模块的部分操作会接收功能配置模块所提供的参数配置进行具体执行,而其生成的RGB格式图像则会反馈给主程序模块,信号采集模块功能结构如图4所示。
1.5功能配置模块
功能配置模块可接收用户设定并传递配置参数。在配置识别模块过程中,提供了识别模拟功能,可用当前所选视频图像代替信号采集模块的所产生的图像结果,对模拟视频中的图像进行识别。功能配置模块的功能结构如图5所示。
1.6主程序模块
主程序模块主要有实时图像显示、历史识别图像显示、识别结果绘制以及数据传输等功能,如图6所示。数据传输是指其接收信号采集模块的RGB图像,然后将图像传输给图像识别模块并从识别模块获得返回的识别结果。识别结果绘制是指在打开功能配置模块中的智能识别时,将识别结果实时显示在图像中。图像显示功能可分为实时图像显示和历史识别图像显示两部分,实时图像显示当前在传送带上经过物品的THz图像,若在功能配置模块打开智能识别,则会实时显示识别结果;历史图像显示则是指在历史图像的数据格子中会排列自动保存的识别图像缩略图[15]。
2界面設计
用户界面主要对应功能配置模块与主程序模块,大致分为功能配置面板、实时图像显示面板、历史图像显示面板、控制命令面板四部分,如图7所示。
系统界面整体共分为6个区域,用A,B,C,D,E,F进行表示,分别为图像或视频采集显示界面、功能配置界面、采集操作按钮界面、历史图像及识别显示界面、工具栏界面和状态显示栏界面,其中A,C,D区域对应于主程序模块,B区域对应于功能配置模块。
3结束语
利用THz辐射设计实现了基于CNN的包裹危险品检测识别系统,对THz成像中的危险物品进行位置检测并给出类别分析。经过测试,本文所提出的模型在测试集图像上达到了92.17%的平均分类准确率与93.36%的检测召回率,在现实生活中具有较高的实用价值。
参考文献
[1]石粒力,吴敬波,涂学凑,等.太赫兹单光子探测器[J].中国科学:物理学力学天文学,2021,51(5):24-40.
[2]刘利平,菅梦楠,陈艺戬.太赫兹技术发展及其应用于6G的挑战分析[J].中兴通讯技术,2021,27(2):17-24.
[3]杨珗.基于传感器网络的危险品运输监测系统[J]信息安全与技术,2013,(9):66-68.
[4] KIARASH A.A Method and System for Enhancing the Resolution of Terahertz Imaging[J]. Measurement,2019,38: 614-619.
[5] SIEMION A,MINKEVICIUS L,QI L,et al.Spatial Filtering Based Terahertz Imaging of Low Absorbing Objects[J].Optics and Lasers in Engineering,2020, 139: 106476.
[6]郑亚垒.基于深度学习的目标检测与跟踪方法研究[D].郑州:郑州大学,2019.
[7]王柳.基于深度学习的空间多目标识别方法研究[J].无人系统技术,2019,2(3):49-55.
[8]但唐朋,柴永磊,姚祉含.基于YOLO模型的目标检测软件[J].科技视界,2019(21):118-119.
[9]雷小康.卷积神经网络定点化关键问题研究[D].北京:北京化工大学,2020.
[10]温宇垚,徐湛,职如昕,等.使用深度学习的社交物联网信任预测模型[J].电讯技术,2021,61(3):269-275.
[11]奚之贵,杨其华,应刘巍.基于Faster-RCNN的物流包裹图像识别研究[J].科技通报,2021,37(1):56-59,64.
[12]昝珊珊,李波.融合改进YOLOv2网络的视觉多目标跟踪方法[J].小型微型计算机系统,2020,41(12):2601-2606.
[13]苏日娜.X-光特定物体图像识别算法的研究与实现[D].呼和浩特:内蒙古大学,2018.
[14]曾文献,张淑青,马月,等.基于卷积神经网络的图像检测识别算法综述[J].河北省科学院学报,2020,37(4):1-8,28.
[15]刘莹,王晓宇,徐卓飞,等.基于卷积神经网络的商品图像识别[J].数字印刷,2020(6):33-40.