智慧城管智能目标检测案件类型方法研究

2022-05-24 11:44陶为翔
电子设计工程 2022年10期
关键词:灰度卷积神经网络

陶为翔,郭 磊,李 京

(正元地理信息集团股份有限公司,北京 101300)

在智慧城管智能目标检测的过程中,目标检测算法具有一定的多样性与适用性,能够根据图像或事物的不同表象,来提取相应的特征点,进而实现对各种案件图像的分类与处理[1]。目标检测算法的应用已较为成熟,被广泛应用于各大领域,在对特征图像进行识别处理后,还可迅速向系统进行精确的反馈。然而在长久以来的应用中,该算法仍然暴露出了一系列弊端[2]。鉴于此,文中实验将对传统目标检测算法进行深入的探究,采用优化卷积神经网络对传统目标检测算法进行改进,旨在提高城市案件图像识别的效率与准确度,实现真正意义上的智慧城市管理。

1 目标检测算法

1.1 图像处理技术

在智慧城管智能目标检测案件的识别处理中,往往对图像处理的效率具有较高的要求,因此通常需要将彩色图像快速转换为灰色图像,以保证图像处理的即时性与有效性[3]。基于加权平均的图像灰度化是一种行之有效的图像处理手段,计算公式如式(1)所示:

式(1)中,(i,j)表示图像像素坐标位置;a、b、c均表示灰度化处理的加权系数,其取值通常分别为0.3、0.59、0.11。所有待处理图像中的像素灰度值均被定义为Gray,如式(2)、式(3)所示:

式中,R表示待处理图像像素中的红色分量;G表示图像像素中的绿色分量;B表示目标图像像素中的蓝色分量[4]。在完成图像灰度化处理后,立即进行图像二值化处理,来有效避免图像中复杂背景与噪声带来的干扰。图像二值化主要包含3 类方法,分别为全局阈值、局部阈值、动态阈值,文中采用全局阈值的手段,具有运算速度快、处理效果好的优势,且能够有效处理物体灰度值与背景差别较大的图像[5-7]。首先将待检测图像的前景与背景的阈值设定为T,令其灰度的平均值为u;前景点数在图像整体中所占的比例值为w0,其平均灰度值即u0,背景点数所占比例值为w1,其对应的平均灰度值为u1,类间方差值表示为g,得到公式如式(4)、式(5)所示:

联立式(4)与式(5),得式(6):

根据式(6)可知,当待检测图像前景与背景之间的差异最大化时,g可达到最大值,此时T也可达到最佳阈值。在经过该种图像处理技术的操作后,可获取到待检测图像的二值化处理结果示意图,如图1所示。

图1 待处理图像的二值化处理结果示意图

图1(a)表示在经过二值化处理后所获取到的智能目标检测案件灰度图,图1(b)是在此基础上进行灰度阈值化处理后的图像。通过采用灰度化阈值处理,能够有效实现针对待检测图像进行的提取,从完整待检测图像中准确地提取出相应的目标检测物[8]。图1(a)与图1(b)中均只存在黑与白两种色彩,能够显著提高目标检测算法的识别精度与处理效率。

1.2 卷积神经网络的结构与计算

在卷积神经网络中,主要包含输入层、卷积层、池化层、全连接层4 种结构。其中输入层作为一个像素矩阵,承担着对目标图像进行简单处理的任务,包括统一图像尺度、归一化处理、降维处理等[9-11]。在输入层中进行一系列操作后,可获取到目标图像的几何特征。卷积层指的是包含多个特征图的卷积神经网络结构,其主要作用为学习特征表达。在对目标图像进行检测识别时,卷积层会通过局部感知的手段对所有特征进行一一识别处理,最终实现对全局信息的掌握[12]。池化层通常位于两个不同的卷积层之间,能够有效控制参数矩阵的大小,且该矩阵的尺寸大小与全连接层中参数数量的多少呈正相关,池化过程如图2 所示。

图2 卷积神经网络中的池化过程

通过图2 可知,池化运算分为两个步骤,第一为最大池化,第二为平均池化。若原始的参数矩阵特征图大小为4×4,且其步长为1,则会按照最大池化与平均池化的不同规则分别实现池化。池化层的作用主要在于防止过拟合现象,并能有效提高卷积层的运算效率。卷积神经网络中存在的全连接层,通常位于其末端,呈现出单层或多层相连接的状态。全连接层的主要作用为对前面提取出的局部特征进行处理,以权值运算的形式进行准确的拼接,进而获取到最高层次图像特征[13-14]。

在卷积神经网络中,其网络训练覆盖了大量的复杂运算,主要为卷积运算与卷积梯度运算,其中前者的实质在于提取有效特征。在卷积层的作用下,卷积运算可从初始特征图中进行有效的提取,不仅可对卷积层的输入进行表示,同时还可表示为卷积层的输出。根据不同的权重卷积核,提取到大相径庭的初始特征图,即feature map。若令任一卷积层中输入的feature map 为xj,则有式(7):

式(7)中,i与j表示提取处理时的匹配结果;f(·)表示激活函数;Mj表示所有初始特征图feature map 的集合;*表示卷积操作;Kij表示卷积层中输入的第i个初始特征图与输出的第j个初始特征图的卷积核。

1.3 面向城管目标检测的优化算法

在文中智慧城管智能目标检测案件的课题实验中,应用卷积神经网络对目标图像进行信息识别与提取,其检测网络的基础网络为VGGNet。在此基础上,对卷积神经网络进行了一定的优化改进处理,在网络架构中添加了辅助层,并采用conv5_3 与conv4_3 这两个不同的卷积层。在进行卷积运算的过程中,首先分别将述两个卷积层的步长设置为8 与4;随后再进行卷积运算,对其提取的特征图进行归一化处理,令其尺寸保持一致;最终将其进行连接。在检测网络进行训练时,往往需要调整其参数与学习率来避免由于数据偏移造成的影响,但这会令网络训练的计算量显著增大,进而导致网络模型的训练效率有所下降[15-16]。基于此,文中对卷积神经网络进行优化的另一措施为增加批次规范化(Batch Normalization,BN)层,BN 层的作用在于标准差归一化处理激活函数数据,能够有效提升训练效率,防止网络训练产生偏移[17]。BN 算法的计算公式如式(8)所示:

式(8)中,B表示单批次的图像特征,且B={x1,x2,…,xm} ;μB表示进行批次规范化后获取的平均值;网络学习的重构参数用γ与β来表示;σB表示批次规范化的方差;代表着规范化。在BN 算法中,输入的内容主要包含单批次的图像特征与网络学习的重构参数,输出结果为yi。文中实验采用的是多层感知卷积网络层,传统与优化卷积神经网络的对比示意图如图3 所示。

图3 传统与优化卷积神经网络的对比示意图

图3(a)为传统的卷积神经网络为线性卷积层,图3(b)为优化后的卷积神经网络添加了1×1 的卷积,并接入一个已完成修正的线性激活,这是一个复杂化的卷积神经网络结构。采用添加1×1 卷积的优化卷积神经网络,能够高效地完成特征图的降维处理,且增大卷积神经网络的深度与宽度,保障其应用性能的稳定性。线性激活函数可表示为式(9):

通过式(9)有助于实现对输入内容的限制,使输入的所有小于零的数缩小至其初始值的十分之一,否则输入值不发生任何变化。该优化卷积神经网络中可提取到每个卷积层的图像特征,并在池化作用下完成对图像的子抽样,不仅能够在减少网络训练参数使用量的基础上,最大化保留图像的有效特征,还可有效避免过拟合的现象,显著提高对目标图像特征的检测精度与效率。

2 智慧城管智能目标检测算法应用效果

2.1 城市管理实验图像数据集处理

针对当前城市管理智能目标检测案件类型的多样化,需要构建一个可供直接使用的标准化成熟数据集。目前我国智慧城管智能目标案件检测领域中,这一部分仍是空白,因此文中将智慧城管作为应用背景,将城管案件作为目标打造了一个囊括较多种类的案件图像标准数据集,如图4 所示。

图4 智慧城管智能目标检测图像数据集实例

根据图4 可知,智慧城管的图像数据集中主要囊括6 种类型,该图像数据集来源于A 省智慧城市管理智能目标检测案件中,广大人民群众上传的城市案件图像,文中对该批案件图像进行整理,最终获取到一个标准化的案件图像数据集,包含6 种案件类型、4 785 个注释对象,共计8 741 张图像。为确保该数据集的可靠性与检测工作的高效性,对所有图像进行筛选、剔除,并对选定的图像进行整理与编号。将图4(a)雨水箅子破损案件图像统一保存至一个文件夹,并将其命名为unite-20211;图4(b)非机动车乱停的案件图像文件夹则命名为event-20212;图4(c)交通护栏破损案件图像所属文件夹为unite-20213;图4(d)乱涂写乱张贴为event-20214;图4(e)机动车乱停的案件图像为文件夹unite-20215;图4(f)井盖破损则表示为unite-20216。

2.2 优化卷积神经网络目标检测效果分析

文中对优化后的卷积神经网络进行了应用,将其应用至智慧城管智能目标案件检测算法中,并利用A 省的检测图像数据集进行了测试。将文中提出的基于优化卷积神经网络的检测算法,与4 种不同的检测算法进行对比,即Fast R-CNN、Faster RCNN、YOLO、SSD。上述5 种算法在检测图像数据集上的检测结果如表1 所示。

表1 不同算法的目标案件图像检测结果

由表1 可知,文中算法具有较为客观精确的识别检测效果,在识别“乱涂写乱张贴”event-20214 时表现得格外突出。Fast R-CNN、Faster R-CNN、SSD在识别该类目标图像时,识别率分别为71.30%、72.30%、79.40%;YOLO 算法的检测率最低,仅为58.00%;然而基于优化卷积神经网络的案件检测算法识别率却达到了83.50%,远超上述4 种检测识别算法。主要是由于在优化卷积神经网络的过程中,大幅增加了待检测图像的小目标特征层数。就检测精度mAP 值而言,实验提出的算法仍然居于榜首,YOLO 算法最低,余下3 种算法的检测精度相差较小,梯度差保持在2个百分点左右。实验选取了2 000张机动车乱停与2 000 张非机动车乱停两种事件的图像,分别进行检测分析,其中针对机动车乱停进行的检测结果如图5 所示。

图5 机动车乱停的检测结果示意图

图5 中直观地呈现出4 种算法在检测机动车乱停的图像时,出现的3 项数据结果,即F1_Score、召回率、准确率。采用优化后的YOLO 算法,能够有效提高机动车乱停图像检测的准确率与召回率。相较于Faster R-CNN 算法与SSD 算法,文中采用的算法具有极高的准确率与召回率,能够在2 000 张机动车乱停的图像中实现有效检测识别。除此以外,非机动车乱停的检测结果如图6 所示。

图6 非机动车乱停的检测结果示意图

据图6 可知,在对2 000 张非机动车乱停的图像进行检测时,采用优化后的YOLO 算法具有一定的优越性。尽管不如对机动车乱停图像检测的准确率与召回率高,但相较其余3 种算法,仍然处于最优水平,能够为智慧城市管理提供有力支撑。

3 结论

作为智慧城市建设的关键要素,城市管理系统受到了愈加广泛的重视。当前城市管理的智能化程度仍然较低,主要是依靠人力来对城市案件进行识别、整理,耗费了大量的时间与金钱,但收效甚微。为了提高城市管理的高效性与精确性,文中针对智慧城管的目标检测算法进行了细致的研究,将优化的卷积神经网络应用其中,将A 省图像数据集作为测试材料,对比分析文中算法与其他算法,结果显示,该算法针对6 大主要案件类型的识别率分别为83.50%、72.30%、74.00%、74.40%、75.70%、78.30%,平均水平与最高值均显著高于其他算法。这表明文中算法具有较高的鲁棒性与识别检测精度,能够为智慧城管贡献力量。尽管如此,在未来还需对该算法进行更为深入的研究与细致的优化,不断提升案件识别效率与准确性。

猜你喜欢
灰度卷积神经网络
采用改进导重法的拓扑结构灰度单元过滤技术
基于递归模糊神经网络的风电平滑控制策略
基于3D-Winograd的快速卷积算法设计及FPGA实现
Bp-MRI灰度直方图在鉴别移行带前列腺癌与良性前列腺增生中的应用价值
Arduino小车巡线程序的灰度阈值优化方案
卷积神经网络的分析与设计
神经网络抑制无线通信干扰探究
从滤波器理解卷积
基于神经网络的中小学生情感分析
基于傅里叶域卷积表示的目标跟踪算法