基于DCNN的火灾探测与定位系统

2021-06-04 03:09张怡
微型电脑应用 2021年5期
关键词:误报率池化层卷积

张怡

(成都理工大学 工程技术学院, 四川 乐山 614000)

0 引言

火灾是在很短的时间内对生命和财产造成重大损害的异常事件[1]。火灾探测可分为两大类:传统火灾报警和视觉传感器辅助火灾探测。传统的火灾报警系统基于需要近距离激活的传感器。这些传感器不太适合关键环境,在发生警报时需要人的参与来确认火灾,包括探索火灾位置。此外,这样的系统通常不能提供关于火灾的大小、位置和燃烧程度的信息。为了克服这些局限性,目前研究人员探索了许多基于视觉传感器的方法[2-6],但这些系统仍然存在一些问题,例如观察到的场景的复杂性、不规则的照明,以及低质量的帧;较高精度的算法其计算量也较大,而简单的方法在精确度和误报率方面存在较大误差。因此,有必要在这些度量之间找到一个更好的折衷,以满足一些实际应用场景的实际需求,所以在此提出了一个基于深度卷积神经网络(DCNN)[7]的监控网络中的早期火灾探测系统(Fire Detection based on DCNN)。由于在系统中使用转移学习策略训练并微调AlexNet架构[8],使得系统尺寸较小。并且该系统可以智能地选择对火灾区域敏感的特征映射,从而更精确地分割火焰,达到精度的提升和误报率减小。

1 系统构成和原理

为了实现高精度,多场景自动火灾检测,在此提出了FDC系统。本节主要对FDC系统进行介绍,给出了FDC系统框架图,如图1所示。

图1 FDC系统框架图

1.1 相关原理介绍

整个FDC系统框架主要是基于DCNN架构,典型的DCNN架构由三个处理层组成:卷积层,池化层和完全连接层[9]。这些层以层次结构排列,使得一层的输出充当下一层的输入。在训练阶段,调整和学习卷积核和完全连通层中所有神经元的权重。这些权重对输入训练数据的代表性特征进行建模,进而进行目标分类。

在系统中使用类似于SqueezeNet[10]的模型来检测火灾和非火灾图像。该模型由2个规则卷积层、3个最大池化层、1个平均池化层和8个Fire模块组成,输入的是224×224×3像素的彩色图像。在第一个卷积层,将64个3×3大小的滤波器应用于输入图像,生成64个特征映射。这64个特征映射的最大激活由第一个最大池化层选择,其步长为2个像素,使用3×3像素的邻域。这样可以将特征图的大小缩小两倍,从而保留最有用的信息,同时丢弃不太重要的细节。接下来,使用两个128个过滤器的Fire模块,然后是另一个256个过滤器的Fire模块。每个Fire模块还包括两个进一步的卷积、压缩和膨胀。由于每个模块由多个滤波器分辨率组成,并且在Caffe框架中没有对此类卷积层的本地支持[11],因此引入了一个扩展层,每个Fire模块中有两个独立的卷积层。第一层卷积包含1×1个滤波器,第二层包含3×3个滤波器。这两个层的输出在通道维度中连接。在3个Fire模块之后,还有另一个最大池化层,其操作方式与第一个最大池化层相同。在512个滤波器的最后一个Fire模块(Fire9)之后,修改卷积层,将类数减少到两个[M=2(fire和normal)]。该层的输出被传递到平均池化层,该层的结果直接输入到Softmax分类器中,以计算两个目标类的概率。

在FDC系统中还采用一种转换学习策略,以进一步提高学习的准确性。采用这种策略,使用了一个预训练的SqueezeNet模型,并根据分类问题对其进行了微调,由于学习速度较慢。所以删除了最后一个完全连接层,以提高效率。

2 用于火灾探测和定位的DCNN

本节介绍了使用所提出的DCNN进行火灾探测和定位的过程。在系统中用不同的参数设置训练不同的模型,经过微调过程,得到了一个在不同条件下,在室内和室外场景下,能够远距离、小范围探测火灾的最优模型。

使用DCNN的另一个动机因素是为了避免预处理和特征标注。在FDC系统中,图像通过DCNN发送,它给输入的图像分配一个“fire”或“normal”标签。这个标签是根据网络计算的概率分数来分配的。以较高的概率得分作为输入图像的最终类别标签。一组样本图像及其预测的类标签和概率分数,如图2所示。

图2 使用DCNN进行火灾定位

为了在样本图像中定位火灾,使用图2中给出的框架。首先,从DCNN得到了一个预测。在非火灾的情况下,不执行进一步的操作;在发生火灾的情况下,对其定位进行进一步的处理,如算法1和算法2所示。

算法1 Feature Map Selection输入:训练样本(TS)、真实值(GT)和提出的CNN模型(CNN-M)输出:对火敏感的特征图1. 通过CNN-M前向传播TS2. 从CNN-M的L层中选择特征图TS3. 将GT和FN调整为256×256像素4. 计算FN的平均激活图FMAi5. 对每个特征图Fi进行二值化:F(x,y)bin(i)=1, F(x,y)i>FMA(i)0, Otherwise 6. 计算GT和每个特征图Fbin(i)之间的汉明距离HDi:HDi=|Fbin(i)-GT|,这就产生了TS×FN汉明距离7. 计算所有生成的汉明距离之和,并使用阈值T短列最小汉明距离8. 根据列出的汉明距离选择适当的特征图

算法1的流程图,如图3所示。

图3 算法1的流程图

算法2:火灾定位算法输入:视频序列的图像I和提出的深层CNN模型(CNN-M)输出:分段火灾的二进制图像Ilocalize1. 从视频序列中选择一个帧并通过CNN-M向前传播2. if predicted label = non-fire thencontinueelsea) 从CNN-M的“Fire2/Concat”层提取特征映射8、26和32(F8,F26,F32)b) 计算F8,F26和F32的平均激活图(FMA)c) 通过阈值T对FMA应用二值化:FLocalize=1, FMA>T0, Otherwise d) 从FMA中分割火灾区域endif

在使用算法1分析了提出的CNN不同层的所有特征映射后,由于“Fire2/Concat”层的特征映射8、26和32对火灾区域敏感,适合火灾定位。因此,融合了这3个特征映射并应用二值化来分割火焰,给出了一组带有分割区域的火灾图像样本,如图4所示。

对火灾进行分割的目的为:(1) 确定被观察场景的严重程度/燃烧程度;(2) 从输入的火灾图像中找到影响区域(ZOI)。根据分割后的火焰像素数可以确定燃烧程度。ZOI可以通过从原始输入图像中减去分割的火焰区域来计算。生成的ZOI图像随后从最初的SqueezeNet模型传递过来,该模型从1 000个对象中预测其标签。对象信息可用于确定场景中的情况。这些信息,连同火灾的严重程度,可以报告给消防队,以便采取适当的行动。

3 实验与评估

3.1 实验环境

本文实验主要是基于一台英特尔i7处理器上的台式机,其内存为64 GB,操作系统为Ubuntu,显卡为英伟达GeForce GTX TITAN X,使用python 3.0进行实现。实验中数据集为公开数据集[12],在该数据集中包含在不同环境中捕获的31个视频。在这些视频中,包括火灾的视频有14个,而普通视频有17个。总共使用了68 457张图像。其中20%和80%的数据分别用于训练和测试。

3.2 实验结果

3.2.1 性能对比

在这里选择了六个现有方法与FDC系统进行对比。结果如表1所示。

表1 各种火灾探测方法的比较

文献[15]和[16]在漏报方面表现最好。然而这两个方法在误报和准确性上表现不是很理想。对于误报来说,文献[17]表现最好,但其漏报率为14.09%,是所有检测方法中最差的。为了获得较高的准确率和较低的误报率,在此研究了使用深度特征进行火灾探测。首先使用了不带微调的AlexNet架构,其准确率为89.96%,误报率从11.67%降低到9.12%。在baseline AlexNet体系结构中,核的权重是随机初始化的,并且在训练过程中考虑到错误率和准确度而进行修改。在这里还应用了转移学习的策略,通过这种策略,从预训练的AlexNet模型初始化权重,结果准确率提高了4.33%,漏报和误报分别减少了8.5%和0.15%。

3.2.2 实际定位结果对比

在这里将从火灾定位和对所观察到的场景的理解来评估本文方法的性能。计算漏报率和误报率率来评价火灾定位的性能。用来定位火灾的特征图比真实图像小,因此调整了大小以匹配真实图像的大小。然后,计算了探测地图和地面真实图像中重叠火力像素的数目,并将其作为误报。同样,还确定了探测图中不重叠的火灾像素的数量,并将其解释为漏报。

将FDC的结果与一些现有方法进行对比,其结果如图5所示。

图5 本文方法与其他方法对比结果

根据算法2中二值化过程的阈值T,在此报告了3种不同的CNNFire结果。从图5可以看出,FDC系统在漏报率和误报率之间保持了较好的平衡,使其更适合于监控系统中的火灾定位。

4 总结

火灾是最危险的异常事件,如不及早控制,可能造成巨大的灾害,给人类、生态和经济造成损失。受DCNN巨大潜力的启发,在此提出了一种基于DCNN的轻量级闭路电视监控网火灾探测系统FDC。该法既能定位火源,又能识别监控对象。此外,FDC系统分别使用微调和SqueezeNet架构来平衡火灾探测的准确性和模型的大小。通过公开数据集,验证了该系统在实际中部署的可行性。考虑到CNN模型对火灾探测和定位的合理精度、规模和误报率,该系统有助于灾害管理团队及时控制火灾,避免巨大损失。

猜你喜欢
误报率池化层卷积
原始数据动态观察窗法在火灾特征信号融合提取中的应用研究
基于3D-Winograd的快速卷积算法设计及FPGA实现
卷积神经网络模型研究分析*
家用燃气报警器误报原因及降低误报率的方法
基于卷积神经网络的纸币分类与点钞
钻杆管体超声波探伤误报分析及措施
基于深度学习卷积神经网络的人体行为识别研究
卷积神经网络的分析与设计
从滤波器理解卷积
基于全卷积神经网络的SAR图像目标分类*