◆杨鹤鸣
基于CNN的光缆交接箱容量识别方法
◆杨鹤鸣
(广东省电信规划设计院有限公司 广东 510630)
针对光缆交接箱中熔纤盘卡槽容量的识别问题,本文通过对排布紧凑的熔纤盘端子面板图像进行分析,借助CNN模型对图像特征提取和识别的能力,提出一种基于CNN的光缆交接箱容量识别方法。
卷积神经网络,图像识别,光缆管理,光缆交接箱
光缆交接箱[1]通常根据实际传输要求配置一定数量的熔纤盘,由于熔纤盘数量、位置、端子面板的规格会存在差异,确定熔纤盘卡槽容量情况对光缆交接箱的资源空间管理、缆线连接判断和接线施工都有一定帮助。对于光缆交接箱中熔纤盘排布紧凑的端子面板外观具有明显特征,因此通过提取图像特征识别卡槽容量情况具有可行性。但实际因光照、拍摄角度和部分遮挡等原因,传统图像识别方法的效果并不理想。
卷积神经网络(Convolutional Neural Networks,CNN)[2-3]是深度学习领域中非常重要的一种模型,其主要在神经网络中引入卷积操作,使神经网络模型能够有效提取图像数据当中的重要特征信息。自2012年起,卷积神经网络模型因其强大的图像特征提取能力而成为现代图像识别领域的主流技术。
本文借助CNN的图像特征提取能力,对光缆交接箱熔纤盘紧凑分布的端子面板图像进行分析识别,提出一种基于CNN的光缆交接箱容量识别方法,从而真实反映熔纤盘卡槽容量情况。
CNN模型结构与传统的神经网络模型类似,也是由大量神经元相互连接构成的复杂网络拓扑结构,具体由输入层、隐藏层、输出层堆叠组成。由于CNN模型中使用了“卷积核”作为神经元,并且利用权值共享策略降低隐藏层中的参数量,因此经典的CNN模型内部隐藏层结构主要由卷积层、池化层、全连接层等组成,其中每种层结构都具有各自的特点和功能。
卷积层:使用给定尺寸的卷积核对输入图像进行滑动卷积处理,常用3×3、5×5等尺寸。“卷积核”具体是将数据与对应权重和偏置进行线性加权求和,接着通过ReLU、Sigmoid、tanh等非线性激活函数得到特征输出,根据指定步长滑动“卷积核”处理整幅输入图像得到特征图。卷积层主要从输入当中提取出重要特征,为后续识别处理提供关键信息。
池化层:使用给定尺寸的池化核对特征图进行滑动处理,对窗口内数据进行相应计算,常见池化操作包括最大池化、平均池化等。特征图通过池化层处理后会大幅降低尺寸,减少网络计算复杂度,同时也压缩了特征,保留重要特征。
全连接层:与前一层各神经元进行完全连接,类似于传统神经网络,通常包含1-2层隐含层结构,主要作用是构建图像特征到样本标签的映射关系。全连接层中包含输出层,最后需要Softmax函数处理输出所属类别概率结果。
CNN的整体结构就是多层卷积层与池化层相互交替堆叠,后端连接具有隐含层的全连接层来给出分类判别结果,组成端到端的学习模型结构。模型训练时需要通过损失函数来衡量网络预测结果与真实标签之间的误差,对于分类问题,常用交叉熵损失函数。
为利用CNN识别排布紧凑的熔纤盘在卡槽中的容量,首先要确定模型的输入图像数据。实际应用中,光缆交接箱中的熔纤盘端子面板通常被所接缆线和标签遮挡,但如果走线合理,标签和缆线遮挡端子的情况大部分集中在面板中部和左侧区域,对于最右侧端子区域一般不会出现大面积遮挡现象,所以“卡槽”区域最右端端子部分通常能够明显反映熔纤盘卡槽的容量情况。
本文模型的输入图像数据应在卡槽端子面板区域中最顶部到最底下的熔纤盘之间的范围内,截取“卡槽”端子面板区域最右端端子部分图像作为输入图像样本。对于模型训练样本集的图像,需要进行图像数据增强处理,考虑到实际应用场景,本文采用图像平滑降噪、小角度旋转、对比度、饱和度等处理,并以样本图像中熔纤盘所占“槽数”作为真实输出标签。
通过对输入图像数据的分析,本文构建4层卷积层和池化层、1层隐含层的全连接层的CNN作为识别模型,其中在卷积层和全连接隐藏层中采用ReLU作为激活函数和最大池化处理。具体网络结构见表1。
表1 CNN模型各层结构信息
在网络训练过程中,为防止模型过拟合,对各层添加dropout处理,以提升模型识别的泛化能力。本文使用多分类交叉熵损失函数作为目标函数,具体为:
本文从光缆交接箱原始图片中裁剪出端子面板合适位置的图像,经过数据增强处理后得到样本数据集,按3:1:1的比例划分为训练集、验证集和测试集,设学习率lr=0.001,批样本大小batchsize=128,dropout舍弃概率rate=0.15等超参数。
以多分类平均准确率、精度和召回率作为性能评价指标,得到如下实验结果:训练集的准确率、精度和召回率分别为0.94215、0.91754、0.89248,而测试集的则为0.91725、0.89017、0.85392。结果表明,本文模型具有较好的分类性能,基本能应用于熔纤盘排布紧凑的光缆交接箱容量识别任务上。
本文通过分析排布紧凑的熔纤盘端子面板图像特点,使用图像数据增强方法生成训练样本,合理设计CNN模型结构并训练模型,经过实验检验,表明本文模型具有光缆交接箱容量的识别能力。
[1]杨林成. 光缆交接箱在接入网中的应用[J].中国新通信,2017,19(19):5.
[2]陈晓冰,黄楚发. 基于卷积神经网络的光通信网络端口资源整治方法[J]. 中国新通信,2018,20(20):39.
[3]晋大鹏,张天心,刘涛.基于Python和CNN的验证码识别[J].软件工程,2019,22(06):1-4.