基于迁移学习的GoogLenet煤矸石图像识别

2019-02-07 05:32曹现刚薛祯也

软件导刊 2019年12期

曹现刚薛祯也

摘要：已有的煤矸石识别方法具有一定效果，但无法满足实际需求。为了寻找新的煤矸石识别方法，提出了基于深度学习的煤矸石图像识别方法。采用Inception模型，并通过迁移学习共享已训练模型卷积层权值和偏差。从煤矸石图像库中随机抽取煤矸石图像作为训练集和测试集，最后将该方法与传统图像识别方法进行比对。实验结果表明，该模型可以有效识别煤矸石，准确率为93.5%，有效提高了煤矸识石别准确率。

关键词：GoogLenet;煤矸石识别;迁移学习

DOI：10.11907/rjdk.191275

中图分类号：TP317.4 文献标识码：A 文章编号：1672-7800（2019）012-0183-04

0引言

煤炭是人类生产生活不可缺少的能源之一。原煤中含有大量的矸石，一般占原煤产量的15%-20%。混杂在煤中的矸石会降低燃烧率，燃烧产物会致环境污染。一直以来，与煤炭外形相似的煤矸石分选是煤炭生产的一大难题。

目前，洗煤厂煤矸分拣主要依靠人工选矸和重介选煤两种方式。在实际生产过程中，机械洗选方法普遍存在占地面积大、水资源浪费多等问题。人工选矸存在劳动强度大、工作环境差、易发生事故等问题，难以保障工人健康，选矸效率低。因此，实现煤矸石自动分选具有十分重要的意义。煤矸分选主要分为射线选矸和机器视觉分选。射线法主要依靠煤矸石对电磁波吸收不同进行分选，对环境和人的身体伤害大。特征表达是机器视觉进行图像处理的核心。传统的机器视觉分选需要人工设计煤矸图像特征，利用煤矸石的灰度、纹理特征设计出其统计特征进行图像识别，其识别结果依赖设计的算法以及经验。现有算法提取的特征值较多，计算量偏大。

深度学习在图像识别领域发展迅速，2012年Alexnet以明显优势赢得ILSVRC（ImageNet Large Scale Visual Re-congnition Challenge）冠军，top-5错误率为17%，远高于第二名的26.2%，确立了深度学习在计算机视觉领域的统治地位。GoogLeNet、VGGNet、ResNet等深度卷积神经网络模型不断涌现，越来越多的学者将这些模型用于图像识别任务中。张邯等提出在交通标志中应用基于Alexnet的识别模型;郑一力等通过迁移学习设计了基于Alexnet和Inception V3的植物图像识别模型;程国建将卷积神经网络引入岩石图像处理，得出卷积神经网络能够更好地表示特征的结论;白林等D5-161通过Inception V3卷积神经网络设计网络模型，摒弃了传统的图像预处理、图像分割、人工设计物体的图像特征进行识别的算法，采用神经网络和大数据实现自动学习图像特征从而进行图像识别，提高了图像识别算法的泛化能力。因此，本文引入In-ceptinonV3网络模型，通过对煤与矸石的特征进行自主学习和训练，建立煤矸识别模型，实现煤和矸石的自动分选。

1相关理论

1.1卷积神经网络

卷积神经网络一般由卷积层、池化层、全连接层、Softmax层组成。卷积层通过卷积核提取图像局部特征，上层特征经过卷积核，再通过激活函数得到新的特征图。池化层通常在卷积层之后，对特征图像进行降维，保证局部特征不变并减少计算量。全连接层、Softmax分类层是lo-gistic回归模型在多分类问题上的推广，利用多项logistic回归实现多分类问题。

1.2GoogLenet Inception模型

随着卷积神经的快速发展，网络层次更深或宽度更宽，但容易出现以下问题：①参数过多，如果训练数据集有限，容易产生过拟合;②网络越深，参数越多，计算量越大;③网络过深，梯度可能会消失，难以优化模型。

GoogLenet Inception V3很好地解决了以上缺陷。它是一个46层的网络，为了避免梯度消失，在不同深度增加了两个辅助的softmax，并按一个较小的权重加到最终分类结果中。这相当于模型融合，同时给网络添加了反向传播的梯度信号，避免梯度消失，也提供了额外的正则化，对整个网络训练很有帮助。

1.3基于迁移学习的Inception V3模型

为了训练一个卷积神经网络模型，需要一个大的数据集。但是，如果数据集不够大则无法培训完整的模型。因此，微调网络成为优化特征提取的首选方法。微调网络是一个基于转移学习概念的过程，具体而言是一个让已经学习的模型适用于新的分类模型的过程。基于InceptionV3卷积神经网络模型，结合煤矸石种类及特点，构建煤矸石识别模型如图1所示。

通过卷积神经网络训练得到的模型具有良好的迁移学习能力，建立基于InceptionV3网络的煤矸石识别模型，通过ImageNet训练完成InceotionV3模型权值和参数，对模型进行初始化，并使用二标签分类器代替原有的全连接层。煤矸石图像特征提取过程如表1所示。

2识别实验与结果分析

本实验配置：16核心power8处理器，主频3.3Gz，一块NVIDIA Tesla K8024GB GPU Accelerator卡的IBM服务器，操作系统为Ubuntul6，使用tensorflowl.10开源深度学习框架作为实验环境。

2.1煤和矸石样本采集

采集煤和矸石数据。为确保图片主体明确，模拟生产环境背景，统一在皮带上进行样本采集，共采集样本3000个，其中煤样本图片1000张，矸石样本图片2000张。煤种类包含烟煤、无烟煤，矸石包括页岩和砂岩。将煤矸分类作为二分类，各类煤种统称为煤，各类矸石统称为矸石。煤和矸石样本如图2所示。其中80%的图片用于训练，10%用于校验，10%用于测试模型的识别准确度。

2.2样本集扩增

深度学习通常会要求拥有充足数量的训练样本。一般来说，数据的总量越多，训练得到的模型效果会越好。为了减少过拟合现象，提升网络泛化能力，在图像处理任务中，对输人图像进行简单的平移缩放、颜色变换，不影响图像类别。对煤矸石数据集进行数据增强，包含图像翻转、明亮度变换以及添加噪声等方法，效果如图3所示。

2.3模型参数设置

使用通过ImageNet上训练完成的Inception V3模型的权值和偏差对网络模型进行初始化，其中参数衰减系数为0.9997，激活函数为ReLU，设定节点保留比率为0.8，设定100次的迭代次数，批尺寸为64。使用softmax分类代替模型最后的全连接层，使用修改过的模型对煤矸石图像进行训练。分别设定0.1、0.05、0.01的初始学习率，分析比较模型对煤矸石的识别准确率。本实验通过设定不同的学习率，寻找较高识别率与建模时间之间的平衡点。

2.4实验结果分析

通过表2可以看到，固定迭代次数为100时，随着学习率的降低，模型对煤矸石识别的准确率逐步提升。最后确定学习率为0.01时网络模型能获得更高的识别准确率，并且建模实时性也很好。

将传统煤矸石识别方法与本实验进行对比，结果如表3所示，主要比对了传统特征提取方法与卷积神经网络模型识别方法的准确率。

从表3可以看出，通过灰度特征或者纹理特征单独对煤矸石进行识别，准确率偏低，将灰度、纹理特征结合起来进行识别，准确度有了一定提高，其中单一采用Inception模型时准确率最低。本文提出将迁移学习与Inception模型相結合，通过迁移学习共享已训练模型卷积层权值和偏差，提高网络识别精度。实验证明，采用本文提出的深度学习Fune-tune Inception准确率优于Inception，说明在将训练好的网络模型迁移至特定领域后，能够获取更好的识别率。

3结语

针对煤矸石识别问题，本文提出了一种基于迁移学习的卷积神经网络煤矸石图像识别方法。对数据集进行扩增后，利用预训练Inceptionv3模型在煤矸石图像数据集上进行识别训练，取得了较好的分类准确率。实验结果显示模型在测试集上的准确率为93.5%，优于传统识别方法，破解了传统算法人工提取特征困难、识别结果差的难题。

下一步工作将对Inceptionv3模型进行改动、优化，以便获得更精准的识别结果，为煤矸分拣机器人进行煤矸石分拣奠定理论基础。