宿恒硕 吕 军 丁志平 唐彦杰 陈旭东 周 强 张哲宇 姚 青
(1. 浙江理工大学信息学院 杭州 310018; 2.张家港海关 张家港 215600; 3.杭州箨草科技有限公司 杭州 311500)
当前,木材种类鉴定主要由专业人员在实验室利用放大镜和显微镜等仪器设备观察木材的宏观和微观特征,与标样比对后确定木材类别(汪杭军, 2013)。每种木材在生长过程中均形成独特的宏观和微观结构,但木材种类繁多,即使同一种木材,其宏观和微观结构也因地点、气候和营养等情况不同存在一定差异。种间相似及种内差异现象增加了木材种类识别难度,加之我国木材贸易监管一线精通木材分类知识的专家稀缺,木材或木制品交易频繁,这种人工木材种类鉴定方法存在着专业性强、任务重、周期长和非实时性等问题,无法满足木材监管实时性和高效性需求,亟需一种快速准确的木材种类鉴定方法。
随着图像处理技术的飞速发展与应用,利用图像进行木材种类识别成为近年来的研究热点(张怡卓等, 2012)。基于图像的木材种类识别方法可以概括为2类: 一类是传统模式识别方法(Lewetal., 2005; Touetal., 2006; 2009a),另一类是深度学习方法(Kwonetal., 2017; Ravindranetal., 2018; Oktariaetal., 2019)。传统模式识别方法首先对木材图像进行预处理,然后提取与筛选木材图像特征,再通过模式识别方法进行分类识别。用于木材识别的图像特征主要包括灰度共生矩阵(白雪冰等, 2005; Touetal., 2009b; Wangetal., 2010)、颜色矩阵(白雪冰等, 2007)、小波变换提取的纹理特征(于海鹏等, 2007; 马琳等, 2013; 戴维等, 2012; 郭德军等, 2005; 王晗, 2008)和HOG局部特征(罗微, 2019; Sugiartoetal., 2017; Nurthoharietal., 2019)等。传统模式识别方法中的图像特征需要通过多次试验筛选获得,模型在测试集中一般能获得较高识别率,但其鲁棒性和泛化能力较差。深度学习方法具有自主学习、特征多样性、准确率高、模型鲁棒性和泛化能力强等优点(Paketal., 2017),近年来在图像识别中获得了成功应用。基于图像的深度学习方法主要是利用卷积神经网络(convolutional neural networks, CNN)对木材图像进行自主分布式特征提取,通过加深网络层数对特征进行更抽象和概括性的表达,进而利用高阶特征信息进行分类识别。Kwon等(2017)利用改进的 LeNet 网络模型对 5 种韩国针叶软木材的横截面图像进行种类鉴定,平均准确率为99.3%。Ravindran等(2018)基于卷积神经网络模型对 10 种山梨科(Sorbaceae)新热带树种木材横截面图像进行分类识别,不同属、种木材平均识别率分别为97.5%和87.0%。Oktaria 等(2019)利用不同卷积神经网络模型识别印度尼西亚30种木材横截面图像,结果发现基于AlexNet模型的木材识别效果最佳,平均识别率达96.7%。上述研究大多针对实验室环境下显微镜拍摄的木材图像,涉及的木材种类偏少,相似木材种类识别率低,无法满足便捷、快速、准确识别木材的需求。
鉴于此,本研究针对传统木材种类人工鉴定方法存在的专业性强、任务重、周期长和非实时性等问题,提出一种基于分块梯度加权的木材种类识别模型,对32种横截面相似的木材进行种类识别,以期提高木材监管的实时性和高效性,为木材种类快速、准确识别提供理论依据。
利用外带微距镜头的手机采集打磨过的木材横截面图像,32种木材共采集图像8 975幅,图像格式为.jpg,大小为 2 240×2 240 像素(图1)。按照8∶1∶1比例随机选择图像作为模型的训练集、验证集和测试集。所有木材图像源自张家港海关国家材种鉴定与木材检疫重点实验室,并经过木材专家鉴定。
图1 木材横截面宏观结构(放大7倍)Fig. 1 Microstructure of wood cross section(amplification of 7 times)第 1 行依次为马达加斯加铁木豆、檀香紫檀、降香黄檀、爱里古夷苏木、卢氏黑黄檀、阿那豆、巴里黄檀、黑核桃The first row is Swartzia madagascariensis, Pterocarpus santalinus, Dalbergia odorifera, Guibourtia ehie, Dalbergia louvelii, Anadenanthera spp., Dalbergia bariensis, Juglans spp.; 第 2 行依次为印度黄檀、猴子果、伯利兹黄檀、马达加斯加黄檀、交趾黄檀、凯尔杂色豆、黄胆木、刺猬紫檀The second row is Dalbergia sissoo, Tieghemella spp., Dalbergia stevensonii, Dalbergia greveana, Dalbergia cochinchinensis, Baphia kirkii, Nauclea spp., Pterocarpus erinaceus; 第 3 行依次为相思木、卡雅楝、中美洲黄檀、龙脑香、大果紫檀、古夷苏木、刀状黑黄檀、阿摩楝The third row is Acacia spp., Khaya spp., Dalbergia granadillo, Dipterocarpus spp., Pterocarpus macrocarpus, Guibourtia spp., Dalbergia cultrata, Amoora spp.; 第 4 行依次为雨树、奥氏黄檀、银叶树、染料紫檀、微凹黄檀、东非黑黄檀、螺穗木、红苏木The fourth row is Samanea saman, Dalbergia oliveri, Heritiera spp., Pterocarpus tinctorius, Dalbergia retusa, Dalbergia melanoxylon, Spirostachys africana, Baikiaea spp.
从图 1 木材横截面宏观结构可以看出,多数木材之间视觉差异小、相似度较高,其中卢氏黑黄檀、阿那豆、巴里黄檀、黑核桃、印度黄檀、猴子果、伯利兹黄檀、马达加斯加黄檀、交趾黄檀、凯尔杂色豆、古夷苏木大巴花、刀状黑黄檀14种木材的纹理特征非常相似,在颜色特征上相思木、卡雅楝、中美洲黄檀、龙脑香、大果紫檀、古夷苏木大巴花、刀状黑黄檀、阿摩楝、雨树、奥氏黄檀、银叶树和染料紫檀12种木材非常相似。
1.2.1 颜色校正 木材横截面图像特征受外界光照和采集设备影响较大,本研究采用灰色世界法(Kwoketal., 2011)对图像进行颜色校正,通过R、G、B三通道灰度平均值计算增益系数,然后用各通道灰度值与对应增益系数的乘积代替原始通道灰度值,消除由图像采集设备和环境差异引起的偏色影响。
图2 颜色校正前后的木材横截面图像Fig. 2 Wood cross section images before and after color correction
1.2.2 数据增强 为提高模型的鲁棒性和泛化能力,采用水平翻转、垂直翻转和增添椒盐噪声的数据增强方法扩充样本图像,使每种木材图像训练样本量达600幅以上。不同数据增强方法见图3。
1.2.3 图像分块 木材横截面宏观结构自相似,为获得更多的训练样本和图像特征,对图像进行分块处理。采用5×5、7×7和10×10分块方法,一幅图像分别可以获得25、49和100幅子图像。通过双线性插值法将每幅分块子图像统一缩放至224×224像素。
卷积神经网络(CNN)采用端到端方式自动学习网络参数,在图像识别中表现出色。目前,应用较多的CNN识别模型有VggNet16(Simonyanetal., 2014)、GoogleNet(Szegedyetal., 2015)、DenseNet(Huangetal., 2017)、MobileNetv3(Howardetal., 2019)、ResNet系列(Heetal., 2016)等。其中,ResNet系列模型引入残差结构,随着网络层数加深,通过引用恒等映射能够解决网络退化问题; 同时,在反向传播过程中始终保证梯度值大于0,能够有效防止梯度消失。相比其他模型,ResNet系列模型在图像识别中取得了较好识别效果,本研究选择ResNet101作为特征提取网络。
利用外带微距镜头手机采集的木材横截面图像存在中间清楚、边缘模糊和变形的问题,为了提高木材种类识别率,将ResNet101模型原有的Softmax分类层进行改进。从木材横截面图像边缘到中心采用不同的梯度值(5×5分块策略依次为0.8、0.9和1,7×7分块策略依次为0.7、0.8、0.9和1,10×10分块策略依次为0.6、0.7、0.8、0.9和1)作为不同子区域图像分类得分的权重,旨在加大中心区域在整个木材横截面图像分类任务中的占比(图4)。利用Softmax方法将各类加权得分转换为最终概率值,概率值的加权转换方法如下:
(1)
(2)
式(1)中:Z表示各子图像分类得分值,n表示分块的行数,m表示分块的列数,S表示加权后的C维得分向量; 式(2)中:C表示木材总类别数,S(i)表示S中第i维的得分值,P(i)表示Softmax计算后第i类的概率值,Y表示最终概率值。
为了评价木材识别模型的识别效果,选择准确率(accuracy)、召回率(recall)、平均准确率 (average accuracy)和平均召回率(average recall)作为评价指标:
(3)
(4)
(5)
(6)
式中:TP表示某种木材正确识别的数量; FP表示错误识别为某种木材的数量; FN表示某种木材错误识别为其他种类木材的数量;C表示木材种类数量。
为了评价不同特征提取网络对木材的识别效果,采用原图形式,在相同训练集、验证集和测试集下,分别训练和测试VggNet16、GoogleNet、DenseNet、MobileNetv3、ResNet50、ResNet101和ResNet152深度学习模型。同时,将分块与梯度加权策略应用于ResNet101模型,测试不同模型对木材的识别效果。
所有模型训练与测试均在开源的 Caffe 深度学习框架下完成。主要硬件配置: CPU为AMD Ryzen 5 3600 6-Core Processor 3.60 GHz和NVIDIA GeForce GTX 1080Ti,主机内存为16.00 GB 。
模型训练采用迁移学习(Panetal., 2009)方式,首先利用在ImageNet数据集上预训练的网络模型对参数进行初始化,然后使用随机初始化器对残差网络中全连接分类层的参数进行初始化。模型采用2个GPU并行训练,模型优化策略选用梯度下降方法,权重正则化系数为0.000 1,动量设置为0.9,使用周期性衰减的学习率,初始化为0.1,每40 000次迭代衰减为1/10。
迭代次数是卷积神经网络训练的主要参数之一,将迭代过程中的损失值和准确率绘制成损失曲线和准确率曲线,用于评估训练过程中模型的学习状态。图5给出了木材横截面ResNet101分类识别模型训练时的损失曲线和准确率曲线,可以看出,随着迭代次数增加,模型的损失曲线逐渐下降,准确率曲线逐渐增加,当迭代到8万次时2条曲线趋于稳定,表明模型已经收敛,并获得较好的精度。
图5 ResNet101模型训练损失曲线和准确率曲线Fig. 5 Training loss curve and accuracy curve of ResNet101 model
用同一木材横截面原图训练集训练VggNet16、GoogleNet、DenseNet、MobileNetv3、ResNet50、ResNet101和 ResNet152共7个模型,并在同一测试集下测试32种木材,识别结果见表 1。其中,ResNet系列3个模型的平均准确率和平均召回率均超过85%,在木材特征提取方面优于其他模型; 在ResNet系列模型中,ResNet101的平均识别准确率比ResNet50、ResNet152分别高4.2%和1.6%。因此,选择ResNet101作为木材种类识别的基础模型。
表1 不同模型的32种木材横截面图像的识别结果Tab.1 Identification results of cross-sectional images of 32 wood species on different models
对木材横截面图像的原图和经5×5、7×7、10×10分块的子图像训练ResNet101模型,32种木材测试的识别准确率结果见图6 。
图6 不同分块方法的木材识别准确率Fig. 6 Identification accuracies of different wood species by different image partitioning methods
从图6可以看出,基于分块的ResNet101模型,每种木材的识别准确率和平均识别准确率均优于基于原图的ResNet101模型,表明分块梯度加权策略能够有效提升木材识别准确率,其中基于7×7 分块的ResNet101模型得到的平均识别准确率为96.5%,优于5×5、10×10分块的94.8%和95.3%。基于原图的ResNet101模型识别准确率始终维持在92%左右,这是因为将缩放后的原图送入ResNet101网络时损失了较多细节信息,而分块后的图像能够保留更多图像内容。从分类结果稳定性来看,对木材横截面原图和5 × 5分块的识别结果波动较大,说明模型的鲁棒性不好。因此,最终选择7×7分块策略。
图像边缘模糊和变形使木材横截面图像丢失很多有效信息,同时增加了图像噪声,从而影响木材识别结果。基于分块的ResNet101模型中每个分块子图像,如果赋予相同权值,对每幅图像识别结果的贡献是相同的,无法降低边缘模糊和变形对图像识别结果的影响。为了减少边缘模糊和变形对识别的影响,提高木材图像识别准确率,对木材横截面图像边缘到中心赋予不同梯度值作为不同子区域图像分类得分的权重。不同ResNet101模型对木材的识别结果如表 2 所示。
表2 不同的ResNet101模型的木材识别结果Tab.2 Identification results of wood species on different ResNet101 models
从表2可以看出,基于分块梯度加权方法的ResNet101模型平均识别率和平均召回率均高于基于原图的ResNet101模型和基于分块的ResNet101模型,平均准确率分别提高6.7%和2.3%,平均召回率分别提高7.4%和2.8%,表明梯度加权方法能够有效提高木材识别准确率。
我国是木材进口大国,也是濒危野生动植物种国际贸易公约(CITES)缔约国,对濒危木材进出口有着严格的监管(尹江苹等, 2019)。随着全球木材交易频繁,而我国木材种类鉴定专家稀缺,依靠传统人工鉴定方法难以满足与日俱增的木材鉴定需求。
木材横截面宏观结构是其细胞组织形状和分布的一种体现,具有种的特异性,是专家识别木材种类的重要依据。随着图像处理和机器学习的发展和应用,利用图像自动识别木材种类成为研究热点。由于木材种类较多,生长环境存在较大差异,不同木材的横截面图像呈现种间相似和种内差异现象,利用手动设计分类特征的传统模式识别方法已无法满足实际应用需求。针对相似度高的木材横截面图像,本研究提出的基于分块梯度加权方法的改进ResNet101模型,能够提取更加精细和抽象的特征,有利于木材横截面图像的精细分类,提高了木材识别准确率,分块梯度加权法增强了模型的鲁棒性和泛化能力。
本研究仅对32种横截面图像相似的木材种类识别方法进行探索,在实际应用中,木材种类繁多,应收集更多种类和数量的木材图像,增加木材识别种类并提高识别率。而且,由于外界环境、拍摄方式等不同,手机采集的样本图像存在较大差异,无法保证图像的均匀性和相似性,可考虑开发稳定的木材横截面图像采集工具。另外,本研究所使用的模型参数数量固定,下一步可在保证识别率的前提下对模型进行裁剪,使模型可以部署到本地嵌入式设备中,提高木材种类的识别速度和信息的安全性。
随着全球木材交易日益频繁,快速、准确地识别木材种类可以缓解木材鉴定专家稀缺和鉴定周期长的问题。以手机采集的木材横截面图像为研究对象,建立7个卷积神经网络模型,对32种相似的木材进行种类识别,结果表明,基于分块梯度加权方法的ResNet101模型可用于木材种类识别,分块梯度加权策略提高了木材识别准确率,平均准确率达98.8%。研究结果可为海关一线木材监察人员提供一种快速便捷的木材初筛鉴定方法。