iWood: 基于卷积神经网络的濒危珍贵树种木材自动识别系统*

2021-12-01 01:50刘守佳张永刚焦立超殷亚方
林业科学 2021年9期
关键词:黄檀紫檀木材

何 拓 刘守佳 陆 杨 张永刚 焦立超 殷亚方

(中国林业科学研究院木材工业研究所 中国林业科学研究院木材标本馆 北京 100091)

随着全球森林资源贸易量剧增,以《濒危野生动植物物种国际贸易公约》(Convention on International Trade in Endangered Species of Wild Fauna and Flora,CITES)管制物种为代表的木材贸易成为全球关注的焦点(Lewisetal., 2015; Brancalionetal., 2018)。截至2019年,CITES已将超过500种木材树种列入附录进行管制(焦立超等, 2019)。我国是CITES的缔约国之一,也是全球最大的木材进口国, 2019年木材进口量1.14亿m3,同比增长1.72%, 木材缺口持续增加,木材资源对外依存度超过50%(王登举, 2019),我国的木材贸易,特别是以CITES附录所列黄檀属(Dalbergiaspp.)、紫檀属(Pterocarpusspp.)和古夷苏木属(Guibourtia spp.)等树种为代表的濒危珍贵木材进口贸易受到国际社会广泛关注; 同时,《国家重点保护野生植物名录(第一批)》也将降香黄檀(Dalbergiaodorifera)、黑黄檀(Dalbergiacultrate)和印度紫檀(Pterocarpusindicus)等树种列入名录进行保护。但在利益的驱动下,濒危珍贵木材及木制品在贸易流通环节中非法走私、以假充真和以次充好等现象时常发生,给国际履约执法和我国林产品产业发展带来了严峻挑战。因此,实现木材树种的科学识别,是我国提升CITES履约执法能力、加强林产品产业链监管以及保障木材安全的重要科学途径。

“种”是木材分类的基本单元,位于分类单位“属”之下。传统木材解剖学方法通过宏观和微观构造特征对木材进行分类和识别,一般只能确定到“属”的水平(Wiedenhoeftetal., 2019),无法满足国际履约执法和国内市场监管需求。近年来发展的DNA条形码(Jiaoetal., 2018)、近红外光谱(Kanayamaetal., 2019)、气相色谱质谱联用(Zhangetal., 2019a)和实时直接分析质谱(Deklercketal., 2019; Zhangetal., 2019b)等方法,虽然有望实现木材“种”的识别,但构建完善可靠的木材相应分类特征(DNA序列、化学指纹图谱等)参考数据库需耗费大量人力财力; 而且,受限于测试手段和装置,上述方法仍无法在口岸现场等场景下对大批量木材样本进行快速高效识别,大大限制了其发展和应用。因此,亟待开展其他木材识别方法研究,弥补现有方法手段的缺陷和不足,以实现木材在“种”水平的自动精准识别。

随着计算机技术的快速发展,图像分类为木材树种精准快速识别提供了新的思路(刘子豪等, 2013)。不同于木材DNA序列和化学指纹图谱等分类特征,木材构造特征可通过图像形式便捷获取,且构建木材构造特征图像分类特征库更加省时省力。但值得注意的是,木材构造特征图像属于细粒度图像范畴(邓旭冉等, 2019),具有不同树种间特征差异小、同一树种内特征差异大的特点,采用传统图像识别方法难以解决木材关键识别特征自动提取和精准分类的问题。近年来快速发展起来的深度学习方法(LeCunetal., 2015)可通过多层卷积神经网络深度解析图像大数据,自动提取识别特征,实现图像准确快速分类,为木材识别新技术的发展奠定了前期基础。

本研究以濒危珍贵黄檀属和紫檀属树种为主要研究对象,在建立木材构造特征图像数据集的基础上,通过构建基于不同卷积神经网络的深度学习模型,实现木材识别特征的自动提取和精准分类,以期为木材“种”的自动精准识别提供新思路,为我国提升CITES履约执法能力、加强林产品产业链监管以及保障木材安全提供科技支撑。

1 材料与方法

1.1 试验材料

木材标本来源于巴西圣保罗技术研究所木材标本馆(BCTw)、中国林业科学研究院木材标本馆(CAFw)、美国林产品实验室木材标本馆(MADw和SJRw)和巴西圣保罗林业研究所木材标本馆(SPSFw),包含15种黄檀属和11种紫檀属木材共417份。其他木材样本采集自广东省东莞鱼珠木材交易市场(YZ),包含13种黄檀属和9种紫檀属木材共110份。试验木材样品来源和数量信息如表1所示。

1.2 木材构造特征图像数据集建立过程

1) 木材样品表面处理: 对木材样品横切面进行砂光,使砂光后的样品表面光滑、无砂光痕迹,且导管、轴向薄壁细胞等未被堵塞或破坏。

表1 木材标本馆(He et al., 2020a)和木材市场的样品及其构造特征图像来源和数量基本信息Tab.1 The information of wood samples and collected anatomical images from wood collections(He et al., 2020a) and market

2) 木材构造特征图像采集: 利用iWood专业图像采集装置对砂光后的木材样品横切面采集8位图RGB图像,图像采集分辨率为2 048像素×2 048像素。图像采集区域覆盖样品整个横切面,且互不重叠,可充分代表木材横切面不同类型的构造特征。

3) 木材构造特征图像数据集建立: 从采集的图像中删除存在缺陷和质量较低的图像,并对保留的图像添加标签,建立图像数据集Rosewood-26。采集自417份木材标本的10 237幅图像用于模型训练和验证,采集自110份木材样本的550幅图像用于模型泛化能力(模型对未知样本的识别能力)测试。

1.3 卷积神经网络模型构建

构建AlexNet(Krizhevskyetal., 2012; Heetal., 2020a)、VGG16(Simonyanetal., 2014)、DenseNet-121(Iandolaetal., 2014)和ResNet-50(Heetal., 2015)4种卷积神经网络模型。模型基本架构包括卷积层(convolution layer)、池化层(pooling layer)和全连接层(fully-connected layer),其中,卷积层和池化层用于自动提取特征,全连接层用于分类识别。在卷积层与全连接层之间,进行线性整流激活函数(rectified linear unit, ReLU)、局部响应规一化(local response normalization, LRN)、池化(pooling)和随机抑制(dropout)等操作,以防止网络训练过程中出现训练集模型识别精度高而测试集模型识别精度低的过拟合问题。

在卷积神经网络每个卷积层和前2个全连接层后均使用ReLU作为激活函数:

f(x)=max(0,x)。

(1)

ReLU函数定义了神经元线性变换后的非线性输出结果,对进入神经元的来自上一层神经网络的输入向量x,使用线性整流激活函数的神经元会输出max(0,x)至下一层神经元或作为整个神经网络的输出。ReLU函数的优点是可以缓解梯度消失问题,加快网络训练速度(Nairetal., 2010),与Sigmoid等其他非线性激活函数相比,ReLU函数更加简单快速。

LRN模仿了生物神经系统的“侧抑制”,即被激活的神经元会抑制相邻神经元。在ReLU函数后加入LRN的目的是调节神经元的响应,使响应值较大的神经元变得相对更大,同时抑制相邻响应较小的神经元,从而提高模型泛化能力。LRN计算方法如下:

(2)

池化在降低特征图谱(feature map)维度和减少参数的同时,一定程度上保留了样本主要特征,起到防止过拟合的作用。池化是一种下采样方法,通常包括最大池化(max pooling)和平均池化(mean pooling)2种方式,本研究采用最大池化方式,保留更显著的图像特征,以更好地防止过拟合。

图1 原始图像预处理流程(以印度紫檀图像为例)Fig.1 The flow diagram of the original image pre-processing(Pterocarpus indicus as an example)

随机抑制是在神经网络前向训练过程中,保持输入不变,随机选择一部分隐层神经元进行运算并保留记录,从而在反向传播时更新这些神经元对应的参数(Hintonetal., 2012)。本研究中,Dropout层设置在前2个全连接层后,以解决全连接层的过拟合问题。

图2 木材构造特征原始图像和均衡处理后图像块样本数量分布Fig.2 The quantity distribution of original anatomical images and the patches after balance processing

1.4 模型训练与测试

1.4.1 图像预处理 对于图像分辨率为2 048像素×2 048像素的高维RGB数据,若直接使用原始数据进行网络训练,不仅运算量大、模型训练耗时长,而且各类别样本数据差异较大,不平衡的训练样本会影响模型训练精度,容易出现过拟合问题。因此,本研究在模型训练前对原始数据进行2种预处理(Heetal., 2020a): 1) 截取图像块并缩小,首先从原始图像中截取1 200像素×1 200像素图像块,然后将其缩小为227像素×227像素图像块作为最终训练图像,以极大降低数据维度(图1); 2) 数据集划分,在保证图像块重叠率小于20%的条件下,对于样本数量较多的类别,从每个图像样本中截取较少图像块,对于样本数量较少的类别,从每个图像样本中截取较多图像块。样本原始图像和均衡处理后图像块的样本数量分布如图2所示,经均衡处理的样本数量方差从0.025 064减小至0.00 557。预处理后,采集于26种木材标本的10 237幅原始图像扩充为132 265个图像块样本,随机选取其中30 896、3 871和3 829个图像块样本分别作为训练集、验证集和测试集。

1.4.2 模型训练 基于谷歌开放数据集ImageNet对模型进行预训练后,微调模型参数,利用木材构造特征图像数据集Rosewood-26对模型进行迁移学习(Panetal., 2010)。采用随机梯度下降(stochastic gradient descent,SGD)方法加速神经网络训练,每次读取400个图像块样本,每265次迭代完成一轮(epoch)样本训练,设置基础学习率(learning rate)、动量(momentum)和权值衰减(weight decay)等参数,用于获得较快梯度下降速度并控制模型复杂度以防止过拟合。

1.4.3 模型测试 模型测试分2个步骤: 1) 采用3 829个图像块样本对模型进行测试,输出混淆矩阵(confusion matrix),并将每类测试样本单独输出,得到所有误判样本,用于进一步分析模型的树种识别能力; 2) 采用收集自交易市场的木材样品图像样本对模型进行进一步测试,计算模型识别精度,评价模型泛化能力。

2 结果与分析

2.1 不同卷积神经网络模型的识别能力

比较本研究构建的4种卷积神经网络模型,AlexNet模型仅5层,结构最简单,模型训练时间最短,但模型识别精度最低; VGG16和DenseNet-121模型识别精度较高,但2种模型分别具有最多的权重数量和最长的训练时间,不利于模型参数调节和优化,且消耗较多算力资源; ResNet-50模型深度虽达50层,但其权重数量最少,训练时间相对较短,识别精度最高(表2)。深度学习模型网络层数对模型性能具有重要影响,网络层数增加后模型可进行更加复杂的特征提取任务,理论上能够获得更好的识别结果,但模型准确度也可能出现饱和甚至下降现象(Penningtonetal., 2017)。ResNet-50模型利用残差学习解决了模型精度退化问题,近年来在图像识别领域得到了广泛应用。Ravindran等(2020)构建ResNet-34模型对10种楝科(Meliaceae)木材进行识别,模型最佳精度为82.7%; 本研究构建的ResNet-50模型对26种濒危珍贵木材的识别精度达98.33%,显著高于已有报道结果。因此,本研究优选ResNet-50模型进行黄檀属和紫檀属树种木材的分类与识别。

表2 不同卷积神经网络模型的参数和分类精度Tab.2 Parameters and accuracy of various convolutional neural networks

2.2 木材分类与识别

ResNet-50模型输出的混淆矩阵如图3所示。在15种黄檀属木材中,仅有交趾黄檀1幅图像被误判为印度紫檀,而在11种紫檀属木材中,无任何图像被误判为黄檀属,ResNet-50模型在“属”水平的分类精度接近100%。在“种”水平上,有9种黄檀属木材(赛州黄檀、绒毛黄檀、东非黑黄檀、降香黄檀、奥氏黄檀、微凹黄檀、印度黄檀、亚马逊黄檀和危地马拉黄檀)和3种紫檀属木材(檀香紫檀、非洲紫檀和染料紫檀)的分类精度达100%。在黄檀属木材中,约8.6%的海南黄檀木材被误判为黄檀,约5.7%的黄檀木材被误判为印度黄檀,比较海南黄檀、黄檀误判图像与真实树种图像,海南黄檀、黄檀和印度黄檀3种木材在构造特征上具有较高相似性,采用传统木材解剖学方法也难以鉴别。在紫檀属木材中,安哥拉紫檀、安达曼紫檀、刺猬紫檀、印度紫檀、大果紫檀和囊状紫檀6种木材的分类结果相互混淆,药用紫檀和罗氏紫檀也出现相互混淆现象。檀香紫檀和染料紫檀木材构造特征极为相似,传统木材解剖学方法难以将二者准确鉴别(梅萍等, 2017; Zhangetal., 2019a; 2019b),而本研究构建的ResNet-50模型可以成功鉴别檀香紫檀和染料紫檀。在11种紫檀属木材中,印度紫檀的分类精度最低(93.28%),该树种分别被误判为安哥拉紫檀、安达曼紫檀、刺猬紫檀、大果紫檀和囊状紫檀。印度紫檀树种存在较大的种内变异性,不同木材样本呈现多样性构造特征,与同属其他树种的木材构造特征容易产生混淆(李桂兰, 2007)。

图3 采用ResNet-50模型识别15种黄檀属和11种紫檀属树种木材的混淆矩阵Fig.3 Confusion matrix for image classification of 15 Dalbergia species and 11 Pterocarpus species generated by ResNet-50 model

2.3 木材树种识别应用

基于构建的深度卷积神经网络模型ResNet-50,本研究开发了iWood木材自动识别系统(殷亚方等, 2019),用于现场环境下木材树种的识别。通过将采集自交易市场木材样品的110幅图像上传至服务器测试发现,样品在“属”和“种”水平的识别精度分别为91.8%和77.3%。虽然该结果低于测试集的识别精度,但仍表明ResNet-50模型对未知样本具有较好识别能力,模型未出现明显过拟合。传统木材解剖学方法可以识别木材到“属”,但难以实现“种”的准确识别,且需要专业人员长期的木材鉴定训练和知识经验积累,耗费大量人力物力; 相较而言,基于本研究建立的木材构造特征图像数据集构建的深度卷积神经网络模型ResNet-50在“属”水平的木材识别能力与专业鉴定人员相当,且识别速度快。同时,本研究首次采用市场来源的木材样品构造特征图像数据集对模型的泛化能力进行测试评价,虽然ResNet-50模型在“种”水平的识别精度仅为77.3%,但随着木材构造特征图像数据集的不断扩充以及模型性能的持续优化,模型识别精度有望进一步提升,以应用于海关执法、木材贸易和质量监督检验等领域,为木材树种自动精准识别提供新的途径。

3 讨论

作为一种可再生生物材料,木材具有生物体普遍存在的天然复杂性,其构造特征通常在种间和种内均表现出较明显的变异性(Heetal., 2020b)。由于在采集、保存和交换等方面存在的局限性,通过木材标本无法获取木材种内所有变异特征,因此传统木材解剖学方法难以实现“种”的准确识别(姜笑梅等, 2010)。基于木材构造特征图像的深度学习方法为木材“种”的准确识别提供了新思路,木材变异性的构造特征可通过图像形式便捷获取,突破了传统木材识别方法依赖实物标本和组织切片获取木材构造特征的局限性。

卷积神经网络可实现大数据量图像的有效降维,并保留图像关键特征,近年来在图像分类领域得到广泛应用。本研究从正确定名的15种黄檀属和11种紫檀属木材标本上采集10 237幅木材横切面构造图像建立木材构造特征图像数据集Rosewood-26,为卷积神经网络模型训练和测试奠定了数据基础; 构建的AlexNet、VGG16、DenseNet-121和ResNest-50 共4种卷积神经网络模型对26种濒危珍贵木材的分类精度分别为93.85%、98.00%、96.00%和98.33%,其中ResNet-50模型分类精度最高。值得注意的是,本研究采用的木材树种类别及其图像数量与深度学习领域的大规模数据集(如ImageNet)相比还远远不足,不同卷积神经网络模型的分类精度未呈现明显差异,今后在构建卷积神经网络模型时,应进一步综合考虑模型深度、权重数量和训练时间等因素,以实现卷积神经模型性能的最优化(Pavindranetal., 2019)。

本研究分别从中国、美国和巴西4个木材标本馆采集木材标本横切面构造特征图像,建立包含15种黄檀属和11种紫檀属木材的高质量图像数据集Rosewood-26,该图像数据集包含各树种不同个体的构造特征信息,尽可能多地覆盖了木材树种的种内变异性,以保证构建的卷积神经网络模型具有较好的鲁棒性和泛化能力(胡明越, 2019)。同时,为了推动深度学习方法在木材图像识别领域的应用,国内外木材标本馆正在采用统一标准进行木材标本数字化,建立涵盖树种变异性的木材构特征图像数据共享平台,为构建更为精准高效的深度学习模型提供尽可能丰富的数据资源。未来通过深入开展木材信息学研究,实现木材图像特征可视化,进一步揭示树木木质部关键构造特征的种间变异规律,将为木材分类与识别奠定理论基础,为木材“种”水平的自动精准识别提供科学依据(何拓等, 2020; 2021a)。

木材现场快速识别是木材树种识别领域长期存在的科技难题,传统木材解剖学方法一般只能确定到“属”的水平,同时随着社会经济快速发展和社会分工越来越精细化,具有丰富经验的木材鉴定专业人员数量越来越少,木材树种现场识别领域面临技术和人员双重缺失的严峻挑战(Wiedenhoeftetal., 2019; Heetal., 2020a; 何拓等, 2021b)。本研究通过专业图像采集装置采集26种濒危珍贵木材标本横切面构造特征图像,建立木材构造图像数据集Rosewood-26,构建卷积神经网络模型,最终成功开发了iWood木材自动识别系统。该系统可实现木材构造特征图像采集、图像数据集管理、模型管理以及在线或离线识别等功能。基于卷积神经网络模型开发的iWood木材自动识别系统,是一种端对端的图像识别模式,用户目前可通过图像采集装置获取待检木材样品的横切面构造特征图像并上传至系统,系统即可快速输出树种识别结果,有望解决包括海关、贸易和质检在内的木材树种识别应用领域检测手段和专业鉴定人员长期缺乏的难题。

4 结论

本研究采集15种黄檀属和11种紫檀属濒危珍贵树种木材横切面构造特征图像建立图像数据集Rosewood-26,构建AlexNet、VGG16、DenseNet-121和ResNet-50 共4种卷积神经网络模型进行木材树种识别,其中ResNet-50模型识别精度最高(98.33%),对9种黄檀属和3种紫檀属木材的识别精度达100%,并可成功鉴别构造特征极为相似的檀香紫檀和染料紫檀; 基于ResNet-50模型构建的木材自动识别系统iWood,在“属”和“种”水平的识别精度分别为91.8%和 77.3%。基于卷积神经网络的木材计算机视觉识别方法,从覆盖木材构造特征变异性的图像大数据中自动提取关键识别特征并进行精准分类,解决了传统木材解剖学方法难以识别木材到“种”的难题,突破了新兴木材识别技术(DNA条形码、化学指纹图谱)难以建立参考数据库的局限,为木材在“种”水平的自动精准识别提供了新的思路。本研究建立的基于卷积神经网络的木材识别系统iWood适用于海关执法、木材贸易和质量监督等多场景下的木材自动精准识别,能够为我国提升CITES履约执法能力、加强林产品产业链监管以及保障木材安全提供科技支撑。

建议今后借助国际林业研究组织联盟(IUFRO)、国际木材解剖学家协会(IAWA)和木材标本国家创新联盟(NIAWC)等国内外平台,形成木材标本及其数据共享网络,建立完整覆盖木材构造特征种内中间变异的图像数据库,为木材图像智能识别奠定数据基础。同时,在对木材样本、图像数据集、深度学习模型及其参数体系深入研究以及识别系统测试应用的基础上,制定木材计算机视觉识别方法标准,推动木材自动精准识别技术的推广应用。

猜你喜欢
黄檀紫檀木材
珍贵树种黄檀栽培技术
斜叶黄檀茎中1个新的肉桂酚类化合物
水边的紫檀靠椅
橘子皮用来开发透明木材
数字说
木材在未来建筑设计中的应用分析
中国紫檀博物馆
加纳木材工业界呼吁政府减免木材进口税以挽救国内木材工业
降香黄檀混交林土壤微生物分布特征
不变的是流光还有那一抹紫檀之美