程铁辕
(成都海关技术中心宜宾分部国家酒类检测重点实验室,四川宜宾 644000)
当前,在白酒微观形态观测等领域,主要应用的观测仪器有原子力显微镜(Atomic Force Microscopy,AFM)等,其中,原子力显微镜在液体样品微观观测方面存在一个很大的不足之处,需要在无尘台上自然风干后方可用于显微镜观察[1],致使白酒中大多数挥发性微量成分无法被观测到,损失了大量重要的样品信息,因此,该方法仅能观测到白酒样品中部分信息。冷冻电子显微镜技术(cryo-electron microscopy)简称冷冻电镜,近年来,随着样品制备观测等技术[2-3]的持续进步以及冷冻电镜软硬件[4-5]的改进,冷冻电镜技术获得了飞跃式发展[6],其在生物大分子复合体和细胞(细胞器)超微结构观测方面的技术优势,极大地推动了结构生物学的飞速发展。相较于其他技术,冷冻电镜技术具有一个重要优势,即样品经过低温冷冻后,能够最大限度地保存样品中包含的信息。冷冻电镜成像获取的照片信息,需要结合图像分析技术才能挖掘出更多的有价值信息,卷积神经网络(Convolutional Neural Network,CNN)作为一种前馈型的神经网络,是目前深度学习技术领域中极具代表性的神经网络之一,近年来,在图像分析和处理领域取得了一系列突破性的研究成果[7-8],卷积神经网络具有强大的特征学习与分类能力,在图像分类等领域具有重要的应用价值,其特点是不需要针对具体特征,即可实现特征提取的封装。当前,透射电镜技术在晶体结构观测上应用广泛[9-10],卷积神经网络应用于中药材等显微特征图像识别研究方面[11]已有相关报道,本研究主要采用冷冻透射电子显微镜技术,拟将冷冻电镜技术与深度学习技术进行结合,通过卷积神经网络对白酒样品的冷冻电镜成像照片信息进行鉴别分类,以期为白酒微观形态观测等领域提供一种全新的研究思路和分析视角,本文将冷冻电镜技术与深度学习技术相结合的应用,主要针对国内市场上普遍存在的白酒掺假实际,但该技术在白酒及液体食品中的应用范围绝不会仅限于此,未来,该技术应该会在白酒微观形态基础研究、白酒酒质评价研究、白酒年份酒研究、白酒产地追溯研究、白酒掺假鉴别研究及液体食品相关研究等多个领域具有广阔的应用前景。
试验样:购自川南某白酒企业固态发酵法原酒(样品编号为1#—5#),购自国内市场的某类别掺假白酒(样品编号为6#、8#),购自国内市场的四川某知名白酒企业的高端成品酒(样品编号为7#、9#、10#),其中,1#:2009 年产一级原酒;2#:2018 年产一级原酒;3#:2018 年产优级原酒;4#:2019 年产一级原酒;5#:2019 年产优级原酒;6#:掺假白酒a;7#:成品酒a;8#:掺假白酒b;9#:成品酒b;10#:成品酒c。
仪器设备:200 kV 冷冻透射电子显微镜(浙江大学冷冻电镜中心),仪器型号:Talos F200C 200 kV(荷兰FEI 公司)。仪器性能:加速电压为20~200 kV 高压,场发射电子枪;点分辨率≤0.3 nm;信息分辨极限0.15 nm;低温样品台(可倾转70 度);配置Ceta 4 k×4 k 相机;安装EPU 和FEI Xplore3D数据收集软件。
将2.5 μL 白酒样品置于铜网(Quantifoil R1.2/1.3)上,通过vitrobot和液态乙烷将溶剂迅速冷冻成玻璃态,在配备有Ceta 4 k×4 k 相机的透射电子显微镜(Talos F200C)上,进行冷冻电镜成像,选取36000×、73000×、120000×3种标称的放大倍数。
采用Matlab 2019a进行数据处理。
2.1.1 原酒微观形态
图1 为2#样品36000 倍的观测图像,多个图像中的圆形轮廓是载网1.2/1.3 的孔,由于碳膜上衬度差,一般观测时只观测圆形轮廓内部的图像,图2为2#样品73000 倍的观测图像,图3 为2#样品120000 倍的观测图像,图4 为3#样品120000 倍的观测图像。3 种放大倍数图像之间的差异,除了与放大倍数有关外,还应该与酒体中存在一些悬浮颗粒有关。如图所示,深色物质为白酒样品中观测的目标物质,从微观形态上看,一部分目标物呈圆球状形态,一部分目标物呈链状形态,圆球状形态物质在空间观测上会有重叠,两种形态物质在空间上的分布都相对较为均匀。
2.1.2 掺假白酒微观形态
图5 为6#样品36000 倍的观测图像,图6 为6#样品73000 倍的观测图像,图7 为6#样品120000 倍的观测图像,图8为6#样品73000倍的观测图像,均为掺假白酒的微观形态图,从微观形态上看,与原酒微观形态图类似,同样存在一些体积相对较大的圆球状形态物质和一些体积相对较小的链状形态物质,链状形态物质的分布较为均匀,而圆球状形态物质分布相对不均。
图1 2#样品图(36000×)
图2 2#样品图(73000×)
图3 2#样品图(120000×)
图4 3#样品图(120000×)
图5 6#样品图(36000×)
图6 6#样品图(73000×)
图7 6#样品图(120000×)
2.1.3 成品酒微观形态
图9 为7#样品36000 倍的观测图像,图10 为7#样品73000 倍的观测图像,图11 为7#样品120000倍的观测图像,图12 为9#样品36000 倍的观测图像。直观来看,同样分布了一些体积相对较大的圆球状形态物质和一些体积相对较小的链状形态物质,与圆球状形态物质相比,链状形态物质的数量更多,分布也更加密集均匀。
图8 8#样品图(73000×)
图9 7#样品图(36000×)
图10 7#样品图(73000×)
从显微镜的照片信息来看,不同类型的白酒样品在图像信息上的差异,很难通过肉眼观察而成功的辨识区分,因此,考虑采用深度学习算法辅助区分,提高识别自动化效率,实现过程为先按照样品类型将冷冻电镜图片进行分类,本文共分为3 类,然后采用深度学习算法进行训练预测。本文采用卷积神经网络,对白酒样品的冷冻电镜成像照片进行鉴别分类时,相对而言,放大73000 倍和120000倍的图像较为清晰,同时,由于采集图像信息时,采集的73000 倍的图像数据更为完整,因此,统一选取各白酒样品的73000 倍的放大倍数进行数据处理,若采集的120000 倍的图像数据完整,也可用于数据处理。
图11 7#样品图(120000×)
图12 9#样品图(36000×)
2.2.1 面向白酒微观图像识别卷积神经网络的构建
当前,基于CNN 的网络结构主要有LeNet-5、AlexNet、CaffeNet、GoogleNet、DenseNet、VGG、ResNet、MobileNetV2 等,其中,AlexNet、CaffeNet等网络结构相对复杂,太冗杂,需要大量的时间和较高的硬件配置去训练网络结构,且实测结果通常不佳。限于篇幅,本文主要采用LeNet-5、ResNet50、VGG16、GoogLeNet 等网络结构,对其进行微调改进后构造白酒微观图像分类识别器。
图13 图像处理结果图
(1)LeNet-5 网络结构在白酒微观图像识别中存在的问题及改进方法。LeNet-5作为较为小型的CNN 网络结构,最早应用于数字图像的分类识别,原始的LeNet-5 网络结构主要是针对0~9 共10 个数字图像分类进行设计,其输入图像大小为32*32,数字图像较为简单。本研究中,LeNet-5 网络结构在白酒微观图像识别中主要存在的问题为:由于白酒微观图像与数字图像的复杂程度差异较大,所需识别的类型数目也不一致,需要对各层网络结构参数做进一步的研究。针对上述问题,经实验研究后,主要改进如下:①增加了ReLU 激活函数:由于ReLU是一种分段线性函数,其具有计算求导简单,能够避免深层网络结构中发生梯度发散的现象,因此,用来替代传统的tanh 和sigmoid 激活函数;②输出层由10个神经元改成3个神经元。
(2)VGG16、ResNet50、GoogLeNet 等网络结构的改进。VGG 网络结构是输入层为224*224*3,输出层是对应的1000 个物体类别,本研究中类别为3类,因此,将最后的输出层类别由1000 改为3,输入层图像统一调整为224*224*3 大小格式,且由于本实验的训练样本较少,本文主要采用迁移学习的方式,迁移学习就是利用已有的深度神经网络(VGG16,ResNet,GoogLeNet 等)进行简单的微调。保留VGG 网络前面原始权重不变,只训练全连接层。由于GoogLeNet 与ResNet50 网络输入及分类类别数与VGG16 都相同,因此,基于上述操作,分别采用VGG16,GoogLeNet,ResNet50 网络对数据进行训练。
2.2.2 基于CNN网络结构的白酒微观图像预处理
LeNet-5 网络结构中白酒微观图像预处理,如图13 所示,将图片大小由4096*4224 集体归一化至32*32 尺寸;ResNet50、VGG16、GoogLeNet 等网络结构,将图片大小由4096*4224 集体归一化至224*224尺寸。
2.2.3 实验结果与分析
(1)采用LeNet-5 网络结构时,训练各参数中batch 大小为128,学习率为0.001,迭代次数为100。具体训练过程中训练样本正确率变化如图14所示,图中横坐标代表训练的迭代次数,纵坐标为训练正确率。由图14可知,本文针对白酒微观图像分类识别所构建的卷积神经网络在训练白酒微观图像过程中达到了较好的效果,该网络结构在训练迭代到第30 次左右时开始接近收敛,在迭代到50 次时,样本训练准确率趋于稳定接近88.89%。
(2)采用VGG16 网络结构时,训练各参数中batch 大小为128,学习率为0.001,迭代次数为50,训练结果如图15所示,其训练准确率达到88%。
图15 VGG16网络训练结果图
(3)采用GoogLeNet 网络结构时,训练各参数中batch 大小为128,学习率为0.001,迭代次数为50,训练结果如图16 所示,其训练准确率达到94%。
图16 GoogLeNet网络训练结果图
(4)采用ResNet50 网络结构时,训练各参数中batch 大小为128,学习率为0.001,迭代次数为50,训练结果如图17所示,其训练准确率达到96%。
图17 ResNet50网络训练结果图
本研究通过将冷冻电镜技术与深度学习技术相结合,应用卷积神经网络对白酒样品的冷冻电镜成像照片信息进行鉴别分类,主要采用了LeNet-5、ResNet50、VGG16、GoogLeNet 等网络结构,针对白酒微观图像分类识别所构建的卷积神经网络在训练白酒微观图像过程中达到了较好的效果,相对而言,ResNet50 网络结构的训练效果最佳,结果显示,采用ResNet50 网络结构时,样本训练准确率达到96%。本研究首次将冷冻电镜技术应用于白酒微观形态的观测,客观来看,该研究存在一些不足,因冷冻电镜的实验成本较高,本文选取的样本量相对较少,准确率的提升依赖于大数据量,因此,在下一步研究中,将进一步加大数据的收集,应该可以通过训练进一步提升准确率。未来,可以预见,冷冻电镜技术与深度学习技术的结合,除在白酒微观观测方面具有很高的应用价值外,在液体样品(食品等)观测方面也将会有相当广阔的应用前景。