近红外光谱技术结合Keras神经网络的枸杞子种类鉴别研究

2023-07-28 13:54:25刘海龙倪金索丽敏
食品安全导刊·中旬刊 2023年6期
关键词:近红外光谱枸杞子人工神经网络

刘海龙 倪金 索丽敏

摘 要:枸杞子具有较高的营养和医学价值,不同产地品种的枸杞品质不同,价格也存在一定的差异,但由于缺乏有效的检测分级手段,枸杞市场鱼龙混杂,影响枸杞市场质量监管。为实现枸杞快速、无损的品种检测,本文提出基于傅里叶变换近红外光谱的枸杞子品种快速区分方法。利用傅里叶变换近红外光谱仪采集了青海、宁夏两个产地6个品种的枸杞子共计648个样本的光谱数据之后,通过多元散射校正(MSC)、标准正态变换(SNV)、移动平均平滑(MA)、标准化(SS)、Savitzky-Golay平滑滤波(SG)、最大最小归一化(MMS)、均值中心化(Zero-centered)分别对6个品种枸杞光谱数据进行预处理,并使用Python语言和Keras框架分别建立了2种神经网络模型。试验结果表明,标准化(SS)处理过后的枸杞光谱数据可快速、高效地实现中宁枸杞子品种判别,为食品安全应用提供了技术支撑。

关键词:人工神经网络(ANN);品种鉴别;近红外光谱;枸杞子

Identification of Goqizi Species Using Near-Infrared Spectroscopy Combined with Keras Neural Network

LIU Hailong, NI Jin, SUO Limin*

(Heilongjiang Bayi Agricultural University, Daqing 163319, China)

Abstract: Goqizi have high nutritional and medical value. The quality of Goqizi from different regions varies, and there are also certain price differences. However, due to the lack of effective detection and grading methods, the Goqizi market is mixed, which affects the quality supervision of the Goqizi market. To achieve rapid and non-destructive variety detection of Goqizi, this paper proposes a fast identification method for Goqizi varieties based on Fourier transform near-infrared spectroscopy. After using a Fourier transform near-infrared spectrometer to collect spectral data of 648 samples from 6 varieties of Goqizi from two regions of Qinghai and Ningxia, multiple scattering correction (MSC), standard normal transformation (SNV), moving average smoothing (MA), standardization (SS), Savitzky Golay smoothing filtering (SG), maximum minimum normalization (MMS) Zero centered preprocessing was performed on the spectral data of 6 varieties of Goqizi, and two neural network models were established using Python language and Keras framework. The experimental results indicate that the standardized (SS) processed spectral data of Goqizi can quickly and efficiently distinguish the varieties of Zhongning Goqizi, providing technical support for food safety applications.

Keywords: Artificial Neural Network(ANN); variety identification; near infrared spectroscopy; Goqizi

枸杞是目前最具發展潜力的药食两用类经济植物,因其含有丰富的营养价值和药用价值而得到消费者的普遍接受和信赖,在全国乃至全世界都享有极高的声誉[1]。目前,我国枸杞主产区的绝大多数栽培品种均引自宁夏枸杞系列品种[2]。研究表明,不同品种或不同产地的枸杞子在多酚、糖类、维生素、氨基酸等化学成分含量等方面具有较大差异[3-6]。例如,禄璐等[7]研究发现,46个枸杞原浆产品的主要成分与口感、风味具有相关性;蒋兰等[8]研究得出多种活性成分能明显提升枸杞子品质,如枸杞多糖含量可作为枸杞果酒酿造工艺的衡量指标[9],枸杞的营养成分是其药用价值的评价指标之一[10]。因此,对不同品种枸杞子进行快速、准确判别,有利于根据不同枸杞子品种的差异有针对性地开展枸杞资源的利用,提高资源利用率。目前有关枸杞子分类方面的研究较少。

近红外光谱是一种介于可见光和中红外间的电磁波,波长为780~2 526 nm,该区域的波长能够记录C-O、O-H和N-H等化学键振动的倍频和合频吸收信息,可以作为获取信息有效载体对含氢基团有机物的理化性质进行测量,且可实现对样品快速、无损的检测,现已广泛运用于各农产品研究中[11-12]。但光谱数据中还包含噪声、基线漂移采样环境干扰等不稳定因素,会导致建立模型的精度下降,因此还需要提前对光谱数据进行预处理,提高光谱数据信噪比和分辨率,从而提高模型预测的准确度。

Keras是一种主流的神经网络框架,其采用Python编写,高度封装,能够在TensorFlow、CNTK或Theano之上运行,用户可以用最小的时间获得最优的实验结果,大大降低了神经网络的使用门槛,减少了构建网络所耗费的时间与精力。目前,该神经网络框架在医学、自动驾驶、人脸识别等众多领域都有使用[13-15]。

1 材料与方法

1.1 样本数据来源

用于实验的枸杞子为产地市购买,分别为中宁

1号、中宁7号、小尖椒(中宁)、青海板型、青海条形,青海1号6个品种。将枸杞子样品进行除杂、干燥后,每个品种选取20粒作为一份样品,得到青海1号104份、青海板型104份、青海条形106份、小尖椒(中宁)106份、中宁1号106份、中宁7号122,共计648份样品。将样本置于近红外光谱实验室静置24 h后进行扫描。

采样仪器为Bruker公司生产的TANGO近红外光谱仪,测量波数为11 550~3 950 cm-1,测量样本的吸光度。每个样品单独扫背景,后扫描32次选取平均光谱作为研究样本。将样品数据按照7∶3的比例随机分为训练集和验证集,划分后训练集和测试集样本数据量分别为454个和194个,结合Keras框架进行枸杞子品种鉴别研究。

1.2 数据预处理

由于样本在扫描过程中极易受到检测环境、仪器、颗粒大小不均匀和自身因素的影响,使光谱数据质量下降,产生基线漂移、噪声、尺度差异等一系列问题,造成模型精度下降。因此对数据分别进行多元散射校正(MSC)、标准正态变换(SNV)、移动平均平滑(MA)、标准化(SS)、Savitzky-Golay平滑滤波(SG)、最大最小归一化(MMS)以及均值中心化(Zero-centered)预处理,提高信噪比和分辨率,让模型更具有稳健性。通过不同方法预处理后的光谱图如图1所示。

1.3 建立模型

人工神经网络(Artificial Neural Network,ANN)的学习能力很强,且对于许多非线性问题有极强的映射能力和容错性[16]。基于反向传播算法(BP)的神经网络作为ANN重要组成部分,在涉及多种非线性因素建模时,相对于传统的反应机理建模显示出巨大的优势[17]。基于Keras框架搭建模型1:输入层—3个隐藏层(8)—输出层(6)以及模型2:输入层—3个隐藏层(16)—输出层(6)的全连接反向传播神经网络模型见图2,使用Sgd随机梯度下降法学习率为0.05,隐藏层均采用rule激活函数。面对多分类问题将输出层激活函数设置为softmax,每批次输入数据尺寸为100,损失函数为交叉熵(CrossEntropy Loss),设置训练迭代次数为10 000次。

2 结果与分析

使用Python语言和Keras框架分别建立了模型1:3个隐藏层(8)—输出层(6),以及模型2:3个隐藏层(16)—输出层(6)的神经网络模型,将通过不同方法预处理后的数据输入模型训练得到结果如图3所示。

分析可知,通过标准化(SS)预处理后的数据在模型1中准确率达到了100%,而在模型2中经最大最小归一化(MMS)和标准化(SS)方法预处理后的数据测试结果准确度均能达到100%,证实了该方法的有效性。

3 结论

通过对自采的6种不同枸杞子品种的光谱数据进行7种不同方法预处理后分别输入复杂度不同的两个Keras搭建的神经网络模型,最终模型对枸杞品种的鉴别准确度达到100%,能够满足枸杞品种鉴别的实际需求。通过SS和MMS两种预处理方法均能增大不同品种之间光谱图的差异,有效提高了近红外光谱预测模型的准确性和鲁棒性,为快速无损检测枸杞品种提供了一种新方法。

参考文献

[1]逄春梅,李艳萍.枸杞中功能性成分的研究进展[J].食品界,2023(4):116-118.

[2]开建荣,李彩虹,赵丹青,等.宁夏不同地区不同品种枸杞中元素含量差异分析[J].食品与发酵工业,2020,46(7):257-264.

[3]王秀芬,李静,方光明,等.枸杞子质量评价研究进展[J].中国医药导报,2020,17(22):46-49.

[4]王益民,张珂,许飞华,等.不同品种枸杞子营养成分分析及评价[J].食品科学,2014,35(1):34-38.

[5]LIU E J,XIA M Q,BAI J,et al.Chemical characterization and 5α-reductase inhibitory activity of phenolic compounds in goji berries[J].Journal of Pharmaceutical and Biomedical Analysis,2021,201:114119.

[6]孙红亮.11种枸杞子总黄酮和总硒含量分析[J].分子植物育种,2022,20(18):6177-6186.

[7]禄璐,闫亚美,米佳,等.枸杞原浆品质分析与评价标准构建[J].食品工业科技,2022,43(21):271-281.

[8]蒋兰,杨毅,江荣高.枸杞的药理作用及其加工现状[J].食品工业科技,2018,39(14):330-334.

[9]许引虎,谢再斌,杨萌,等.枸杞果酒酿造工艺的研究进展[J].酿酒科技,2023(1):117-122.

[10]吉德娟,张得芳,王占林,等.有机栽培下枸杞果实中营养成分的含量特征[J].青海大学学报,2022,40(5):41-46.

[11]RAHMAWATI L,PAHLAWAN M F R,HARIADI H,et al.Detection of encapsulant addition in butterfly-pea (Clitoria ternatea L.) extract powder using visible–near-infrared spectroscopy and chemometrics analysis[J].Open Agriculture,2022,7(1):711-723.

[12]ZHU X F,ZHANG C Y,HAO Y J,et al.Effects of corn stover mulch quantity on mid-infrared spectroscopy of soil organic carbon in a no-tillage agricultural ecosystem[J].The Journal of Applied Ecology,2021,32(8):2685-2692.

[13]刘志雄,潘媛媛.基于Keras的LSTM模型的心肌梗死患者发病预测[J].电脑知识与技术,2022,18(23):68-70.

[14]蔡默晗,刘晨煜,张辛沅.基于Keras神经网络模型的车道线识别技术研究[J].现代计算机,2022,28(13):76-78.

[15]储汇,宋陈,汪晨灿.基于Keras卷积神经网络的多人脸识别抗干扰研究[J].洛阳理工学院学报(自然科学版),2022,32(1):62-67.

[16]REN R,LI X M,LI Z,et al.Projected change in precipitation forms in the chinese tianshan mountains based on the back propagation neural network model[J].Journal of Mountain Science,2022,19(3):689-703.

[17]蔡月芹,趙文杰,王雪.基于近红外光谱技术的玉米品种鉴别方法研究[J].江苏科技信息,2019,36(21):36-38.

猜你喜欢
近红外光谱枸杞子人工神经网络
El descubrimiento de las hierbas terapéuticas La historia de Shennong,el “Soberano de la Agricultura”
嚼服枸杞子缓解口干
利用人工神经网络快速计算木星系磁坐标
人工神经网络实现简单字母的识别
电子制作(2019年10期)2019-06-17 11:45:10
基于近红外光谱法的藜麦脂肪含量快速检测
洛伐他汀胶囊近红外一致性检验模型的建立
小麦子粒粗蛋白FT—NIRS分析模型建立的初步研究
近红外光谱分析技术快速检测冰温贮藏牛肉品质
肉类研究(2015年3期)2015-06-16 12:41:35
枸杞子的简易鉴别法
保健与生活(2014年1期)2014-04-29 11:31:23
基于声发射和人工神经网络的混凝土损伤程度识别