可见/近红外高光谱成像技术对长枣中葡萄糖含量的无损检测

2019-08-21 01:50程丽娟刘贵珊万国玲何建国
发光学报 2019年8期
关键词:波长预处理葡萄糖

程丽娟,刘贵珊,万国玲,何建国

(宁夏大学 农学院,宁夏 银川 750021)

1 引言

灵武长枣是一种天然保健品,为宁夏回族自治区特有的一种鲜食枣品种,由于有利的气候和土壤环境使长枣口感鲜美、质地酥脆、果实营养丰富,被称为“枣中之王”[1-2]。糖是长枣果实可溶性固形物主要组成成分,其含量直接影响着灵武长枣的甜度及风味,长枣果实中主要可溶性糖为果糖、葡萄糖和蔗糖[3],葡萄糖为一种单糖,与其他糖相比,葡萄糖更容易被人体吸收,而且吸收后能直接为人体各个组织所利用[4]。对于糖含量的测量,一般都采用折射仪、糖度计、蒽酮法等几种传统方法,属于有损检测,存在劳动强度大、检测过程复杂、样品破坏强度大等问题,而且传统方法测的都是总糖含量,无法实现具体某一种糖含量的检测。

本文以灵武长枣作为研究对象,利用高光谱成像技术采集长枣400~1 000 nm的光谱数据,选取正交信号校正法(Orthogonal signal correction,OSC)、多元散射校正(Multiple scattering correction,MSC)、卷积平滑(Savitzky-Golay,SG)、去趋势(Detrending)、高值滤波(Gaussian-filter,GF)、中值滤波(Median-filter,MF)等6种预处理方法减少噪音干扰,结合PLSR建模方法优选最佳的预处理方法;使用间隔随机蛙跳算法(Interval random frog,IRF)、竞争性自适应加权算法(Competitive adaptive reweighted sampling,CARS)、反向区间偏最小二乘法(Backw ard interval PLS,BiPLS)、连续投影算法(Successie projection algorithm,SPA)、无信息消除变量(Uninformative variable elimination,UVE)等5种数据降维方法,结合使用偏最小二乘回归(Partial least squares regression,PLSR)和多元线性回归(Multivariable linear regression,MLR)2种建模方法分别对全波段和特征波段建模,选取最优模型,为长枣中葡萄糖含量的快速检测奠定理论基础。

2 实验

2.1 材料与试剂

灵武长枣采购于宁夏灵武果业开发有限责任公司,采摘后的长枣放置于低温保鲜盒中运至实验室,将大小均一、颜色鲜红、表面光滑的长枣样本擦拭、用密封袋密封并依次编号,置于实验室冰箱中4 ℃冷藏。每隔5 d测试一次(贮藏期1,6,11,16,21,26,31 d,共计7次),每次随机取21个长枣作为试验样本。

葡萄糖标品,四川省维克奇生物科技有限公司;滤头(0.45 μm)、水系膜(0.45 μm×50 mm)、乙醇(色谱级),天津科大贸化学试剂厂。

2.2 仪器

实验过程中使用的仪器主要为:AGILENT型高效液相色谱仪(美国安捷伦科技公司);Hyper Spec VIS/NIR 高光谱成像系统(美国Headwall Photonics 公司),如图1所示。

图1 Vis/NIR 高光谱成像系统Fig.1 Vis/NIR hyperspectral imaging system

2.3 高光谱信息采集

实验之前将高光谱成像系统打开预热30 min,通过预实验确定了光谱扫描的最佳参数:CCD相机曝光时间20 ms,物镜高度385 mm,扫描长度70 mm,电控位移平台速度200 μm/s。在完成对整个长枣果实的扫描后,通过光谱矩阵的空间组合,构建三维空间和光谱数据立方体,高光谱图像用白色和暗色参考图像进行校准[10,23]。校正图像(R0)使用下列公式计算:

(1)

其中,R0是黑白校正后的长枣反射率图像数据,R是长枣原始数据,RD是暗反射图像数据(反射率0%),RW是白色反射率图像数据(反射率约100%)。

2.4 葡萄糖含量的测定

标准溶液的配置:准确称取葡萄糖标准品100 mg(精确至0.000 1 g),加入少量超纯水溶解并定容至5 mL容量瓶内,配制成质量浓度为20 mg/mL的溶液。准确吸取2 mL葡萄糖溶液于5 mL容量瓶中定容,制备成质量浓度为8 mg/mL的葡萄糖溶液。按照对应比例稀释,依次制备其他浓度标准溶液,最后得到质量浓度均为0.5,1,2,4,8 mg/mL的葡萄糖标准溶液。

提取液的制备:采集长枣样本,削皮,取1 g果肉研磨捣碎,加入10 mL 无水乙醇进行均质、超声提取半小时,11 000 r/min的离心机中离心15 min后收集上清液,在剩下的残渣中加入5 mL 无水乙醇再一次提取,将两次所得的上清液合并。55 ℃真空旋干,超纯水溶解并定容到25 mL容量瓶刻度线位置,充分摇匀,测试前用0.45 μm针式过滤器过滤,流动相为超纯水进行反复测试。

2.5 图像处理

利用高光谱成像系统采集样品图像后,使用ENVI4.8(Research System Inc,USA)软件选取长枣光谱图像赤道位置大约30 pixel×30 pixel的区域作为感兴趣区域(Region of interest,ROI),计算出的平均光谱值作为该长枣的反射光谱。

2.6 数据分析

采用The Unscrambler X 10.4软件对光谱预处理,图像分析软件为ENVI 4.8,利用Matlab R2014a软件进行建模、划分样本集,绘图软件为origin 8。

3 结果与讨论

3.1 HPLC测量结果

图2为长枣提取液的高效液相色谱出峰图,葡萄糖出峰时间为13.42 min,与标准品相对应。线性方程为y=4.5050×10-6x-2.40×10-2,相关系数R2=0.999 9,表明两者具有良好的线性相关性。精密度、回收率的测定结果分别见表1、2,精密度测试结果表明长枣样品的峰面积基本稳定,通过计算得到相对标准偏差(RSD为0.31%)<1%,表明该方法精密度高;加标回收率为92.84%~98.01%,平均回收率为95.43%,有较高的准确性。

图2 长枣提取液的高效液相色谱出峰图Fig.2 High performance liquid chromatographic peak of jujube

表1 精密度结果Tab.1 Precision result of sample

表2 加标回收率结果Tab.2 Recoverles from sample

3.2 样本划分

采用蒙特卡罗法共检测出5个异常样本,分别为93,109,118,137,144样本。剔除异常样本后,相关系数Rc由0.680 5增大到0.766 3;然后使用SPXY算法将剩余的142个样本按照3∶1的比例划分成107个校正集和35个预测集,统计结果见表3。

表3 长枣葡萄糖含量数据统计Tab.3 Statistics of jujube glucose content

3.3 筛选最佳预处理方法

表4为原始光谱以及预处理光谱的PLSR建模结果,由相关系数、均方根误差评价模型稳定性,图3为几种预处理光谱。可以看出使用OSC预处理方法,建模效果降低,因此,经过预处理的光谱建模效果不一定高于原始光谱模型效果;使用其他几种预处理方法,模型相关系数均高于原始光谱,均方根误差低于原始光谱,说明这几种预处理方法可以消除噪音干扰,提高建模效果;经过数据和图像对比分析,确定SG(7)为最佳预处理方法。

表4 不同预处理方法的PLSR模型Tab.4 PLSR methods of different spectra pretreatment

图3 不同预处理方式的光谱曲线。(a)MSC处理;(b)OSC处理;(c)De-trending处理;(d)SG(7)处理;(e)GF处理;(f)MF处理。Fig.3 Spectral curves with different pretreatment.(a)MSC treatment.(b)OSC treatment.(c)De-trendingtreatment.(d)SG(7)treatment.(e)GF treatment.(f)MF treatment.

3.4 光谱数据降维

3.4.1 SPA算法选取特征波长

SPA算法可以在很大程度上精简模型,应用SPA选取特征波长时,设置变量范围为5~25,归一化处理后得到前5个波长变量下的RMSECV值,如图4所示,分别为 401,415,425,641,699 nm。

3.4.2 UVE提取特征波长数

设置五折交互验证,运行程序得到输入变量的稳定性结果,如图5所示。

图4 SPA提取的特征波长数Fig.4 Number of characteristic wavelengths extracted by SPA

图5竖线左右两侧各为125个变量(左边为波长变量,右边为随机变量)。用该方法共选取了15个特征波长,分别为 449,463,502,506,554,607,612,617,622,627,679,727,886,924,929 nm。

图5 UVE-PLSR稳定性分布曲线Fig.5 Stability distribution curve of UVE-PLSR model

3.4.3 CARS算法提取特征波长

CARS挑选特征波长的参数设置为:蒙特卡洛采样次数为300,交互验证组数为10,筛选过程如图6。曲线(a)为筛选特征波长数的过程,运行次数逐渐加大,波长数呈现由快到慢的递减趋势,最后下降幅度趋于平缓,体现了波长变量筛选的粗选与精选;曲线(b)表示RMSECV的变化趋势,呈现先下降后上升的趋势,刚开始RMSECV值不断减小,说明CARS方法在运行过程中无关变量被消除,随着运行次数的增加,RMSECV值趋于平缓,说明变量变化不明显,最后,RMSECV值持续上升,说明一些关键变量数被消除;曲线(c)中的每条线代表回归系数的变化趋势,*号表示RMSECV最小的位置,CARS选出的18个特征波长分别为478,554,588,670,675,679,737,756,780,795,804,843,852,895,924,948,958,963 nm。

图6 CARS法选取波长变量过程Fig.6 Process of selecting wavelength variables by CARS method

3.4.4 IRF提取特征波长

IRF[24]参数设置如下:迭代次数N=3 000,子间隔初始值Q=50,间隔宽度W=15,最大主成分数为20。运行IRF程序后得到111个间隔中排名前10的间隔,具体见表5;组合间隔的 RMSECV值如图7所示。

表5 灵武长枣葡萄糖含量光谱数据排名前10的波长间隔Tab.5 Top ranked 10 wavelength interval of Lingwu long jujube spectral data

图7 组合间隔的RMSECV值Fig.7 RMSECV value of the combined interval

从表5可以得出,前10个区间选出的波点范围是46~60、65~87、90~115,但图7显示,RMSECV值最低时,组合间隔数为22,因此,排名前22间隔的波长被选作为特征波长,这些波长依次是35~87号、90~117号,具体是564~814 nm、828~958 nm,总共61个波长。

3.4.5 BiPLS提取特征波长

使用BiPLS[25]法提取特征波长时将整条光谱分为12个子间隔,采用留一法交叉验证计算各个区间及组合区间的RMSECV 值,结果如表6所示。

表6 12个子区间数的BiPLS优化结果Tab.6 Optimization results of 12 subinterval numbers

由表6可以看出,当入选区间为[5,8,9,10,11]时,RMSECV值最小,利用BiPLS总共选择出51个波长,其相对应的特征变量主要分布在598~641 nm和742~943 nm。

3.5 建立模型

对全波段和特征波段分别建立PLSR、MLR模型,如表7所示。整体来看,使用SPA、UVE算法提取特征变量数后的建模效果均低于全波段模型,而其他提取方法建模效果和全波段相当,甚至优于全波段模型结果;鉴于IRF、BiPLS方法提取的特征波长数较多,使用CARS算法在此基础上再次降维处理,以减少波段数;对比分析16种模型,建模效果最优的是PLSR-IRF+CARS,Rc=0.835 3,Rp=0.832 2。

表7 不同波长提取方法建立的的PLS和MLR模型的结果Tab.7 Results of PLS and MLR models based on different wavelength extraction methods

4 结论

本文以灵武长枣为研究对象,采集宁夏灵武长枣400~1 000 nm的光谱图像,提取反射光谱,同时利用HPLC测量长枣中的葡萄糖含量,对光谱值和化学值建立PLSR、MLR模型。采用高光谱成像技术可以实现灵武长枣葡萄糖含量的预测。主要结论如下:

(1)对原始光谱采用6种方法进行预处理,通过对比分析数据和图像信息,确定SG(7)为最佳预处理方法,该预处理方法降低了噪音,去掉了无用信息,提高了建模效果,结果如下:Rc= 0.826 5,Rp=0.791 0,RMSEC为0.005 3 mg/g,RMSEP为0.005 6 mg/g;

(2)基于最优预处理方法,使用了7种数据降维方法,提取特征波长数分别为5,15,18,61,51,33,27,占到全波段的4%、12%、14.4%、48.8%、40.8%、26.4%、21.6%;

(3)对以上8种降维处理数据分别建立PLSR和MLR模型,PLSR-IRF+CARS为最优模型,Rc=0.835 3,Rp=0.832 2,提取特征波长可减少冗长数据,降低维数,实现快速检测。

猜你喜欢
波长预处理葡萄糖
求解奇异线性系统的右预处理MINRES 方法
葡萄糖漫反射三级近红外光谱研究
糖耐量试验对葡萄糖用量的要求
基于预处理MUSIC算法的分布式阵列DOA估计
葡萄糖对Lactobacillus casei KDL22发酵及贮藏性能的影响
日本研发出可完全覆盖可见光波长的LED光源
浅谈PLC在预处理生产线自动化改造中的应用
多发性肺硬化性血管瘤18~F-脱氧葡萄糖PET/CT显像1例
RP—HPLC波长切换法同时测定坤泰胶囊中6个成分的含量
便携式多用途光波波长测量仪