范东翠,刘文超,陈慧芝*,张慜,2*
1(江南大学 食品学院, 江苏 无锡,214122)2(食品科学与技术国家重点实验室(江南大学),江苏 无锡,214122)
近红外光谱(near infrared spectrum,NIR)是介于可见光和中红外之间的电磁波,波长范围为780~2 526 nm[1]。NIR无损分析技术是通过NIR测量技术结合光学计量学建立校正模型,对未知样品进行定性或定量分析,已广泛应用于食品领域,具有技术成本低、检测速度快、不破坏样品及无需预处理等优点。便携式NIR仪器在工作原理上与传统NIR相同,但其将传统的光、机、电元件集装在芯片内部,具有微小、易携带、集成度高、智能化和成本低等特点[2]。
基于食材的流变特性对挤出型3D打印特性有重要影响,然而传统流变仪法对材料流变特性表征所需时间长,样品处理复杂。本研究拟对便携式NIR技术检测鱼糜凝胶体系流变特性和打印适用性进行研究,以期建立快速、无损评价食材打印特性的新型检测方法。以不同水分含量和盐含量的鱼糜凝胶体系构建不同打印特性的实验样本,测定样本的流变特性和近红外光谱;对比不同光谱的预处理方式,通过NIR参数,建立鱼糜凝胶体系的3D打印特性定性分类预测模型和流变参数定量预测模型。
冷冻鲢鱼鱼糜,中国湖北洪湖井力水产食品有限公司。
DISCOVERY HR-3流变仪,美国TA仪器公司;IAS-3100便携式近红外光谱仪,无锡迅杰光远科技有限公司;美菱BCD-200MCX电冰箱,合肥美菱股份有限公司。
1.3.1 鱼糜凝胶体系的制备
冷冻鲢鱼鱼糜,低温运输,-18 ℃冰箱保存。水分含量为(75.0±0.5) g/100 g,粗蛋白含量为(15.8±0.3) g/100 g。取解冻后的鱼糜置于斩拌机中空斩2 min,再分别添加0、1、2、3 g/100 g的食盐(以鱼糜含量计),斩拌5 min。同时加入0 ℃水,保持低温斩拌,并分别调节不同含盐量的鱼糜溶胶最终水分含量至76.5、80.0、83.5、87.0 g/100 g。最后将鱼糜溶胶装入塑料容器中,4 ℃静置12 h后用于后续打印和测试。
1.3.2 鱼糜凝胶体系流变性质的测定
在静态流变测试中,剪切速率设置为0.1~100 s-1[5],当样品从平板间隙逸出即停止实验。剪切速率-黏度曲线采用幂律流体模型拟合[6],如公式(1)所示:
(1)
1.3.3 鱼糜凝胶体系的NIR检测
便携式NIR仪设备采取下照漫反射的采样方式。该仪器的有效检测波长范围为950~1 650 nm,采样间隔为1 nm。测试前,通过检测空载圆形样品池进行校准。取10 g左右的鱼糜凝胶体系平铺于圆形样品池中进行检测。
使用SPSS 22进行判别分析(Fisher判别法)。使用Unscrambler X 10.4进行光谱预处理和偏最小二乘法(partial least squares regression,PLSR)建模,训练(建模)样本个数∶预测样本个数为2∶1。建模时选择留一法作为交叉验证方法[8]。
本文共获取112个有效样本(16组配方×7组重复),不同盐含量和水分含量的鱼糜凝胶体系4类打印特性样本各28个。采用Kennard-Stone方法[9]对112个有效样本划分训练集(含交叉验证集)和测试集,选取76个样本作为训练集,余下36个样本作为测试集。由于本研究采用交叉验证的方式,所以交叉验证集的划分不在此体现。在正常情况下,测试集的数据范围应大于预测集的数据范围[8]。具体样本数据集情况如表1所示。测试集中n、K、G′-10、G″-10、G*-10范围均在训练集范围内,所选训练集和测试集均合理。
由图1可知,112个鱼糜凝胶样本的NIR曲线趋势整体一致。在970、1 170、1 450 nm附近存在光谱吸收峰。LIU等[10]和CHEN等[11]分别使用相同的便携式NIR仪采集不同干燥条件下的蓝莓和紫薯泥的NIR图在类似的3个波长附近存在光谱吸收峰。其中970 nm附近的吸收峰与O—H伸缩振动的二级倍频相关[12],1 170 nm附近的吸收峰与C—H伸缩振动的二级倍频以及C—H伸缩振动和变形的合频相关[13-14],1 450 nm附近的吸收峰与O—H伸缩振动的一级倍频相关[9]。从NIR图中虽然可以得到光谱波段响应信息,但不同于中红外光谱的“指纹峰”,NIR重叠严重,光谱的解释性差,需要结合化学计量学的方法信息定性或定量分析[15]。
表1 各数据集样本的主要流变数据分布情况Table 1 Distribution of main rheological data in each data set
图1 鱼糜凝胶样品的NIR图Fig.1 NIR spectra of surimi gel samples
在采集NIR的过程中,受到环境背景引起的光散射、仪器随机噪声等非人为因素的影响,采集的光谱数据除样品自身的信息外,常常伴随着背景干扰和噪声等等一些无用冗余的信息。因此,需要对原始光谱信息进行预处理,以减少干扰信息对光谱分析产生的影响,提高所建模型的准确度和精准度。本次使用了多元散射校正(multiplicative scatter correction,MSC)、标准正态变量变换(standard normal variable transformation,SNV)、均值中心化(mean centralization,MC)、基线校正(baseline)等常用的光谱预处理方法[16-18]。
(1)多元散射校正(MSC)。图2为112个鱼糜凝胶样品的NIR的MSC预处理结果。
图2 112个鱼糜凝胶样品的NIR的MSC预处理结果Fig.2 MSC pretreatment results of NIR spectra of 112 surimi gel samples
MSC的基本原理是通过构建一个所测样本的理想光谱作为标准,对所有测量的光谱进行基线平移和偏移校正。MSC可以有效的消除由于散射水平不同带来的光谱差异,从而增强光谱与数据之间的相关性。具体算法如下,首先,计算所有光谱数据的平均值作为理想光谱,如公式(2)所示:
(2)
其次,对每个样本的光谱与平均光谱进行一元线性回归,如公式(3)所示:
(3)
最后,对每个样本的光谱进行校正,如公式(4)所示:
(4)
式中:x,光谱数据的光谱值;n,样本个数;xi,第i个样本的光谱;ai和bi分别表示为样本i的与平均光谱进行一元线性回归后得到的相对偏移系数和平移量。
(2)标准正态变量变换(SNV)。图3为112个鱼糜凝胶样品的NIR的SNV预处理结果。与MSC一样,SNV的实际结果是它从光谱数据中消除了散射和粒度效应的干扰。
图3 鱼糜凝胶样品的NIR的SNV预处理结果Fig.3 SNV pretreatment results of NIR spectra of surimi gel samples
SNV的原理是对所有光谱数据进行标准化分析(基于光谱阵的行),用原始光谱值减去所有光谱的平均值,然后用得到的数据除以它们的标准差。具体算法如公式(5)所示:
(5)
(3)基线校正(Baseline)。图4为112个鱼糜凝胶样品的NIR的Baseline预处理结果。基线校正的理论假设是当没有有效信号时,检测器获取的信号值应当为0(所谓基线),但实际上由于仪器硬件运行不可避免会带来检测器响应,进而影响目标光谱的获取,所以通过基线校正来进行噪音的近似剔除。本章用原始光谱值减去所有光谱的最小值进行基线校正。
图4 112个鱼糜凝胶样品的NIR的Baseline预处理结果Fig.4 Baseline pretreatment results of NIR spectra of 112 surimi gel samples
(4)均值中心化(MC)。图5为112个鱼糜凝胶样品的NIR的MC预处理结果。MC的原理是每个光谱减去样品光谱的平均值,使所有光谱数据都分布在零点两侧。该预处理后的数据能更充分反映光谱的变化信息。
线性判别分析(linear discriminant analysis,LDA)是将高维的模式样本投影到最佳鉴别矢量空间,使样本在新空间的可分离性最大化,以达到抽取分类信息的效果。当数据集包含的变量多于样本(即光谱数据),则可以选择主成分分析结合线性判别分析(principal component analysis-linear discriminant analysis,PCA-LDA)算法。PCA是通过寻找多维数据方差最大的线性组合而实现数据降维。PCA-LDA可以相互取长补短,在高维度数据矩阵处理与分类领域中具有程序简单、效率高、结果直观等优势,广泛应用于多种样本的识别[19]。经过不同光谱预处理方法处理后的NIR数据建立的PCA-LDA模型的预测结果见表2。MC处理与原始光谱的判别正确率相同均为91.96%,而经过Baseline处理的判别正确率仅为88.39%,这可能是因为预处理在减少噪音干扰的同时也剔除了部分有效光谱信息。MSC处理和SNV处理的结果最好,判别正确率均为100%。
表2 基于NIR参数对鱼糜凝胶体系打印特性的判别分析Table 2 Classification of printability of surimi gels using discriminant function based on the NIR parameters
对于NIR数据,每个样本含有上千个自变量,PLSR结合了主成分分析和多元线性回归两种算法的优势,能够提取自变量中与预测指标相关性较高的变量信息建立模型,使模型更简洁。本文使用NIR参数(950~1 650 nm波长范围的吸光度)建立鱼糜凝胶体系主要流变参数PLSR预测模型,通过光谱预处理方式对原始光谱进行校正,以期提高模型的预测精度。表3为MSC、SNV、基线校正(Baseline)、MC、MSC+MC、SNV+MC、Baseline+MC等常用的光谱预处理方法处理后,建立的PLSR模型结果。
表3 基于NIR参数对鱼糜凝胶体系主要流变参数的PLSR预测模型Table 3 Calibration and prediction results for main rheological properties (G′, G″ and G* at 1 and 10 rad/s, K) of surimi gels by PLSR models using the NIR parameters
本文主要研究了利用NIR检测鱼糜凝胶体系的打印特性的分类识别和主要流变参数的预测效果,对比了不同光谱预处理对模型的预测效果。结果表明,经过MSC和SNV预处理后,建立的PCA-LDA模型对鱼糜凝胶体系的打印特性等级进行判别,判别效果最好,判别正确率均为100%。经过MC预处理后,建立的PLSR模型对鱼糜凝胶体系的流变参数K预测效果最好,测试集的决定系数为0.944 6,测试均方根误差RMSEP为67.43;经过MSC联合MC方式和SNV联合MC方式预处理得到的光谱数据对流变参数G′-10、G″-10、G*-10的建模效果类似,均优于其他预处理方式。