眭亚南,张雷蕾,卢诗扬,杨德红, 朱 诚*
1. 中国计量大学生命科学学院,浙江 杭州 310018 2. 浙江省海洋食品品质及危害物控制技术重点实验室,浙江 杭州 310018
中国是虾需求量大国,大量虾产品顺利进入市场依赖于冷冻保藏技术的发展。明虾营养丰富、肉质鲜美,含人体所需氨基酸。由于其高水分、脂肪和蛋白质,虾被归类为高度易腐烂的食品。虾的质量取决于储藏条件[11],冷藏是明虾贮藏和加工主要途径,而在冷冻冷藏过程中出现多种恶化机制,如脂肪氧化、风味物质消失、酶或微生物腐败[12]。随着贮藏时间的增加,颜色发生改变、产生挥发性物质,营养品质下降,甚至危害食用者身体健康。目前,水产品检测方式有电子鼻法、化学方法、微生物方法、感官评定方法,但这些方法存在检测时间长,样品受损等缺点。为确保水产品食用性、安全性,实现虾品质的快速检测方式具有深远意义。
除了现有的方法,新技术如拉曼光谱,由于其无损、快速、现场可用性和精度高等优点,近年来应用广泛[3,7-8]。拉曼检测方法方便、快捷,只需将检测探头对准样品,根据吸收的拉曼散射光能量便可绘制出样品光谱图,只需少量样品拉曼光谱提供详细结构信息,根据拉曼强度和拉曼位移可对物质进行定性和定量分析[6-7]。陈繁等运用拉曼光谱结合主成分回归(PCR)和偏最小二乘对预测蜂王浆蛋白质和水分含量,预测集决定系数分别为0.948和0.879[4,8]。翟晨等运用拉曼光谱结合偏最小二乘测定苹果中溴氰菊酯和啶虫脒含,相关系数分别为0.94和0.85[9]。窦颖等利用拉曼光谱结合偏最小二乘实现面粉品质的快速检测,建立的水分、灰分、湿面筋等模型相关系数分别为0.945,0.993和0.981[9,13],说明运用拉曼光谱通过建立模型可获取定量信息[1,4-5]。目前拉曼技术有应用于肉类制品的分类、分级,但将其应用在虾品质的快速鉴定方面缺少相关指导方法和实验验证,有待于进一步的研究和探索。
研究中使用拉曼光谱分析虾,针对虾品质问题,基于自行设计的拉曼光谱检测系统实现对虾在4 ℃和-20 ℃不同贮藏条件下品质变化快速评定。本文就色差(L*, a*, b*)、pH、挥发性盐基氮(total valatile basic nitrogen, TVB-N)品质指标进行研究,将光谱学和前向逐步回归、岭回归和偏最小二乘(partial least squares,PLS)3种模型相结合,预测不同指标的含量信息。结合SG平滑+背景扣除+二阶微分+标准正态变量变换4种预处理方法和结合PCA降维技术提高模型鲁棒性、筛选最佳模型,从而完成对虾新鲜度快速实时评定。
基于QE-Pro光谱仪(Ocean Opticis公司)、Laser-785 nm激光器、传输光纤、拉曼检测探头、置物台自行搭建实验室激光拉曼检测系统,785 nm激光束通过传输光纤经拉曼检测探头聚焦明虾表面并激发拉曼散射光,检测探头捕获拉曼信号汇集到光纤送入光谱仪,经分光聚焦于CCD阵列,实现对探测样品拉曼散射光的高效收集。
1.2.1 样本制备
采集明虾品种为中国对虾,由杭州萧山养殖场养殖,饲料采用天马EP高端虾料,不会导致水中的亚硝酸和氨氮指数偏高,有利于虾苗的生长及水质健康。明虾购于杭州高沙农贸市场和下沙物美超市,人工运输到实验室自然致死,分批装入食品级密封袋并贴上标签。样品总数65份,分别在4 ℃和-20 ℃下贮藏,其中51份在4 ℃下贮藏6 d,每天取样品测定各指标值,14份在-20 ℃下贮藏30 d,取样测量天数分别为2, 4, 6, 9, 11, 12, 13, 14, 16, 17和30,每份取9个样测定各指标值。
1.2.2 理化值测定
色差测定采用CS-10色差计,取虾腹不同测定点测量5次取平均。
pH测定: 称取绞碎虾肉2 g,加20 mL氯化钾(KCl)溶液,搅拌30 s后离心,用pH计测定上层清液,设定3个平行,结果取平均值。
TVB-N测定参照GB 5009.228—2016中自动凯氏定氮仪法,试样搅拌静置30 min后均质,取上层液离心,将离心液和氧化镁全部放入消化管消化,测定3次结果取平均。
1.2.3 光谱采集
基于实验室自行搭建光谱检测系统,解冻试样置于检测台,设定光谱仪参数为: 采集时间4 500 ms, 积分次数2次,激光功率320 mW,采样间距3~5 mm。光谱采集环境为暗光,可避免荧光干扰。试样光谱采集取不同测定点3次后平均。
选取光谱范围500~2 000 cm-1,采用光谱分析软件Uspectral-Pro数据预处理及定量模型建立。为优化光谱信号和提高模型预测能力,将SG平滑(savitzky-golay, SG)、背景扣除(background deduction,BD)、二阶微分(second order differential,SOD)、标准正态变量变换(standard normal variable transformation,SNV)等常规方法组合。由于光谱特征参数较多(包含1500个光谱特征变量),因而在对原始光谱数据组合预处理后采用PCA技术降维, PCA可以解决共线问题,削弱误差产生的影响[8]。定量模型建模集和预测集划分为45份和20份,模型评价指标为相关系数(R)和均方根误差(RMSE),R越大,RMSE值越小,预测准确率越高。
明虾贮藏中的品质指标包含颜色(L*, a*, b*)、pH和TVB-N等,TVB-N是反映水产品鲜度的重要指标,TVB-N≤25 mg/100 g为一级鲜度,TVB-N≤30 mg/100 g为二级鲜度。随着储藏时间的增加,所有明虾样品的TVB-N值呈上升趋势,由表1、表2理化数据分析得出,明虾在4 ℃下TVB-N最大值为32.889,已超过二级鲜度标准,-20 ℃下TVB-N最大值为20.218为一级鲜度标准,结果发现-20 ℃明虾的TVB-N值均低于4 ℃,说明冷藏易于保鲜。4 ℃下pH从6.780上升到8.560,而-20 ℃下pH值从6.920上升到7.480, 原因是虾体内蛋白质会分解产生碱性物质[2],随储藏时间增加,-20 ℃明虾pH变化不明显,说明冷藏易于保鲜。明虾的色泽变化也是反应鲜度的指标之一,明虾颜色(L*,a*,b*)测定如表所示,L*代表虾体亮度,a*代表虾体红绿值,b*代表虾体蓝黄值,表中a*多为负值表示明虾在a*分量上的颜色变化在偏绿范围内,随储藏时间增加,L*由31.929上升到43.764,此时4 ℃下虾体表面逐渐变黑,明虾腐败严重; 而-20 ℃下L*最小值为33.933、最大值为37.922,虾体腐败程度低,以上品质指标含量的变化反映了明虾品质随储藏时间的变化。
表1 明虾在4 ℃贮藏过程中鲜度指标的化学分析统计结果Table 1 Statistical analysis of chemical analysis offreshness index of prawns during storage at 4 ℃
表2 明虾在-20 ℃贮藏过程中鲜度指标的化学分析统计结果
Table 2 Statistical analysis of chemical analysis of freshness index of prawns during storage at -20 ℃
温度指标最大值最小值平均值方差标准差L∗37.92233.93335.9931.2451.115a∗-3.198-7.975-4.0490.2340.484-20 ℃b∗4.9910.4162.3981.6681.291pH7.4806.9207.1490.0270.166TVB-N20.2186.48510.18115.4673.932
图1 拉曼光谱(a): 原始光谱; (b): 不同预处理光谱; (c): 4 ℃明虾光谱; (d): -20 ℃明虾光谱Fig.1 Raman spectra(a): Original spectrum; (b): Spectra of different pretreatment;(c): 4 ℃ shrimp spectrum; (d): -20 ℃ shrimp spectrum
表3为光谱数据经过2种处理方式(SG+BD+SOD+SNV和SG+BD+SOD+SNV+PCA)不同指标(L*,a*,b*,pH和TVB-N)的岭回归模型建模结果和预测结果,分析表中数据可知,2种处理方式在建模集上都取得较好效果。只采用组合预处理后的a*和b*指标建模集R分别为0.983和0.986,RMSE分别为0.144和0.179,预测准确度高,而在预测集中a*和b*指标R分别为0.513和0.564,预测效果较差; 采取PCA技术降低数据维度后,a*和b*指标建模集R降低,同时预测集R上升,过拟合有明显改善。主要原因: 原始数据维度较高,模型过于复杂,导致在建模集上准确度高而预测集预测效果很差的过拟合现象,通过降低维度提高了预测准确率。表中可知PCA降维后建模集除L*指标外其他指标R明显下降,RMSE变大,可能维度降低后模型过于简单,导致不能很好拟合建模集数据,模型精度下降。比较可知,经SG+BD+SOD+SVN处理后的模型过拟合现象比较严重,在预测集上预测准确率很低,在PCA处理后L*指标建模集和预测集R均有上升,表明PCA可以有效提高预测精度。
表3 不同组合预处理岭回归模型的结果对比Table 3 Comparison of results of different combined preconditioned ridge regression models
表4为不同指标在不同处理方式下PLS模型建模和预测结果,表中显示,SG+BD+SOD+SNV组合处理下L*,a*和b*三者指标建模集预测精度比较高,R分别为0.942,0.913和0.922,均方根误差分别为0.936,0.242和0.417; 预测集R分别为0.630,0.539和0.648,RMSE为1.938,0.650和0.880,预测精度偏低,产生过拟合现象; pH和TVB-N建模集和预测集准确度相差不大,预测效果良好。经PCA降维处理后的建模集均方根误差普遍较高,模型精度低于第一种处理方式,L*,a*和b*建模集相关系数分别为0.652,0.616和0.703,预测效果很差。比较可知,在最佳处理方式SG+BD+SOD+SNV下的L*,a*和b*等指标预测集预测准确率偏低。
表4 不同处理方式的PLS模型的结果对比Table 4 Comparison of results of different combined pre-processed PLSR models
分析表5各品质指标前向逐步回归定量模型结果可以看出,最优处理方式为SG+BD+SOD+SNV,各指标建模集R最高为0.94,预测集各指标R均高于0.85,RMSE最低,建模效果好。相较于岭回归、PLS,采用前向逐步回归结合SG+BD+SOD+SNV处理得到各指标预测值和真实值线性相关性高,预测准确率高,图2为前向逐步回归建模效果图。
表5 不同处理方式的SMLR模型结果对比Tabel 5 Comparison of SMLR model results with different combinations of pretreatment
以生鲜明虾为研究对象,发现拉曼光谱不仅可以观测虾品质的变化,还能实时检测虾中挥发性盐基氮、pH、颜色(L*,a*, b*)等品质指标含量,通过利用拉曼光谱技术结合化学计量学方法如岭回归、偏最小二乘回归和前向逐步回归建立虾品质指标参数颜色(L*, a*, b*)、pH、挥发性盐基氮(TVB-N)的定量分析模型。光谱预处理过程包括两部分: 一是SG+BD+BOD+SNV, 二是SG+BD+BOD+SNV+PCA。结果表明: 岭回归和偏最小二乘均有过拟合的现象发生,过拟合指在训练数据集上模型预测得分较高,在测试数据集上预测精度较差,可能原因为光谱数据维度(1 500个特征变量)太大远远超过样品总量,导致模型过于复杂,不能准确拟合预测数据。在光谱数据经过SG+BD+BOD+SNV去除无关信息和噪声后,选取PCA对原数据空间降维,结果表明: 岭回归在PCA降维后a*,b*,pH,TVB-N建模集精度降低,各指标预测集准确率有所提升,L*预测集相关系数提升0.2,均方根误差降低,说明PCA可以有效提升模型精度; 偏最小二乘在PCA处理后各指标建模集准确率较低,预测集无明显提升,可能原因为偏最小二乘本来就集成了主成分分析,预测集效果不明显。前向逐步回归模型在建模集和预测集上准确率高,泛化能力强,其评价指标相关系数R均高达85%以上,均方根误差RMSE普遍很低,在SG+BD+BOD+SNV等预处理下取得最好结果,说明前向逐步回归模型稳健,结合拉曼光谱技术可以实现明虾品质的快速检测。
图2 品质指标前向逐步回归定量模型建模效果图(a): L*指标; (b): a*指标; (c): b*指标; (d): pH指标; (e): TVB-N指标Fig.2 Effect diagram of quality indicator quantitative model based on Forward stepwise regression(a): L* indicator; (b): a* indicator; (c): b* indicator; (d): pH indicator; (e): TVB-N indicator