王 娅,张存存,付玉叶,张 凡,王 颉,王文秀
(河北农业大学食品科技学院,河北省农产品加工工程技术中心,河北 保定 071000)
明虾肉质鲜嫩营养丰富,深受消费者喜爱。新鲜度是衡量明虾品质及加工适宜性的重要指标,在捕捞、运输和贮藏等环节时的新鲜度检测至关重要[1]。传统的水产品新鲜度判定方法主要有感官评价[2]、理化检测[3]、微生物检测[4]等。然而,上述检测方式尚存在一些弊端,如检测过程耗时过长和容易受主观影响等[5],因此无法满足快速、无损检测的需求。其中,挥发性盐基氮(total volatile basic nitrogen,TVB-N)含量一直被认为是评判虾肉新鲜度最重要的一个指标[6-7],因而构建一种明虾中TVB-N含量快速检测的方法具有重要的意义。
近年来,光学检测技术逐渐发展,例如光谱学、计算机视觉和高光谱成像技术等,并已在水产品上有所应用。王琦[8]、高亚文[9]、Lan Weiqing[10]等综述了近红外光谱技术在水产品检测中的应用,表明该技术能够在不破坏样品的情况下,对水产品中水分含量、蛋白质含量、菌落总数、TVB-N含量和pH值等参数进行检测。张安红[11]利用近红外光谱技术测定了对虾中TVB-N含量,建立的偏最小二乘模型的预测相关系数达到了0.911,表明近红外光谱技术可以快速无损检测对虾中TVB-N含量。Hosseinpour等[12]利用机器视觉技术实现了烘干过程中虾色变化的实时监测。Dai Qiong等[13]利用可见-近红外高光谱成像系统(400~1 000 nm)与小波分析相结合确定冷藏期间对虾的TVB-N含量。程旎[14]将光谱特征与图像特征进行融合建立无损快速检测淡水鱼TVB-N含量的方法,结果表明,融合模型的预测能力高于单一的近红外光谱和机器视觉模型。综合现有研究可知,高光谱技术能够同时获得图像与光谱信息,但由于设备成本过高,数据量过大,限制其在实际中的应用[15]。为了实现新鲜度的快速准确测定,开发融合近红外和机器视觉技术的检测方法具有重要的应用价值,而目前融合图谱信息对明虾中TVB-N快速检测的研究仍鲜有报道。
针对上述问题,本研究融合特征图谱信息构建了明虾TVB-N含量的快速检测方法,并将其与单独利用近红外光谱信息和图像信息进行对比分析。首先,基于近红外光谱技术,对比不同波段范围和不同预处理方法对建模结果的影响,构建明虾近红外光谱与TVB-N含量之间的支持向量机(support vector machine,SVM)模型。然后,利用搭建的机器视觉图像采集系统,获取不同新鲜程度明虾样品的图像,提取图像特征信息并与TVB-N含量建立SVM模型;最后,为了进一步提高TVB-N定量分析模型的精度,融合图谱特征信息构建明虾新鲜度检测的SVM模型,并对不同模型的差异进行对比分析。
明虾 市购。
盐酸 天津市永大化学试剂开发中心;氧化镁、三氯乙酸、硼酸、甲基红、溴甲酚绿 国药集团化学试剂有限公司;95%乙醇 天津市通新化工公司;所用化学试剂均为分析纯。
K1100型全自动凯式定氮仪 济南海能仪器股份有限公司;FLAME-S-VIS-NIR-ES可见-短波近红外光谱仪(波长范围为350~1 000 nm,数据采集间隔为0.38 nm)、FLAME-NIR近红外光谱仪(波长范围为940~1 650 nm,数据采集间隔为5.36 nm) 美国海洋光学公司;CCD相机、MV-EM 200C(分辨率为1 600×1 200)、BT-118C0820MP5镜头 北京维视图像公司。
1.3.1 样品制备
样品均为当日凌晨从渤海海域养殖区运至的新鲜明虾,质量为14~18 g,体长为10~15 cm。将活虾置于0 ℃冰水混合物中15 min使其猝死,沥干后用自封袋包装并置于4 ℃冰箱中冷藏,每天取4 只进行实验,连续测定13 d,共获得有效样品51 个。
1.3.2 光谱信息采集
利用自行搭建的可见-近红外光谱采集系统获取明虾样品的反射光谱。该系统主要包括可见-短波近红外光谱仪(以下简称波段一)、近红外光谱仪(以下简称波段二)、光源、Y形光纤、计算机等,系统结构示意图如图1所示。Y形光纤的分叉端分别通过SMA905接口与两台光谱仪连接,光纤探头端置于载物台正上方,与样品表面的距离为6 mm。所用光源为2 个12 V、5 W的卤素灯,呈45°对称分布置于载物台上方。双波段光谱仪通过USB数据线与计算机连接。
图1可见-近红外光谱采集系统示意图Fig. 1 Schematic diagram of the visible-near-infrared spectrum acquisition system
实验时,首先打开仪器预热30 min,使其处于较为稳定的工作状态。然后取出冷藏的明虾样品,用滤纸吸干表面水分。在采集样品光谱前,先将光纤对准聚四氟乙烯标准白板,调整光谱仪积分时间使光强达到总量程的80%。本研究中波段一和波段二光谱仪的积分时间分别为27 ms和400 ms,平均次数分别为5和1,平滑度分别为5和3。依次获取参比光谱和暗背景光谱后,将样品置于载物台时,采集其第2腹节、第3腹节和接近尾部3 个不同位置处的反射光谱,求取平均后作为该样品的最终光谱。实验环境温度维持在(25±1)℃,湿度为(30±5)%。为了减小外部环境光的影响,实验在密闭的暗箱中进行。
1.3.3 图像信息采集
图2 图像采集系统示意图Fig. 2 Schematic diagram of the image acquisition system
机器视觉系统主要由相机、镜头、图像采集卡、光源、暗箱和计算机等组成,如图2所示。光源为2 个140 mm×20 mm的白色LED条形光源,呈45°对称分布置于载物台上方,光源总功率为42.48 W,从而确保充足且均匀的光线条件。为了增强背景和样品的对比度,以白色底板为背景对样品的图像进行采集。综合考虑相机的视野面积及镜头的焦距,将镜头前端与背景底板之间的距离设置为20 cm,使明虾样品成像于像平面的中间区域,确保成像清晰。采集图像时调整为手动曝光模式,镜头光圈值f=4.5,速率为1/100(关闭变焦和闪光灯功能),在“高分辨率”和“超高质量”照相模式下采集图像,并将图片以JPEG格式存储。上述图像采集过程在内壁涂成黑色的暗箱内进行,从而减少了外界光线的干扰。
1.3.4 TVB-N含量测定
光谱和图像采集完成后,参照GB 5009.228—2016《食品中TVB-N的测定》,利用K1100型自动凯式定氮仪对虾样品中TVB-N含量进行测定[16-17]。将明虾剥壳、绞碎,精确称取(3.0±0.1)g虾肉置于锥形瓶中,加入50 mL 20 g/L三氯乙酸溶液,每隔5 min搅拌,30 min后进行过滤,取滤液备用。然后,取10 mL滤液置于消化管中,并加入5 mL 10 g/L氧化镁溶液,蒸馏5 min,再利用20 g/L硼酸溶液吸收,吸收液用0.05 mol/L的盐酸进行滴定。每个样品平行测试3 次,取3 次均值作为最终的结果。测样品前,用10 mL 20 g/L三氯乙酸溶液代替滤液与5 mL 10 g/L氧化镁溶液作为空白对照,重复以上操作。TVB-N含量按下式计算:
式中:X为样品内TVB-N含量/(mg/100 g);V1为试液消耗盐酸标准滴定液的体积/mL;V2为试剂空白消耗盐酸标准滴定液的体积/mL;C为盐酸标准滴定液浓度/(mol/L);m为试样质量/g。
1.4.1 光谱数据处理与特征提取
图3 双波段融合过程流程图Fig. 3 Flow chart of the dual-band spectral fusion process
较宽的波段范围可以提供更多反映样品TVB-N含量差异的光学信息,模型预测的效果也会更佳[18-19]。而本研究获取的原始光谱为350~1 000 nm和940~1 650 nm波段范围内的两段独立光谱,因此首先利用区域特征加权融合法对双波段光谱进行有效融合,以获取更加全面的光谱信息。具体操作为:1)截掉两端噪音较大的区域,分别保留450~970 nm和940~1 650 nm范围的光谱作为原始光谱,并对其进行平滑处理,进一步提高信噪比;2)在2 个波段光谱仪重叠的940~970 nm波段范围内,根据波段二光谱仪获取数据的波长点,等间距选取942.79、947.83、952.89、957.97、963.08、968.21 nm处共6 个波长位置,并利用样条插值法求得波段一光谱仪在上述波长下的光谱数据。然后,对波段一光谱在上述6 个波长下的数据赋予权重1.0、0.8、0.6、0.4、0.2、0.0,对波段二对应波长下的数据赋予权重0.0、0.2、0.4、0.6、0.8、1.0,保证每个波长下2 个波段光谱仪获取数据的权重和为1,对双波段光谱进行加权求和;3)将450~940 nm间的原始光谱、940~970 nm间融合后光谱和970~1 650 nm间原始光谱有效连接起来,从而获取完整的融合后的双波段连续光谱。光谱融合后,由于两台光谱仪的数据采集点间隔不同(分别为0.38 nm和5.36 nm),导致2 个波段光谱数据量有明显差异,会对后续分析产生影响。因此,进一步利用样条插值的方法,将融合后光谱以2 nm为间隔进行数据重排,使光谱数据能均匀分布。
光谱采集过程极易受到外界因素的影响,包括杂散光、样品粒度、纹理等,因此需对光谱进行预处理,去除无关信息带来的干扰[20]。本研究对比采用标准正态变量变换(standard normal variate transformation,SNV)、一阶导数、二阶导数3 种方法对光谱进行处理,同时对不同方法按不同顺序组合使用对建模结果的影响进行了分析。此外,进一步利用竞争性自适应加权算法从众多变量中优选了与TVB-N有关的特征变量,建立更为稳健可靠的预测模型。
1.4.2 图像特征提取
在进行图像特征分析和提取之前,需对图像进行适当预处理,如背景分割、平滑去噪、形态学变换等,目的是滤除由采集设备带来的随机噪音、背景噪音以及样品本身存在的固有影响,从而突出待分析目标的特征。由于明虾目标区域和背景区域的颜色具有明显的差异,且不同样品图像灰度有差异,不具有确定的分割阈值,因此本研究采用自适应阈值分割法进行背景分割。获取的明虾原始彩色图像具有RGB三个通道,而阈值分割通常对灰度图像进行处理,因此利用加权平均算法将彩色图像转换为灰度图像,并利用基于灰度直方图的图像分割法实现明虾和背景区域的分割。然后,对二值化图像展开腐蚀操作,将边缘部位的虾脚虾须消除掉,再进行图像膨胀填充二值化图像中的孔洞区域,从而得到较为完整的虾的形状图像。最后,分别提取目标区域的颜色、面积、长度、宽度、描述图像椭圆形状的偏心率、等面积圆直径和周长等特征。
1.4.3 模型构建与评价
模型构建采用SVM算法,该算法可以很好地处理非线性的辨识问题,构建的模型有较为强大的预测性能[21-22]。由于径向基核函数能够将非线性样本数据映射到高维特征空间,在未获得先验知识指导时,也能够获得好的拟合结果[23-24]。因此本研究采用基于径向基核函数的SVM算法构建光谱和图像信息与TVB-N含量之间的关系模型。
模型的评价参数包括校正集相关系数(correlation coefficient in the calibration set,Rc)、预测集相关系数(correlation coefficient in the prediction set,Rp)、校正集标准分析误差(standard error of calibration,SEC)、验证集标准分析误差(standard error of prediction,SEP)和相对分析误差(relative percent deviation,RPD)。R P D >2.5,表示预测效果较好,预测精度较高;1.5<RPD<2.5,表示通过此方法进行定量分析可行,但模型预测能力不够强大,预测精度有待提高;RPD<1.5,表示该预测模型很难进行定量检测分析,还需进一步优化[25-26]。
图4明虾贮藏期间TVB-N含量变化Fig. 4 Variation in TVB-N content in prawn during storage
根据海产品卫生标准(GB 2733—2015《鲜、冻动物性水产品》),海鱼和虾可接受的TVB-N含量小于30 mg/100 g。由图4可知,贮藏开始时TVB-N含量较低为4.26 mg/100 g,第7天时超过30 mg/100 g腐败临界值,随贮藏时间延长TVB-N含量增加,这主要是由于明虾蛋白质含量较高,在酶和微生物的作用下,使蛋白质分解而产生氨及胺类等具有挥发性的碱性含氮物质,又结合因腐败产生的有机酸形成TVB-N,进而其含量迅速上升。
基于获取的光谱数据,利用Kennard-Stone算法将全部样品按3∶1的比例分为校正集和验证集,则有38 个样品用于建立模型,13 个样品用于对模型进行验证。如表1所示,校正集样品的TVB-N含量范围为3.85~98.97 mg/100 g,涵盖了较宽的范围,能够满足对新鲜、次新鲜、腐败和严重腐败等不同样品的检测需求。且验证集中样品的TVB-N含量均在校正样品覆盖的范围之内,表明该子集可以对模型的预测性能进行验证。
表1明虾的TVB-N含量Table 1Statistics of TVB-N content of prawn
2.2.1 原始光谱信息解析
图5 原始光谱(a)和双波段融合原始光谱(b)图Fig. 5 Dual-band raw spectrum (a) and fused spectra (b)
将原始光谱中两端噪音较大的区域截掉,保留信噪比较高的450~970 nm和940~1 650 nm波段范围的光谱信息用于后续分析。由图5a可知,不同TVB-N含量的明虾样品的近红外光谱曲线的谱形相似,但又不完全重合,既体现了样品间的差异性,又体现了总样品集的连续性。在450~1 650 nm的光谱区域内,样品的近红外光谱曲线出现多处吸收峰呈递增或递减的趋势,472 nm处的吸收峰与高铁肌红蛋白有关,539 nm处的吸收峰与氧化血红蛋白有关,580 nm和605 nm处的吸收峰与氧合肌红蛋白有关,775~850 nm与N—H键的第三倍频有关[27]。在冷藏过程中,该范围内光谱发生变化是由于肌红蛋白与硫化氢结合形成了肌红蛋白硫化物或者被微生物产生的氢过氧化物氧化形成了黄色或绿色的胆色素。980 nm处的峰与O—H键的二级弯曲振动有关,1 060 nm与C—H键的振动有关,在1 180 nm附近是饱和烷烃C—H键伸缩振动的二级倍频吸收带,也是O—H键的合频吸收带,1 280 nm与N—H键振动有关[28]。此外,还可以看出在940~970 nm范围内,2 个波段的光谱仪获取的光谱数据并不重合,这是由于2 个波段光谱仪器性能不同,对于同一样品采集得到的反射率不同,因而存在数据交叉现象,利用区域特征加权融合算法处理后的光谱如图5b所示,可以看出两段光谱得以无畸变的融合为一条连续的光谱,在940~970 nm的重叠波段范围内,光谱曲线连接良好,并且节点处变化平缓。
2.2.2 基于不同波段全光谱数据建模分析
表2 不同波段全光谱SVM建模结果对比Table 2Comparison of full-spectrum SVM modeling results in different wavelength ranges
基于不同波段的光谱信息,采用不同的预处理方法建立明虾样品TVB-N含量的SVM模型,结果如表2所示。与利用原始光谱数据建立的SVM模型相比,利用预处理后光谱数据建立的SVM模型预测效果均有所提高,说明预处理方法可以有效地消除或降低光谱数据中的噪声。基于第一波段的光谱信息,利用先一阶导数再SNV处理的方法建立的模型最佳,其Rc为0.936 6,SEC为13.34 mg/100 g,Rp为0.913 0,SEP为15.19 mg/100 g,RPD为2.42,表明模型的结果还有待进一步提高。基于第二波段光谱信息建立的模型结果优于前者,这可能与波段二比波段一光谱的信噪比好,无关信息的干扰减少有关。最佳的预处理方法为先经过二阶导数再进行SNV处理,模型的Rc为0.952 4,SEC为16.77 mg/100 g,Rp为0.9421,SEP为18.97 mg/100 g,RPD为2.53。与利用单一波段的光谱建模结果相比,利用双波段融合后的光谱信息建立的模型精度最高,这可能与融合后的双波段光谱包含的信息量更加丰富有关。最优结果为经过一阶导数处理后建立的模型,其Rc为0.957 8,SEC为14.01 mg/100 g,Rp为0.931 9,SEP为16.39 mg/100 g,RPD为2.66。
2.2.3 基于特征波长的建模结果分析
上述建模过程中利用了450~1 650 nm全波段共602 个波长的数据,输入变量的数据量过多,容易导致数据处理和模型建立时间过长,且光谱数据之间可能存在冗余或信息重叠的情况。因此,需要利用特征变量提取方法从602 个波长变量中选取少量有用的波长点数据,建立简化的预测模型,同时进一步提高模型预测性能。本研究利用竞争性自适应加权算法筛选特征波长,设置采样次数为100 次,最大潜变量数为5,并选择十折交叉检验法。利用该方法最终筛选得到与TVB-N有关的12 个特征波长,分别为488、538、630、692、714、758、800、862、874、928、936 nm和1 034 nm,由于TVB-N属于虾肉中的胺类化合物,因此通过对TVB-N进行近红外光谱分析即可测定含氢基团—OH、—CH、—NH和—SH的含量,结合图5可知,488 nm处吸收峰与高铁肌红蛋白有关,538 nm处与氧化血红蛋白有关,630 nm处与S—H键肌红蛋白有关,758 nm处与O—H键的第三倍频有关,800 nm处与N—H键的第三倍频有关,1 034 nm与C—H键的振动有关[27-28],反映了TVB-N含量与特征波长之间的关系。
以特征波长下的数据为因变量,以TVB-N标准参考值作为自变量,建立SVM模型,如图6所示。与利用全光谱数据建模结果相比,模型结果有了较大的改善,Rc升高至0.977 4,SEC下降至8.21 mg/100 g,Rp升高至0.968 7,SEP下降至10.56 mg/100 g,RPD为3.38。RPD值有明显提高,表明预测效果较好,预测精度较高,此预测模型可以应用到实际检测当中。相比任瑞娟[5]利用近红外光谱信息构建的预测对虾5 ℃贮藏期间TVB-N含量的PLS模型效果要好,该模型Rp为0.876 0,SEP为12.93 mg/100 g。
图7 明虾图像预处理过程Fig. 7 Prawn image preprocessing process
对于明虾的外观品质,一般是根据人的感官依据相应的标准进行评价,但由于感官评价受多种因素的影响,存在很大的主观性和随机性。利用计算机视觉技术对明虾颜色、形状等各项指标进行量化,能够有效提高明虾新鲜度评价的效率与准确度[29]。虾图像预处理过程如下图所示。首先使用Matlab读取文件并对图7A进行二值化处理,使用自适应阈值变换法把灰度图像转换成二值图像,将虾从背景中提取出来(图7B)。接着将二值化的图像进行腐蚀操作,去除边缘的虾脚虾须(图7C),再进行图像膨胀操作并填充二值图像中的孔洞区域,从而获得完整虾的形状(图7D)。
表3 提取的特征像素信息Table 3 Extracted feature pixel information
获取的图像特征数据如表3所示,不同贮藏时间明虾的R、G、B均值差异较小,说明颜色特征参数相似性较大;几何特征中面积和周长的参数值有明显不同,其中鲜虾面积参数值最大为478 576.00,贮藏10 d的面积参数值最小为369 618.92;鲜虾周长参数值最大为5 575.52,贮藏12 d的周长参数值最小为3 416.51,各参数均随时间的延长呈下降趋势,这可能是由于虾肉水分含量高,体内酶活性强,再加上微生物的活动,虾体很快变黑且无光泽,贮藏后期出现了汁液流失,甲壳、头部脱落现象,虾外观品质变化较大[30]。在Matlab 2016a软件中将图像特征信息采用归一化处理后再与TVB-N含量建立SVM模型,其Rc为0.955 8,SEC为16.39 mg/100 g,Rp为0.933 5,SEP为19.79 mg/100 g,RPD为1.74,此时1.5<RPD<2.5,即表示此建模方法可行,但模型预测能力不够强大。这可能是因为某些样品在冷藏期间受到不同程度的挤压加速了虾的腐败变质进而对构建预测TVB-N含量的SVM模型产生干扰。
表4 3 种模型结果的比较Table 4 Performance comparison of the three models
虾在冷藏过程中的新鲜度的变化通常伴随着内部属性(化学成分、组织结构等)和外部属性(颜色、质地、气味等)的变化。基于不同传感器数据的融合可以从虾样本中获取比单个传感器数据更多的信息,进而可以全面评估虾的新鲜度,从而获得更好的TVB-N含量预测结果[31]。因此本实验将提取的图像特征信息与光谱特征信息进行融合建立SVM模型,模型评价结果见表4,通过3 种模型结果的对比可知,采用光谱特征信息所构建的模型效果较好,Rc为0.977 4,SEC为8.21 mg/100 g,Rp为0.968 7,SEP为10.56 mg/100 g,RPD为3.38;利用图像特征信息建立的模型效果较差,Rc为0.955 8,SEC为16.39 mg/100 g,Rp为0.933 5,SEP为19.79 mg/100 g,RPD为1.74;利用融合图谱特征信息建立的模型最有效,Rc为0.986 2,SEC为5.27 mg/100 g,Rp为0.988 4,SEP为7.51 mg/100 g,RPD为6.29,预测集相关系数有所提高,误差显著降低且RPD大于2.5,表明模型的预测能力有了明显提高,与单一检测方法相比,它具有信息量大和容错性好等优点,较单独采用光谱信息或图像信息建立的模型效果要好。与陈全胜等[32]利用图谱融合方式基于BP神经网络方法建立的茶叶综合品质评判模型的结果类似,结果表明,该融合模型可行,评判结果的准确性和稳定性都较单个信息模型有所提高。
为了获得更为快速准确测定明虾TVB-N含量的方法,本实验探究单独使用近红外光谱技术和机器视觉技术以及融合图谱特征信息3 种不同方式对建模结果的影响,最终确立了融合图谱特征信息的方式建立的SVM模型,其Rc为0.986 2,SEC为5.27 mg/100 g,Rp为0.988 4,SEP为7.51 mg/100 g,RPD为6.29,校正集和验证集误差明显降低,预测精度显著提高。结果表明,融合图谱特征信息的方式可以提高预测明虾中TVB-N含量的性能,可为多源信息融合技术应用于虾的新鲜度指标快速定量检测提供参考,此外,还可为光谱与图像技术在水产品应用上提供理论支持,后期可开发便携式仪器,使其大规模投入应用。