房盟盟,丁佳兴,崔腾飞,王 莉,杨晓玉,吴龙国,刘贵珊,何建国
(宁夏大学农学院农产品无损检测实验室,宁夏银川 750021)
鸡蛋营养全面均衡,是人们日常所需营养的主要来源,常被作为其他食品营养价值的标准参比物。鸡蛋中蛋白质含量高达12.8%[1],含有人体所需的8种必需氨基酸,易被人体利用。此外,鸡蛋中还含有钙、铁、磷等多种矿物质和维生素,对于提高人体免疫力、降低体重等方面具有积极意义[2]。随着人们生活水平的提高,人们对鸡蛋的要求正由数量向质量转变。鸡蛋品质检测包括内部品质(蛋黄颜色、血斑、肉斑、蛋白高度、蛋白pH和哈氏单位HU等)检测和外部品质(蛋形、重量、蛋比重、蛋形指数、蛋表面破损、壳色等)检测[3]。在蛋品储藏、销售过程中,新鲜度在一定程度上可解释为一些感官的、化学的、微生物的及物理的参数,它是禽蛋及其产品的主要指标,其中,鸡蛋新鲜度指标——哈氏单位是分级标准中最重要的一项,是未来鸡蛋品质检验的发展方向。
传统的化学检测方法虽具有简便、检测成本低等优点,但其缺点也十分明显,破坏性实验,耗时长、效率低,检测过程中只能抽检,覆盖面小容易出现检测漏洞[4]。因此,亟需寻求一种检测准确、快速、效率高的检测技术。近年来,光谱无损检测技术发展迅速,弥补了传统检测方法的不足,在分析检测的过程中,可透过待测物质的表面,达到检测内、外品质的目的,对待测物无破坏性,测量方便且操作简单,几分钟甚至几秒钟内就可以完成样品的一次测试,而且光谱技术在分析过程中一般不消耗样品,成本低[5-6]。现有的研究报道中,王巧华[7]等探究鸡蛋光反射特性及其与新鲜度的关系,得出带壳鸡蛋在比较新鲜时光反射率最大的结论;刘燕德[8]等分析了鸡蛋内部品质与透射特性的相关关系,从而对鸡蛋的新鲜度作出估量,提出利用鸡蛋的透射特性对其新鲜程度进行无损检测和分级是可行的;吴建虎[9]等利用可见/近红外光谱技术无损检测新鲜鸡蛋蛋白质含量,结果表明可见/近红外反射光谱技术可以较好的预测新鲜鸡蛋的蛋白质含量。因此,本实验利用高光谱技术快速无损检测鸡蛋哈氏单位是可行的。
为避免检测单一品种鸡蛋带来的偶然性,本实验以三个不同品种的鸡蛋为检测对象,利用高光谱(900~1700 nm)成像技术采集光谱信息,结合化学统计学法检测的鸡蛋哈氏单位,建立反射光谱检测模型,对比不同预处理方法、全波段与特征波长下的模型效果,选取最优预测模型,实现鸡蛋哈氏单位的高效无损检测,为鸡蛋新鲜度的自动快速无损检测提供技术支持。
鸡蛋 购买于银川当地超市,180枚,均为粉壳鸡蛋,重量介于50.00~70.00 g之间,其中富硒鸡蛋、昊惠鸡蛋、普通粉壳鸡蛋各60枚。仔细清洁表面,晾干后编号。
AL204型号电子天平 梅特勒-托利多仪器(上海)有限公司;A型游标卡尺 贵州西南工具(集团)有限公司;N17E-NIR型光谱成像系统 光谱范围900~1700 nm,结构如图1所示,主要包括:采集暗箱和信息处理的计算机(CPU为Inter(R)Core i7-2600,主频为3.40 GHz,内存为4.00 G),联想(北京)有限公司;4个35 W的HSIA-LS-TDIF型卤钨灯线光源 北京卓立汉光仪器有限公司;Zelos-285 GV型CCD相机 德国Kappaopto-electronicsGmbH公司;PSA200-11-X型推扫式输送装置 北京卓立汉光仪器有限公司;Imspector N17E型近红外成像光谱仪 芬兰奥卢光谱成像有限公司。
图1 900~1700 nm高光谱成像系统Fig.1 900~1700 nm hyperspectral system注:1.计算机;2.光源;3.CCD相机; 4.载物平台;5.成像光谱仪。
将采集完光谱信息的鸡蛋,按编号顺序逐个称其重量W,记录数据。轻轻敲破鸡蛋将其倒在保持平衡的玻璃板上,用高度游标卡尺测量破壳后距离蛋黄1 cm处浓蛋白高度H。测定时要选准位置,测量破壳后蛋黄边缘与浓蛋白边缘中点的浓蛋白高度(避开系带),测量成正三角形的三个点,将高度指针下降至接近蛋的表面时,即可读出蛋白高度,取其平均值,代入下列公式[10]:
HU=100lg(H-1.7W0.37+7.57)
式中,HU为哈氏单位,H为蛋白高度(mm),W为鸡蛋蛋重(g)。
由于各波段下光源强度的分布不均性以及仪器中暗电流的存在,导致光源分布较弱的波段图像有较大噪声,会掩盖一定的样品信息,同时,在光谱图像信息采集的过程中存在噪声干扰,降低了光谱数据采集的准确性,因此,在采集光谱数据前,需要首先采集黑、白图像以减弱CCD相机暗电流和高光谱成像系统光源变化对采集样本光谱图像质量的影响。依据下列公式进行校正[11-13]:
式中:RC表示校正后光谱反射强度;IR为表示原始光谱漫反射强度;D为表示黑板校正时的光谱漫反射强度;IW为表示白板漫反射光谱强度。
样品的图像采集过程在暗箱中进行,预先根据光源的照度设定好CCD相机的曝光时间,以保证图像清晰[14]。经反复调整,确定高光谱成像系统的最佳参数值为曝光时间10 ms,图像采集速度为1.73 mm/s,物距为8 cm。实验过程中,把鸡蛋样本按编号顺序逐个放置于载物台上,关闭暗箱门,连接位移平台控制电机,开始扫描,获取900~1700 nm波段的高光谱图像信息。
本实验采用三项式九点卷积平滑(Savitzky-Golay Smoothing,S-G)、多元散射校正(Multiplicative Scatter Correction,MSC)、标准正态化(Standard Normal Variate,SNV)三种方法对原始光谱进行预处理,建立原始光谱、预处理后光谱的偏最小二乘(Partial Least Squares Regression,PLSR)模型,比较分析。模型采用相关系数(Rc/RP)、均方根误差(RMSEC/RMSEP)进行评估,好的模型应该是具有较大的相关系数,较小的均方根误差,同时,主成分数较小者的模型运算速度相对较快,也是评价模型好坏的一个重要指标。
实验采用偏最小二乘回归(Partial Least Squares Regression,PLSR)权重β系数法、遗传算法(Genetic Algorithm,GA)两种特征波长方法提取特征波长,分别建立偏最小二乘(Partial Least Squares Regression,PLSR)模型、主成分回归(Principal Component Regression,PCR)模型,比较模型效果。
表2 原始光谱与预处理后光谱的PLSR模型效果Table 2 The effect of PLSR model on raw spectrum and pretreated spectrum
除去测定时有明显差异及破损的样品,实验中实际获得167枚鸡蛋的光谱信息与哈氏单位。校正集与预测集呈4∶1比例划分,保证预测集样本的哈氏单位变化范围在校正集样本哈氏单位变化范围内。本实验以直接购回的鸡蛋为研究对象,哈氏单位分布如表1所示。
表1 鸡蛋哈氏单位分布Table 1 Distribution of egg hassian unit
注:我国对鲜鸡蛋进行哈氏单位分级:特级>72,一级60~72,二级31~59,三级<31。
采用软件ENVI V.4.6(美国Research System公司)对获取的图像数据进行裁剪[15],减少背景图像中多余信息的影响,选取感兴趣区域(Region of interesting,ROI),取平均光谱信息作为原始光谱,如图2所示。
图2 高光谱原始图像及曲线Fig.2 Hyperspectral original image and curve注:a.高光谱原始图像;b.感兴趣 区域选取;c.高光谱原始曲线。
从图2(c)中可以看出,原始光谱曲线两端曲线抖动严重,即存在较大的噪音干扰,因此选取993~1657 nm内224个波段的光谱曲线分析建模[16]。
为消除光谱曲线上的噪音及其他无关信息的干扰,需要对原始光谱进行适当预处理和优化,将鸡蛋品质信号和噪声分离,最大程度地提取有效信息[17]。原始光谱、预处理后光谱的PLSR建模效果,如表2所示。
由表2可以看出,与原始光谱数据所建模型相比,经S-G卷积平滑、MSC预处理的模型相关系数(Rc/RP)较低,均方根误差(RMSEC/RMSEP)较大,建模效果不如原始光谱。SNV处理的光谱模型,校正集相关系数稍高于原始光谱,但其预测集相关系数为四种模型最小,均方根误差较大,这说明标准正态法处理光谱时,忽略了原始光谱中某些有用信息或放大了噪音,模型准确性降低,效果不佳。综上所述,原始光谱PLSR模型预测效果较好,其Rc为0.8175,校正集均方根误差为2.9271,Rp为0.8150,预测集均方根误差为3.2416。
为减少全波段原始光谱数据冗余,取出无关信息,提取有效信息,建立低维数据模型[18]。实验提取224个波段下原始光谱的特征波长,并建立不同模型比较分析[19]。
2.3.1 权重β系数法选择特征波长及建模 采用The Unscrambler X软件中的权重β系数法选择特征波长,对全波段下的原始光谱反射曲线进行PLS回归,由加权β系数得到回归系数曲线,基于局部最大值和最小值原则提取特征波长,如图3所示。PLSR权重β系数法共选取15个特征波长:1005,1017,1175,1226,1261,1321,1401,1413,1419,1425,1431,1479,1515,1613,1631 nm。采用偏最小二乘(Partial Least Squares Regression,PLSR)、主成分回归(Principal Component Regression,PCR)法建立鸡蛋哈氏单位的检测模型,对比建模效果,如表3所示。
图3 反射光谱曲线权重系数图Fig.3 Weighted regression coefficients of reference wavelength
表3 权重β系数法提取特征波长建立的不同模型Table 3 The different models of feature wavelength establishment by weight β coefficient method
由表3可以看出,采用加权β系数法提取特征波长所建立的不同模型建模效果相差不大,其中,β-PCR模型的RC比β-PLSR模型稍高,但其RP低于β-PLSR模型,且β-PLSR模型的主成分数(10)较少,说明稳定性较好,运行速度更快,因此,加权β系数法提取特征波长后,采用PLSR法建模效果更好。
2.3.2 遗传算法(GA)提取特征波长及建模 采用MATLAB软件中的遗传算法(Genetic Algorithm,GA)对样品原始全波段光谱进行特征波长的选择,以交互验证系数(RMSECV)取最小值为原则,确定特征波长数,变换程序赋值,多次尝试,建立鸡蛋哈氏单位的偏最小二乘(Partial Least Squares Regression,PLSR)、主成分回归(Principal Component Regression,PCR)模型,对比建模效果,优选GA法提取特征波长的输入参数,如表4所示。
表4 GA法提取特征波长建立的不同模型Table 4 The different models of feature wavelengths extracted by GA
由表4可以看出,采用GA法提取特征波长时,改变赋值量变化,可获得不同的特征波长。用PLSR方法建模时,当赋值10时,建立的PLSR模型效果较好,其RC为0.8118,校正集均方根误差是2.9677,RP为0.8203,预测集均方根误差是3.2762;用PCR方法建模时,当赋值15时,建立的PCR模型效果较好,其RC为0.8018,校正集均方根误差是3.0370,RP为0.8162,预测集均方根误差是3.2566。不同建模方法所建最优模型之间相比较,GA-PCR模型的相关系数(Rc/RP)小于GA-PLSR模型,均方根误差大于GA-PLSR模型,说明GA-PLSR模型的建模效果较好,且模型稳定。综上所述,利用GA法提取特征波长时,当赋值为10,提取28个特征波长,采用PLSR法建模的模型效果最佳。
经上述处理分析,获得全波段光谱所建的模型、加权系数法提取特征波长所建立的最优模型、遗传算法提取特征波长所建的最优模型,将三个模型综合对比,分析建模效果,如表5。
表5 全波段与特征波段下的PLSR模型效果Table 5 The PLSR model effect in full band and characteristic band
由表5可知,三个模型相比较,经PLSR加权β系数法提取特征波长所建模型的相关系数(RC/RP)在三个模型中最小,均方根误差(RMSEC/RMSEP)在三个模型中最大,模型效果最差。全波段PLSR模型与GA法提取特征波长建立的模型相比较,FS-PLSR模型的Rc高于GA-PLSR模型,RMSEC低于GA-PLSR模型,而GA-PLSR模型的Rp高于FS-PLSR模型,RMSEP高于FS-PLSR模型,建模效果不相上下。但与全波段光谱模型需计算224个波段相比,GA-PLSR模型只需要运算提取出的28个波段即可,运行速度快,节省时间,可在保证检测准确度的基础上,大幅度提高效率。综上所述,采用GA法提取特征波长后建立的鸡蛋哈氏单位PLSR模型效果最好,其建模结果如图4所示。
图4 鸡蛋哈氏单位GA-PLSR模型Fig.4 The GA-PLSR model about egg’s haugh unit
本实验采集180枚鸡蛋样品900~1700 nm波段的高光谱信息,结合化学统计学算法,建立鸡蛋哈氏单位无损检测模型。为避免模型只针对某单一鸡蛋品种预测效果较好而不具有普遍性,实验选用三个品种的鸡蛋作为样品,采集光谱数据并进行如下处理。
3.1 获取样品全波段原始光谱信息,选择993~1657 nm内224个波段的光谱数据,进行原始光谱与S-G卷积平滑、MSC、SNV预处理光谱的PLSR模型比较。结果表明,三种方法预处理后并没有得到较好的预测模型和校正模型,处理效果不佳。因此,利用原始光谱进行后续数据处理分析。
3.2 利用PLSR加权系数法、GA遗传算法分别提取特征波长,建立PLSR、PCR模型,通过变换参数,反复尝试,比较模型效果,进而优选最佳特征波长提取方法及建模方法。结果表明,经GA法提取28个特征波长后建立的PLSR模型效果最好,其RC为0.8118,校正集均方根误差是2.9677,RP为0.8203,预测集均方根误差是3.2762,有效降低了模型复杂度,提高了准确性。
实验获得鸡蛋哈氏单位最优模型GA-PLSR,克服了传统检测方法时间长、过程繁琐的缺点,实现鸡蛋哈氏单位高效、快速、无损检测,方便快捷且不损坏样品,为鸡蛋的新鲜度快速判别、分级分选提供理论依据和新方法,具有十分重要的现实意义。
[1]杨月欣,王光亚,潘兴昌,等.中国食物成分表[M].北京:北京大学医学出版社,2002:185-201.
[2]关蕴良,杜剑云.试论鸡蛋的营养价值[J].中国保健营养(下旬刊),2012,22(12):5509-5509.
[3]李晓利.哈氏单位是检验鸡蛋品质的重要指标[J].检验检疫学刊,2013,23(2):48-49,72.
[4]刘晓明.蛋品储藏过程中新鲜度变化研究[D].济南:齐鲁工业大学,2014:2-13.
[5]李蕾蕾,王海霞,黄洁燕,等.近红外光谱法快速测定枇杷叶中熊果酸的含量[J].中国实验方剂学杂志,2013,19(23):103-106.
[6]罗阳,何建国,贺晓光,等.农产品无损检测中高光谱成像技术的应用研究[J].农机化研究,2013(6):1-7.
[7]王巧华,周平,熊利荣,等.鸡蛋光反射特性及其与新鲜度的关系[J].华中农业大学学报,2008,27(1):140-143.
[8]刘燕德,乔振先.鸡蛋光特性及其新鲜度的相关性研究[J].江西农业大学学报,2002,24(1):45-47.
[9]吴建虎,黄钧.可见/近红外光谱技术无损检测新鲜鸡蛋蛋白质含量的研究[J].现代食品科技,2015,31(5):285-290.
[10]杜丹萌,王风诺,王世平,等.鸡蛋新鲜度随储藏条件变化规律的研究[J].食品开发,2014,39(5):26-29,33.
[11]张保华,李江波,樊书祥,等.高光谱成像技术在果蔬品质与安全无损检测中的原理及应用[J].光谱学与光谱分析,2014,34(10):2743-2751.
[12]高海龙,李小昱,徐森淼,等.透射和反射高光谱成像的马铃薯损伤检测比较研究[J].光谱学与光谱分析,2013,33(12):3366-3371.
[13]Giovenzana V,Beghi R,Civelli R,et al.Optical techniques for rapid quality monitoring along minimally processed fruit and vegetable chain[J].Trends Food Sci Technol,2015,46(2):331-338.
[14]Alexandrino G L,Khorasani M R,Amigo J M,et al. Monitoring of multiple solid-state transformations at tablet surfaces using multi-series near-infrared hyperspectral imaging and multivariate curve resolution[J].Eur J Pharm Biopharm,2015,93:224-230.
[15]丁佳兴,吴龙国,何建国,等.高光谱成像技术对灵武长枣果皮强度的无损检测[J].食品工业科技,2016,37(24):58-62,68.
[16]吴龙国,何建国,刘贵珊,等.基于近红外高光谱成像技术的长枣含水量无损检测[J].光电子激光,2014,25(1):135-140.
[17]王松磊,吴龙国,康宁波,等.基于高光谱图谱融合技术的宁夏滩羊肉嫩度检测方法研究[J].光电子·激光,2016,27(9):987-995.
[18]李丹,何建国,刘贵珊,等.基于高光谱成像技术的小黄瓜水分无损检测[J].红外与激光工程,2014,43(7):2393-2397.
[19]强锋,王芹志,何建国,等.基于VIS/NIR高光谱技术的灵武长枣SSC含量的无损检测研究[J].现代食品科技,2017,33(4):283-288.