李 雄,刘燕德,孙旭东,欧阳爱国,姜小刚,王观田,欧阳玉平
华东交通大学机电与车辆工程学院,江西 南昌 330013
中国是西瓜生产和消费最大的国家,而西瓜内部含有人体所需的各种营养成分,具有良好的保健功效及很高经济价值,随着人们现代生活水平的提高,人们对西瓜的内在品质提出了更高的要求。现有西瓜品质选择主要依靠经验判断,如瓜的外观纹路、颜色等,缺乏有效的西瓜无损分选方法。近红外光谱检测技术在苹果、梨等水果品质方面已经得到广泛的应用,因此,基于近红外检测技术在线检测西瓜的内部品质探索研究具有可行性[1-3]。
国内外研究人员应用近红外光谱检测技术对水果内部品质进行了大量的动态在线检测研究,Zhang等[4]联合近红外和高光谱技术,采用CARS-SPA模型提取1 000~2 500 nm的有效波长,建立不同产地苹果可溶性固形物分级的通用数学模型,相关系数达0.917。Guo等[5]采用SPA算法有效筛选近红外光谱,建立猕猴桃可溶性固形物无损检测模型,获得较好的测定效果。欧阳爱国等[6]研究不同变量筛选方法对近红外光谱检测不知火杂柑可溶性固形物模型影响,结果表明光谱预处理方法MSC结合偏最小二乘方法缩短了建模时间,改善了模型精度。
以上的研究,都是对皮薄、体积小形状规则的水果,以整个果品混合糖为因变量建立相关检测模型,研究的重点是模型算法的优化。然而化学基础信息与光谱信息的对应才是提高模型的关键。针对水果市场上大量的皮厚、体积大的水果,果肉区域可见-近红外透光性差、光线折射区域难以确定、化学基础信息采集区域不当等问题,导致的品质信息预测效果差,以西瓜为研究对象,探讨西瓜不同区域的可溶性固形物对西瓜品质检测的影响,揭示西瓜光透射规律特征与品质属性的内在联系。
试验所用西瓜购自江西南昌市,共360个大小相近品种为麒麟瓜的实验样品,用蒸馏水将外部擦洗干净,编号后在室内温度25 ℃存放1 d后采集光谱,麒麟瓜的重量、可溶性固形物的理化指标如表1所示,其中270个西瓜样品为建模集,90个样品为预测集。
表1 建模集与预测集西瓜样品可溶性固形物统计结果Table 1 Statistical results of soluble solidsin modeling set and prediction set
西瓜内部的光谱采集是通过在线检测装置来完成的,在线检测装置结构如图1所示,包含了检测系统、控制系统和传输系统,具体零件有触发装置、计步盘、齿轮、链条、光纤、暗室、卤素灯、光谱仪、PLC(programmable logic controller)、样品杯、触发器、分级出口、电动机等。本装置通过各个机械联合运作完成西瓜的光谱采集。图1中的7所示为两个卤钨灯,为西瓜的漫透射方式采集西瓜光谱信息提供光源,透过西瓜内部的光被8所示的光纤接收传输至电脑。西瓜以5个/s的传输速度通过检测系统,卤素灯照亮经过的西瓜,西瓜每经过一次触发Ocean光谱仪配置的SpectraSuit软件采集样品的光谱能量值,并传输至计算机保存。光谱采集前装置预热30 min,卤钨灯光照强度为100 W,在线检测装置积分时间为100 ms(额定积分时间)和150 ms两种设置,西瓜果柄朝上,底部果蒂在正下方,每个西瓜划分成8个面,采集8条光谱,取其中4条光谱的平均值为区域光谱,另外4条光谱的平均值为混合糖度光谱。
图1 西瓜可溶性固形物分选装置Ⅰ: 检测系统; Ⅱ: 控制系统; Ⅲ: 传送系统1: 触发装置; 2: 计步盘; 3: 齿轮; 4: 链条; 5: 光纤; 6: 暗室;7: 卤素灯; 8: 样品; 9: 光谱仪; 10: PLC; 11: 样品杯;12: 触发器; 13: 分级出口; 14: 电动机Fig.1 The selection device of SSC for fruitⅠ: Detection; Ⅱ: Control; Ⅲ: Transfer;1: Trigger; 2: Step counter; 3: Gear; 4: Chain;5: Fiber; 6: Darkroom; 7: Halogen lamp; 8: Sample;9: Spectrometer; 10: PLC; 11: Sample cup;12: Trigger; 13: Graded export; 14: Motor
切下西瓜相应区域的果肉,挤出适量的西瓜汁滴入到折射式数字糖度计(PR-101a)测量可溶性固形物,每次测量后用纯净水标定糖度0%后继续测量下一个点,每个西瓜切下区域相应位置的平均数作为该区域的可溶性固形物值[7]。
获取的西瓜光谱和对应区域的可溶性固形物输入到MATLAB和Unscrambler软件,处理后建立相应的预测模型,选取最佳的模型输入到在线检测装置可实现西瓜的糖度在线分级。模型的优劣由相关系数和均方根误差来评价。由于不同区域的可溶性固形物差异较大,所以利用不同区域的可溶性值建立预测模型,寻找较高的相关系数和较小的均方根误差模型[8]。
1.5.1 西瓜平均光谱特性分析
图2所示是西瓜在分选装置两种参数下采集的光谱,分选装置旧参数为积分时间100 ms,电流8.0 A,新参数的积分时间为150 ms,电流8.15 A,电流是指卤钨灯的电流强度,实验装置的卤钨灯最大承受电流8.3 A,长期的实验表明当卤钨灯通常在8.0 A的电流下得到稳定,如果电流过高容易烧毁灯泡和损伤果品,电流过低采集的光谱强度不够; 大胆尝试了8.15 A的卤钨灯电流作为新参数进行试验。积分时间是表示光谱在水果内部的照射时间,长期的实验表明,采集果品的积分时间设置为100 ms(旧参数)能够满足光谱采集的信息,本实验以50 ms为一个梯度,增加一个梯度的积分时间(新参数)进行新旧参数的对比。图中可以看出新参数在波长相同的范围内,吸光度的强度更高。在卤钨灯的额定电流环境下,新参数增加了0.15 A的电流,从而增加卤钨灯的光照强度,光纤获取的吸光度则更强,此外,新参数增加了光谱在水果内部品质的光照时间,获取更全面的水果内部信息。
西瓜内部含有各种复杂的化合物,这些化合物基本是由C—H,N—H和O—H等官能团组成。图中显示,在460~620 nm波段范围内出现了不同层次的波峰和波谷,在波长为496 nm的吸收峰可能是因为电子跃迁导致,577 nm吸收峰可能是因为N—H官能团伸缩振动和变形振动一级倍频导致[9]。
1.5.2 近红外光谱预处理
为了提高PLS预测模型的精准度,减少非实验因素导致的误差,需要消除噪声、识别奇异性样本、增强光谱信号。对吸光度光谱值进行卷积平滑(S-G),卷积平滑通过最小二乘拟合的多项式移动窗口数据加权平均来降解光谱噪声,从而提高信噪比,保留西瓜吸光度光谱有用的信息,如式(1)所示
(1)
与其他皮薄、体积小的水果不同,西瓜内部结构复杂、体积大、可溶性固形物内部不均匀,不同区域的可溶性固形物有较大的差异。图3所示是西瓜光谱采集和糖度采集区域划分。西瓜分为8份,为了探究可见-近红外光在西瓜内部透射路径,寻找与光谱相关性最高的区域糖度,西瓜底部做圆形标记,光纤头放置在此区域接收光谱,其中A,B,C和D区域切开后分别测量并求出心糖、中糖、外围糖、底边糖平均值,而1,2,3和4等区域切开后将整块西瓜挤汁,求综合糖度值。近红外光透过果肉传输给西瓜底部光纤,采集西瓜光谱信息。
图3 西瓜光谱采集和糖度采集区域划分
图4所示为西瓜由果中心向外延伸可溶性固形物的划分,第1个2 cm区域的糖称之为心糖,第2个2 cm区域的糖为中糖、第3个2 cm区域的糖为外围糖,最后约2 cm区域的糖为底边糖,距离西瓜中心最远的区域为白色瓜皮,本实验不研究瓜皮可溶性固形物。如图5所示为心糖、中糖、外围糖和底边糖的变化趋势,其中心糖、中糖、外围糖、底边糖区域的可溶性固形物的平均值分别为11.27,11.05,10.66和6.07 brix,整块西瓜一起榨汁计算出的混合糖(SSC)平均值为9.9 brix。西瓜不同区域可溶性固形物(SSC)有明显的差异,距离果中心最近的心糖值最高、其次是中糖、外围糖、底边糖,越靠近瓜皮区域的糖度值越低。由此推测,西瓜糖度值选择不当,对模型精度的影响将较大。
图4 可溶性固形物位置划分Fig.4 Location of soluble solids
图5 西瓜可溶性固形物含量随深度变化趋势Fig.5 The content of soluble solids inwatermelon varies with depth
分别将西瓜按照图5的方式切开后,测量西瓜内部的心糖、中糖、外围糖和底边糖(SSC)等化学值矩阵,数据导入到Matlab数据处理软件中,分为建模集270个,预测集90个样品建立偏最小二乘(PLS)数学模型,建模前通过程序实现光谱的预处理。如表2所示是以不同区域可溶性固形物为为因变量,接收的光谱值为自变量建立的PLS模型结果。
表2 不同区域可溶性固形物建模结果对比Table 2 Comparison of modeling results of soluble solids in different regions
通过对比不同区域可溶性固形物(SSC)的建模结果发现,在额定功率的前提下,适当提高分选装置的积分时间和卤钨灯电流,整体上会提高可溶性固形物的无损检测模型的预测精度。可能是因为增加了光强,提高了水果内部的通透性,也增加了光在水果内部的停留时间,水果内部获取了较多的信息。而对比心糖、中糖、外围糖和底边糖(SSC)等区域的化学值建模结果,发现如果以常规的方式切下的西瓜挤汁得到的混合可溶性固形物作为模型输入自变量得到的效果并不是最佳,由于西瓜果肉多,取局部区域的可溶性固形物作为模型的因变量可适当的提高模型精度。在西瓜可溶性固形物区域选择方面,区域的选择不同导致的建模相关系数会有较大的差异。选取底边糖(SSC),最靠近西瓜皮的2 cm果肉的可溶性固形物作为模型的因变量,建模效果最好。其次是最靠近果肉区域的可溶性固形物也就是心糖(SSC)作为模型的因变量模型效果较好,而外围糖和中糖的效果最差。
如图6所示是分选装置新参数采集光谱后,以西瓜底边糖(SSC)为因变量建立的可溶性固形物偏最小二乘(PLS)预测模型散点图,360个西瓜样品划分好90个预测集和270个建模集。预测集相关系数为0.89,预测集均方根误差为0.24,建模集相关系数为0.96,建模集均方根误差0.18。图7为西瓜PLS可溶性固形物定量模型的主成分因子数图,建模时选择较低的主成分因子(PC)会覆盖西瓜果肉光谱中的有效信息,降低定量模型精度,例如选择PC为5或者6时出现“欠拟合”,而PC为9或者10会出现“过拟合”,最佳的PC为8,预测精度达到最优,所以本研究西瓜可溶性固形物定量模型的最佳主成分数为8。
图6 PLS模型建模散点图Fig.6 PLS model modeling scatter plot
图7 主成分因子数和均方根误差Fig.7 Number of principal component factorsand root mean square error
图8是定量模型的回归系数图,全谱中各个变量均在西瓜可溶性固形物预测中发挥了作用,而系数较大的波长点对西瓜可溶性固形物变量起的贡献率最大,例如,在525,535,552,564和578 nm处的波长点对因变量的预测的作用最大,将采集到西瓜能量谱输入到模型中,经过计算可以得到西瓜的可溶性固形物。
图8 西瓜可溶性固形物预测模型回归系数图Fig.8 Regression coefficient diagram of watermelonsoluble solids prediction model
通过比较发现,在西瓜底部采集光谱,针对果肉内部不同区域化学信息指标检测西瓜果品可溶性固形物的效果有较大的差异。底边区域为可溶性固形物的最佳采集区域,中糖、外围糖区域效果最差,因此西瓜可溶性固形物预测建模有着一定的规律性: 由于利用漫透射方式采集西瓜光谱,西瓜有2 cm左右的瓜皮,阻挡了部分光透射到水果内部,将可见-近红外光停留在底边层的信息最多,底边糖的建模效果最佳。其次由于光学折射原理,入射光经过西瓜果皮后会发生一定角度的折射,直线传播经过的中糖、外围糖区域表征的西瓜果实内部信息较少。如图9所示,是可见-近红外光谱在西瓜内部输运的示意图,可见-近红外透过细胞紧密的瓜皮后,在果肉的机械组织区域发生折射,由于西瓜光强的限制以及西瓜体积大、内部结构复杂的特点,光经过靠近果皮底边糖表征了最多的果肉信息。
图9 光在西瓜内部输运示意图Fig.9 Schematic diagram of light transmittinginside watermelon
果品不同区域果肉的可溶性含量有明显差异,心糖区域的可溶性固形物含量最高,靠近果皮的底边糖区域可溶性固形物最低。而可溶性固形物等化学基础信息与光谱信息较好的对应可提高预测模型精度。通过偏最小二乘算法,将西瓜内部组织分层处理,研究漫透射方式下西瓜心糖、中糖、外围糖、底边糖区域的可溶性固形物对模型精度的影响,其中底边糖区域可溶性固形物建立模型最佳,预测集相关系数达到0.89,均方根误差为0.24,高于其他区域模型精度。说明西瓜底边层包含了可见-近红外光谱的最大量信息,为最佳的可溶性固形物采集区域,探讨了水果光散射规律特征及其与品质属性的内在联系,为光谱数据库和分析模型的在线更新提供参数。