基于色差的冬枣甜度无损预测研究

2021-02-04 14:05朱莉莉傅茂润王新策刘晶晶程建峰
中国果菜 2021年1期
关键词:甜度色差冬枣

朱莉莉 ,傅茂润,王新策,刘 欣,刘晶晶,孙 斐,*,程建峰*,崔 波

(1.齐鲁工业大学食品科学与工程学院,山东济南 250353;2.江西农业大学农学院,江西南昌 330045;3.生物基材料与绿色造纸国家重点实验室,山东济南 250353)

冬枣(Ziziphus jujubecv.Dongzao)是北方落叶果树中的高档鲜食水果,皮脆肉嫩,甘甜可口。随着枣产业的发展,一种合理、快速、精确地将冬枣进行分级的模型可以满足许多企业的要求,市场需求迫切[1]。冬枣的鲜果质量等级多以果实色泽、着色面积和大小为衡量标准[2]。色泽是评价果蔬质量的一个重要因素,在一定程度上反映了果蔬的成熟度和品质变化[3]。冬枣在成熟过程中,颜色由最初的绿色变为红色。有研究提出,枣皮的颜色变化是由类黄酮、类胡萝卜素和花色苷水平的变化引起的[4],也与酚类物质氧化有关[5-6]。也有研究者提出,枣皮的转红与malvidin 3-O-糖苷和delphinidin 3-O-糖苷的大量积累有很大关系[7]。时维康等[8]通过采集冬枣颜色特征,完成了生熟冬枣的快速检测与分离,正确率高达90.23%。因此,色泽可作为冬枣品质无损检测的指标。可溶性固形物(soluble solids content,SSC)是一种综合参数,主要包括糖、酸、维生素、矿物质等成分,是确定果实成熟度和收获后等级的重要质量属性[9]。研究发现,多种水果的SSC与品质有关。如草莓在发育过程中颜色的变化与SSC和总酸(total acid,TA)的比值存在相关性[10]。颜色特征也是葡萄的SSC值快速无损检测的重要指标[11-12]。王世芳等[13]通过采集西瓜5个点的近红外光谱,预测了其SSC;Tian等[14]利用高光谱成像技术建立了基于苹果皮颜色预测SSC的模型。也有研究显示,颜色可作为芒果[15]、梨[16]、草莓[17]等的SSC预测指标。因此,果实的色泽和SSC之间可以建立相关模型。MATLAB作为三大数学软件之一,在科研及实际工程中具有非常重要的作用,尤其在大数据处理方面具有难以比拟的优越性[18]。MATLAB可解决高光谱预处理中出现的问题[19],也可对采集的图像进行处理及表征[20]。回归分析是把工程和科学实验数据拟合为线性函数,利用MATLAB软件可以很好地建立回归模型,并对模型进行精细分析[21]。

本研究以市场购买的新鲜冬枣为样本,利用精密色差仪和水果成熟度无损伤检测仪测定了色差数据及DA值(the delta absorbance)。DA值是基于两种波长下的吸光度差异并通过公式转化而成的一个固定数值,试验通过测量水果中的叶绿素含量来判定水果的成熟度或货架期,利用所得数据,使用MATLAB软件建立冬枣色泽与甜度模型,找到一种利用色泽检测甜度的快速检测方法。本研究旨在建立一种无损、快速检测甜度的机器学习模型,根据甜度将冬枣进行分级,推动冬枣分拣智能化技术的发展。

1 材料与方法

1.1 材料与仪器

沾化冬枣(Zizyphus jujubaMill var.inermis Dongzao),采购于济南市长清区果蔬批发市场。

3nh精密色差仪,深圳市三恩驰科技有限公司;DA-Meter便携式水果成熟度无损伤检测仪,北京阳光亿事达公司;PAL-1水果糖度计,ATAGO(爱拓)。

1.2 试验方法

冬枣运至实验室后,将表面受损、有缺陷、个头过大或过小的果挑出。然后根据果实表面的红色面积,将冬枣分成4筐,每筐分别挑选4组,共16组。分级标准见下页表1,根据冬枣果皮红色和绿色的分布面积,第1~4组的红色面积占比为0~25%,第5~8组的占比为26%~50%,第9~12组的占比为51%~75%,第13~16组的占比为76%~100%。每组随机选取24个果进行拍照并测定相关指标。

表1 冬枣分级标准Table 1 The grading standard of jujube

1.3 测定指标与方法

1.3.1 果实色泽

采用3 nh精密色差仪进行测定,先对仪器进行校正,在冬枣赤道位置平均取4个点,每个点重复测量3次,然后记录果实颜色测定指标L、a、b、c、h。最后以4个点所得值的平均值作为模型预测的数据。L代表明暗度,a代表红绿色,b代表黄蓝色,c代表彩度,h代表色调角。

1.3.2 叶绿素含量

使用DA-Meter便携式水果成熟度无损伤检测仪测定叶绿素含量。对仪器进行校正后,在冬枣赤道位置平均取4个点测定该值,最后计算4个点的平均值作为模型预测的数据,即为它的叶绿素含量值(the delta absorbance,DA值)。

1.3.3 SSC

每组冬枣选取24个,挤汁后用PAL-1水果糖度计测定SSC,取平均值。

1.4 数据处理

用Excel 2019、SPSS 21.0进行数据整理,运用MATLAB 2018软件进行相关性分析,并对模型进行拟合,建立回归模型。

2 结果与分析

2.1 冬枣色泽分析

试验共选取了16组冬枣(图1所示A~Q组),每组冬枣数量为24个,测得数据共有384个,其中320个数据用于模型建立,64个数据用于模型预测,用于预测的数据平均选取于每个组。每组随机选取24个枣用于试验,因进行模型建立时,色泽数据分布广泛,提升模型的适用范围。颜色的发育与成熟度息息相关,从图1可以看出,冬枣的色泽差异从全绿至全红,且在表面的着色面积不均匀,成熟度从A组至Q组也是逐渐加深。冬枣在发育过程中,叶绿素、β-胡萝卜素和花色苷的含量下降,而酚类物质含量增加[4],从而使枣皮的颜色发生变化。用色差仪测得的b值均为正值,表示色泽偏黄;而测得的a值有正有负,a值为负代表偏绿,为正代表偏红。所测得数据中,第一组的a值均为负值,最后一组均为正值,且a值逐渐增大,与枣皮红色面积逐渐增加相吻合。

图1 冬枣色泽差异图Fig.1 The color difference map of jujube

2.2 相关性分析

相关性分析的目的是为了检测所测变量之间的密切程度。运用MATLAB软件,做了L、a、b、c、h、DA值、SSC之间的相关性分析,如图1所示。从右侧图标可知,黄色越深,两指标间的正相关性越大;蓝色越深,两指标间的负相关性越大。由图可以看出,所要预测的变量SSC与其余变量之间都存在一定的相关性,既有正相关也有负相关。DA值是利用近红外光在果实表面测得的吸光值并通过一定的公式转化得到,John等[22]在开发苹果的最佳收获成熟度模型时使用了DA值,Zhang等[23]预测了DA值与桃色差、硬度、SSC等之间的关系,发现桃的硬度与DA值存在最大相关性。

本试验在建立冬枣甜度预测模型时发现DA值与SSC的相关性极小,不能用于模型建立。在本试验选择不同转色程度的枣,可以作为枣的一个成熟过程,所得的数据中,DA值的范围为0.3~0.9,有一定的跨度。色差数据L、a、b、c、h与SSC都存在较大的相关性,只有a值与SSC是正相关性,且相关性最高,为0.71。a代表红绿色,冬枣在成熟过程中,色泽的明显变化是由绿转红。

图2 各指标间的相关性分析Fig.2 Correlation analysis between various indicators

2.3 模型构建

2.3.1 单变量曲线估计

根据图1的相关性分析,冬枣所测的SSC与色差仪所测的L、a、b、c、h的相关性均大于0.5,故对其进行单变量曲线估计,结果见表2。表2列举了线性、对数、倒数、二次、三次、幂、增长及指数共8种函数,由表知无论哪种函数,R2均较低,最高为0.546,最低为0.001。DA值与SSC之间,R2极低,P值均大于0.05,结合图2的相关性分析可以得出,冬枣的DA值与SSC之间不存在相关性,在构建多元函数时将其排除。冬枣所测的SSC与色差仪所测的L、a、b、c、h之间,虽然P值均极显著,可用来构建函数,但相关系数R2均较低,构建一元函数效果不佳,构建多元函数是更好的选择。

表2 各变量与所测SSC之间的曲线估计Table 2 Curve estimation between each variable and the measured SSC

2.3.2 多元一次线性回归

利用色差仪测得数据建立线性回归模型,SSC~1+L+a+b+c+h,结果得出R2=0.596、P=9.74×10-60,方差分析表如表3。所得函数模型P值小于0.01,呈极显著,但方差分析表中,a、b项的P值均大于0.05,一个好的函数模型要求函数P值以及各项的P值均小于0.05,且计算方差膨胀因子VIF,结果大于5,说明用来建立函数的自变量间存在多重共线性关系。根据所得结果,对所得函数模型进行改进,去除不显著项以及根据学生化残差查找出的异常点,最终得到改进后的函数模型一:SSC=20.153 0+0.370 7×L+0.504 5×c-0.477 2×h,R2=0.76,P=9.88×10-82,其方差分见下页表4,各项自变量的P值均小于0.01,呈极显著。利用所得函数测得的SSC和实际测得SSC作图,如图3(见下页)所示。

表3 模型一改进前方差分析表Table 3 The variance analysis table of model 1 before improving

表4 模型一改进后方差分析表Table 4 The variance analysis table of model 1 after improving

图3 模型一预测SSC与实测SSC之间的散点图Fig.3 Scatterplot between predicted SSC and measured SSC of model 1

2.3.3 多元一次线性逐步回归

利用stepwiselm指令,对各项自变量与SSC之间做多元一次线性逐步回归,函数模型为SSC~1+L+a+c+h,得到结果R2=0.595、P=1.22×10-60,方差分析见表5。

表5 模型二改进前方差分析表Table 5 The variance analysis table of model 2 before improving

从表中可以看出,各项变量得P值均小于0.05,呈显著。基于学生化残差查找异常点,进行模型改进,进而得到函数模型二:SSC=33.5983+0.2835×L-0.4930×a+0.7729×c-0.659 4×h,R2=0.737,P值为1.47×10-75,方差分析见表6,各项变量P值均小于0.01,呈极显著。利用函数所得预测SSC与实测SSC之间所做的散点图。见图4,由图可知,R2=0.737,RMSE=1.255。

表6 模型二改进后方差分析表Table 6 The variance analysis table of model 2 after improving

图4 模型二预测SSC与实测SSC之间的散点图Fig.4 Scatterplot between predicted SSC and measured SSC of model 2

2.3.4 模型预测

利用函数模型一和二进行预测,预测结果见表7、8。从每批枣数据中选取4组,共64组来进行预测,计算相对误差率。两个表展示了10组相同色差数据的预测结果。从两表的对比中可以看出,利用模型一进行预测,误差多呈现负值,而利用模型二进行预测,误差多呈现正值。可见,无论用哪种模型预测,对于较高SSC数据,预测效果均不好,相对误差率较大,在建立模型时,查找出的异常值大部分是较高SSC的数据,因此两个函数模型均有一定的局限性,适用于SSC值范围为17~28。模型一的平均相对误差率为4.904%,模型二的平均相对误差率为4.258%,模型二的预测效果较好,但模型一和二的R2分别为0.76、0.737,相比较而言,模型一的拟合效果较好。

2.4 描述性统计

依据所测数据,统计了全部数据的平均值、中间值、标准误差、分布范围、最小值、最大值、标准偏差和样本方差,结果见表9。由表可知,各项数据的平均值与中间值相差不大,说明数据符合对称分布。SSC值最大为31.5,最小为14.9,分布范围广泛,而函数模型适用范围为17~28,其值太大或太小,均较难预测。

表7 基于模型一预测SSCTable 7 SSC estimation using the model 1

表8 基于模型二预测SSCTable 8 SSC estimation using the model 2

表9 描述性统计(n=384)Table 9 Descriptive statistics(n=384)

3 讨论

本文利用测得的冬枣无损指标——色差数据以及有损指标——SSC,基于MATLAB软件,共建立了两种函数模型,模型一:SSC=20.1530+0.3707×L+0.5045×c-0.4772×h,R2=0.76,P=9.88×10-82;模型二:SSC=33.598 3+0.283 5×L-0.493 0×a+0.772 9×c-0.659 4×h,R2=0.737,P=1.47×10-75。从R2看,模型一的拟合效果较好。利用所建立的模型预测64组数据,模型一、二的相对误差率分别为4.904%、4.258%,模型二的预测效果较好。两种模型间的差异在于a值,a代表红绿色,本文选取的冬枣,色泽变化是从完全青色至完全红色,a值存在更能代表其色泽,且模型二预测的相对误差率小于模型一,综合来看,运用模型二来预测冬枣的甜度,效果更佳。

回归分析是建立数学模型最重要的统计分析方法之一,现在越来越多的研究基于建立相关的预测模型,如Zhang等[24]建立了桃的SSC和质量之间的回归模型。Qiao等[11]建立的SSC预测模型的相关系数为0.695~0.727,从而得出图像颜色特征提取可以应用于葡萄SSC值的快速无损检测。本试验建立的两种模型的相关系数分别为0.76、0.737,因此利用冬枣的色泽预测其SSC是可行的。陈冲等[25]利用近红外光谱技术无损预测了冬枣的糖分。综上,本试验利用色差仪测得的L、a、b、c、h数据对冬枣甜度进行预测是可行的,能为冬枣糖分的无损检测提供新的思路。MATLAB作为三大数学软件之一,在进行模型拟合时具有较大优势。在进行冬枣SSC预测模型拟合时,也做了多元二次、三次回归分析,但拟合效果不如线性回归。可见,在做多元多次回归分析时,MATLAB更加便捷、有效,掌握好这个软件,有利于模型构建中的数据处理与分析。

猜你喜欢
甜度色差冬枣
CIEDE2000色差公式在彩涂板色差检测上的应用研究
基于机器视觉的布匹色差在线检测系统
水果冰一下更甜
冬枣深加工 延伸产业链
一种锯齿状冬枣采摘装置
汽车车身与外饰件色差控制
涂装色差控制工艺分析
甜甜的“喜出望外”
尝尝它们,你才知道什么叫“甜得发齁”
优质冬枣周年管理工作历