朱 洁 黄 华 祝诗平 吴维吉 谢智勇 李 旭 刘广昊
(西南大学工程技术学院1,重庆 400716)(中国天津粮油批发交易市场2,天津 300171)
小麦在储藏和加工中,当单粒小麦籽水分偏离正常值时会引起一系列问题[1],如霉变、虫蚀和生芽等,若不及时处理会损失大量小麦。同时小麦种子水分过高极易发生冻害将导致发芽率降低。小麦籽水分检测的方法主要分为两大类:一是直接法[2],如105 ℃恒重法、真空干燥法、定温定时烘干法和化学法等,这类方法具有检测精度和准确度高的优点,但其操作过程繁琐且费时,并对检测样本有一定的破坏性;二是间接法[3],如近红外光谱法、红外法、电阻法、电导法、电容法、微波法、中子法、射频阻抗法、核磁共振法、声学法和摩擦阻力法等,这类方法具有检测速度快的特点。由于近红外光谱区具有丰富的基团信息,因此利用近红外光谱预测农产品的水分得到了广泛的应用[4]。金华丽等[5]利用近红外光谱对小麦粉水分进行了定量分析,其预测水分的相关系数为0.98,表明利用近红外光谱法预测小麦粉的水分具有较高的精度。Li等[6]将近红外光谱技术和深度信念网络结合,对小麦的相关成分进行了预测,其中水分的相关系数为0.99,预测的标准误差为0.69%。Shi等[7]在研究光谱预处理和波长选择对近红外和中红外光谱构建的偏最小二乘回归模型的影响,其研究对象为小麦的粗蛋白及水分含量。Mutlu等[8]利用近红外光谱结合人工神经网络对小麦的多个品质参数进行预测,其中水分预测的相关系数为0.92。
从文献上看,利用近红外光谱预测小麦及小麦粉的含水量具有精度高,检测速度快等优点。但这只是对一批小麦籽样品进行预测,获得的是该批样品的平均含水量,没有对单粒小麦籽含水量进行预测。高光谱成像技术[9-12]除了获得物质的近红外光谱信息外,还可以获得物质的图像信息,这为实现单粒小麦籽含水量的检测提供了可能。吴静珠等[13]和Caporaso等[14]都利用高光谱成像技术和偏最小二乘法对小麦籽粗蛋白含量进行预测。Qiu等[15]利用高光谱成像技术结合卷积神经网络对单粒水稻种子品种进行了识别,随着样品数量的增加,其准确率达到了94%。Mahesh等[16]把高光谱成像技术用于快速鉴别小麦水分等级。Zheng等[17]利用高光谱技术对小麦籽粒含水量进行预测,其相关系数为0.97,但其只研究一种预测模型,且采用了人工加湿的方法使样本含水量在5%~45%之间。
本研究使用高光谱技术实现对单粒小麦籽含水量的预测,并用小麦的图像位置信息绘制出小麦籽水分分布图。分布图可以定位单粒小麦水分异常值,为实现从一批样品中自动识别与剔除水分异常的单粒小麦籽提供参考。
本实验样品小麦由中国天津粮油批发交易市场提供,其收获年份为2013年至2017年;其产地分别来自国内的河北省和山东省,国外的澳大利亚、加拿大和美国;其种类包括硬质白小麦、软质白小麦、硬质红小麦和软质红小麦等,共计50份小麦样品。从每一份样品中随机挑选出50粒小麦籽,共2 500粒小麦籽样品用于实验。
选用VNIR-HIS-B1621型可见/近红外成像系统作为单粒小麦籽的高光谱图像采集系统。该系统主要由CCD相机、363~1 025 nm光谱成像仪、IT 3900 150 W卤素光源、移动平台和暗箱等组成。装载小麦籽的样品池为12.6 cm×8.5 cm的塑料托盘,在塑料托盘顶部预先贴上宽度为17 mm的白色电气绝缘胶带作为参考白板,每次进行样品扫描时除了能获得样品的光谱信息外,同时也能获得自定义参考白板的信息。高光谱相机使用35 nm的镜头,镜头与样品池的距离为33 cm,在高光谱采集软件中设置相机曝光时间为21 ms,移动台的速率为0.792 mm/s,图像分辨率为1 632×1 232。
整个高光谱图像采集过程将小麦分成A面与B面分别进行光谱数据采集。首先将小麦样品折痕向上(记为A面)放入样品池中。样品池内小麦按照10行5列排列,一次光谱扫描可以获得50粒小麦籽高光谱数据。经过50次装样与高光谱扫描后可获得2 500粒样品小麦高光谱数据采集。然后将小麦样品折痕向下(记为B面)放入样品池中,重复该过程,总共获得5 000条小麦籽的高光谱曲线。
按照GB 5009.3—2016《食品安全国家标准 食品中水分的测定》[18]中的直接干燥法测量单粒小麦籽样品的含水量。首先,把干净无盖的小塑料瓶标号,并置于105 ℃的鼓风干燥机中干燥1.0 h;其次,用精度为0.001 g的AL分析天平测量并记录小麦干燥前粒质量,将小麦放入对应标号的小塑料瓶,并置于105 ℃的鼓风干燥机中干燥3.0 h,待冷却0.5 h后记录小麦粒质量。重复上述步骤两次后测得的两次干燥的粒质量差不超过2 mg,即为恒重。小麦样品水分按式(1)进行计算:
(1)
式中:m1为烘干前小麦粒质量/g,m2为第3次烘干后小麦粒质量/g。
由于一次高光谱扫描会获得50粒小麦籽的数据,为了分析单粒小麦籽的含水量需要从这50粒小麦中将单粒小麦籽光谱数据提取出来。高光谱采集系统获得的光谱数据是一个大小为1 024×1 623×1 123的3维矩阵,其中1 024表示相机水平方向的像素数,1 623表示将波长363~1 025 nm分成1 632个点,1 123表示总共扫描的行数。提取单粒小麦籽的光谱数据流程为:首先从获得的3维数据矩阵中选择波长为580 nm的光谱图像;然后将其转换成二值图像,通过二值图像获得单粒小麦的边缘信息,再根据小麦边缘空间位置信息在原始光谱矩阵中提取光谱数据,最后计算其平均值获得单粒小麦籽的平均光谱数据。分别提取A面与B面小麦的光谱数据共5 000条谱线。
高光谱在每个波段下光源强度分布不均匀,通常需要对原始光谱数据进行白板与黑板校正。本实验采用自定义的参考白板对原始光谱数据进行白板校正。根据公式(2)对光谱数据进行黑白板校正[19]:
(2)
式中:IO为白板校正后的光谱数据;I为原始光谱;IW为白板的平均光谱数据;ID为黑板的平均光谱数据。
实验中使用HSI Analyzer软件采集光谱,使用MATLAB R2017b软件进行光谱数据分析与建模。
1.5.1 光谱数据预处理
常见的光谱预处理方法有去中心化(Mean)、标准正态变换(SNV)、多元散射校正(MSC)、应用Savitzky-Golay平滑的一阶导数(SAVG1)和二阶导数(SAVG2)等,以及两两组合的复合预处理方法。经过不同的预处理方法后,新的光谱数据将具有不同的统计特性。如原始光谱经过去中心化处理后,新的光谱数据均值为0;经过SNV预测处理后,新的光谱均值为0,方差为1。MSC预处理有利于消除光谱散射影响。SAVG1或SAVG2预处理,相当于利用差值光谱进行建模。分别比较未做预处理(None)与Mean、SNV、MSC、MSC+Mean、SAVG1+Mean、SAVG1+SNV和SAVG2+SNV预处理方法对小麦籽含水量的预测结果。根据校正集均方根误差(RMSEC)、预测集均方根误差(RMSEP)、校正集相关系数(RC)、预测集相关系数(RP)来评价模型的预测性能。在不同主成分(PC)下,RMSEP值越小,RP值越大,说明该模型具有更好的预测性能。
1.5.2 偏最小二乘法回归法建模
在光谱的定量分析算法中有多元线性回归、主成分回归和偏最小二乘回归(PLSR)等。PLSR在光谱建模分析中得到较广泛的应用。利用4种光谱模型预测单粒小麦的含水量,分别记为MA、MB、MC和MD。其中模型MA、MB分别由单粒小麦籽的A面和B面各2 500条谱线构成。模型MC由同一粒小麦的A面与B面光谱数据的平均值构成,模型MD将A面与B面的光谱数据共同构成一个5 000条谱线的光谱矩阵。利用PLSR方法分析比较这4种模型对单粒小麦籽含水量预测性能的影响。
测得小麦样品的参考含水量在1.83%~16.72%范围中,按照含水量从低到高进行排序。利用等间隔取样法,按照3 ∶2的比例将小麦分成校正集和预测集,即每5个样品中取出2个为预测集。本实验中校正集共1 500粒小麦籽,预测集共1 000粒小麦籽。
图1 校正后的单粒小麦籽平均光谱曲线
对单粒小麦籽原始的光谱数据做黑白板校正后的平均光谱曲线如图1所示,在363~410 nm左右吸光度随波长的增加而减小,而在410~950 nm波长范围内吸光度增加的速率由快变缓,最后吸光度在950~1 025 nm波长范围内逐渐减小。
将MA、MB、MC和MD 4种光谱模型用不同的预处理方法分别进行PLSR建模预测单粒小麦籽的含水量,其结果如表1至表4所示。
对比表1与表2中的数据可知,利用MA模型进行PLSR建模的预测效果整体上优于MB模型。这主要是PLSR建模使用的是单粒小麦籽的平均光谱,A面小麦籽的平整度比B面好,小麦籽越平整,其与光谱仪镜头之间的距离越一致,故获得的反射光谱系数就越平稳。
对比表1~表4可知, 4种预测模型采用SAVG1+SNV预处理时具有最佳的预测性能。这主要是SAVG1预处理利用光谱的1阶差值谱建模,有利于消除光谱中基线的平移,可以消除其他背景的干扰。以RMSEP最小为依据,4个模型的预测性能由高到低的次序是模型MD、模型MC、模型MA、模型MB,即模型MD具有最佳预测效果。模型MD将A面与B面小麦的光谱数据混合在一起具有较好的鲁棒性。
表1 MA模型单粒小麦籽含水量的预测结果
表2 MB模型单粒小麦籽含水量的预测结果
表3 MC模型单粒小麦籽含水量的预测结果
表4 MD模型单粒小麦籽含水量的预测结果
对于模型MD,采用SAVG1+SNV预处理时,其RMSEP =1.36%,RP=0.90。画出模型MD在SAVG1+SNV预处理下预测小麦籽含水量的散点图如图2所示。
图2 模型MD小麦籽含水量的预测结果
高光谱成像技术相对于近红外光谱的优势在于高光谱不仅可以获得物质的光谱信息,还能把光谱信息与物质的空间位置联系起来,利用空间位置信息结合近红外光谱的预测模型就可以获得单粒小麦水分分布图。为了检验模型MD的性能,本实验重新从50份小麦样品中每份随机挑选出1粒小麦籽样品,共50粒小麦籽用于外部测试。将这50粒小麦籽分成A面与B面进行光谱扫描,然后将A面与B面的光谱数据利用模型MD进行单粒小麦籽含水量的预测。单粒小麦与整盘小麦的水分分布图如图3所示。
图3 A面与B面小麦籽水分分布图
在图3a中,A面与B面小麦的伪彩色图由波长分别为680、550、450nm 3个波长点合成RGB三基色图像。图3b是整盘单粒小麦籽的水分分布,色彩越偏红其含水量越高。从图3b中可以直观地观察每一粒小麦的含水量,能定位到具体的含水量异常的小麦。图3c将整盘小麦的前两列,共20粒提取出来,并标出参考含水量(红色字体)与预测含水量(黑色字体)。
统计这50粒小麦籽含水量的预测结果为:A面小麦籽含水量预测的绝对误差最小值为0.37%,最大值为3.60%,平均值为1.13%;B面小麦籽含水量预测的绝对误差最小值为0.15%,最大值为3.50%,平均值为1.22%。
图3中整盘小麦的平均含水量为7.18%,不难看出,不同小麦籽水分预测值存在差异,但同时又在平均含水量上下波动,说明采用高光谱成像技术预测单粒小麦水分的方法是可行的。本研究收集的小麦样品有5种年份、4个种类和5个产地,其样品分布具有代表性,这使得建立的预测模型具有很好的适应性。
高光谱成像技术既可以预测一批小麦样品整体含水量,又可以预测单粒小麦的平均含水量,甚至可以利用单粒小麦的光谱信息将单粒小麦水分分布可视化。将2 500粒小麦籽分为A面和B面进行光谱扫描,利用A面和B面的光谱信息构成MA、MB、MC和MD 4种模型用于建模预测小麦籽的含水量。由预测结果可知:利用模型MA进行PLSR建模的预测效果整体上优于B面。A面与B面实验结果表明:小麦样品的不同放置方式对PLSR建模有影响,这主要是由于不同的放置形式,小麦光谱的反射面的平整度不一致所引起的。在这4种预测模型中,模型MD预测单粒小麦籽的含水量优于其他3种模型。利用高光谱成像技术结合偏最小二乘回归法预测单粒小麦含水量是可行的,并能够定位一批样品中单粒小麦的含水量不正常的粒籽。