不同气候生态型籼稻糙米粗蛋白含量光谱估测模型研究

2021-12-21 05:22田容才高志强卢俊玮
中国粮油学报 2021年11期
关键词:籼稻糙米微分

田容才 周 昆 高志强 卢俊玮

(湖南农业大学农学院1,长沙 410128) (湖南省农业科学院水稻研究所2,长沙 410125)

水稻是我国重要的粮食作物之一,籼稻在长江中下游稻区种植面积占比达97.6%[1],具有重要的地位。随着人们生活水平的不断提高,对稻米品质提出了更高的要求。稻米的主要营养成分是蛋白质,蛋白质含量决定了大米的食味品质和营养品质[2],蛋白质含量是评价大米品质的重要指标之一。传统的稻米蛋白质检测方法虽准确可靠,但存在有损、耗时、专业性强等弊端,因此探寻快速无损高通量的测定方法具有重要意义。

为建立籼稻粗蛋白含量光谱快速无损检测的普适性模型,本研究利用2019年长江中下游籼稻联合区试实验,测定了36个不同气候生态型籼稻品种籽粒反射光谱及糙米粗蛋白含量数据,分析两者的相关关系,建立了基于最优光谱指数、全波长及特征波长的籼稻糙米粗蛋白含量估测模型,并用R2、RMSE对模型精度进行评价,以期找到用于籼稻粗蛋白估测的特征参数和最适模型。

1 材料与方法

1.1 实验材料

早籼稻和晚籼稻实验布设于湖南省水稻研究所实验田(28°12′N,113°5′E,海拔44.9 m),中籼稻实验于湖南省长沙县路口镇明月村基地(28°24′N,113°13′E,海拔45 m)进行。早籼稻供试材料为2019年长江中下游早籼中早熟组,共11个,分别为中早75、中佳早27、中两优286、陵两优230、中早67、中早72、中早73、株两优213、株两优229、金早香1号和中早35,中籼稻供试材料为2019年长江中下游国稻科企联合体中籼迟熟组,共11个,分别为荃优洁田一号、C两优金4号、玮两优534 、丰两优四号、呈两优九华占、中香优美香新占、551两优570、珍两优2056、晶两优美香油占1号、民升优827和隆两优金2号,晚籼稻供试材料为2019年湖南省水稻研究所晚籼中熟组,共14个,分别为五优308、五丰A/19制4、33S/恢1、五丰A/制5、33S/H2437、33S/恢3、五丰A/制2、特S/H2292、F-3A/18P9、33S/恢2、五丰A/19制1、桃1a/wp54、五丰A/制3、泰丰A/18W731。随机区组布置实验,小区面积13.34 m2,行距20 cm、株距20 cm,3次重复。育苗移栽方式种植,早籼稻2019年3月25日播种,7月23日收获,中籼稻5月16日播种,9月17日收获,晚籼稻6月23日播种,10月29日收获。田间管理按照国稻科企联合区试要求进行。

1.2 数据采集

1.2.1 稻谷光谱数据采集

水稻成熟收获时,每小区随机选取长势较一致的3兜水稻植株,剪取其稻穗,按小区编号用尼龙编织袋装好,带回实验室自然阴干,2个月后,人工脱粒,利用室内暗室平台采集稻谷光谱数据。采用FieldSpec 3 便携式地物波谱仪(ASD,美国)测定,仪器波长范围350~2 500 nm,光谱采样间隔1.377 nm@350~1 050 nm、2 nm@1 000~2 500 nm,光谱分辨率3 nm@700 nm、10 nm@1 400 nm。将脱粒后的每个小区制成1个样本,用直径8 cm,高1.5 cm的玻璃器皿盛装。测定时LAMP Pro 50 W的卤素灯为唯一光源,光源与样本垂直高度16 cm,光纤探头距样本7 cm,与水平成60°,探头视场角25°,每样本重复测量10次,在ViewSpec Pro 6.0软件中进行平均值计算,将所得平均光谱作为该小区稻谷反射光谱数据。首次使用需热机15 min,并进行优化与白板定标,每个样品测定前均使用标准白板重新标定。实验共采集了1080条反射光谱曲线。

1.2.2 糙米粗蛋白含量测定

将测完光谱数据的稻谷样品,用新丰JLGJ4.5型检验砻谷机去壳得糙米,FW-100高速万能粉碎机将糙米磨细成粉,糙米粉过60目筛后用感量为0.000 1 g分析天平秤取充分混匀的固体试样2 g,最后将制备的硝化管用FOSS KjeltecTM 8400全自动凯氏定氮仪测定糙米粗蛋白含量。粗蛋白测定结果为湿基。具体方法参照GB 5009.5—2016。

1.3 方法

1.3.1 光谱指数选择

根据水稻光谱特征及其前人的研究成果[21],选取3个常用的光谱指数用于籼稻糙米粗蛋白含量的估算,具体计算公式见表1。

表1 光谱指数的计算公式

1.3.2 特征波长选择

本文对原始光谱反射率进行一阶微分变换后,首先根据籼稻稻谷原始及一阶微分光谱峰谷特征对应的波长作为敏感波长,再通过原始及一阶微分光谱与糙米粗蛋白含量的相关性分析相结合,将与粗蛋白含量达显著或极显著相关的敏感波长筛选为特征波长,用于估测模型的构建。

1.3.3 模型构建及评价

首先利用ViewSpec Pro 6.0软件对测得的1080条原始光谱反射率数据进行平均及一阶微分计算并导出,然后在Excel 2016中进行相关性分析,根据稻谷峰谷特征及β-coefficient达显著或极显著的方式筛选特征波长,任意两波长组合构建的DSI、NDSI、RSI指数采用R语言编程并绘图,最后利用The Unscrambler X 10.4软件建立基于最优光谱指数、全波长及特征波长的PLSR、PCR、SMLR模型,并用Origin Pro 9.1软件进行绘图。采用决定系数(R2)和均方根误差(RMSE)对模型精度进行验证与评价。R2越大,RMSE越小,建模集和验证集越接近,说明模型精度及稳健性越好。RMSE计算公式如下:

2 结果与讨论

2.1 籼稻样本数据统计特征

对凯氏定氮法测得的不同气候生态型籼稻糙米粗蛋白含量化学值进行统计分析,为体现模型的普适性,按照部分品种建模,剩余品种验证的方式划分建模集与验证集。首先对粗蛋白含量化学值进行升序排序,再按照隔二选一的方式划分,所得结果见表2。由表2可知,不同气候生态型籼稻糙米粗蛋白含量表现为早籼稻>晚籼稻>中籼稻,其粗蛋白含量均值分别为 (9.62±0.53)、 (7.88±0.46)、 (6.73±0.62) g/100 g,说明籼稻糙米粗蛋白含量在不同气候生态型方面存在差异,数据具有一定的代表性。按照2:1的方式划分建模集与验证集,包括72个建模样本和36个验证样本,其中建模集粗蛋白含量范围在5.46~10.47 g/100 g,变异系数为15.86%,验证集粗蛋白含量范围在6.03~10.37 g/100 g,变异系数为15.14%,验证样本粗蛋白含量范围包含在建模样本中,且两者变异系数较大,说明建模集与验证集划分合理,验证样本可作为独立数据对模型精度进行外部检验。

表2 籽粒粗蛋白含量统计特征

2.2 籼稻籽粒反射光谱特征

将早、中、晚籼稻籽粒原始及一阶微分光谱反射率进行平均计算,得到不同气候生态型籼稻籽粒原始及一阶微分光谱反射率曲线图。由图1可知,早、中、晚籼稻具有相同的反射特征,即“峰谷”位置相近,但反射强度在气候生态型上存在差异,表现为中籼稻>晚籼稻>早籼稻,与粗蛋白含量相反,即反射率随蛋白质含量的升高而降低。这一规律与人们对籼稻的食味品质评价契合,认为籼稻蛋白质含量与食味值呈极显著负相关[22],因此能否利用蛋白质含量不同的籼稻其籽粒光谱反射率存在差异的特征,实现籼稻食味品质的快速无损评价有待进一步验证。由图1(A)可知,籼稻稻谷具有显著的峰谷特征,共出现9个反射峰,分别在895、944、1 108、1 299、1 647、1 850、2 017、2 211和2 398 nm波长附近,6个反射谷,分别在993、1 204、1 467、1 927、2 105和2 276 nm附近。一阶求倒变换能增强原始数据的信噪比,显示更多的信息,因此由图1(B)可知,经过一阶微分变换后籼稻反射峰谷数量明显增多,共出现16个反射峰,分别位于441、609、688、930、1 037、1 227、1 283、1 373、1 516、1 606、1 731、1 833、1 953、2 151、2 289和2 343 nm等波长附近,14个反射谷,出现在517、665、907、971、1 148、1 267、1 344、1 402、1 573、1 895、2 050、2 250、2 313和1 458 nm等附近,将籼稻原始及一阶微分光谱反射率峰谷位置用于籼稻特征波长的筛选。

图1 籼稻籽粒原始及一阶微分光谱反射率曲线

按照糙米粗蛋白含量的差异绘制籼稻原始光谱反射率曲线如图2。在470~1 390 nm波段范围内,籼稻光谱反射率大致表现为随粗蛋白含量升高而降低,但粗蛋白质量分数在9%~9.9%和10%~10.9%范围内的光谱曲线没有出现该规律,可能是受数据量的影响,因为共有7个材料粗蛋白质量分数位于9%~9.9%,仅3个材料粗蛋白质量分数在10%~10.9%范围内。在1 390~2 500 nm范围内,粗蛋白质量分数在6%~6.9%、7%~7.9%及8%~8.9%间的光谱差异不明显,但粗蛋白质量分数为6%~8.9%和9%~10.9%存在显著差异,因此470~2 500 nm波段可作为不同气候生态型籼稻粗蛋白含量光谱估测的敏感区域。

图2 不同粗蛋白含量籼稻籽粒原始光谱反射率

2.3 籼稻光谱反射率与糙米粗蛋白含量的相关性分析

对不同气候生态型籼稻籽粒原始及一阶微分光谱反射率与其对应的糙米粗蛋白含量进行相关性分析,结果如图3所示。籼稻籽粒原始光谱反射率在全波长范围内与糙米粗蛋白含量呈极显著负相关,与颜士博[23]的研究结果相似。其中944 nm处达相关系数最大值,为0.873。一阶微分光谱相关系数在全波段内波动较大,在419~681、696~875、867~929、936~996、1 019~1 045、1 048~1 205、1 208~1 252、1 288~1 462、1 467~1 637、1 680~1 725、1 737~1 779、1 851~1 926、1 936~2 040和2 224~2 266 nm等波段范围内呈极显著相关关系,其中在672、721、906、951、1 153、1 224、1 313、1 494、1 751和1 887 nm等波长附近相关系数均达0.8以上。

图3 籼稻籽粒原始及一阶微分光谱反射率与粗蛋白含量相关系数

2.4 籼稻糙米粗蛋白含量估测模型构建及验证

2.4.1 基于光谱指数的粗蛋白含量估测模型

图4 任意两波长构建的原始及一阶微分光谱指数 与糙米粗蛋白含量的决定系数

表3 最优光谱指数建模结果

2.4.2 基于全波长的粗蛋白含量估测模型

对比3种方法建模效果,发现总体表现为PLSR>SMLR>PCR,这可能是因为PLSR模型能同时对光谱阵和浓度阵进行分解,有利于提高模型精度[25],而PCR模型只分解光谱阵,没有充分考虑光谱阵与浓度阵的关系[26],同时由于本文原始光谱在全波长与籽粒粗蛋白呈显著负相关,一阶微分光谱也在大部分波段范围与粗蛋白含量呈显著相关关系,因此SMLR模型效果略优于PCR模型。综合考虑建模集与验证集R2和RMSE,发现基于原始光谱反射率建立的PLSR模型对籼稻糙米粗蛋白含量估测效果最佳,说明该模型在不同品种间具有较好的普适性及稳定性。

表4 全波长模型估测结果

2.4.3 基于特征波长的粗蛋白含量估测模型

虽然全波长估测模型精度较为理想,但是存在信息冗余、运算效率低及设备成本高等弊端,在实际应用中难以推广,而在大量的光谱信息中,通过特征提取方法筛选出可用于目标参数反演的少数特征波长,具有更大的实际意义。本文通过分析稻谷原始及一阶微分光谱反射率的峰谷特征,再结合峰谷位置对应的反射率与粗蛋白含量的相关关系,筛选出可用于不同气候生态型籼稻糙米粗蛋白含量估测的特征波长见表5。原始光谱中共提取了15个特征波长,占全波长0.7%的信息量,且其与粗蛋白含量的相关系数均在0.6以上,其中944 nm处相关系数最高,达0.873。一阶微分光谱中共筛选出19个特征波长,占全波长0.88%的信息量,其中665 nm处与粗蛋白含量相关系数最大,为0.874。

表5 特征波长

将表5筛选出来的原始及一阶微分特征波长作为自变量,糙米粗蛋白含量为因变量,建立基于特征波长的PLSR、PCR和SMLR模型,各模型的效果如表6所示。由表可知,基于一阶微分特征波长建立的3种模型效果普遍优于原始光谱特征波长构建模型,这可能是因为一阶微分变换能提高数据信噪比,显示更多的信息,也可能是模型的输入变量个数多于原始光谱特征波长所致。在基于原始特征波长建立的SMLR模型中,仅944 nm入选,建模R2为0.763,验证R2为0.853,而在一阶微分特征波长构建的SMLR模型中,665、1148和1344 nm等3个波长入选建模变量,建立的多元回归模型建模集R2为0.815,验证集R2达0.912,由此可知,SMLR估测模型均表现为验证效果优于建模效果,说明模型具有较好的适应性,但缺乏稳健性。综合看来,在特征波长估测模型中,以一阶微分光谱反射率建立的PLSR模型效果最理想,用4个主成分数,达到建模R2为0.842,RMSE为0.506%,验证R2为0.823,RMSE为0.523%的效果。说明PLSR模型在估测籽粒粗蛋白含量方面具有显著优势,与PLS模型是近红外品质分析仪的内置模型[27]的研究结果相似,但建模方法影响估测精度,研究发现神经网络[28-29]、深度学习[30]等机器学习方法能有效提高模型估测精度,下阶段还将从估测算法做进一步探究。

表6 特征波长模型估测结果

3 结论

本实验研究36个长江中下游不同气候生态型籼稻品种籽粒原始、一阶微分光谱特征及其与粗蛋白含量的相关性分析,建立了基于最优光谱指数、全波长和特征波长的糙米粗蛋白含量估测模型,得到如下结论:籼稻籽粒光谱反射率随着粗蛋白含量的升高而降低,具体表现为中籼稻>晚籼稻>早籼稻;在基于最优光谱指数、全波长和特征波长的估测模型中,PLSR模型效果最优,建模集和验证集R2均达0.8以上,能有效估计籼稻糙米粗蛋白含量,为籼稻品质检测提供了快速、无损、高通量的方法。

猜你喜欢
籼稻糙米微分
糙米破碎多因素试验研究
从稻名演变看籼稻的起源
2021年无为市优质中籼稻品种比较试验
拟微分算子在Hp(ω)上的有界性
上下解反向的脉冲微分包含解的存在性
借助微分探求连续函数的极值点
杂交籼稻花药基部开裂性状的遗传研究
对不定积分凑微分解法的再认识
江西省粳稻种植面积突破6 666 hm2
麦胚糙米混合粉的挤压制备工艺研究