近红外透反射光谱测定单粒稻种的蛋白质含量

2019-08-28 11:02王纯阳马玉涵刘斌美郭盼盼
核农学报 2019年10期
关键词:单粒稻种波数

王纯阳 马玉涵,3 刘斌美 郭盼盼 黄 青,*

(1 中国科学院合肥物质研究院技术生物与农业工程研究所,安徽 合肥 230031;2 中国科学技术大学 生命科学学院,安徽 合肥 230026; 3安徽科技学院生命与健康科学学院,安徽 凤阳 233100;4中国科学院合肥物质研究院智能研究所,安徽 合肥 230031)

稻米(Oryzasativa)属禾本科植物,是世界上主要粮食作物和四大直接经济作物之一,是人体必需的淀粉、蛋白质和矿物质等营养成分重要来源,因此,稻米种子的质量控制一直是水稻育种工作者、农民和消费者极为关注的问题[1]。蛋白质是水稻的主要营养成分之一,也是评价稻米品质的重要指标[2]。为了能够更加精确地获得具有最优性状的种子,育种专家已经开始在单粒种子水平上研究个体的性状差异[3-4]。研究发现通过单粒种子的检测技术可以在筛选优质突变体方面显著提高效率[3]。但对单粒种子进行检测时传统方法存在相当大的困难,工作量巨大且耗时长,检测过程还会对种子本身造成伤害而无法用于后续的留种选育。

相比传统的化学有损测定方法,如凯氏定氮法(kjeldahl method,KM)[5]、杜马斯燃烧定氮法(Dumas nitrogen analyzer,DM)[6],近红外光谱(near infrared spectroscopy,NIRS)技术具有无损、快速、多成分、无污染的分析特点,同时,在检测过程中无需进行样品处理,也提高了谷物的检测效率[7-9]。目前,NIRS因其经济、方便等特点已被广泛应用于农业[10-11]、食品[12-13]等领域,在单粒大豆[14]、玉米[15]和小麦[16-17]中分别成功检测了淀粉、蛋白质和水分等化学成分含量。在单粒稻种的NIRS分析中,研究人员均只采用了近红外透射光谱用于分析各化学成分[18-21],而NIRS反射光谱仅用于建立米粉[22-23]和群体糙米[24]的蛋白质和直链淀粉模型。在实际应用中常采用近红外反射光谱代替NIR透射光谱进行水稻种子的在线快速检测。由于单粒种子体积小,在水稻单粒种子鉴定中,光谱信噪比相对较低,有效地应用近红外反射光谱技术仍然是一个挑战,同时,稻壳的存在也会对测量过程造成干扰。

本研究试图将NIR光谱技术应用于水稻种子蛋白质含量分析,为此,以获得的离子束辐照籼稻品种9311突变体库为定标样本,建立可靠的近红外定量模型,并尝试采用不同的近红外测量模式(包括透射、漫反射和透反射)构建和优化偏最小二乘回归模型,以期为高效准确地评价水稻单粒种子的蛋白质含量提供基础。

1 材料与方法

1.1 试验材料

用于建模的稻种来自9311水稻离子束辐射突变体库,是用兰州近代物理所的HIRF 装置(heavy ion research facility)通过用碳离子处理(200 Gy,80 MeV)得到的诱变种子,并经过多代培育获得的。其稻谷粒型之间差异明显,单粒稻种的重量变化范围为27.6~41.0 mg,较好地避免了其他性状的干扰。此外,本试验中用于模型适用性的测试为来自不同地域的稻种,包括Ⅱ伏838、明恢63、华粳籼74、武运粳27、IR36(籼)、9019(籼)、黄华占(籼)和桂朝2号等8个品种。

1.2 光谱采集

测定前将水稻种子放置干燥箱内平衡约12 h,以避免水分干扰;种壳测定时保持其物理状态与种子一致,避免物理变量的干扰。采用近红外光谱仪(Bruke MPA,德国)分别采集相应种子、种壳、米粉和糙米的漫反射、透反射及漫透射光谱。

图1 单粒糙米(A)及其薄片(B)的漫反射光谱和透射光谱分析Fig.1 Trans-reflectance and diffuse-reflectance spectra of a single brown-rice kernel (A) and brown-rice flake (B)

光谱采集软件为OPUS7.0。其中,漫反射光谱的光谱采集范围为4 000~12 000 cm-1,分辨率为16 cm-1,扫描次数为32次;透反射光谱采集范围、分辨率和扫描次数与漫反射光谱相同,但在采集光谱时,需在糙米或水稻种子后放置一片与其大小相似的全反射体;漫透射光谱的光谱采集范围为5 800~12 500 cm-1,分辨率为16 cm-1,扫描次数为64次。

1.3 水稻种子蛋白质含量的测定

人工去除种壳,将糙米压碎,过100目筛,然后置于80℃烘箱过夜。采用Vario EL cube元素分析仪(德国Elementar)中CHNS模式测定米粉的含氮量。取约5 mg米粉样品,氧化炉温度设置1 150℃,还原炉设置850℃,通氧时间为90 s,标准品为苯磺酸[24]。用测定的米粉含氮量(以百分分数表示)乘以系数5.95(对稻米而言,氮换算为蛋白质含量的系数),即为相应粗蛋白含量。

1.4 数据分析

建模集样本数为60,蛋白质含量的变化范围为6.069%~14.399%;预测集样本数为20,蛋白质含量的变化范围为7.38%~14.10%。建模集和预测集的蛋白质含量跨度较大,具有较好的代表性。模型的分析建立和预测在Unscramble 9.7上完成,采用偏最小二乘法建立模型,并分别采用标准正态变换(Standard normal variate,SNV)、多元散射校正(Multiplicative scatter correction,MSC)、Savitzky-Golay一阶导数(SG first deriv)和Savitzky-Golay二阶导数(SG second deriv)光谱预处理方法优化定量模型。评价模型的性能采用决定系数(R2)、交互验证均方根误差(root mean square error of validation,RMSECV)和预测均方根误差(root mean square error of prediction,RMSEP)[25]。

2 结果与分析

2.1 单粒糙米的光谱分析

单粒糙米的漫反射光谱和透反射光谱的吸收波动区别较小(图1-A),为此从单粒糙米的腹部取一块厚度约1.5 mm的糙米薄片,套一铝箔制成的近红外光谱增强反射器,再分别测定其漫反射和透反射光谱(图1-B)。通过对比发现,糙米薄片的透反射光谱与米粉的漫反射光谱相似,说明透反射光谱用于糙米检测效果优于漫反射光谱采集方式。

2.2 单粒糙米蛋白质定量模型的建立

基于上述的单粒糙米近红外光谱特征,分别尝试了在漫反射、透反射和透射光谱采集方式下建立单粒糙米蛋白质定量模型。由表1可知,漫反射光谱采集方式下单粒糙米蛋白质各偏最小二乘(PLS)模型的决定系数(R2)值偏低,难以满足实际分析;透反射光谱采集方式下SNV光谱预处理的模型最优,其R2=0.95,预测均方根误差(RMSEP)为0.34%(图2-A);透射光谱采集方式下SNV光谱预处理的模型最优,其R2=0.97,RMSEP=0.27%(图2-B)。透反射光谱、透射光谱采集方式下SNV光谱预处理的模型对应的最佳主成分数的回归系数曲线见图2-C、-D。综上,运用近红外光谱测定单粒糙米的蛋白质含量时,透反射和透射光谱采集方式均能满足分析要求。

表1 单粒糙米蛋白质模型的交互验证和外部检验结果Table 1 Cross validation and external validation statistics for protein content in single brown-rice kernels

2.3 单粒稻种的光谱分析

实际分析中,完整的稻种分析更具有优势,故本试验对单粒稻种的NIRS特征作了进一步分析。由图3可知,8 300 cm-1处吸收峰为糙米和稻种,而稻壳没有吸收,故8 300 cm-1处吸收峰为糙米的光谱吸收峰,6 500~7 200 cm-1波数范围内糙米和稻壳均存在吸收,而4 000~6 500 cm-1波数范围内稻壳吸收更强。此外,单粒稻种的近红外漫反射光谱和单粒糙米的近红外漫反射光谱明显不同,证明稻壳对稻种的近红外光谱影响较大。为了更有效地去除稻壳对稻种的光谱影响,选用6 500~9 100 cm-1和7 200~9 100 cm-1两个段波数范围建立蛋白质模型。

2.4 单粒稻种蛋白质定量模型的建立

由表2可知,漫反射光谱采集方式下,由于稻壳的影响很难建立满足实际分析的蛋白质定量模型;透反射光谱采集方式下,选择6 500~9 100 cm-1波数范围和SNV光谱预处理,模型的RMSEP=0.81%(图4-A);透射光谱采集方式下,选择7 200~9 100 cm-1波数范围和SNV光谱预处理,模型的RMSEP=0.24%(图4-B)。图4-C、D分别展示了透反射和透射光谱采集方式下性能最优的蛋白质定量模型的回归系数曲线。综上,透射光谱采集方式下,单粒稻种的蛋白质定量模型较为准确。透反射光谱采集方式下,模型具有一定的预测能力。

图3 漫反射(A)、透反射(B)和透射(C)光谱采集方式下单粒稻种、糙米和稻壳的近红外光谱分析Fig.3 The comparison of NIR spectra of single rice kernel, rice grain and husk under (A) diffuse-reflectance, (B) transflectance, and (C) transmittance spectral acquisition modes

2.5 蛋白质定量模型的适用性

为了测试单粒糙米和单粒稻种的蛋白质定量模型的适用性,测试了Ⅱ伏838、明恢63、华粳籼74、武运粳27、IR36(籼)、9019(籼)、黄华占(籼)和桂朝2号8种其他来源的种子。由表3、图5可知,选用合适的模型可以比较准确地预测其他稻种的蛋白质含量,特别是采用透射光谱方式。此外,在透反射光谱采集方式下,本研究已建立的蛋白质含量透射模型对其他稻种的单粒糙米的蛋白质预测能力弱于对9311突变株的糙米蛋白质预测能力。这可能是因为透反射光谱不仅包含了糙米的化学成分信息,而且包含了单粒种子的物理形态、新陈度等信息,如何扣除这些因素的影响以提高模型适用性尚有待进一步研究。

表2 单粒稻种蛋白质模型的交互验证和外部检验结果Table 2 Cross validation and external validation statistics for protein content in single rice seeds

3 讨论

3.1 单粒糙米漫反射与透射光谱分析

目前,研究学者多采用NIR漫反射光谱分析米粉的蛋白质含量[22-23],而鲜见用NIR漫反射光谱分析单粒糙米蛋白质含量的报道。糙米的密度高于米粉,且已采用NIR透射光谱成功建立了单粒糙米的蛋白质模型[21],故推测漫反射光谱采集方式下漫反射光谱未采集到信号足够强的化学成分信息。研究表明,透反射测量不仅比透射测量更为便利,而且比漫反射测量的信噪比更高,尤其适用于近透明样品的测量[26]。因此,本研究采用透反射光谱采集方式验证这一推测。为了应用透射近红外光谱,采用铝箔制成的近红外光谱增强反射器。本研究结果表明,单粒糙米的漫反射和透反射光谱吸收波动区别较小,而糙米薄片的透反射光谱与米粉的漫反射光谱更加相似;对比分析得知,单粒糙米的漫反射光谱没有足够的糙米化学成分信息,而单粒糙米的透反射光谱明显克服了漫反射光谱的缺点,具有更好的信噪比,且4 000~5 300 cm-1波数范围内光谱吸收“饱和”。

3.2 单粒糙米蛋白质定量模型构建

Rittiron等[21]采用NIR透射光谱构建了单粒糙米的蛋白质定量模型, 其最低SEP为0.38%,选定的波数分别为5 753、5 896、5 931、6 053 cm-1。本试验得到的单粒糙米定量模型优于该模型。定量模型构建过程中,最优变量的回归系数分析可用于透反射和透射光谱采集方式下对光谱定量模型选取范围的有效筛选[27]。

图4 透反射光谱、透射光谱采集方式下SNV光谱预处理的单粒稻种蛋白质模型的外部检验结果(A、B)及其相应回归系数曲线(C、D)Fig.4 The external validation results of single rice grain protein content model of NIR trans-reflectance spectra (A) and of NIR transmittance spectra (B) with the SNV pre-treatment, and correspond regression coefficient curves of the optimum number of latent variables (C, D).

注:A、B分别为透反射采集方式下一阶导数光谱、一阶导数+矢量归一化光谱预处理结果;C,D分别为透射采集方式下多元散射校正光谱、一阶导数+多元散射校正光谱预处理结果。Note:A and B are the predicted results based on transflectance spectra under first-derivative and first-derivative + SNV pre-treatment.C and D are the predicted results based on transmittance spectra under MSC and first-derivative + MSC pre-treatment, respectively.图5 单粒糙米蛋白质模型的预测结果Fig.5 The predicted results of single brown-rice protein content models

名称NameN%N%×5.95糙米-透反射Brown ricetransflectance稻种-透反射Rice seedtransflectance糙米-透射Brown rice transmittance稻种-透射Rice seedtransmittanceⅡ伏8381.166.907.716.177.257.74Ⅱ伏8381.076.377.216.256.357.24Ⅱ伏8381.247.387.887.127.317.37Ⅱ伏8381.468.698.128.728.629.24明恢631.297.687.598.657.848.20明恢631.368.098.117.838.008.26明恢631.267.507.377.307.507.63明恢631.539.108.787.178.768.80IR361.277.569.148.957.938.76IR362.0912.4411.1111.8312.2412.40IR361.9011.3010.419.6211.7911.53华粳籼741.126.667.277.316.636.75华粳籼741.599.468.779.759.029.45桂朝2号1.337.919.517.627.747.93桂朝2号1.659.829.227.938.828.98黄华占1.197.087.617.466.957.47黄华占0.965.716.796.045.616.00武运粳271.378.159.359.278.949.4290191.227.268.568.747.188.09当粳101.508.938.667.658.268.81

本研究中,单粒糙米的透射光谱中6 050~7 610 cm-1和8 440~8 800 cm-1区域对其蛋白质模型影响较大,而这两个区域分别为一级倍频区和二级倍频区[28],这些区域中6 094、7 251、8 440、8 763 cm-1与蛋白质中C-H键的伸缩和弯曲振动的一级倍频、二级倍频和组合频相关,6 603、6 657、6 958 cm-1分别与蛋白质中N-H键的伸缩振动的一级倍频和组合频相关,6 900、8 620 cm-1分别为C=O的伸缩振动的三级倍频和四级倍频[29];单粒糙米的透反射光谱中,4 400~4 600、5 600~6 050、8 300~8 800 cm-1对其蛋白质模型影响较大,其中C=O、N-H和C-H的分子振动主要在4 400~4 600 cm-1波数范围[30],这一结果与米粉的回归系数分析相一致。此外,Rittiron等[21]在建立单粒糙米的蛋白质模型时采用了5 754、5 896、5 931、6 053 cm-1波数(R2=0.96),也证明了5 600~6 050 cm-1波数范围的合理性。

3.3 单粒稻种蛋白质定量模型的构建

在实际生产和新品种选育过程中,单粒稻种的分析对稻种品质的分析更有科研意义和应用价值。Oido等[20]利用NIR透射光谱对单粒稻种蛋白质含量(参考值范围为5.9%~7.9%)进行了定量分析,选定的波数区域为5 880~12 500 cm-1,成功构建的该单粒稻种蛋白质含量模型的SEP为0.53;Kawamura等[31]利用NIR透射光谱对未干糙米蛋白质含量(参考值为7.%~9.4%)进行定量分析,选用的波数范围为9 300~12 100 cm-1,构建的蛋白质含量模型SEP为0.24。本试验结果(图4)表明,稻种在透反射和透射光谱采集方式下具有性能最优的蛋白质定量模型的回归系数曲线,该结果糙米蛋白质含量的影响范围一致。8 300~8 800 cm-1波数范围对单粒稻种的蛋白质定量模型影响较大,该波数范围主要为C-H的二级倍频和C=O的四级倍频[29]。单粒稻种透反射光谱的6 500~8 100 cm-1波数范围对其蛋白质模型的建立存在影响,但由于稻壳的干扰,该波段与蛋白质含量间的相关性较差。本研究构建的蛋白质含量NIR光谱定量模型,稻种蛋白质含量参考值在6.07%~14.4%之间,比Oido等[20]和Kawamura等[31]建立的单粒稻种的蛋白质含量模型测量范围更宽。本研究通过比较3种NIR光谱采集方式发现,基于透射测量的蛋白质含量模型预测能力更优,甚至更接近透过测量的预测能力,透射光谱采集方式下,选用光谱范围为7 200~9 100 cm-1,预处理方式为标准正态变换,维数为7时,定量效果最佳,交互验证R2=0.96,RMSECV=0.26%,外部验证R2=0.98、RMSEP=0.24%。

4 结论

为对单粒糙米和稻种的蛋白质含量进行高效无损定量分析,本研究以蛋白质含量为6.07%~14.4%的水稻突变体库为分析对象,对比分析了漫反射、透射、透反射3种采集模式对单粒糙米和稻种NIR光谱及定量模型的影响。通过对比发现,在光谱采集方面,透反射光谱采集方式下可以建立相关性较好的单粒糙米蛋白质模型和具有一定相关性的单粒稻种蛋白质模型,且更适合实际中的在线分析。由于稻壳的存在,单粒稻种漫反射光谱采集方式会受到一定的干扰,导致检测准确度较低,而透射和透反射光谱可以有效降低这一干扰,透射光谱采集方式下可以建立准确度较高的单粒稻种蛋白质定量模型,其R2=0.96,RMSEP=0.24%。通过对来源不同的水稻种子进行测试,验证了单粒种子蛋白质定量模型具有一定的适用性。本研究结果为单粒糙米和单粒稻种的近红外光谱在线无损分析提供了理论基础,也为作物育种行业快速、高效地筛选和水稻种子质量检测提供了一个实用的范例。

猜你喜欢
单粒稻种波数
声场波数积分截断波数自适应选取方法
一种基于SOM神经网络中药材分类识别系统
家蚕种质资源单粒缫丝成绩评价
玉米单粒播种子质量标准实施我国精量化播种步入规范化新时代
家蚕单粒缫丝质评价体系初报
秋收:胭脂米重回京城
重磁异常解释的归一化局部波数法
基于声场波数谱特征的深度估计方法
水稻机插秧育苗催芽器研制成功