于翠红,樊翠芹,张丽,徐俊杰,刘朝芳,蒋春志,唐晓东
(河北省农林科学院粮油作物研究所,河北省作物遗传育种实验室,河北 石家庄 050035)
玉米是我国重要的粮食作物之一,也是饲料和加 工业原料的主要来源。近年来,随着人们生活水平的提高和膳食结构的改变,玉米的用途发生了重大变化,玉米品质也变得越来越重要。国家标准中玉米粗蛋白含量测定采用常规的化学分析法,不仅需要一系列的前处理,操作繁琐,还破坏了被测定样品的子粒结构,使样品不能再作为种子利用。而且针对不同的化学成分需要不同的分析方法和程序,分析速度慢,不适于作物品质育种工作中大批量早代育种材料的筛选。因此,选择一种快速、无破坏测定玉米品质性状的方法尤为重要。
近红外光谱(near-infrared reflectance spectroscopy,NIRS) 分析技术是利用化学物质在近红外光谱区内的光学特性,快速测定样品中一种或多种成分含量和特性的物理测试技术。该技术是20 世纪80 年代后期迅速发展起来的,具有检测样品用量少、检测速度快、无污染、非破坏性测定以及测定一次光谱可同时获得多种品质成分含量等优点,目前广泛应用于工业[1]、农业[2]、食品[3,4]、医药[5,6]等领域,在欧美等国家已成为农作物品质分析的重要手段[7]。与国外相比,我国NIRS 分析技术在作物育种上研究进展较为缓慢。该技术虽然在一些重要农作物的主要品质性状分析上得到了一定程度的应用,并建立了相应的定标模型,但是在实际应用过程中还存在着一些问题。如,建立模型所用的样本量少,构建的模型实际适用性差;模型得不到及时维护和升级,不能适应育种需要等。本研究旨在通过采集适合黄淮海地区种植的普通玉米杂交种,采用NIRS 分析与常规化学测定法相结合的方法,建立一种快速检测玉米品质性状的定标模型,以实现玉米品质育种过程中早代材料的无破坏大批量检测,提高育种效率。
NIRS 分析技术用于测定玉米品质研究已经取得了一定进展[8,9],但由于其是一种间接的分析方法,测定样品成分含量的方法是建立在化学测定法或其它仪器测定基础之上,是一种“再生”的测定方法[10],因此,任何一台近红外光谱仪对每种组分或每种参数都要单独定标[11]。利用DA7200 型近红外光谱分析仪建立玉米子粒粗蛋白定标模型,探讨其用于测定玉米子粒粗蛋白含量的可行性,旨为玉米品质育种提供一种快速、简易的测定方法,以适应玉米品质育种的工作需要。
试验材料为适合黄淮海地区种植的具有代表性的玉米品系,共计598 份。
1.2.1 样品光谱采集 采用DA7200 二极管阵列近红外光谱分析仪〔瑞典波通(Perten) 公司生产〕收集光谱数据。该光谱仪带有旋转式样品检测盘,在波长950~1 650 nm 范围内采集光谱,采样间隔为5.0 nm,每个样品采集2 次做双平行实验。取平均光谱值用于NIRS 分析。
1.2.2 样品化学值测定 粗蛋白含量测定采用UDK159 全自动凯氏定氮仪,按照GB 5009.5—2016进行;水分含量测定采用LSIS-B2V/VC 111 型电热恒温干燥箱和CP114 型电子天平,按照GB 5009.3—2016进行。每个样品重复测定2 次。粗蛋白含量为折干基后含量,指标值取2 次测定结果的平均值。
1.2.3 玉米粗蛋白定标模型的建立与验证
1.2.3.1 近红外漫反射光谱采集和处理分析。对参试玉米材料分别进行光谱扫描,得到598 份玉米近红外原始光谱。对复杂有机物的光谱分析,要利用其全波长信息,运用化学计量学方法进行研究。在近红外漫反射光谱中,各种基团存在特定吸收峰,由于不同基团产生的光谱在吸收峰位和强度上不同,随着样品组成的变化,光谱特征也将发生变化,因此,需要根据测定样品的NIRS 与它们的组成成分,通过合理的光谱处理及校正方法,建立样品光谱与组成成分之间的校正模型。本研究中,利用瑞典波通(Perten) 公司生产的Unscrambler 9.8 光谱分析软件,在软件提供化学计量方法中选用一阶求导与标准正态变量转换法(SNV) 相结合的方法进行光谱预处理,得到处理后的NIRS。将常规化学分析方法测得的数据输入到光谱数据中进行分析,回归统计方法采用偏最小二乘法(partial least square,简称PLS)[12,13]。
1.2.3.2 定标模型的建立与衡量。以玉米粗蛋白的化学测定值为横坐标、近红外预测值为纵坐标,得到定标集散点图,并进行一元线性回归分析。建立定标模型后,利用定标标准差(SEC)、预测标准差(SEP)、定标相关系数(Rc) 和预测相关系数(Rp) 衡量模型的预测能力。要求有较小的SEC 和SEP,较大的Rc和Rp。一般情况下,SEC 和SEP 越小,Rc 和Rp 越大,定标模型的预测能力越好。
1.2.3.3 定标模型的验证。选取90 个具有代表性的玉米品种,采用国家标准中的化学方法测定其粗蛋白含量,利用建立的定标模型进行粗蛋白含量预测。对NIRS 分析结果与常规化学分析结果做线性图并进行分析。
598 份定标集玉米样品的粗蛋白含量为7.35%~14.42%,平均值为9.65%,标准差为1.77。样品的粗蛋白含量范围基本覆盖了玉米生产和育种材料中粗蛋白含量的常态分布范围,具有良好的连续性和代表性,满足NIRS 定标条件的要求。
2.2.1 近红外漫反射光谱采集和处理分析 对598 份玉米材料分别进行光谱扫描,结果(图1) 显示,在950~1 650 nm 波长范围内存在多个吸收峰。利用Unscrambler 9.8 光谱分析软件,采用一阶求导与SNV 相结合的方法进行光谱处理,得到处理后的近红外光谱(图2)。
图1 598 份玉米的近红外原始光谱Fig.1 Near infrared original spectra of 598 corn samples
图2 一阶求导和SNV 处理后的近红外光谱Fig.2 Near infrared spectroscopy after first-order derivatives and SNV treatment
2.2.2 玉米粗蛋白定标模型的建立 从玉米粗蛋白定标集化学测定值与近红外预测值的相关散点图(图3)可以看出,样品测定结果数据点基本分布在直线两侧,且偏离很小。通过一元线性回归,得到定标方程为y=0.886x+1.126,Rc 为0.941 3,SEC 为0.358 7,呈极显著正相关,说明定标集的预测值与化学测定值具有显著的线性关系。
对90 个玉米品种粗蛋白含量的化学测定值与预测值(表1) 进行比较,同时,对NIRS 分析结果与常规化学分析结果做线性图(图4),得到预测回归方程为y=0.93x+0.450 7,Rp 为0.972 1,SEP 为0.313 7。表明验证集各样品的NIRS 分析结果与常规化学分析结果具有较好的线性关系,样品较集中地分布在中心线附近,预测值与实测值较吻合,所建模型具有较好的预测效果。
图3 玉米粗蛋白定标集化学测定值与近红外预测值的相关散点图Fig.3 Scatter diagram of correlation between chemical determination value of corn crude protein calibration set and the near infrared predictions
NIRS 分析依靠样品间光谱信息的细微差别来对样品进行定量或定性分析,是一种物理的分析方法,其分析结果受多种因素影响,主要是样品的代表性和化学分析误差。本研究所用材料为适合黄淮海地区种植的玉米杂交种,子粒类型包括马齿型、硬粒型和中间型,子粒粗蛋白含量变化范围为7.35%~14.42%,因此,样品具有较好的代表性。
粗蛋白含量化学值的测定采用国家标准方法,每个样品进行2 次重复测定,目的在于减少化学分析造成的误差。其次,扫描时样品的粒度大小、均匀性等也会造成光谱误差。本研究中,采取了重复装样、取平均光谱的方法,来消除玉米子粒样品因粒度大小、均匀性不一致等因素造成的光谱误差。此外,在建模前采用一阶求导处理与SNV 相结合的方法对光谱进行预处理,部分消除了光谱误差,从而提高了所建模型的质量。
王铁固等[14]以玉米完整子粒为试验材料,采用偏最小二乘回归法建立近红外反射光谱测定其蛋白质和淀粉含量的数学模型,模型预测结果与化学测定值的相关系数分别达到了0.946 9 和0.924 0,校正后模型预测的准确性与化学测定方法相当。赵环环等[15]利用付里叶近红外漫反射光谱技术与PLS 法相结合对玉米子粒样品的蛋白质含量进行分析,预测样品相关系数为0.982,预测标准差为0.587,预测模型对样品的预测结果比较理想,可以满足农产品品质分析的要求。本研究中,验证集NIRS 的测试值与化学方法实测值相关系数为0.972 1,预测标准差为0.313 7,绝对差值介于-0.35~0.77,符合粗蛋白含量测定允许的误差范围,说明定标模型的预测值与化学测定值具有较高的一致性,预测效果较好,达到了品质分析对准确度的要求。与传统分析技术相比,利用NIRS 分析技术进行测定时不需要对分析样品进行破坏,分析过程中不消耗试剂和耗材,且检测速度快(检测1 个品种只需3 min)。因此,用所建定标模型进行玉米子粒粗蛋白品质分析适用于大批量育种早代材料的筛选。
表1 玉米粗蛋白含量化学测定值与近红外预测值的比较Table 1 Comparison of chemical determination values and near infrared predicted values of corn crude protein content (%)
图4 玉米粗蛋白验证集化学测定值与近红外预测值的相关散点图Fig.4 Scatter diagram of correlation between chemical determination value of corn crude protein validation set and the near infrared prediction
虽然本研究所用材料具有较好的代表性,粗蛋白含量范围基本覆盖了玉米生产和育种材料的常态分布范围,所得定标模型的验证结果表明模型的预测值与化学测定值的相关系数达到0.972 1,可以利用该模型对玉米子粒粗蛋白含量进行无损检测,指导玉米品质育种早代材料的筛选,但是,样品中粗蛋白含量的变化范围尚不够宽泛,所收集的材料中缺少含量低于7%和高于15%的样品。因此,应在现有研究的基础上,增加一些有代表性的样品,使样品中粗蛋白成分的变化范围足够宽泛并能覆盖今后玉米生产或育种材料中粗蛋白含量的变化范围,同时对所建定标模型做进一步优化,以提高模型的质量,扩大其应用范围。