严金欣, 李新奇
(1.海南大学, 海口 570208; 2.三亚市国家耐盐碱水稻技术创新中心, 海南 三亚 572024;3.湖南杂交水稻研究中心, 长沙 410125)
第三代杂交水稻是指以普通隐性核雄性不育系为杂交母本,以常规品种或品系为杂交父本杂交配制而成的新型杂交水稻[1-2]。第三代杂交水稻克服了第一代杂交水稻和第二代杂交水稻在技术上的局限性。其在水稻生长季节的任何时期均表现出雄性不育的特性,且不会因环境条件的改变而发生育性波动,是作物杂种优势利用的理想遗传工具[3-4]。
第三代杂交水稻不育系选育方法为红色荧光繁殖系的自交繁殖。通过自交后,每个稻穗上会得到结实一半的雄性不育系种子和一半的繁殖系种子[5-6]。在种植栽培时此生产方式操作简单,只需要按常规水稻种植方法将繁殖系种植收获即可。
从繁殖系植株上收获的种子需要进行荧光色选,以便区分出无荧光的普通核雄性不育系种子和有红色荧光的繁殖系种子[7]。然而在色选环节中,笔者发现,发育不良的水稻种子存在谷壳发黑或红色荧光较弱等情况,对于以计算机视觉为技术基础的红色荧光色选机识别率往往会降低,由于繁殖系和不育系水稻种子组分的化学性质存在显著差异,寻求可用于精选的其他方案对不育系选育尤为重要。
研究表明,生物体的近红外光谱是其表面光学特征及内在组分化学性质的本质反映,随着生物体表面色泽和内在组分或结构的变化,其近红外光谱特征信息也发生着显著变化[8-10]。
在近红外光谱的判别分析中 SIMCA(Soft independent modeling of class analogy)为最常用的建模方法。SIMCA 方法为每个类建立了独立的主成分分析(Principal component analysis,PCA)模型,然后依据该模型对未知样品进行分类[11-12]。本研究针对第三代杂交水稻不育系分选方案中的不足和近红外光谱识别方法的高分辨能力,建立了敏感波段和全波段的近红外光谱辨别模型,为第三代杂交水稻不育系选育提供新的快速鉴别手段。
2022年5—7月水稻收获期间,随机采取湖南杂交水稻研究中心海南基地第三代杂交水稻样品5 kg。人工分拣去除水稻样品中秸秆、草籽、石子、土块等杂质后,放入袋中,置于38 ℃烘箱中,通风干燥24 h,调节样品中含水量尽量保持一致,使用荧光色选机分选,人工筛选出确定无色不育系种子和红色荧光繁殖系种子2份,各选取外观状态正常的100粒。其中1份样品用于建模,1份样品用于验证。
1.2.1光谱采集
采用厦门奥谱天成公司生产的ATP 8600微纤近红外光谱仪,使用漫反射方法,扫描样品的近红外光谱,分辨率约为3 nm,光谱波长范围为900~1 700 nm,重复扫描4次求平均光谱并存盘备份。
1.2.2数据处理与分析
采用Unscrambler光谱分析软件进行主成分分析和SIMCA建模;Origin软件进行绘图;Excel软件进行绘表及数据汇总。
水稻种子的原始光谱中包含较多干扰信息,为了便于得到敏感波段,直接将平均光谱进行比较。从不育系种子和繁殖系种子的平均光谱(图1)可看出,在1 350~1 450 nm范围内繁殖系水稻种子的光谱吸收值显著低于不育系水稻种子。且全波段曲线变化较为相似。因此,选取1 350~1 450 n波段光谱作为敏感波段。
图1 不育系水稻种子和繁殖系水稻种子的平均光谱Fig.1 Average spectrum of male sterile rice seeds and breeding rice seeds
在进行SIMCA模型建立前,需要对光谱数据进行主成分分析。通过对近红外光谱的数据特征观察发现,在光谱数据存在较大差异时,遂使用Unscrambler光谱分析软件对全波段光谱数据进行数据归一化,在不影响信息的基础上使数据在每个维度都服从均值为0、方差1的正态分布。得出全波段及敏感波段各主成分累积贡献率(表1、表2)。
表1 全波段主成分累积贡献率Table 1 Total contribution rate of all band principal components
表2 敏感波段主成分累积贡献率Table 2 Total contribution rate of sensitive band principal components
选取最少主成分数可达到100%识别率为最终构建的SIMCA模型。结果显示,在全波段SIMCA光谱范围内无色水稻种子和红色水稻种子最佳主成分数为5。在敏感波段处最佳主成分数为3(表3)。
表3 全波段及敏感波段不同主成分数所建模型的识别率Table 3 Recognition rate of models with different principal components in full band and sensitive band
为了进一步验证已建立SIMCA模型的识别率,将未参与建模的100个水稻样品光谱数据代入上述SIMCA辨别模型,结果表明,该SIMCA模型对2个种类的识别率均为100%。
第三代杂交水稻繁殖系种子与不育系种子近红外光谱存在显著差异,且存在明显的敏感波段。本研究利用SIMCA法建立了辨别模型,并且选取利用主成分数最少的最优模型均达到100%的识别率。证明此方法在敏感波段及全波段都能有效辨别第三代杂交水稻繁殖系与不育系。