表型组学研究进展及其在作物研究中的应用

2022-11-21 07:39潘朝阳陆展华刘维王晓飞王石光陈浩方志强巫浩翔何秀英
广东农业科学 2022年9期
关键词:冠层高通量组学

潘朝阳,陆展华,刘维,王晓飞,王石光,陈浩,方志强,巫浩翔,何秀英

(1.广东省农业科学院水稻研究所/ 广东省水稻育种新技术重点实验室/ 广东省水稻工程实验室/农业农村部华南优质稻遗传育种重点实验室,广东 广州 510640;2.华中农业大学植物科学技术学院,湖北 武汉 430070)

表型组学是利用多尺度、多维度的全方位数据,包括空间尺度上小至核苷酸序列和细胞,大至组织、器官、个体、群体及整个生育期的时间维度信息,系统地研究某一生物或细胞在各种不同环境条件下所有表型的学科[1]。随着植物表型获取技术和设备的不断完善,以及基因组学、蛋白组学、代谢组学、生物信息学和大数据计算的快速发展,高通量表型组学分析在种质资源鉴定、遗传图谱绘制、功能基因挖掘等方面发挥着越来越重要的作用[2]。

表型组学的优势和潜力还体现在多组学研究的交叉结合与关联分析,可针对植物的细胞、组织、器官和群体等不同层面以及不同生长发育时期进行综合分析,以绘制各项生命活动过程中的调控网络,解析植物的生物学规律,真正服务于农业生产[3]。因此,充分挖掘基因组、转录组和蛋白质组等各种组学的信息,加快高通量、高分辨率的表型研究,对全面了解基因型、表型和环境之间的关系,发现并揭示植物重要基因的功能,加强和提升我国在植物功能基因组及作物遗传改良领域的地位具有非常重要的意义。

表型是基因型与环境相互作用的产物。由于表型本身的复杂性和动态变化,研究者通常只专注于少数几个表型进行研究,而且传统研究过程中表型数据的获取依靠人工或简单设备测量,劳动量大、效率低,易受主观因素影响。随着不同尺度表型组学研究平台的发展,表型组学通过多尺度传感器、光学成像技术可以高通量、精准获取作物表型数据,已在水稻、玉米、大豆等主要粮油作物株高测量、叶面积指数测定、植物病虫害监测、产量估测等研究领域运用[3-5],实现了农作物产量、抗性等重要农艺性状的解析,为农作物育种、栽培和精准农业提供基于大数据的决策支持[5-7],对作物育种领域复杂的田间表型鉴定具有重要的借鉴意义。

本文综述了表型组学的发展历程及其在农作物研究领域中的应用,深入剖析了其在农作物根系、冠层结构、生物和非生物胁迫研究中的应用,旨在为农作物田间表型数据的高通量获取和解析提供依据,加速表型组学在农作物育种中的应用。

1 表型组学发展历程

“表型”一词体现了所研究的性状变异的遗传来源以及非遗传来源(通常指环境)之间的相互作用[8]。早在1866 年,孟德尔将豌豆的7 个性状作为“表型”研究“遗传因子”,开启近代遗传学研究进程。1909 年丹麦生物学家约翰逊将孟德尔提出的“遗传因子”定义为“基因”,正式提出“表现型”这一概念:一种特定的基因型可能表现不同的表现型,而一个特定的表型可能对应不同的基因型[8]。20 世纪90 年代,针对植物单一或系列表型(phenome)的研究开始受到广泛关注,并逐渐发展成为生物学研究中的一个重要分支[9]。21 世纪初,相对于单一性状,植物表型组能为植物研究提供全面的科学证据,尤其是伴随着基因组学的快速发展,表型组学的理论基础和研究方法得到较大完善[10]。2007 年,美国康奈尔大学植物分子遗传育种学家Susan McCouch 认为,表型组学研究应与高分辨率连锁图谱、全基因组关联分析和基因组选择模型等技术紧密结合,通过建立强大的表型分型系统,精确表征不同物种的细胞、器官和组织在不同发育阶段、不同环境中的表型差异[11],表型组学研究已从细胞层面上升到群体层面。2011年,德国LemnaTec 公司和荷兰KeyGene 公司共同研发的植物表型工厂PhenoFab 正式运行,标志着大型表型平台正式应用于商业化育种[12]。截至2020 年,国内外众多科研单位建立了高通量的表型组学研究平台,如澳大利亚植物表型研究中心(APPF)、德国Jülich 植物表型研究中心(JPPC)、英国国家植物表型研究中心(NPPC)、加拿大植物表型与影像研究中心(P2IRC),以及我国的华中农业大学作物表型中心、南京农业大学植物表型学研究中心等,大大加速了表型组学的应用和发展。2017 年,法国植物表型协会主席、法国国家农业研究院(INRA)作物生理生态学家Francois Tardieu 和英国诺丁汉大学植物学家Malcolm Bennett 共同提出多尺度表型组(Multiscale phenomics)研究的构想(图1)[13]。从概念提出至今,表型组学以其强大的数据获取和解析能力持续致力于研究环境、基因和表型之间的相互作用,广泛应用于基础研究和应用基础研究。

2 高通量表型平台和成像系统技术研究进展

2.1 表型平台的空间领域与运作方式分类概述

随着机器人技术、传感器技术、高通量成像技术的快速发展,植物表型组学的研究已经进入高通量、高精度、自动化、无损伤的大数据时代[13]。根据空间领域和运作方式,表型平台可分为手持式、信号固定检测杆、移动表型机器人、牵引式表型移动车、固定式检测台、移动轨道式表型平台、小型无人机、固定翼无人机、卫星遥感等(表1)。其中,手持式配有数据采集系统,该系统可以搭载数码相机、多光谱和热敏传感器等传感器来获取相应的表型特征[14];该方式方便灵活,但费时、费力、通量较低。无人车的优势是可以携带更大的电源和不同种类的传感器,使得传感器的测量不受限于光照条件,但缺点是通量较低以及对土壤条件不敏感[15]。轨道表型平台将RGB 相机、多光谱/超光谱相机以及热相机和激光传感器等安装在轨道上,它的优势是可以同时监测不同的性状,并对农作物生长、生理、形态等进行无损检测[16]。农业机器人已逐渐成为助推智能农机升级、智慧农业产业快速发展的重要抓手,也是我国追赶国际技术前沿的战略机遇[17-18]。无人机遥感系统可以高通量地获取多个地块的高时空分辨率图像,精准分析农业气象条件、土壤条件、作物表型等参数的空间变异性及其相互关系。无人机遥感系统已被应用于农作物覆盖度、株高、倒伏面积、生物量、叶面积指数、冠层温度等农情信息的监测研究[19]。这些表型获取平台已实现从宏观到微观多个尺度,全方位服务于作物学研究和农业生产领域。

表1 表型平台分类[20]Fig.1 Classification of phenomic platform[20]

一般来说,通过地面可以获得更高分辨率的图像,对农作物的性状特征捕获地更为详细,但地面平台在覆盖范围较小、工作效率不高。与地面表型平台相比,空中表型平台能够以相对较高的效率来获取图像,而且覆盖区域更大。但空中表型平台没有统一的使用标准,这些都制约着表型组学的大规模应用。

2.2 表型平台成像系统概述

图像采集技术是表型组学的重要基础。根据不同的研究需要,针对不同组织器官的特征以及图像性质,可以将图像采集技术分为二维和三维(表2)。二维图像采集主要集中于可见光、高光谱、多光谱等不同光谱下的光学成像,利用植物在不同光谱波段对光的吸收反射特性来提取相关的表型参数。在众多成像技术中,RGB 成像是最受欢迎的方法,不仅可应用于反映植物形态结构特征,还可应用于病原菌胁迫表型分析[11,21-22]。多光谱和高光谱相机依赖于太阳辐射与农作物之间的光谱反射作用,可以用来监测病虫害、产量等表型性状[20,23-25]。由于太阳辐射被叶片色素(如叶绿素)吸收,单叶或冠层在可见光光谱范围的反射率较低,在绿色光谱区域的反射率峰值约为550 nm,反射率随着可见光谱区向近红外光谱区过渡而急剧增加[26-27]。热成像相机可用于测量热光谱红外区域的红外辐射,作为水分胁迫重要指标之一[21]。

激光雷达是一种新兴的主动遥感技术,能够精确获取农作物的空间形态数据,在高通量农作物表型监测中有广阔应用前景,激光雷达通过集成高分辨率相机、热成像仪、高光谱成像仪等传感器,能够通量化同步获取农作物各生长时期的多源表型数据,并提取株高、株幅、叶长、叶宽、叶倾角和叶面积等参数,为植物生物学和基因组学分析提供数据支持[28-29]。X 射线CT 成像技术在根系和茎秆结构研究中得到了较好应用。CT 最重要的组成部分是X 射线源、样品台、检测器和重建算法[30]。当X 射线穿过样品时与样品材料相互作用,被吸收或被散射,密度更大的材料和质量更大的元素往往会造成更高的衰减。这种X射线强度的变化被探测器以X 射线照相的形式捕捉到,最终生成样本内部结构的体积图,从而实现无损检测。

3 表型组学在作物研究领域的应用

作物学研究涉及到大量田间表型数据,传统的田间性状调查通常需要对单株单一性状进行逐一调查,易受主观因素、测量工具和环境的影响,无法满足全基因组、转录组等各种组学的需要,而且传统的作物生长分析往往采用破坏性的采样方式。随着表型组学的快速发展,基于图像的表型技术利用数字图像来表征植物的形态和生理反应,可以在短时间内通过图像处理计算分析出植物的表型参数。此外,高通量表型组学研究设施集传送系统、采集相机、控制系统及分析存储系统于一体,能够全自动、无损伤地获取植物全生育期的多维度表型信息[1,12]。随着传感器成本的下降和计算机处理能力的提升,以及获取大量复杂表型的传感器的自动表型平台的开发,高通量表型技术在农作物育种应用中显示出巨大潜力[13]。

3.1 表型组学在作物根系研究中的应用

了解根系的结构及其发育过程对解析植物适应性机制和应答机制的分子遗传机理具有重要作用。Shi 等[34]采用特殊的长通滤波器,对在透明培养皿表面生长的根部进行近红外(NIR)成像监测其根系生长,结果显示白光会触发向光反应,而通过使用NIR 滤光片则可以避免光效应,从而确认该方法适合无干扰检测黑暗中的根系研究。梁丽秀等[35]基于Matlab 算法进行根系的图像分割,将获得的水稻根系图像先进行预处理,然后建立主干-分支的连接算法进行自适应阈值分割图像,获取根系的结构特征。Bodenr 等[36]提出基于微根窗技术、自动传送技术、图像处理以及计算机大规模运算技术于一体的高通量植物根系表型系统,根系表型装置根桶(Rhizo tube)的出现可以满足高通量、快速的表型分析要求。但微根窗技术所获得的图像噪点多、画质不清晰,制约其大规模应用。CT 技术广泛应用于医学、材料学研究中,近年来也应用于农业和植物科学研究(图2)。CT 可以对根系进行高通量、无损检测,增加根与土壤的对比度,再利用中值滤波和边缘算法分离根段。Tardieu 等[37]运用X 射线CT 成像技术建立了水稻根系构型(Root system architecture,RSA)可视化高通量处理流程,对土壤中根系进行细致无损的观察。基于X 射线CT成像技术的无损、高通量优点,该技术被逐渐应用于茎秆、稻穗、籽粒3D 表型性状的研究,促进了水稻功能基因组和农作物育种技术的发展。

3.2 表型组学在作物冠层生物量估测中的应用

作物冠层结构和生物量直接决定了作物的产量水平。目前基于冠层结构的光学图像分析已应用于多种粮食作物研究,为产量预测提供重要依据[42]。唐延林等[43]对水稻抽穗后不同时期冠层的高光谱反射率进行研究,结果表明高光谱遥感方法可以应用于水稻产量估测,其中以高光谱植被指数R990-R440、R1200-R440 的效果最佳。Jin 等[29]利用定位定向系统算法,将AquaCrop模型与光学和雷达成像数据相结合,开发了一种冬小麦产量估算方法,结果表明预测产量与实测产量之间存在高度相关性。Zhang 等[44]以农作物冠层高光谱遥感机理为基础,融合新型特征选择算法与迁移学习技术,提出冬小麦叶片叶绿素含量反演新方法。Liang 等[45]基于无人机多光谱影像构建了水稻冠层氮含量提取模型,利用该模型可以高效提取不同水稻品种在全生育期内的冠层氮含量变化曲线,进而筛选出氮高效利用的水稻品种。无人机拍摄RGB 图像基于运动恢复结构(Motion recovery structure)也可以估算农作物的冠层高度,并运用支持向量机、随机森林、逻辑回归3 种算法来验证估产的精度[46-47]。可见,利用无人机等方法获取的作物冠层结构光学数据对产量构成要素的评估具有重要应用价值。

3.3 表型组学在作物非生物胁迫研究中的应用

非生物胁迫是影响作物丰产稳产性的重要因素之一。农作物在生殖期和灌浆期对高温和干旱胁迫高度敏感,在此期间遭受胁迫会导致农作物产量显著降低[48]。Klein 等[49]使用Scanalyzer 3D 表型分析系统每隔7 d 拍摄1 次可见光和NIR波长下3 张正交图像,发现RGB 图像可以更好地识别植物形态,而NIR 图像可以揭示叶片水分含量。通过图像分析可检测到的叶片萎蔫,也可以成为水分胁迫的一个指标。Zhou 等[50]利用RGB相机、红外热像仪和多光谱相机组成的无人机成像系统,对116 个基因型的大豆生育期影像数据进行分析,通过提取归一化差异植被指数(NDVI)、绿基NDVI(gNDVI)、温度、色相、颜色饱和度、冠层大小和株高等7 个图像特征来量化冠层萎蔫状态。

另一种估算水分胁迫的方法是使用基于高光谱或多光谱图像的模型或指数。Laraswati 等[51]基于图像的表型分析方法结合选择指数和多变量分析,在短时间内轻松表征水稻形态变化,并将这种方法应用于干旱胁迫下的水稻品种筛选。利用低空无人机搭载超高清可见光相机的方式,还可高通量(5 min 约400 个小区)、高频次(每天多次采集数据)获取大田动态表型性状,突破了大田水稻干旱表型性状采集的技术瓶颈,有效提高了数据采集的效率和精准度,使田间复杂农艺性状的高通量获取和解析成为可能。

3.4 表型组学在作物生物胁迫研究中的应用

病虫害的发生也是造成作物产量损失和品质下降的重要因素之一。因此,在病虫害发生初期进行预警,对作物的丰产稳产具有重要作用。在特定的环境条件和管理措施下,早期植物密度是决定基因型发展的基本性状[52]。利用数字图像处理技术在无控制条件下识别多种植物病害是Barbedo 等提出的[22,53]。Zhang 等[54]采用可见近红外高光谱成像仪采集感染水稻白叶枯病后不同时间的叶片光谱图像,根据光谱指数简单算式的计算结果,对不同基因型水稻品种在不同染病时间的病害等级,利用光谱特征进行了快速定性评价。Guo 等[55]利用数码相机观察褐飞虱和白背飞虱取食过程中水稻幼苗的颜色变化,并通过数字图像分析法得出基于红-绿-蓝反射率和植被指数的排序方法比基于色调的饱和度和亮度的两种颜色指数更能区分品种间的损伤反应。虽然有许多成像技术可用于识别农作物病虫害,但正确使用分析这些图像并对其进行分类的算法也在整个过程中发挥着重要作用。

4 表型组学研究展望

表型组学概念提出后,已随着多组学、跨学科交叉融合技术的飞速发展,极大地促进了功能基因组学的研究。近年来,一些大型的表型组学研究装置、装备以及大数据分析平台的建设进一步推动了表型组学的发展和应用。但是目前仍存在一些尚待解决的问题,如多功能、高通量的表型鉴定平台可以获取大量的数据资料,但数据的储存和解析需要多设备和分析技术的支撑。为提高表型组学成像系统所采集到图像的质量、分辨率和维度数,已研发出大量仪器设备和分析平台,但这些仪器设备成本较高且不能同时保证多种参数的数据质量,限制其更广泛的应用[56]。因此,成像传感器、图形处理器和计算机视觉技术的不断提升,仍是未来表型组学需要不断突破的方向之一。

对表型组学来说,多元数据的综合分析可以解释一些新的生物学现象,这就要求在表型设施平台建设及数据采集方面应尽量多考虑多种类型数据的采集。由于单个传感器获取的数据特征有限,通过结合多种成像传感器或成像技术以获得更多的表型特征和更全面的数据集,从不同层面、不同尺度揭示更多常规手段难以挖掘的调控机制,从而突破单一成像技术的局限性[1]。因此,除了多组学技术的深度融合外,利用不同测量设备的组合分析,全面解析作物生长发育规律也将成为表型组学研究的发展趋势。

近地面表型平台在特定表型获取中具有极大的潜力,如车载平台、导轨式平台以及观测塔等,然而其难以完成跨区域作业,并且工作效率和时空分辨率仍受较大限制。相对于这些技术,无人机遥感平台凭借机动灵活、成本低、空间覆盖广等优势,对田间表型的获取可操作性更高,并且能够快速准确地监测田间农作物的生长变化[57-58]。无人机通过搭载可见光、高光谱、激光雷达等先进传感器,为高效获取各类植物表型数据(包括生物量、冠层覆盖度、株高、叶面积指数和氮含量等)提供了可行途径,已逐渐成为获取作物田间表型的重要手段[44-47]。因此,随着大数据存储和解析技术的提高,以无人机为代表的近地遥感高通量表型平台,将在未来作物表型尤其是株型、产量、收获指数等复杂农艺性状研究中发挥重要作用。

猜你喜欢
冠层高通量组学
六种冠层阻力模型在冬小麦蒸散估算中的应用
密度与行距配置对向日葵冠层结构及光合特性的影响
高通量卫星服务专用网络的应用模式探索
高通量血液透析治疗老年慢性肾衰竭对治疗有效率、Hb及ALB指标的影响研究
新一代高通量二代测序技术诊断耐药结核病的临床意义
高通量卫星通信综述
影像组学在肾上腺肿瘤中的研究进展
不同灌溉条件下一个春小麦重组自交系(RIL)冠层温度与产量性状的相关性
基于激光雷达的树形靶标冠层叶面积探测模型研究
东莨菪碱中毒大鼠的代谢组学