陈佳佳,仲雨晴
(1.苏州科技大学 化学与生命科学学院,江苏 苏州 215009;2.苏州市环境监测站,江苏 苏州 215012)
农业土壤重金属污染已成为世界性的环境和公共健康问题[1]。农药和化肥的过量使用、采矿、制造业和污水排放均可造成重金属污染[2-3]。农业土壤中的重金属包括两类:第一类是镉(Cd)、铅(Pb)、汞(Hg)等有毒元素,在极低浓度下即可对活细胞产生毒性;第二类是必需微量元素,如锌(Zn)、铁(Fe)、铜(Cu)和锰(Mn),在植物代谢反应中起关键作用,然而过量存在时也会阻碍其他营养素的代谢功能,对植物产生毒害作用[4]。对于植物而言,重金属中毒可导致生理、形态和结构紊乱,对生长产生不利影响。环境中的重金属可通过食物链在动植物体内积累,最终转移到人体系统,对人体健康构成威胁。
为应对重金属胁迫,植物进化出了非常复杂的免疫系统和防御机制。遭受重金属胁迫时,植物的信号转导通路首先被激活,通过信号转导级联的次级信使激活胁迫响应基因,继而进行转录调控,由RNA 控制相应蛋白的翻译,最后调控代谢物合成来维持植物体代谢平衡[5]。随着核酸序列平台、肽测序平台、质谱和生物信息学方法的进步,组学技术近年来在植物抗逆研究领域取得了长足发展,对植物金属胁迫应答的研究也深入到了基因组学、转录组学、蛋白质组学、代谢组学等水平。组学平台通过高通量方法对DNA、转录本、蛋白质、代谢物等多个层面的变化进行表征和量化,可在不同维度揭示植物耐重金属机理,为重金属应答基因鉴定、标志性代谢物及通路挖掘提供有力手段[6]。
然而,单一的组学手段并不足以描述重金属胁迫逆境下植物反应的复杂性。因此,需要整合不同组学层面的信息,理解各分子之间的调控及因果关系,构建调控网络,才能深层挖掘参与植物非生物胁迫耐受反应的关键分子。图1 展示了在植物重金属胁迫研究中应用的组学方法。
图1 多组学技术在植物重金属抗逆机制研究中的应用
笔者综述了基因组学、转录组学、蛋白质组学和代谢组学的主要技术方法及其特点,对组学技术在植物重金属应答机制研究中的应用进展进行分类介绍,并对多组学联合分析的研究思路进行展望,以期为重金属耐受植物的培育提供参考。
基因组学是研究基因组的结构、功能、进化和修饰的学科。近年来分子生物学技术的突破加快了高通量基因组测序、基因组表征和基因表达分析的速度。利用基因表达序列分析(SAGE)、表达序列标签(EST)、下一代测序(NGS)、基因组全关联研究(GWAS)等高通量方法,可以大规模、高通量地对参与重金属胁迫反应的基因进行鉴定和表征。
表观基因组在DNA 序列不改变的情况下,研究基因组的化学修饰和空间结构改变对基因功能和表达的调控[7]。表观遗传修饰包括DNA 甲基化、组蛋白修饰、染色质重塑等,这些表观遗传机制导致染色质结构的改变,从而在转录水平上调控mRNA 的积累[8]。多项证据表明,表观遗传修饰在植物应对重金属胁迫中发挥重要作用。重金属胁迫会导致许多应激响应基因编码区甲基化模式的改变,从而调节其表达。例如,在Pb、Cd 和Zn 抗性小麦中,重金属ATP 酶HMA2 和TaABCC2/3/4 金属解毒转运体的启动子区域DNA 甲基化水平显著降低[9]。TaHMA2在金属远距离转运中起重要作用,说明DNA 甲基化可通过调节重金属解毒转运蛋白的表达赋予小麦重金属抗性。除了DNA 甲基化,组蛋白修饰是重金属胁迫下植物调节基因表达的另一种适应性机制。例如,Cd 处理可诱导小麦根系中12 个组蛋白修饰基因TaHMs 的表达水平增加2.2~6.4 倍[10]。
比较基因组学是检验植物物种间基因组相似性和差异性的关键技术。通过比较基因组图谱能够了解调控植物基因组进化的模式和策略,并揭示基因组的功能区域。植物基因组因插入、缺失、重复、倒置和易位导致的改变在遗传和表型多样性研究中发挥着重要作用。数量性状基因座(Quantitative Trait Loci,QTL)定位和GWAS 是了解由多基因控制的复杂性状遗传基础的重要途径。QTL 是对性状有不同影响的多态位点,QTL 定位利用DNA 标记生成连锁图谱,识别与某些特征相关的基因组区域。然而,QTL 区域较大,所含基因众多,给候选基因的鉴定带来困难。GWAS 则基于测序和微阵列提供的植物基因组序列和遗传图谱来分析样本,能够更准确地预测和识别与有益性状相关的等位基因、基因组位点和SNP/indel,这是基于图谱的QTL 分析无法达到的。目前,QTL 定位和GWAS 已广泛用于定位植物重金属耐受相关的分子标记。
Qiao 等[11]从春小麦籽粒中鉴定获得Cd 含量相关的3 个QTL 区域,并进一步从中筛选与Cd 摄取和运输相关的候选基因。Ci 等[12]在小麦染色体4A 和5D 上发现了Cd 积累相关的2 个QTL。Ban 等[13]在小麦4BS 和6BL 染色体上发现了2 个低Cd 含量相关QTL。姚等[14]利用栽培稻与野生稻构建的双单倍体(DH)群体构建连锁图谱,共检测到11 个与硫酸铜胁迫相关的QTL。朱等[15]以粳稻和籼稻杂交获得的重组自交系群体为材料,检测到9 个耐金属离子胁迫的QTL,对这些QTL 区间内与耐金属离子胁迫的候选基因定量分析,发现4个基因在双亲间的表达量差异显著。林等[16]以籼粳交DH 群体为材料,发现8 个耐4 种金属离子(Fe2+、Cd2+、Al3+、Na+)胁迫的QTL。Pan 等[17]在水稻品系中通过GWAS 鉴定出35 个与Cd 积累显著相关的QTL。Guttieri等[18]利用GWAS,在硬粒小麦5BL 上Cdu1 位点同源区域的5AL 上发现了Cd 积累相关的SNP。除此以外,GWAS 在玉米、高粱和谷子等粮食作物上均已成功完成。
组学技术的另一个分支是转录组学,其研究对象为细胞或生物体中转录本的全部集合。与基因组不同,转录组是高度复杂和动态的,并具有时空特异性。转录组学采用多种方法对基因表达水平进行定量分析,如DNA 微阵列、SAGE 或基于下一代测序的高通量技术,如RNA 测序(RNA-seq)和数字基因表达(DGE),从而对特定表型相关的基因转录本或RNA 进行精确描述。
转录组分析已被广泛应用于比较重金属胁迫条件下耐受基因型和敏感基因型之间转录水平的差异,从而实现胁迫耐受相关基因的鉴定[19]。Beyene 等[20]通过RNA-seq 分析,在铁胁迫的小麦根系中鉴定出5 654 个差异表达基因,其中编码金属转运体和ABC 转运体的基因占主导地位,并发现谷胱甘肽在铁胁迫下参与小麦的转录和酶活性水平。玉米根系的基因组表达谱分析[21]揭示了响应铅胁迫的重要转录本,发现4 000 多个基因受到差异调控,基因产物与细胞过程和信号传导有关。Zhang 等[22]采用比较转录组学方法分析了Cd 抗性和敏感性的小麦的Cd 解毒机制。Cd 抗性株中,编码谷胱甘肽、抗坏血酸和过氧化氢酶活性的转录物积累,过氧化物酶和超氧化物歧化酶的表达水平较低。Zhou 等[23]通过RNA 测序,在高Cd 积累型小麦中发现了399个Cd 诱导的差异表达基因,主要通过参与苯丙素生物合成和谷胱甘肽代谢响应Cd 胁迫。
除了mRNA 外,转录组学也可用于研究生物体中非编码RNA,如微小RNA(microRNA)和长链非编码RNA(lncRNA)的差异表达。
2.2.1 microRNA 表达谱分析
microRNA 是长度约为21 个核苷酸的小分子非编码RNA,可通过抑制或降解转录物来负向调节其靶基因[24]。转录组学可用于评估microRNA 及其下游靶标在应对重金属胁迫时的表达变化。Qiu 等[25]通过RT-PCR检测microRNA 表达谱,发现在Cd 胁迫下小麦幼苗的根和叶中5 种microRNA 及其靶基因存在差异表达。其中miR398 通过调节其靶基因CSD 参与小麦Cd 胁迫,从而影响小麦对氧化胁迫的耐受。Zhou 等[23]用Cd分别处理低Cd 积累和高Cd 积累两个小麦品种,同时鉴定获得差异表达的microRNA 和mRNA,通过表达相关性分析发现,microRNA 可以调控重金属ATP 酶(HMA)的表达。Zhou 等[26]的另一项研究发现,低Cd 积累小麦中差异表达的microRNA 调控的靶基因富集在PI3K-Akt 信号通路中,而高Cd 积累型中差异microRNA调控的靶基因与碳水化合物消化和吸收途径相关。
2.2.2 lncRNA 表达谱分析
lncRNA 是一类长度超过200 个核苷酸的RNA,作为各种发育过程和胁迫反应的生物调节剂,在转录、转录后和表观遗传水平中发挥着重要的调控作用。lncRNA 可靶向各种应激反应mRNA、转录因子调控基因以及microRNA,在植物胁迫应答中起着重要作用。
最近研究发现,lncRNA 参与调控重金属进入植物系统的吸收过程。Feng 等[27]通过RNA-seq 鉴定了甘蓝型油菜中镉响应的lncRNA,发现了镉响应microRNA 的内源性靶标类似物。利用qRT-PCR 对其中3 个lncRNA 进行功能验证表明,它们和参与Cd 摄取与解毒的3 个mRNA 具有序列相似性,可竞争性结合miRNA,从而提高相应mRNA 的表达。Liang 等[28]使用RNA 测序对水稻lncRNA 进行了全基因组分析和功能鉴定,发现Cd 诱导的差异lncRNA 参与调控半胱氨酸和蛋氨酸代谢相关靶基因。
蛋白质组学是对细胞、器官或物种在特定时间点上存在的整个蛋白质序列的研究和表征。由于蛋白质的翻译后修饰会影响蛋白质的实际功能,因此蛋白质组比DNA 标记物和转录组更能准确地反映细胞内的实际状态。
传统的蛋白质组学分析方法主要为凝胶电泳法,如二维电泳(2-DE)和凝胶内差异电泳(DIGE)。多维蛋白鉴定技术(MudPIT)是一种非凝胶的蛋白质组分析方法。质谱(MS)方法包括液相色谱-MS(LC-MS)、离子阱-MS(IT-MS)、基质辅助激光解吸/电离-MS(MALDI-MS)等技术。最近开发的荧光团标记的蛋白质免疫沉淀和无标记的基于质谱的定量方法,在鉴定低丰度信号和调节蛋白复合物方面可达到更高的精度。激光捕获显微解剖(Laser-Capture Microdissection,LCM)可用于鉴定组织和细胞特异性蛋白质,这些蛋白质在作物对环境胁迫的反应中起着至关重要的作用。在调节植物对环境胁迫的反应过程中,磷酸化和糖基化等翻译后修饰起着关键作用[29],蛋白质磷酸化位点可通过基于质谱的磷酸化蛋白质组学技术、固定化金属亲和层析(IMAC)进行分析。特定激酶结构域的变化则可通过SILAC 和iTRAQ 进行检测。
蛋白质是植物应激反应的主要关键调节因子,可作为环境胁迫下的生物标志物,蛋白质组学分析已在重金属胁迫的植物研究中得到广泛应用。Jian 等[30]发现Cd 胁迫诱导小麦产生多种蛋白质,主要参与抗氧化过程、重金属解毒和谷胱甘肽代谢途径。此外,Cu 胁迫诱导小麦根和叶片中蛋白质组显著变化,参与信号转导、胁迫防御和能量产生的蛋白质显著增加,而参与蛋白质代谢、碳水化合物代谢和光合作用的蛋白质严重减少[31]。Cr 胁迫下玉米叶片蛋白质组分析发现,Cr 诱导的差异表达的蛋白主要参与ROS 解毒和防御反应[32]。
代谢组是指机体细胞、组织或器官内所有内源性低分子量(<1 000~1 500 D)的化合物。植物界约有20 万~100 万种不同的代谢物,其种类、理化性质、化学结构和极性水平各不相同。作为基因和蛋白质的下游产物,代谢组是连接表型和遗传信息的纽带,对生物体的生理状况起着决定作用。代谢组学旨在对代谢组进行定量、定性和动态研究。
代谢组学分析常用的分离技术包括气相色谱(GC)、液相色谱(LC)和毛细管电泳(CE)。检测技术包括质谱(MS)、光谱、核磁共振(NMR)和电化学方法。分离与检测技术的结合产生了一系列不同的代谢组学研究平台,如LC-MS、GC-MS、LC+UV、CE-MS 等。新型代谢组学分析技术,如傅里叶变换离子回旋共振MS、基质辅助激光解吸/电离MS 成像(MALDI-MSI)、离子迁移率光谱MS(IMS-MS)的进步,为植物代谢物的研究提供了更精准的研究手段。
近年来,许多研究对代谢产物的变化进行定性和定量分析,从代谢组学的角度分析植物耐受重金属胁迫的机制,主要包括降低重金属吸收、重金属螯合、抗氧化防御、清除自由基等。
细胞壁是植物接触重金属的第一个结构,主要成分包含木质素和低聚果糖。木质素大量存在于根内皮层细胞壁中,可作为屏障来控制细胞体对水和矿物质的吸收,并且影响营养矿物质的积累和转运。低聚果糖包含多糖,能够结合二价和三价的重金属离子。因此,植物体通过改变细胞壁的成分来促进重金属阳离子结合至细胞壁,从而减少自身对有毒金属的吸收。例如,在Cd 胁迫条件下,小麦中半纤维素和果胶的积累增加,有助于提高根细胞壁结合Cd 的能力[33]。在白菜叶片和根系中,铜和铁离子胁迫导致硫代葡萄糖苷、羟基肉桂酸以及碳水化合物的积累[34],推测糖解/糖异生途径通过抑制Cd 摄取来减轻Cd 毒性。针对低镉和高镉积累基因型甘蓝油菜的代谢组学[35]比较发现,高Cd 积累型油菜中木质素高表达,说明木质素可作为物理屏障阻止Cd 进入植物体。此外,Cd 诱导植物甾体、单萜和类胡萝卜素表达上调,用于清除胁迫产生的超氧阴离子自由基。吲哚乙酸IAA 显著减少,由于IAA 能促进植物对重金属的吸收,其表达水平降低减少了植物的Cd 摄取。
植物代谢产生的天然植物螯合素如有机酸等,可以结合自由移动的重金属离子形成螯合物,从而降低毒性作用。Xie 等[36]对镉胁迫下苋的代谢组研究证明了植物螯合素与重金属的关系,结果表明,高Cd 胁迫下的12 种氨基酸类植物螯合素含量均有所增加。
此外,抗氧化防御机制在高等植物对重金属的耐受和富集中具有重要作用。植物的很多次生代谢产物具有抗氧化功能,能够清除重金属诱导的活性氧基团(ROS)。Lai 等[37]利用代谢组分析发现Cd 诱导紫色甘薯根中色氨酸和谷胱甘肽显著表达。色氨酸和谷胱甘肽都是酶促抗氧化剂的辅助因子,也可以直接猝灭ROS并调节与生物和非生物应激反应相关的基因表达。同样,Keunen 等[38]证实了谷胱甘肽(GSH)诱导的抗氧化防御在拟南芥抗Cd 胁迫中的重要作用。水培向日葵根和叶片的代谢组学[39]显示,Cr 胁迫诱导产生具有抗氧化活性的萜类物质。常见重金属胁迫下植物差异表达的代谢物见表1。
表1 重金属胁迫下差异表达的植物代谢物
组学方法的最新进展产生了大量数据,然而,单一组学数据不足以理解植物胁迫反应的复杂性。多组学数据整合将降低使用单一数据产生的假阳性结果,有助于精准理解复杂的胁迫反应。如何全面地注释、整合和建模来自不同组学层面的高通量数据是交互式组学的最大挑战之一。数据整合的关键在于构建可用于预测复杂特征并提高预测精度的模型。预测表型的相关统计模型主要包括线性和非线性模型。线性模型如基因组最佳线性无偏预测(GBLUP)、线性混合模型(LMM)、贝叶斯稀疏线性混合模型(BSLMM)、惩罚线性混合模型和广义矩估计方法(MpLMMGMM)模型,已被广泛用于多组学数据建模。机器学习(ML)则是一种非线性的建模方法,同时使用有监督和无监督学习编程范式,从复杂大数据中进行统计推断。处理多组学数据时,可使用主成分分析(PCA)和DIABLO 进行数据集成分析,从而推断不同组学层分子之间的相互联系,发现关键生物过程、调控因子和生物标志物[41]。
组学实验产生的高通量数据需要大量的计算资源进行存储和分析,近年来综合组学数据库应运而生。Gramene 数据库[42](http://www.gramene.org)是一个作物和模式植物物种的功能基因组学数据库,收录了基因、蛋白质、microRNA、sRNA、代谢物、分子标记和表型信息等信息,同时还提供了多组学数据集信息的集成。WheatGmap 数据库[43](https://www.wheatgmap.org)集成了多种绘图模型和大量公共数据,如全基因组测序(WGS)、全外显子组测序(WES)和转录组深度测序(RNA-seq)数据集,为小麦抗逆功能基因组学研究提供了丰富的信息。
此外,基于网络的分析服务器和高通量数据分析平台也不断涌现,如PaintOmics[44]、KaPPA-view[45]、COVAIN[46]和O-miner[47]、3Omics[48]、MiBiOmics[49]、VANTED[50]和IOMA[51]。这些组学分析工具均具有用户友好的使用界面,并可用于整合来自不同方法的组学数据。PaintOmics[44]是一个基于网络的服务器,利用生物通路图实现多组学数据集的整合。PaintOmics 可将转录组学和代谢组学数据中关键的差异基因或代谢物映射到KEGG 通路,从而对多组学数据进行可视化分析。KaPPA-view[45]工具则针对用户提交的定量转录组和代谢组信息,在植物代谢通路图上对关键转录本和代谢物进行注释。COVAIN[46]是一个基于MATLAB 的图形用户界面工具,可针对代谢组、基因组、蛋白质组和转录组等不同水平的组学数据进行数据预处理、单元或多元统计分析、通路映射、相关网络拓扑分析和可视化。O-miner[47]也是一个基于WEB 的组学分析工具,可自动处理大型复杂的转录组、基因组和甲基组数据集,识别显著改变的信号通路和新型生物标志物和靶点。3Omics[48]通过相关性网络、共表达、通路富集和GO(基因本体)富集,可快速整合多个转录组、蛋白质组和代谢组数据,并生成组间相关性网络,将具有时空特异性的转录本、蛋白质和代谢物之间的数据关系可视化。MiBiOmics[49]是一个基于网络的独立应用程序,实现了多组学数据的可视化、集成和分析,基于组学网络来挖掘复杂的生物系统,并识别与特定表型相关的可靠生物标志物。VANTED[50]软件基于图形标准将不同层次组学数据进行网络集成并可视化,可实现对组学数据的功能注释和直观分析。IOMA[51]平台是一个综合组学和代谢分析平台,可以定量地将蛋白质组学和代谢组学数据与基因组水平的代谢模型相结合,以更准确地预测代谢通路分布。总之,多组学整合分析可以实现生物系统的多尺度表征,有助于全面理解胁迫耐受相关的复杂调控网络。
植物重金属胁迫的组学研究领域近来获得了长足发展,加深了对于植物耐受重金属响应机制的理解。然而对于高度复杂的植物胁迫应答调控网络,目前的认识远远不够。随着组学分析技术的进步,多组学数据库的建立,数据挖掘和建模方法的完善,有望将来自不同组学的数据源进行整合分析,从而构建跨层次的分子互作用关系网络。多组学整合未来在植物研究中会得到更加广泛的应用,为重金属胁迫分子标记的鉴定、代谢通路解析提供重要的参考依据,也为组学辅助育种开辟一条新的途径。