郭凤丹+王兴军+侯蕾+赵术珍+厉广辉+夏晗
摘要:代谢组学是一门新兴的交叉学科,是系统生物学的重要分支,目前已被广泛应用于动物、植物、微生物等研究领域。本文简要介绍了代谢组學的检测技术及数据处理方法,概述了代谢组学在植物代谢途径以及代谢组遗传基础研究中的进展,包括不同植物材料、不同环境条件尤其是逆境胁迫下的代谢谱分析以及代谢相关QTL定位、功能基因鉴定等,分析了代谢组学发展过程中的问题,并对其应用前景进行了展望。
关键词:植物;代谢组学;研究方法;代谢谱;遗传基础;进展
中图分类号:S188:Q781文献标识号:A文章编号:1001-4942(2017)12-0154-09
Abstract Metabolomics is an important branch of system biology and has been widely used in studies of plants, animals and microorganism. In this article, the detection technologies and data processing methods of metabolomics were introduced briefly. The research progresses of metabolomics in understanding plant metabolic pathways and genetics of metabolome were summarized, including metabolic profiling of different plant materials under different environmental conditions especially the stress conditions, mQTL mapping and identification of functional genes. The problems present in the metabolomics studies were also discussed, and the prospective application metabolomics was previewed.
Keywords Plant; Metabolomics; Research method; Metabolic profiling; Genetic basis; Progress
近年来,组学技术成为探索生命奥秘的重要手段,继基因组学、转录组学和蛋白质组学之后,代谢组学也迅速发展起来,成为系统生物学的一个重要组成部分。它旨在对生物体组织或细胞特定时期下的全部小分子代谢物质进行定性和定量分析,主要反映生物体的生理和生化状态[1]。传统的代谢概念包括合成代谢和分解代谢,代谢产物也包括中间代谢产物和最终代谢产物,因此广义上的代谢物应包括所有参与生物体内生命活动的分子。但为了有别于基因组、转录组和蛋白质组,代谢组目前只涉及相对分子质量约小于1 000 D的小分子代谢物质[2]。
随着现代分析技术的不断改进、数据库的积累和生物信息学的发展,代谢组学得到快速发展,已被广泛应用于动物、植物和微生物等诸多研究领域[3]。植物内源代谢物种类繁多,总数有20万~100万种[4],对生命过程中这些代谢物进行全面的定性定量研究,对于后基因组时代全面认识植物生命活动十分必要[5]。代谢组学旨在发掘生命现象的分子结果,丰富组学研究内容,通过与其他组学技术整合,将生命过程和结果有机结合分析,在功能基因鉴定、代谢途径解析及自然变异的遗传结构分析等方面发挥着越来越重要的作用。本文简要综述了代谢组学研究方法及在植物代谢规律和遗传基础研究中的进展。
1 植物代谢组学研究方法
植物代谢组学分析一般包括试验设计、植物栽培及取样、样品制备和预处理、代谢产物的分离和鉴定、数据的分析和解释。由于植物代谢物尤其是次生代谢物种类繁多、结构迥异,根据研究对象及目的不同,代谢组学分析的具体步骤会有所不同,采用的分离鉴定手段及数据分析方法也会各不相同。
植物代谢物的种类和含量除受遗传及环境因素影响外,还与样品的提取制备过程关系紧密。为了获得稳定的试验结果,样品制备需要考虑试验材料的生长、取样的时间和地点、取样量及样品的处理方法等问题。为真实反映代谢产物在植物体内的存在信息,采集样品后需立即阻断材料内在酶的活性,通常采用冷冻/液氮降温法保存材料,抑制代谢反应的进一步发生,待使用时取出均质粉末[6]。代谢产物提取和分离的方法要根据目标组分的分子结构、溶解性、极性等理化性质以及所选用的分析技术进行选择,通常选用的萃取溶剂为水或甲醇、乙醇、异丙醇、氯仿、乙腈、己烷等溶剂。在代谢物分析之前,通常先用固相萃取、固相微萃取、亲和色谱等方法进行预处理[7]。
代谢组分析技术包括代谢物的分离、检测及鉴定。目前,代谢产物的分离技术主要有气相色谱(gas chromatography, GC)、液相色谱(liquid chromatography, LC)和毛细管电泳(capillary electrophoresis, CE)等。检测及鉴定技术主要有质谱(mass spectrometry, MS)、核磁共振(nuclear magnetic resonance, NMR)、库仑分析、傅立叶变换-红外光谱(FT-IR)、紫外吸收、荧光散射、发射性检测和光散射等。分离技术与检测技术的不同组合就形成了不同的代谢组学分析技术。目前,常用分析手段是核磁共振,气相色谱、液相色谱、毛细管电泳与质谱联用等。
针对代谢物组学分析技术,2010年之前主要瓶颈在于可以鉴定的代谢物种类较少,通常在100种以内,这就使组学价值大打折扣。随着技术发展,现在的代谢组学实测可以达到300种代谢物以上。迄今,还没有一种代谢组学分析方法能够涵盖所有的代谢物,多种分析平台联合使用是对单一分析技术的补充,以达到对不同极性代谢物的广谱分析。
针对核磁共振技术新开发的魔角旋转(magic anglespinning,MAS)[8]、磁共振成像(magnetic resonance imaging, MRI)和活体磁共波谱(vivo magnetic resonance spectroscopy, MRS)[9]等技术进一步促进了核磁共振在材料活体部位代谢组分析中的应用。质谱技术有直接进样和色谱-质谱联用两种方式。傅立叶变换-离子回旋共振-质谱(fourier transform-ion cyclotron resonance-mass spectrometry,FT-ICR-MS)、飞行时间质谱(time of flight-mass spectroscopy,TOFMS)、轨道阱质谱(orbitrap)等适合于直接进样的质谱分析技术得到了发展,在未知化合物的确定上发挥了很大作用[10]。另外,电喷雾萃取电离(extractive electrospray ionization, EESI)、实时直接分析(direct analysis in real time, DART)、解析电喷雾离子化(desorption electrospray ionization, DESI)等新型离子化技术的发展也促进了直接进样质谱在代谢组学中的应用[11]。针对色谱-质谱联用技术,二维气相色谱(GC×GC)-质谱(MS)联用[12]和二维液相色谱(LC×LC)-质谱(MS)联用技术[13]提升了代谢物分离效率,增加了峰容量,提高了检测灵敏度,从而扩展了代谢谱的分析范围。亲水相互作用色谱(hydrophilic interaction liquid chromatography, HILIC)技术的出现改善了强极性和强亲水性小分子物质的分离状况,已广泛应用于代谢组学研究[14]。此外,微流体色谱(microfluidics)和超临界流体色谱(supercritical fluid chromatography, SFC)等新型色谱技术以其强大的分辨能力,将进一步促进代谢组学研究的发展[15,16]。
代谢组学通过仪器分析得到的数据是一个庞大的多维矩阵,为了充分获取数据中的潜在信息,常用化学计量学中的模式识别方法对原始数据进行降维和归类处理,将其转变为适合多变量分析的数据形式。常用的模式识别方法主要有无监督方法(unsupervised method)和有监督方法(supervised method)两种。无监督方法应用最多的有主成分分析(principal components analysis, PCA)、自组织映射(self-organizing mapping, SOM)、非线性映射(non-linear mapping, NLM)、系统聚类分析(hierarchical cluster analysis, HCA)等。有监督方法主要包括偏最小二乘法(partial least squares, PLS)、线性判别分析(linear discrimination analysis, LDA)、偏最小二乘法-判别分析(PLS-DA)和人工神经元网络(artificial neural networks, ANN)等。
代谢组学建立数学模型的目的是为了从海量数据中提取有用的生物信息,筛选出在生理、病理或逆境响应中重要的生物标记物。而获取信息的前提是利用生物信息学对未知代谢物进行结构鉴定或注释[17]。近年来,建立了一系列公共代谢组学数据库资源,如MassBank (http://www.massbank.jp/)、KEGG COMPOUND (http://www.genome.jp/kegg /compound/)、KNApSAcK (http://kanaya.naist.jp/KNApSAcK/)、Plant metabolome database (PMDB) ( http://www.sastra.edu/scbt/pmdb/)、LipidMaps (http://www.lipidmaps.org/),以及整合了四大小分子数据库KEGG、HMDB、Lipid Maps、BioCyc的新的统计分析程序MetaboLyzer[18]。
尽管目前国内外在代谢组学研究平台及技术开发方面取得了不少进展,但仍无法满足代谢组学研究的需要,还需继续开发高效可靠的研究方法及技术手段。
2 植物代谢组学研究进展
植物代谢物分为两大类,初生代谢物和次生代谢物。初生代谢物为维持植物生长发育和生命活动所必须,次生代谢物则更多地参与植物抗病、抗逆等环境因子应答。在植物生长发育过程中,任何内外因素的影响都可能引起植物代谢物含量或代谢流的变化。由于代谢物处在植物系统生化活动的末端,反映的是已经发生的生物学事件,所以相对于其他组学,代谢组学更能反映植物体的生理和生化状态,因此被越来越广泛地应用于植物生物学及相关领域的研究中。代谢组学在植物中的应用主要集中在两个层面,一是代谢谱分析,包括不同基因型、不同生态型植物的代谢产物比较,代谢途径研究,不同环境条件对代谢物的影响以及抗逆代谢组学研究等;二是遗传代谢组学(genetical metabolomics),即用来解析植物代谢的遗传基础,包括代谢相关QTL定位、功能基因鉴定及代谢途径解析等。
2.1 不同植物材料的代谢组分析
对不同基因型材料间尤其是突变体或基因改造植物与野生型材料间的代谢产物进行比较,对于筛选优良品种或基因、评价基因改造效果及进行功能基因组学研究有重要意义。Mumm等[19]采用6个代谢组学平台对31种不同基因背景及來源稻米的代谢产物进行检测,发现茉莉香米(jasmine)和印度香米(basmati)存在代谢上的差异,对于解释稻米改良育种过程中稻米质量、生化组成和基因型之间的潜在联系提供了新的研究思路,并为稻米品种改良提供种质材料及技术路线。为了解稻米直链淀粉含量与米粒外观、淀粉颗粒结构等表型特征的关系,Kusano等[20]采用基于质谱的代谢组学对五种不同直链淀粉比例的粳稻和两种基因敲除突变体粳稻的代谢物变化进行分析,为水稻育种相关代谢性状及其潜在遗传基础研究提供了有用信息。Chen等[21]利用GC/LC-MS对拟南芥硫苷合成酶基因CYP79F1的两个RNAi株系进行代谢组学分析,发现一些氨基酸、糖类、多肽和激素等代谢产物发生变化,同时通过蛋白质组学分析对结果进行验证,两组数据对于进一步了解拟南芥硫苷代谢的分子调控网络及后续增强植物抗性和质量奠定了基础。
除了不同基因型,利用代谢组学技术对同一植物不同发育时期或不同组织器官的代谢物种类和含量进行研究也具有重要意义。Aharoni等[22]采用FT-MS对草莓果实成熟过程中一系列代谢产物的动态变化过程进行非靶向代谢组学分析,从而对草莓的成熟机制有了进一步了解。Park等[23]采用GC/MS方法对不同栽培年限的人参根部样品进行代谢组学分析,结果显示,人参环氧炔醇(panaxydol)和人参炔醇(panaxynol)含量随栽培年份增加而升高,可以作为鉴别人参年限的关键组分。贾岩等[24]采用基于NMR的代谢组学技术对不同发育阶段的款冬花(Tussilago farfare)次生代谢物的合成规律进行分析,并联合高通量转录组学筛选关联酶基因,为款冬花次生代谢物的生物合成调控研究奠定了基础。Ahmad等[25]采用GC/MS对马来西亚重要的油料作物小蓼(Polygonum minus)根茎叶中的挥发性代谢组分进行分析,发现癸醛和月桂醛是其香气的主要贡献者,且三帖化合物在叶中大量富集,为小蓼挥发性组分植物化学谱(phytochemical profiles)的研究奠定基础。
2.2 不同生境下植物代谢组研究
植物代谢过程尤其是次生代谢过程及代谢物的富集受环境中各种生物和非生物因素的影响,利用代谢组学研究不同生境下植物代谢产物的差别,不仅能够深入了解植物与环境的相互作用,還能揭示植物表型与生长发育及生物多样性的关系。这类研究常用于药用植物鉴别和质量控制。
我国药材种类繁多,来源复杂,中药基原品种的真伪、正宗与否,直接关系到药材疗效,即使同一种药材,产地及自然条件不同,药材的产量和质量也不相同,临床疗效也有较大差异,因此有“道地药材”的说法。代谢组学分析可广泛应用于中药基原品种鉴定及不同生态型不同产地药材的品质鉴定与质量控制。传统中药柴胡有两种来源,分别是柴胡Bupleurum chinense D.C.和狭叶柴胡B. scorzonerifolium Willd.,俗称“北柴胡”和“南柴胡”,传统的色谱分析方法均不能对两者进行准确区分,Qin等[26]采用基于1H-NMR的代谢组学找到了区分两个种的标志物,体现了1H-NMR代谢组学在中药种类鉴别及质量评价中的独特优势。沙棘是典型的多基原藏药,刘悦等[27]采用1H-NMR代谢组学结合DNA条形码技术发掘了3种沙棘遗传和生化特征的差异性,能对3种沙棘进行准确鉴定。韩正洲等[28]采用UPLC-Q-TOF/MS技术对栽培型和野生型野菊花的整体代谢物组成进行比较分析,发掘了可以区分两种野菊花的特征性化学成分,为其质量评价提供了有效手段。郑文等[29]采用UPLC-Q-TOF/MS技术对不同产地来源的虫草化学成分进行鉴定分析,发现不同产地的虫草在有效成分种类和相对量上存在一定差异,其中西藏产的虫草质量最高,说明代谢组学技术可用于虫草药材的真伪、产地、品质等的评价。另外,由于药用植物的活性成分多为次生代谢产物,基于次生代谢和生态环境的密切相关性,有学者提出通过选择具有一定环境压力的次适宜生态环境来解决药用植物栽培中生长和次生产物累积的矛盾的观点[30-32]。利用代谢组学研究药用植物次生代谢产物的合成累积机制及其影响因素,对于指导药材栽培、提高药效成分含量具有重要意义。
2.3 逆境胁迫下植物代谢组研究
凡是对植物生长发育不利的环境条件统称为逆境或胁迫。植物在长期进化过程中,在生长习性、生理、代谢等方面逐渐形成了各种应对逆境胁迫的适应对策。植物对逆境胁迫的耐受性和敏感性是一个复杂的生物过程,其中最重要的是代谢的改变,即植物通过调节代谢网络以诱导产生一系列特殊代谢物,从而达到对生物、非生物胁迫的防御作用。对植物尤其是农作物的抗逆生理及分子机制已经有大量研究,但对植物如何响应各种逆境胁迫依然缺乏深入系统的了解。代谢组学可以通过监测植物体系受到胁迫或刺激后代谢产物的变化来揭示胁迫环境下植物的应答机制,是植物抗逆研究很好的途径。因此,代谢组学已成为研究植物逆境胁迫下代谢途径变化和耐受机理的重要手段[33]。代谢组学与其它组学技术(基因组学、转录组学、蛋白质组学)的整合,更有助于人们从整体上把握植物胁迫应答机制。
干旱是限制植物生长发育的重要环境因子,也是目前制约农业生产的全球性问题。Urano等[34]采用GC/TOF-MS和CE-MS方法对野生型拟南芥和NCED3基因(ABA合成相关基因)敲除突变体(nc3-2)在干旱胁迫下的代谢变化进行了分析,发现干旱胁迫下nc3-2突变体中有46种代谢物上调,野生型中有61种上调。与野生型相比,突变体中一些受ABA调控的代谢物增幅较小,如缬氨酸、亮氨酸、异亮氨酸、葡萄糖、果糖及乙醇胺等;另一方面,一些不受ABA调控的代谢物增幅较大,如棉子糖、柠檬酸盐、丙氨酸等。这些结果为探究干旱胁迫下植物代谢分子机制提供了新数据。
Fumagalli等[35]利用1H-高分辨率魔角旋转(1H-high-resolution magic angle spinning, HR MAS)和NMR对两个水稻栽培品种(Arborio和Nipponbare)在干旱和高盐胁迫下的代谢组学进行研究,地上部和根部试验结果表明,Arborio幼苗对两种非生物胁迫较Nipponbare更敏感。PCA分析显示氨基酸和糖类在胁迫条件下显著积累,其中,Arborio幼苗的积累量较Nipponbare高,两栽培品种间存在明显差异。
Nam等[36,37]以野生型水稻Hwayoung和过表达AtCYP78A7基因(编码细胞色素P450蛋白)的耐旱转基因水稻为材料,利用1H-NMR和GC平台分别对其地上部和籽粒在不同水分环境下的代谢组进行分析。在不同生长阶段(分蘖期、抽穗期和成熟期)不同基因型水稻均能被很好地区分,土壤水分条件在一定程度上影响水稻代谢组。在抽穗期,两基因型间由于糖类含量不同形成的明显区分只在水分缺失条件下出现,说明水稻基因型对代谢组的影响受生长阶段和水分条件的限制。籽粒代谢组结果显示,正常浇水和干旱条件下不同基因型的水稻均能得到很好区分,基因型的不同导致了氨基酸和糖类水平的差异。与野生型水稻相比,在转基因水稻中,干旱条件显著提高了籽粒γ-氨基丁酸、果糖、葡萄糖、甘油、甘氨酸和乙醇含量。这些代谢物的变化可能通过一些胁迫响应通路起作用来提高转基因水稻的耐旱能力。
土壤中可溶性盐分过多对植物造成危害称为盐害或盐胁迫。我国土壤盐渍化现象严重,盐渍土面积大、分布广、类型多,对植物尤其是农作物耐盐机理的研究具有重要意义。Johnson等[38]以两种对盐胁迫敏感程度不同的番茄株系Edkawy和Simge F1为材料,利用傅立叶变换-红外光谱和化学计量学方法对果实的代谢指纹图谱进行分析。有监督的DFA分析方法能够区分两种基因型对照和高盐处理组的果实;采用遗传算法(genetic algorithms, GA)鉴别应答盐胁迫潜在的重要功能物质,包括饱和及不饱和腈化物、含氰化合物、氨基自由基和含氮化合物等。Gong等[39]利用GC-MS和生物芯片技术研究了耐盐植物盐芥(Thellungiella halophila)和拟南芥在盐胁迫下代谢物的差别。与拟南芥相比,盐芥在无盐和高盐环境中均具有较高的代谢水平;在150 mmol/L NaCl处理下,盐芥的代谢响应更为复杂,糖类、糖醇、有机酸和无机离子等的代谢水平均较拟南芥高。
Widodo等[40]对耐盐性不同的两种大麦(Hordeum vulgare)Sahara和Clipper在盐胁迫下的代谢反应分析显示,盐敏感型大麦Clipper中包括脯氨酸和γ-氨基丁酸等氨基酸以及聚胺腐胺的含量升高,这些代谢产物的积累与植株的缓慢生长和叶片坏死率有关;而在耐盐型大麦Sahara中,己糖磷酸、三羧酸循环中间体及参与细胞保护的代谢物含量均升高,推测其与Sahara叶片的细胞保护和对高Na+的耐受有关。Shelden等[41]同样对Sahara和Clipper应对盐胁迫的代谢差异进行了研究,不同处在于其是以大麦根尖的根冠/细胞分裂区、伸长区和成熟区三个结构区为研究对象,鉴定了76个已知的差异代谢物,从组织和细胞水平增强了对植物耐盐机制的理解。Wu等[42]比较了野生型大麦和栽培大麦在盐胁迫下的代谢差异,结果显示,渗透调节是大麦应对盐胁迫的基本机制,野生型大麦耐盐性较强、生长较快,在盐胁迫下,其叶绿素和相容性溶质含量相对较高,而栽培种主要通过增加糖酵解和能量消耗来应对高盐胁迫。
Richter等[43]利用GC-MS技术对耐盐性不同的两个玉米杂交种在盐胁迫下的代谢组进行分析,结果显示,耐盐品种中葡萄糖、果糖和蔗糖的积累增强了其对盐胁迫的适应能力。Yang等[44]对普通野生大豆和耐盐野生大豆在盐碱胁迫下的代谢组进行比较研究,发现耐盐品种中绝大部分有机酸和脯氨酸的含量增加,TCA循环在普通大豆中增强,在耐盐大豆中反而减弱,说明普通大豆的耐盐机制是通过增强TCA循环产生更多ATP来应对逆境条件,而耐盐品种可能通过调节氨基酸及有机酸合成来产生更多相容性溶质。
除了干旱和盐碱胁迫,极端温度、金属离子污染等也会对植物生长产生不利影响。Jin等[45]对耐寒性不同的两个烟草品种K326和CB-1在冷胁迫下的代谢组进行分析,GC-MS和LC-MS检测到200个差异代谢物,其中,氨基酸和糖类如葡萄糖、果糖、肌醇等在耐寒品种K326中有较高的积累量,此外,一些次级代谢产物在两品种中的积累量也不同。
代谢组学在植物遭受生物胁迫的研究中也得到广泛应用。Scandiani等[46]以抗病能力不同的两种大豆NA 4613 (敏感型)和DM 4670 (部分抗感染型)为材料,对南美大豆猝死综合症病菌(Fusarium tucumaniae)感染早期的根系代谢组进行研究,结果显示,接种后7天,一些氨基酸和多胺类物质在感病品种中有较高积累量,利用这些特征能够将两品种进行区分。
2.4 植物代谢组的遗传基础研究
代谢组学已经被广泛应用于植物代谢组的遗传基礎研究及代谢相关功能基因鉴定中。植物组织中的代谢物水平作为代谢性状(m-traits),往往也是受多基因控制的数量性状,因此,可以运用数量性状座位(quantitative trait loci, QTL)作图对各种代谢物含量进行遗传分析[47]。大多数代谢性状的遗传学基础研究材料都是通过杂交或回交获得的连锁群体。
为了研究植物代谢与生物量积累的关系,Meyer等[48]以拟南芥重组自交系(RIL)群体为材料,对其初生代谢物进行QTL分析,共检测到84个代谢物的157个QTLs和6个生物量相关QTLs。Matsuda等[49]为了揭示水稻籽粒代谢表型的遗传背景,对水稻回交群体进行了大规模的代谢物QTL(mQTL)分析,共鉴定出759个代谢物的802个mQTLs。其中,大部分代谢物积累水平的广义遗传力较低,对环境因子较为敏感,如糖类和氨基酸,而一些次级代谢物如黄酮类化合物的广义遗传力较高。进一步通过连锁分析对黄酮合成途径中的糖基转移酶基因进行了分析。Li等[50]以粳稻(Lemont)和籼稻(特青)的重组自交系群体为材料,利用代谢组学结合生长测定来定位QTL从而对其初级代谢物的遗传变异进行研究,结果显示,水稻初级代谢物的广义遗传力较低,绝大多数mQTLs只有小到中度的效应,两个代谢相关的QTL热点对富含碳氮的代谢物有着相反的作用,表明他们可能影响碳氮代谢平衡。
Gong等[51]以一个有高密度SNP图谱的水稻重组自交系群体[52]为研究对象,对其剑叶和发芽种子进行代谢组分析及mQTL作图,共鉴定出900个代谢物的超过2 800个mQTLs。对mQTLs的全基因组分布研究显示,代谢物的遗传调控存在明显的热点区域,利用数据挖掘技术从部分精度较高、遗传效应较大的位点中鉴定获得24个控制代谢物水平的候选基因。通过mQTL遗传互作的分析,对水稻黄酮类物质的代谢途径进行了重构。为了研究大麦中影响啤酒胶体稳定性的遗传机制,Ye等[53]利用大麦Franklin/Yerong双单倍体(DH)群体对酒精冷浑浊(ACH)QTL进行分析,发现了一个相关QTL,qACH。由蛋白质组分析鉴定出的两个关键浑浊活性蛋白基因(BATI-CMb和BATI-CMd)与qACH位于染色体的同一位置,推测BATI-CMb和BATI-CMd是qACH的候选基因,控制着啤酒胶体的稳定性。对Franklin和Yerong中BATI-CMb和BATI-CMd核酸和氨基酸序列的多态性分析可以开发相应的基因分子标记,用于大麦的分子辅助选择育种。多平台的代谢组学分析与mQTL的联合研究对于代谢相关功能基因的鉴定和代谢网络模型的构建有着重要意义。
mQTL定位在植物遗传代谢组学研究中取得许多进展,但该方法局限于连锁群体的使用,存在重组位点少、群体构建费时费力、无法覆盖多个不同品种等问题。随着高通量基因分型检测技术的发展,全基因组关联分析(genome-wide association study,GWAS)结合代谢组学已成为植物数量遗传学研究强有力的工具[54]。
Chan等[55]为了研究拟南芥中硫代糖苷代谢途径的遗传结构,采用GWAS对96个拟南芥品种包含40多个硫代糖苷表型性状进行分析,结果显示,每个发育阶段与硫代糖苷关联的位点都不相同。采用共表达网络(co-expression network)方法从数量庞大的GWAS位点中筛选出许多影响硫代糖苷积累的候选基因。Wen等[56]从368份玉米自交系中鉴定出983个代谢物,利用GWAS定位了1 459个性状显著关联位点。进一步通过自交系群体的eQTL(expression QTL)与RIL群体的mQTL对mGWAS显著位点进行了验证,并利用重测序和候选基因关联分析鉴定出5个典型候选基因的潜在变异。Chen等[57]通过对529个水稻自然变异群体的广泛靶向代谢组学分析,结合mGWAS分析,检测出634个控制代谢物自然变异的显著遗传位点。通过数据挖掘注释了36个调控生理、营养相关代谢物的候选基因,并进一步利用遗传和生化分析手段鉴定了其中5个候选基因。Matsuda等[58]采用mGWAS方法解析水稻次级代谢物自然变异的遗传结构,从175份水稻自然品种中鉴定出89个代谢物的323个显著位点,数据分析显示大部分代谢性状只与少量的强QTLs紧密关联。Dong等[59]采用代谢组学结合GWAS对水稻中酚胺的时空积累模式进行研究,定位了多个控制酚胺含量自然变异的位点,并通过转基因验证了两个亚精胺羟基肉桂转移酶的候选基因。基于mGWAS技术从基因到代谢水平的分析已成为功能基因鉴定和以组学为基础的作物遗传改良的有用工具。
QTL分析及GWAS促进了植物代谢组学与功能基因组学的研究,但两者在应用上各有利弊,将两者结合起来,并整合转录组学、蛋白质组学更有助于从整体上把握植物代谢的遗传机制。Wu等[60]将多种单一方法(GWAS、RIL、IL、代谢组-转录组网络分析)进行整合对拟南芥初级代谢的关键调控因子进行研究,利用mGWAS方法从314个拟南芥自然品种中定位了94个初级代谢物的617个显著位点,然后将这些位点与先前发表的利用拟南芥RILs和 ILs群体鉴定的mQTLs数据进行比较验证,同时,利用已报道的拟南芥转录组和代谢组数据构建代谢-转录关联网络,来进一步验证鉴定的位点。经过综合分析,共得到92个主要的位点,从中筛选出76个代谢候选基因,并进一步通过功能缺失突变体验证了两个分别与酪氨酸降解和β-丙氨酸代谢相关的新基因。整合数量遗传学与网络分析的综合方法能够大大提高位点鉴定的灵敏性和精确度。
组学联合技术也同样被应用于作物抗逆代谢组学的遗传基础研究中。Jin等[45]对冷胁迫下两种耐寒性烟草品种进行代谢组学分析的同时,也对其进行了转录组学研究,分别从CB-1和K326中鉴定出14 590和14 605个差异表达基因(DEGs),其中有约50%为冷诱导基因,且耐寒品种K326中大部分冷诱导基因的表达变化程度高于CB-1。为了挖掘小麦赤霉病抗性QTL区间内的有效基因,Dhokane等[61]采用代谢组学和转录组学联合研究了携带抗性和敏感性等位基因(QTL-Fhb2)的小麦重组自交系,结合侧翼标记序列分析,鉴定出4-香豆酸:CoA连接酶(4CL)、胼胝質合成酶(CS)、碱性螺旋-环-螺旋(bHLH041)转录因子、谷胱甘肽S-转移酶(GST)、ABC转运蛋白-4(ABC4)和肉桂醇脱氢酶(CAD)位点为QTL-Fhb2区域内潜在的抗性基因,有助于构建植物响应赤霉病的完整分子机制。Ma等[62]对两个不同耐旱水稻品种(不耐旱品种IRAT109和耐旱品种IAC1246)进行代谢组和转录组分析,来探究干旱胁迫下维持光合作用的关键代谢途径。在干旱和水分充足条件下,分别从两品种中鉴定出4 059、2 677个差异表达基因以及67、49个差异代谢物,其中6个差异代谢物以及215个DEGs与渗透势和抗氧化能力显著相关。在耐旱品种IAC1246中,4-羟基肉桂酸和阿魏酸与光合作用相关DEGs的上调趋势一致,因此,4-羟基肉桂酸和阿魏酸被认为是水稻抗旱关键代谢物,其代谢途径中的DEGs则有望成为耐旱候选基因。这说明以代谢物为基础并结合转录组学方法是筛选抗旱基因的一种有效方法。
3 问题与展望
代谢组学是一门交叉学科,其与生物科学、分析化学、化学计量学及生物信息学等多种学科密切相关,是系统生物学研究中的一个重要环节。随着分析检测技术的发展,特别是基于质谱及核磁共振的代谢谱分析的发展,代谢组学的研究领域不断扩展。但作为一门新兴学科,代谢组学仍处于发展阶段,仍然面临着许多亟待解决的问题,如检测灵敏度的提高,通用检测方法的开发,无偏性、高通量定量分析的实现以及代谢组学数据注释的完备等。自动化、标准化、完整化的代谢组学研究技术是未来的发展方向。
在植物代谢研究方面,代谢组学将单一、少量的代谢物分析发展成整体或某个层面的海量代谢数据的研究,突破了研究层面窄的局限性。尤其是通过对代谢组学数据与基因组学、转录组学等其他组学数据的整合,为植物代谢途径及遗传结构的研究开辟了新局面。然而,各类组学分析方法在应用上各有优缺点,如何根据研究目标、对象及试验设计选择合适的技术手段或从已有的海量数据中选取有用的信息,是研究者们需要不断探讨的问题。随着分离检测技术的不断提高、多平台数据的综合应用以及生物信息学的发展,代谢组学将在阐述生物过程的分子机理中发挥不可替代的作用。
参 考 文 献:
[1] Fiehn O, Kopka J, Dormann P, et al. Metabolite profiling for plant functional genomics[J]. Nat. Biotechnol.,2000, 18(11):1157-1161.
[2] Fiehn O. Link between genotypes and phenotypes[J]. Plant Mol. Biol., 2002, 48(2): 155-171.
[3] Griffiths W J. Metabolomics, metabonomics and metabolite profiling[M]. London: The Royal Society of Chemistry, 2008.
[4] Dixon R A,Strack D. Phytochemistry meets genome analysis and beyond[J]. Phytochemistry, 2003, 62(6):815-816.
[5] Nakabayashi R,Saito K. Metabolomics for unknown plant metabolites[J]. Analytical and Bioanalytical Chemistry, 2013,405(15):5005-5011.
[6] Hardy N W,Hall R D. Plant metabolomics: methods and protocols[M]. New York: Humana Press, 2012.
[7] 邱德有,黄璐琦. 代谢组学研究——功能基因组学研究的重要组成部分[J].分子植物育种, 2004, 2(2):165-177.
[8] Griffin J L, Cemal C K, Pook M A. Defining a metabolic phenotype in the brain of a transgenic mouse model of spinocerebellar ataxia 3 [J]. Physiol. Gen., 2004, 16(3):334-340.
[9] Bollard M E, Stanley E G, Lindon J C, et al. NMR-based metabonomic approaches for evaluating physiological influences on biofluid composition [J]. NMR Biomed.,2005,18(3): 143-162.
[10]Lei Z, Huhman D V, Sumner L W. Mass spectrometrystrategies in metabolomics[J]. Journal of Biological Chemistry, 2011, 286(29): 25435-25442.
[11]Dettmer K, Aronov P A, Hammock B D. Mass spectrometry based metabolomics[J]. Mass Spectrometry Reviews, 2007, 26(1): 51-78.
[12]Ernst M, Silva D B, Silva R R, et al. Mass spectrometry inplant metabolomics strategies: from analytical platforms to data acquisition and processing[J]. Natural Product Reports, 2014, 31(6): 784-806.
[13]Wang Y, Lu X, Xu G W. Development of a comprehensive two-dimensional hydrophilic interaction chromatography/quadrupole time-of-flight mass spectrometry system and its application in separation and identification of saponins from Quillaja saponaria[J]. Journal of Chromatography A, 2008,1181(1/2):51-59.
[14]Vuckovic D. Current trends and challenges in sample preparation for global metabolomics using liquid chromatography-mass spectrometry[J]. Analytical and Bioanalytical Chemistry, 2012, 403(6): 1523-1548.
[15]Theodoridis G A, Gika H G, Want E J, et al. Liquid chromatography-mass spectrometry based global metabolite profiling: a review[J]. Analytica Chimica Acta, 2012, 711: 7-16.
[16]Rainville P D, Theodoridis G, Plumb R S, et al. Advances in liquid chromatography coupled to mass spectrometry for metabolic phenotyping[J]. Trends in Analytical Chemistry, 2014, 61:181-191.
[17]劉贤青,罗杰. 植物代谢组学技术研究进展[J]. 科技导报,2015,33(16):33-38.
[18]Mak T D,Laiakis E C,Goudarzi M,et al. MetaboLyzer: a novel statistical workflow for analyzing postprocessed LC-MS metabolomics data[J]. Analytical Chemistry, 2014, 86 (1):506-513.
[19]Mumm R, Hageman J A, Calingacion M N, et al. Multi-platform metabolomics analyses of a broad collection of fragrant and non-fragrant rice varieties reveals the high complexity of grain quality characteristics[J]. Metabolomics,2016,12(2):38.
[20]Kusano M, Fukushima A, Fujita N,et al. Deciphering starch quality of rice kernels using metabolite profiling and pedigree network analysis[J]. Molecular Plant, 2015, 5(2):4425-4451.
[21]Chen Y Z, Pang Q Y, He Y, et al. Proteomics and metabolomics of Arabidopsis responses to perturbation of glucosinolate biosynthesis[J]. Molecular Plant, 2012, 5(5):1138-1150.
[22]Aharoni A, Ric de Vos C H, Verhoeven H A, et al. Nontargeted metabolome analysis by use of fourier transform ion cyclotron mass spectrometry[J]. Omics, 2002, 6(3): 217-234.
[23]Park H E, Lee S Y, Hyun S H, et al. Gas chromatography/mass spectrometry-based metabolic profiling and differentiation of ginseng roots according to cultivation age using variable selection[J]. Journal of AOAC International, 2013, 96(6): 1266-1272.
[24]贾岩,张福生,肖淑贤,等. 款冬花不同发育阶段的代谢组学和比较转录组学分析[J]. 中国生物化学与分子生物学报, 2017, 33(6):615-623.
[25]Ahmad R, Baharum S N, Bunawan H, et al. Volatile profiling of aromatic traditional medicinal plant, Polygonum minus in different tissues and its biological activities[J]. Molecules, 2014, 19(11):19220-19242.
[26]Qin X M,Dai Y T,Liu N Q,et al. Metabolic fingerprinting by 1H-NMR for discrimination of the two species used as Radix Bupleuri[J]. Planta Medica,2012,78(9):926-933.
[27]刘悦,刘川,谭尔,等. 基于DNA条形码和1H-NMR代谢组学二维方法的多基原藏药沙棘鉴定[J]. 中国中药杂志, 2016, 41(4): 578-585.
[28]韩正洲,杨勇,贾红梅,等. 基于植物代谢组学的栽培型与野生型野菊花的化学成分比较及定量分析[J]. 药物分析杂志, 2017, 37(7):1196-1206.
[29]郑文,王诗盛,钟艺,等. 基于代谢组学技术的虫草鉴别研究[J]. 中国现代应用药学, 2017, 34(8):1145-1149.
[30]Yan X F, Wu S X. Soil nutrient factors related to salidroside production of Rhodiola sachlinensis distributed in Chang Bai Mountain [J]. Environmental and Experimental Botany, 2004, 52(3): 267-276.
[31]謝彩香, 索风梅, 贾光林, 等.人参皂苷与生态因子的相关性[J]. 生态学报, 2011, 31(24): 7551-7563.
[32]何忠俊,黄希,梁社往,等. 滇重楼根茎皂苷含量与生态因子的关系[J]. 生态环境学报, 2016, 25(3):409-414.
[33]邵常荣,张旸,解莉楠,等. 植物对非生物逆境响应的转录调控和代谢谱分析的研究进展[J]. 植物生理学报,2011, 47(5):443-451.
[34]Urano K, Maruyama K, Ogata Y, et al. Characterization of the ABA-regulated global responses to dehydration in Arabidopsis by metabolomics[J]. Plant Journal, 2009, 57:1065-1078.
[35]Fumagalli E, Baldoni E, Abbruscato P, et al. NMR techniques coupled with multivariate statistical analysis: tools to analyse Oryza sativa metabolic content under stress conditions[J]. Journal of Agronomy and Crop Science, 2009, 195:77-88.
[36]Nam K H, Shin H J, Pack I S,et al. Growth stage-based metabolite profiling of drought-tolerant transgenic rice under well-watered and deficit conditions[J]. Plant Omics Journal, 2015, 8(6):587-594.
[37]Nam K H, Shin H J, Pack I S,et al. Metabolomic changes in grains of well-watered and drought-stressed transgenic rice[J]. J. Sci. Food Agric., 2016, 96(3):807-814.
[38]Johnson H E, Broadhurst D, Goodacre R, et al. Metabolic fingerprinting of salt-stressed tomatoes[J]. Phytochemistry, 2003, 62(6):919-928.
[39]Gong Q,Li P,Ma S,et al. Salinity stress adaptation competence in the extremophile Thellungiella halophila in comparison with its relative Arabidopsis thaliana[J]. The Plant Journal,2005,44(5):826-839.
[40]Widodo J H P, Patterson J H, Newbigin E, et al . Metabolic responses to salt stress of barley (Hordeum vulgare L.) cultivars, Sahara and Clipper, which differ in salinity tolerance[J]. Journal of Experimental Botany,2009, 60: 4089-4103.
[41]Shelden M C, Dias D A, Jayasinghe N S, et al. Root spatial metabolite profiling of two geno types of barley (Hordeum vulgare L.) reveals differences in response to short-term salt stress[J]. J. Exp. Bot., 2016, 67 (12): 3731-3745.
[42]Wu D Z, Cai S G, Chen M X, et al. Tissue metabolic responses to salt stress in wild and cultivated barley[J]. PLoS One, 2013, 8(1): e55431.
[43]Richter J A, Erban A, Kopka J, et al. Metabolic contribution to salt stress in two maize hybrids with contrasting resistance[J]. Plant Science, 2015, 233: 107-115.
[44]Yang D S, Zhang J, Li M X,et al. Metabolomics analysis reveals the salt-tolerant mechanism in Glycine soja[J]. Journal of Plant Growth Regulation, 2017, 36(2):460-471.
[45]Jin J J, Zhang H, Zhang J F, et al. Integrated transcriptomics and metabolomics analysis to characterize cold stress responses in Nicotiana tabacum[J]. BMC Genomics, 2017, 18(1):496.
[46]Scandiani M M, Luque A G, Razori M V, et al. Metabolic profiles of soybean roots during early stages of Fusarium tucumaniae infection[J]. Journal of Experimental Botany , 2015, 66 (1):391-402.
[47]Suhre K, Gieger C. Genetic variation in metabolic phenotypes: study designs and applications[J]. Nat. Rev. Genet., 2012, 13(11): 759-769.
[48]Meyer R C, Steinfath M, Lisec J, et al. The metabolic signature related to high plant growth rate in Arabidopsis thaliana[J]. Proc. Natl. Acad. Sci. USA, 2007, 104(11): 4759-4764.
[49]Matsuda F, Okazaki Y, Oikawa A, et al. Dissection of genotype-phenotype associations in rice grains using metabolome quantitative trait loci analysis[J]. Plant J., 2012, 70(4): 624-636.
[50]Li B H, Zhang Y Y, Mohammadi S A, et al. An integrative genetic study of rice metabolism, growth and stochastic variation reveals potential C/N partitioning loci[J]. Sci. Rep., 2016, 6: 30143.
[51]Gong L, Chen W, Gao Y, et al. Genetic analysis of the metabolome exemplified using a rice population[J]. PNAS, 2013, 110(50): 20320-20325.
[52]Yu H, Xie W, Wang J, et al. Gains in QTL detection using an ultra-high density SNP map based on population sequencing relative to traditional RFLP/SSR markers[J]. PLoS One, 2011, 6(3): e17595.
[53]Ye L Z, Huang Y Q, Dai F, et al. Identification of two key genes controlling chill haze stability of beer in barley (Hordeum vulgare L.) [J]. BMC Genomics, 2015, 16 (1):449.
[54]Riedelsheimer C, Lisec J, Czedik-Eysenberg A, et al. Genome-wide association mapping of leaf metabolic profiles for dissecting complex traits in maize[J]. PNAS, 2012, 109(23): 8872-8877.
[55]Chan E K, Rowe H C, Corwin J A, et al. Combining genome-wide association mapping and transcriptional networks to identify novel genes controlling glucosinolates in Arabidopsis thaliana[J]. PLoS Biol., 2011, 9(8):e1001125.
[56]Wen W, Li D, Li X, et al. Metabolome-based genomewide association study of maize kernel leads to novel biochemical insights[J]. Nat. Commun., 2014, 5: 3438.
[57]Chen W, Gao Y, Xie W, et al. Genome-wide association analyses provide genetic and biochemical insights into natural variation in rice metabolism[J]. Nat. Genet., 2014, 46(7): 714-721.
[58]Matsuda F, Nakabayashi R, Yang Z, et al. Metabolome genome-wide association study dissects genetic architecture for generating natural variation in rice secondary metabolism[J]. Plant J., 2015, 81(1): 13-23.
[59]Dong X, Gao Y, Chen W, et al. Spatio-temporal distribution of phenolamides and the genetics of natural variation of hydroxycinnamoyl spermidine in rice[J]. Mol. Plant, 2015, 8(1): 111-121.
[60]Wu S, Alseekh S, Cuadros-Inostroza ,et al. Combined use of genome-wide association data and correlation networks unravels key regulators of primary metabolism in Arabidopsis thaliana[J]. PLoS Genet., 2016, 12(10): e1006363.
[61]Dhokane D, Karre S, Kushalappa A C, et al. Integrated metabolo-transcriptomics reveals Fusarium head blight candidate resistance genes in wheat QTL-Fhb2[J]. PLoS One,2016, 11(5): e0155851.
[62]Ma X S, Xia H, Liu Y H, et al. Transcriptomic and metabolomic studies disclose key metabolism pathways contributing to well-maintained photosynthesis under the drought and the consequent drought-tolerance in rice[J]. Front Plant Sci., 2016, 7:1886.