李慧,马德志,姜明,刘溪,陈晓婷,刘振艳
(齐齐哈尔医学院医药科学研究院,黑龙江 齐齐哈尔 161006)
传统中药继承了数千年历史精华的积累,在现代疾病预防和治疗方面具有自身的优越性和特点。随着质谱色谱技术的快速进步,促进了中药有效成分的发现与鉴定,然而尚有许多中医药理论缺少现代自然科学的支撑和验证[1]。随着人类基因组计划的完成,人类探索生物的发展规律进入了后基因组时代,转录组学、蛋白组学和基因组学等逐渐被广泛应用。其中转录组学的应用最为广泛,发展也最为迅速,不仅是研究细胞表型和功能的重要手段,也是研究基因结构、基因功能及表达的新的研究方法[2]。广义的转录组(Transcriptome)是指生物体细胞或组织在特定状态下所转录出来的所有RNA的总和,包括能够编码蛋白质的RNA(即mRNA)和不能编码蛋白质的RNA(rRNA,tRNA,microRNA等)。狭义的转录组指所有编码蛋白质的mRNA总和。
近年来,随着DNA高通量测序技术的飞速发展,大规模测序技术(如Roche公司的454 GS-FLX、Illumina公司的Genome Analyzer II和ABI公司的AB SOLiD))的出现彻底颠覆了转录组研究的方式,由传统的基因芯片技术发展到RNA测序技术(RNA-seq),也称为转录组测序技术。该技术以高通量的方式揭示特定时间、特定组织或细胞中基因的全部表达情况、测定转录水平的SNP/Indel/SSR等遗传多态性情况、识别相同基因的选择性剪切或拼接情况、检测未知基因等。目前,RNA-seq技术已成功应用于动物、植物、微生物等各类生物当中。在动物(例如:半番鸭[3]、黄牛[4]、山羊[5]等)研究中主要涉及到疾病研究、关键基因发掘及基因剪切等方面。而植物转录组研究则显示出更加巨大的应用潜能,例如:Wang等利用Illumina HiSeq 2000技术研究了枸橘的转录组序列特征,并筛选出参与冷调控途径的相关基因与转录因子[6]。Zhang等研究东方百合转录组信息,获得39 636条Unigene序列并筛选出156个与类黄酮生物合成途径相关的关键酶基因,从而为花色形成的分子机理及分子标记辅助育种奠定了基础[7]。自2010年以来,RNA-seq技术在中药材中的应用也越来越广泛,例如,人参[8]、冬虫夏草[9]、灯笼果[10]等传统中药材都进行了高通量转录组的测序和分析。
本文参考已发表的转录组测序研究文献,概括了转录组测序技术在药用植物领域中的应用及取得的成果,并对该技术在药用植物中的后期研究进行展望。
到目前为止,用于转录组数据获取和分析的测序方法主要经历了三代技术类型的变迁(见表1):1)第一代测序技术主要有以Sanger测序作为基础的SAGE(serial analysis of gene expression)和MPSS(massively parallel signature sequensing)、以PCR为基础的全长cDNA文库和EST(expressed sequence tag)文库的测序分析。2)第二代测序技术即RNA-seq技术,是以Roche公司的454技术、Illumina公司的Solexa技术和ABI公司的SOLiD技术为代表的新一代测序技术,该技术可实现快速、大批量转录组检测。鉴于其通量高、分辨率高、灵敏度高、不受限制等优点,使得RNA-seq技术成为目前转录组测序研究的主导方法。3)第三代测序技术是近年来建立在第二代测序基础之上兴起的以PacBio为代表的测序技术,该技术可获得更长乃至全长转录组序列。目前,第三代测序技术应用较少但发展迅猛,将会为组学和生物信息学研究带来新一轮的机遇。
表1 三代转录组测序技术比较
RNA-seq已经成功用于水稻、拟南芥、玉米等模式生物当中,而大多数中药材植物作为非模式生物,缺乏相关基因组信息。因此,RNA-seq成为药用植物新基因挖掘、功能预测等重要的研究方法,已在国内外大规模开展,比如丹参[17]、西洋参[18]、甘草[19]等。目前, 已经有超过50种传统药用植物通过RNA-seq 进行了转录组研究,尤其2014年以来,RNA-seq技术发展极为迅速,见表2。
表2 药用植物转录组研究明细
2.2.1 药用植物发育机制研究
长期以来,中药材种植缺乏优良的管理与品种选育技术,导致品种退化、抗逆性差等问题严重。现代转录组技术可以从整体水平上研究药用植物种质资源的代谢途径与调控机制,深入开展药用植物转录组研究有助于揭示生长发育过程中的关键影响因素,为药用植物栽培育种提供指导。邓楠等[71]利用RNA-seq技术获得6个不同发育时期膜果麻黄种子转录组信息,KEGG分析表明种子萌发期间共有16 748个编码基因参与了125个代谢通路,其中代谢途径参与基因最多,占所有编码基因的22.5%(3 768个);其次是次生代谢产物生物合成途径占11.27 %(1 888个);再次是植物激素信号传导编码基因占4.54 %(761个)。Mehta等[63]利用转录组测序技术发现参与番泻叶干旱胁迫响应的基因涉及到植物激素信号传导、渗透活性物质、活性氧清除、叶绿素代谢途径和信号因子等方面。进一步基因表达分析表明存在6个基因(转录因子MYC2,9-顺式-环氧类胡萝卜素双加氧酶,L抗坏血酸过氧化物酶,氨基环丙烷羧酸氧化酶,8′羟化酶,WRKY转录因子)与干旱胁迫密切相关。唐娟[55]对3个不同品种茯苓进行品质特征分析和转录组测序研究,结果发现靖航一号在加工性能和有效成分含量方面占有优势,通过转录组测序和基因差异表达分析发掘出673个新基因,并筛选出与茯苓多糖代谢相关的4个关键基因。
2.2.2 次生代谢产物生物合成途径研究
次生代谢产物是药用植物的重要组成部分,其种类繁多,主要有含氮有机物、生物碱、萜类、酚类、黄酮类及有机酸等。次生代谢产物不仅是药用植物适应环境压力,提高生存竞争能力,抵抗生物和非生物胁迫的重要角色,而且是具有广泛药用价值的生物活性物质。药用植物具有作用靶点多,组分复杂的特点,通过转录组测序解析次生代谢产物生物合成途径并挖掘关键酶基因,可为药用植物活性成分的积累和高效利用提供科学依据。朱孝轩[72]利用二代测序技术和三代测序技术同时对长春花的叶、花和根进行转录组测序和分析,通过二代测序筛选出可能参与吲哚生物碱(TIAs)合成的8个P450候选基因和5个功能基因,通过三代测序发现了与TIAs途径有关的转录因子及可能参与TIAs途径的调控催化酶编码基因的可变剪切,克隆了所有环烯醚萜途径的催化酶基因并构建了3个基因的表达模块,为探索完整TIAs途径在酵母中的重建奠定了基础。Li等[57]研究了金钗石斛中石斛碱生物合成途径关键基因,发现了可能参与倍半萜骨架合成相关的30个蛋白编码基因序列,其中的MF23通过调节MVA途径中的基因表达影响石斛碱的生物合成。并推测后修饰酶在石斛碱的生物合成中发挥了重要作用。
2.2.3 药用植物SSR分子标记的开发
Simple sequence repeat (SSR)分子标记也称为微卫星DNA多态性标记,由2~6 bp的基本重复单元组成。SSR分子标记能按孟德尔规律稳定地遗传与分离,在药用植物基因组中散布着大量的串联重复序列,具有多态性高、重复性好、共显性、覆盖面广、易检测、操作简单等优点,已在遗传图谱构建、基因定位和分子标记辅助育种、遗传多样性分析和品种及纯度鉴定等方面得到广泛应用。利用转录组测序获得SSR分子标记,可不依赖于全基因组信息,快速和廉价地获得大量的重复序列位点,避免全基因组测序周期长、成本高的缺点,也可避免EST-SSR信息量少的问题。目前,已广泛应用于丹参、沙棘、甘草、茯苓及罗汉果等多种药用植物中。李翠婷等[73]分析了野三七转录组中的SSRs位点信息,共搜索到21 320个SSRs,分布于17 780条unigenes中,SSRs位点出现频率为16.82%。利用15对具有多态性的引物对13个野三七材料进行遗传多样性分析并将其分为2类。Liu等[74]检测到2 446条大蒜EST-SSRs,这些序列中AGA/TCT和GAA/TTC重复基元频率最高(66.1%),并将其中的1 506条序列设计成SSR引物。随机选择200对引物对大蒜及其他5个不同百合科品种进行扩增,有效扩增引物分别为194对和155~186对,表明这些引物具有很好的种间通用性,为图谱构建、QTL定位、遗传多样性分析和关联作图等提供了支撑。代娇等[75]在16 369条厚朴转录组序列中共获得8 635个SSRs位点,出现频率为52.75%。SSR 序列中单核苷酸、二核苷酸和三核苷酸为优势重复类型,主导重复基元类型为 A/T(47.16%)、AG/CT(31.74%)、AAG/CTT(6.53%)。45对引物中22对(48.89%)可以扩增出预期大小的条带。含SSR的Unigene与能量和氧化还原等代谢过程,以及 RNA 转运、剪接体和植物激素信号转导等通路有关,这些SSR序列的获得将为厚朴基因挖掘和分子标记辅助育种提供有利的工具。
本文在简要介绍转录组测序技术的基础上,从药用植物发育机制、次生代谢产物生物合成和SSR分子标记开发等3个方面综述了国内外近年来在药用植物转录组研究方面的应用成果。转录组测序技术具有通量高、覆盖范围广、精度高、不依赖于基因组参考序列等特点,适用于所有模式和非模式生物,使得转录组测序成为药用植物经济有效的研究工具。通过对转录组数据分析,将有助于挖掘新的功能基因和代谢通路,为天然药物来源新途径,探索药用植物道地性形成的分子机制提供新的思路和方法。通过对次生代谢途径关键酶基因的研究,为药用植物次生代谢产物的生物合成与含量调控提供分子基础。通过SSR分子标记的开发,构建药用植物指纹图谱,为分子标记辅助育种,种质资源收集、鉴定与评价提供技术支撑。转录组的研究能够对理解药用植物的生理学和生物化学的各个方面提供新的信息,为中医药理论提供现代分子生物学的支撑和验证。
转录组测序技术作为后基因组时代发展起来的一项测序技术,必将成为今后应用最广的分析技术,将有更多的药用植物会采用转录组测序方法来了解其基因的表达、功能。结合新兴的蛋白质组学、代谢组学研究,实现高通量与高效率的结合,助力传统中药的现代化进程。