(1.中国农业大学资源与环境学院,农田土壤污染防控与修复北京市重点实验室,北京 100193;2.中国农业大学资源与环境学院,国家农业绿色发展研究院,植物-土壤相互作用教育部重点实验室,北京 100193)
目前绝大多数微生物尚不能被分离培养,其功能及代谢特征尚未可知,因此限制了对环境微生物的挖掘和利用.近年来,随着微生物组学研究方法的快速发展和突破,极大地推动了环境微生物的研究进程.微生物组学技术以不依赖于分离培养的优势可针对环境样品中的全部微生物进行研究,能够系统性地揭示整体微生物群落的组成、活性、功能及动态变化等[1,15].其中,宏转录组学通过分离提取微生物群落中的RNA或者富集mRNA,合成cDNA[7]进行高通量测序分析.这种方法可针对微生物群落研究其在某一特定环境、特定时期和特定状态下进行转录的所有RNA的类型及数量,来确定活跃微生物的代谢功能.相对于宏基因组研究微生物群落的组成和功能(包括死亡和休眠微生物),宏转录组的优势是可以揭示微生物群落中活跃物种的组成及其基因的表达.以宏转录组为代表的多组学研究方法为解析不同生境微生物群落动态变化、相互作用和功能响应提供了前所未有的机遇.自2007年以来,宏转录组学在各领域得到广泛应用,与宏转录组学相关文章数量持续上升,其中2018年发文量达到200余篇(注:截止至2020年12月5日,以metatranscriptomics和metatranscriptome为主题检索Web of Science数据库).本文系统地介绍了宏转录组学的原理和数据分析流程,归纳了环境中微生物群落及其代谢能力的最新进展,并强调了如何继续利用宏转录学来研究环境中微生物类群的生态适应及其功能关联.
1.1.1 样品的采集和保存 mRNA分子的平均半衰期在几秒到几分钟范围内,且具有相同生物学功能的基因显示出相似的mRNA降解率,这是宏转录组学样品提取中存在的主要难点[18].此外, mRNA稳定性会受到微生物生长速度的影响,在微生物种内和种间也存在较大差异[19].因此,为了最大限度地减少前期准备导致的RNA转录谱及其完整性的变化,需要尽可能缩短在实验样本采集、贮存、运输和制备过程中的时间.例如,样本采集后应立即投入液氮中快速冷冻或者将样品转移到RNAlater等核酸保存液中,然后转移至-80℃冰箱中保存,尽量避免反复冻融.理想情况下,采样过程引起的延迟应在分秒范围内[20].
1.1.2 总RNA的提取 总RNA的提取一般是借助物理方法(微珠)结合细胞裂解液将细胞破碎,利用试剂使蛋白质变性,从而将RNA释放到溶液中.Mettel等人[21]基于腐殖酸含量不同的4种土壤(草地,稻田,森林和农田),从RNA的纯度、完整性及产率等方面评估和优化了RNA提取方法.一般来说,从低pH(4.5~5.0)土壤要比从高pH (7.0~8.0)土壤中提取RNA的稳定性和完整性高,并且腐殖酸含量较低.近年来,各种高效商业试剂盒也逐渐用于土壤RNA的提取.目前,PowerSoilTM总RNA提取试剂盒(MoBio)最为常用.此试剂盒基于苯酚(pH = 4.5~5.0)进行提取,然后采用试剂盒特异性的RNA纯化方法.在RNA的提取过程中,要注意提取条件(如是否需要低温)和污染控制. RNA酶分布广泛且非常稳定,容易降解mRNA,因此在提取RNA过程中要操作规范,以减轻RNA酶污染.
图1 宏转录组学实验流程
1.1.3 mRNA的富集 环境微生物群落中的总RNA主要由mRNA、tRNA和rRNA组成,其中mRNA约占1%~5%[22].模板mRNA的质量与cDNA的合成效率密切相关.因此,富集mRNA是微生物群落基因表达功能分析中的关键一步,也是宏转录组实验中的重要一步.从环境样品中富集mRNA的方法包括以下几种:
(1) rRNA消减杂交处理[23]. rRNA的消减杂交保留了mRNA转录本的全部多样性,因此可以用于针对mRNA的研究中.消减杂交的关键是利用一组捕获探针与rRNA内高度保守的序列区域互补. MICROB细菌mRNA富集试剂盒可用于通过消减杂交特异性去除细菌rRNA ,但将其应用于土壤RNA提取时仍存在一些缺陷.例如,土壤微生物组的多样性及复杂性使得靶向rRNA捕获探针的物种覆盖范围成为mRNA富集的限制因子. rRNA探针的设计要尽可能涵盖更多的物种类别.此外,随着用于mRNA富集的RNA片段增加,消减杂交的rRNA去除效率也会下降[22].
(2)优先降解rRNA的核酸外切酶处理.其原理是利用5'-单磷酸酯依赖核酸外切酶酶促反应来降解rRNA .成熟的rRNA易被5'-单磷酸酯酸化,而真核生物的mRNA受帽子结构保护,细菌mRNA带有三磷酸基团, mRNA由此被保留下来.因此认为rRNA被5'-单磷酸酯酸化是通过5'端至3'端进行核酸外切酶特异性降解,从而达到mRNA的富集.然而,当用其提取土壤RNA时,由于细菌的mRNA衰变过程中,位于5'端的三磷酸基团转化为单磷酸形式,所以5'-单磷酸酯依赖核酸外切酶不仅降解rRNA,还会大量的降解mRNA[21-22,24].此外,腐殖质是强大的酶抑制剂,会影响5'-单磷酸依赖核酸外切酶的活性,因此提取土壤RNA时必须先要去除腐殖质[21].
(3)凝胶电泳片段分离[16].通过精确切除主要rRNA条带之间的琼脂糖可回收非rRNA.此方法可以通过切除23S, 16S和5S核糖体条带之间的琼脂糖来有效去除rRNA,但mRNA中可能仍含有微量的rRNA.由于腐殖酸在电场中的迁移速度比RNA分子快,该方法还可以同时去除腐殖酸[16].
(4) 双链特异性核酸酶(DSN)处理[25].双链特异性核酸酶是一种在高温下优先降解双链DNA的酶.该方法通常在富含mRNA的cDNA文库中降解rRNA反转录的cDNA.一般在RNA状态下使用mRNA特异性Poly(A)尾部选择,或者使用寡核苷酸引物方法从总RNA中进行逆转录.
1.1.4 cDNA的合成 一般来说,当前的高通量测序平台需要以cDNA为模板.因此,富集的mRNA需要经过反转录为cDNA后再进行测序. cDNA合成基本步骤如下:首先以RNA单链为模板,在DNA反转录酶的作用下催化合成cDNA第一链,随后以其为模板,利用聚合酶生成cDNA第二链.通过将cDNA双链和载体连接,以此为模板进行PCR扩增,即可构建cDNA文库,用于微生物基因表达及调控分析.
原始下机数据一般为fastq格式,其包含测序过程中添加的引物、接头、测序错误序列以及宿主污染等,因此需要对数据进行质控.在质量控制阶段, Cutadapt[31]和Trimmomatic[32]常用来去除接头(adapter)和低质量碱基.数据质控后,可使用本地软件或者在线工具通过对比数据库进行mRNA和rRNA分离提取.CAMERA[33]和MG-RAST[34]是用于宏转录组数据处理的在线分析网站,可通过对其已有数据库进行序列的对比分析.通过SortMeRNA[35]软件对比相应数据库,可从宏转录组数据中筛选出rRNA和mRNA序列.在对RNA序列进行预测和分类后,基于Trinity[36]、PANDAseq[37]或FLASH[38]等软件分别对获得的RNA的转录本序列碎片进行重叠配对, 分离后的mRNA序列可用于构建宏转录组长片段并进行基因表达鉴定,对于rRNA的分析则可获得相应的微生物物种信息.拼接产生的mRNA contigs ,映射阶段使用的软件为Bowtie2[39],可将上一步生成的mRNA长序列映射到参考基因组.基于NCBI_nr, KEGG(https://www.kegg. jp/), COG (http://www.ncbi.nlm.nih.gov/COG)等数据库对比可用于对获取的序列进行功能注释.而基于SILVA (http://www.arb-silva.de/)和NCBI_nt (https: //www.ncbi.nlm.nih.gov/) 数据库可以得到碱基序列所携带的物种和结构组成信息. 序列对比至数据库可使用USEARCH[40]、BLAST[41]或DIAMOND[42]等软件.MEGAN[43]软件可以将数据库对比结果进行物种分类和功能注释.
最后,通过DESeq2[44]或edgeR[45]软件对基因进行差异表达分析,可借助绘图软件进行数据可视化处理.针对提取的rRNA序列,使用BLAST进行聚类分析, SOAP2[46]用于提取rRNA,再用QIIME2[47-48]、MOTHUR[49]对比基因数据库参考从而对rRNA序列进行物种注释,获得精确度较高的物种组成图谱.
图2 宏转录组学的数据分析流程
表1 宏转录组学在环境生态学中的应用研究
由人类活动或自然因素所引起的环境污染可能会破坏微生物生境而引起微生物群落结构变化,进而影响微生物群落基因的表达.宏转录组学可以从转录水平上揭示污染物降解过程,以及污染物对微生物群落代谢的影响.Falk等[60]研究了受人为污染的淡水沉积物中的微生物群落,指出β氧化、糖异生和聚酯合成相关基因在有机污染物丰富的地方出现高表达,且降解谱的终点是硝酸盐还原和产甲烷过程.Lu等[82]基于扩增子研究并未发现草甘膦对淡水微生物群落结构有显著影响,但宏转录组学分析表明草甘膦显著影响了一些蓝藻的转录.宏转录组学还可以用来研究污染物对微生物群落基因表达产生的影响以及污染物代谢过程的影响因素.Doyle等[62]研究石油污染海水发现,沿不同海岸线的距离会导致烷烃和多环芳烃分解代谢途径的差异表达;含氧相可以通过微生物介导的替代电子受体(如硫化物)的再氧化以及通过生物固氮提供氮,促进缺氧相中石油的生物降解[83].此外,宏转录组还可以挖掘代谢污染物的主要微生物类群.Zhou等[84]利用宏转录组研究汞污染的稻田,发现了该地微生物群落中相对丰度较低但能够降解汞的主要微生物是,,和; Sharma等[85]指出古菌在重金属和农药污染的土壤中发挥着重要的作用.因此宏转录组为生物修复的相关研究开拓了新思路.
Application of metatranscriptomics in environmental microbial ecology.
LI Ying1, WU Xing-Jie2, HE Zhi-Bin2, BEI Shui-Kuan2, MA Ke1, PENG Jing-Jing2*
(1.Beijing Key Laboratory of Farmland Soil Pollution Prevention and Remediation, College of Resources and Environmental Sciences, China Agricultural University, Beijing 100193, China;2.Key Laboratory of Plant-Soil Interactions, Ministry of Education College of Resources and Environmental Sciences, National Academy of Agriculture Green Development, China Agricultural University, Beijing 100193, China)., 2021,41(9):4341~4348
In this review, the pipeline for metatranscriptomics workflow and data analysis were systematically summarized. Then, the strategy of research in environmental microbial ecology was discussed. Based on the above, the prospects of metatranscriptomics application were proposed. Metatranscriptomics has been useful in analyzing the function of environmental microbiomes. It provides a powerful tool for us to better understand the dynamic evolution of the functional microbial community and its relationship with environmental factors and ecosystem function.
metatranscriptomics;microbiome;community structure;functional gene expression;mRNA enrichment;RNA
