宏基因组学与动物病原微生物检测

2014-01-25 13:22:09吴旧生王鹏歧刘月环
中国比较医学杂志 2014年9期
关键词:基因组学文库高通量

吴旧生,王鹏歧,刘月环

(1.浙江大学动物科学学院,杭州 310058;2.浙江省医学科学院,杭州 310013)

宏基因组学(metagenomic),又称环境基因组学(environmental genomics),检测技术上不依赖培养,直接从微生物的天然环境中提取基因组DNA,对微生物群体进行研究分析,最大限度地挖掘微生物资源。宏基因组学技术是寻找新基因、开发新的生物活性物质、研究群落中微生物多样性的新途径, 目前已成为国际微生物学研究的热点,本文对宏基因组学及其研究技术在人、动物微生物研究及检测中的应用进行综述,展望未来的发展趋势和研究重点。

1 宏基因组学提出

迄今为止,人类对微生物世界的认识基本上都集中在不到1%的微生物上,环境中绝大多数的微生物还未被研究过甚至是被知道,主要是因为99%以上的微生物目前都是 难 被纯培养的[1],这己经成为现今微生物学界的普遍共识。Schmidt等[2]于1991年直接提取海水样品DNA进而构建了λ噬菌体文库,并进行了16S rRNA基因的筛选分析。1996年,Stein等[3]克隆了40 kb的一种未知海洋古细菌的基因组片段,并进行了测序分析,该项研究有里程碑式的意义。Handelman等[4]1998年提出一种以环境样品中的微生物群体基因组为研究对象,以功能基因筛选和测序分析为研究手段,以微生物多样性、种群结构、进化关系、功能活性、相互协作关系及与环境之间的关系为研究目的的新的微生物研究方法, 并首次使用了metagenomics(metagenome)这个名词,中文译为“宏基因组学”。文献中的环境DNA文库(Environmental DNA libraries),土壤DNA文库(soil DNA libraries),eDNA文库(eDNA libraries),重组环境文库(recombinant environmental libraries),全基因组文库(whole genome treasures),群体基因组(community genome),全基因组鸟枪法测序(whole genome shotgun sequencing)等都是相近的定义或名称。宏基因组学(metagenomics)是将环境中全部微生物的遗传信息看作一个整体来研究微生物与自然环境、或生物体之间的关系[5]。

2 宏基因组学的研究现状、方法与困难

最初宏基因组学的基本研究策略是样品和基因(组)的富集→提取特定环境中的基因组DNA→构建宏基因组DNA文库→筛选目的基因→目的基因活性产物表达。宏基因组学不仅克服了微生物难以培养的困难,结合生物信息学的方法,还可揭示微生物之间、微生物与环境之间相互作用的规律,大大拓展了微生物学的研究思路与方法,为从群落结构水平上全面认识微生物的生态特征和功能开辟了新的途径。目前,微生物宏基因组学已经成为微生物研究的热点和前沿,广泛应用于环境保护(气候、水处理、极端环境、海洋资源)、人体(动物)肠道(含呼吸道、皮肤、生殖道)、石油污染修复、生物冶金等领域,取得了一系列引人瞩目的重要成果。

宏基因组学的研究方法主要包括序列分析法、同位素探测技术和二代测序技术。

序列分析法 (sequence driven screening method),又包括基于探针的探针杂交技术、基因芯片技术和焦磷酸技术等。探针杂交技术现用于土壤基因文库的筛选[6],被有效地用于鉴定系统发育学中的标志基因和带有高度保守域的酶基因[7]。Sebat等[8]利用芯片技术对其所研究的微生物群落基因组进行筛选, 鉴定出多个新的微生物种群。Wagner等[9]应用DNA微阵列技术对活性污泥中微生物的群落结构进行了研究,获得了大量新的信息,该方法的缺陷是低丰度微生物难以分析。而焦磷酸测序(pyro sequencing) 的出现则大大的提高了测序的效率[10]。

在复杂群落构建的宏基因组文库中找到特定的目的基因,需要筛选和测序成千上万的克隆,通过同位素探测技术 (stable isotope probing,SIP )研究特定代谢过程的生物基因组,克隆从SIP实验中获得的13C标记的核酸,从而构建一个因吸收了特定的基质而在环境中执行特定代谢功能的微生物宏基因组文库,这极大地减少了需要筛选的克隆数量[11],是目前在分子微生物(生态学)领域应用比较广泛的方法之一。二代高通量测序广泛应用是宏基因组学得以长足发展的基础,并使得宏基因组技术应用于人类及各类家畜等动物的胃肠道微生物群落结构和功能研究[12]。

虽然宏基因组学研究正极大限度地发掘及发挥了人们难以想象到的微生物群落的巨大功能,然而它也面临着一些困难。首先,不同的取样和DNA提取方法决定了宏基因组研究的结果,如何对这些方法进行标准化是宏基因组学研究的一个难点。第二,由于许多基因或基因产物在外源宿主中不表达或表达后没有活性,限制了后期的研究,因而建立更多的适于不同基因表达的宿主系统是基于功能筛选的宏基因组学研究的又一困难。第三,数据分析及生物信息学分析方法、微生物培养技术及模式微生物全基因组序列获得等方面的规范有待于提高。因此,建立较规范宏基因组数据库,供不同领域及各个国家的研究人员共享使用,将更有利于对宏基因组学研究结果的解释和利用。

3 宏基因组学与人类疾病

人类消化道(包括胃肠道、口腔),呼吸道、 泌尿生殖系统、皮肤等是各类微生物存在的天然场所,因此由其构成的人类疾病的宏基因组学研究也相继开展。如美国国立环境卫生科学研究所( national institute of environmental health sciences,NIEHS ) 于1998年启动了环境基因组计划(environmental genome project,EGP),意在就环境与基因相互作用及其对人类健康的影响进行系统全面的研究,主要内容包括环境胁迫对机体遗传变异的过程和机理,发掘环境应激和应答基因的多态性及探讨这些多态性基因的功能及其与患病风险的关系。2007年美国国立卫生研究院(NIH)启动的人类共生菌群基因组计划(human microbiome project,HMP)正是这方面的深入展开的重要支持与表现。由我国科学家(华大基因公司)参加的欧洲人体肠道宏基因组研究计划 (european metagenomics of the human intestinal tract,MetaHIT),对124例欧洲人肠道菌群基因组样本用新一代大规模高通量测序技术进行深度测序,获得330万个人体肠道宏基因组的参考基因,约是人自身基因的150倍,这些基因信息可以估计人肠道中存在约1000~1150种细菌,这些细菌是绝大部分个体所共有的且是未知的[13]。

宏基因组技术提供了较为全面的菌种多样性分布的特征,在研究探讨人类疾病中不可培养的微生物多样性已有了较大进展,如Breitbart等[14]用鸟枪测序法对人体排泄物的宏基因组文库进行研究, 结果表明获得的病毒大约有1200种基因型,大多数为新病毒, 可能与人类疾病有着密切的关系。Gill等[15]对2名健康成年人粪便标本的DNA进行测序后发现,仅有1%~5%的DNA不是来自细菌,消化道细菌的基因数量达60000 多种, 比在人类基因组中发现的多出一倍,是由细菌和人体细胞组成的混合体,该研究结果对许多人类疾病的临床诊断和治疗研究具有深远的意义。Kurokawa等[16]对13个处于不同年龄层的健康人体粪便微生物种群进行了研究, 表明未断奶婴儿的具有较大个体差异性, 而成人及已断奶儿童则呈现出高度的功能一致性。2008年Finkbeiner等[17]通过构建12个腹泻小孩肠道内容物宏基因组文库, 发现得到的病毒序列与GenBank中的已知序列同源性很低。同时,利用二代测序技术对口腔、呼吸道、皮肤等部位的菌群及与相关疾病的宏基因组学研究也取得了较大进展。Keijser等[18]利用高通量测序系统对多个健康人唾液及牙菌斑合并样品的研究发现,总数为19万个细菌的16S rRNA序列中,在唾液和牙菌斑中分别鉴定出185和267个细菌属,分别涵盖了5600和10000个不同菌种。Zaura等[19]对健康人口腔菌群的研究表明:利于健康的核心细菌数超过500种以上,使人们对口腔菌群细菌的数量有了新的认识。Willner等[20]检测了5名囊性肺纤维化病人和5名健康呼吸道的病毒宏基因组序列后发现,病人组检测到175个独特的病毒基因型,且以编码芳香族氨基酸为主,提示呼吸性病毒与囊性肺纤维化有潜在的关系。Gao等[21]用16SrDNA测序的方法发现正常人群的手、身体表皮微生物群落呈现高度多样性。

以上成果显示,宏基因组学技术在探索人体与不可培养病原菌相互关系的研究方面将有着广阔的应用前景。

4 宏基因组学与动物免疫及致病

动物的胃肠道中存在着大量的共生微生物群落,构成了动物消化道微生物区系,正常肠道微生物对宿主具有营养、免疫、生长刺激与生物拮抗等作用,它们通过寄主胃肠道中特定环境,利用种群间的互作,在动物胃肠道中形成一种稳定的微生态环境。长期以来,对于胃肠道微生物的研究是建立在纯培养技术上[22]。宏基因组技术可以不依赖实验室培养条件,有可能使人们更加全面地认识肠道微生物的致病机制,寻找预防和治疗的方法。

如利用宏基因组技术对倭蜂猴粪便微生物的结构组成及其潜在功能研究表明,在人类所占比例较小的Proteobacteria和Actinobacteria在倭蜂猴中更为普遍,而在人类中的优势菌群Firmicutes在倭蜂猴中却是少数。同时,通过对倭蜂猴与人及其他一些动物的胃肠道宏基因组数据进行双向聚类发现,虽然倭蜂猴和小鼠肠道系统的功能有差异,但其微生物群落结构却最为相似[23]。Zhu等[24]通过分析大熊猫肠道微生物宏基因组,发现了包括纤维素酶、β-葡萄糖苷酶等在内的多种糖苷水解酶编码基因,这些研究更进一步证实了胃肠道微生物与其宿主之间的共同进化,其代谢产物能影响宿主粘膜系统的发育、血管的发生、肠道上皮的更新、肠道功能的维持及参与宿主基因的表达[25]。

自Muyer等[26]1993年首次用变性梯度电泳(denaturing gradient gel electrophoresis,DGGE)技术(主要分析16S rRNA区段)分析土壤环境的微生物区系以来,该技术已广泛用于人类、动物肠道微生态及其它环境微生态的研究[27-28]。典型的如高倩等[29]用DGGE法结合免疫组织化学(immunohistochemistry,IHC)方法研究了三种不同级别实验小鼠(普通级小鼠,清洁级小鼠和SPF小鼠)肠道菌群组成与肠黏膜相关淋巴组织sIgA阳性细胞分布,结果表明普通小鼠肠道细菌种类、数量及sIgA阳性细胞分布数量及部位均为最多,与清洁级、SPF级小鼠有明显差异。利用非培养法研究鳞翅目昆虫模式动物—家蚕肠道内容物发现家蚕肠道中寄生有16种以上的细菌[30]。Rawls等[31]发现,斑马鱼(Danio rerio)肠道中某些微生物可以刺激肠道上皮细胞增殖,促进营养物质代谢,刺激斑马鱼自身免疫系统的应答反应。

另外,胃肠道微生物被认为是药物、酶基因和其他新型产品的来源,目前国内外研究者已通过构建动物胃肠道微生物宏基因组文库或对宏基因组进行直接测序,成功筛选到多种糖苷水解酶及淀粉酶、脂酶/酯酶等酶类基因[32]。总之,借助于大规模测序和生物信息学分析,在动物胃肠道微生物群落的宏基因组学方法中,发现大量过去无法得到的未知微生物的新基因或基因簇,大大拓展了研究范围,积累了大量基因序列信息,这一新的研究思路的引进,使得未来动物胃肠微生物间互作机理更加深入,使得研究动物胃肠道代谢定向调控成为可能,为动物性疾病防治、开发和利用动物胃肠道微生物资源提供了有力的技术支持。

5 宏基因组学在动物病原微生物研究上的应用及策略

因为宏基因组学技术可以避开传统的培养方法,在DNA水平来探讨机体,机体微生物群落结构及其与环境微生物的关系,利用此法可快速可靠地获得体内、体表(胃肠道、呼吸道、口腔、生殖道、皮肤)微生物中各种微生物的菌落指纹和特征性核苷酸序列,为疾病诊断和微生物资源发掘提供信息与依据,而且宏基因组方法多数是基于核酸分子杂交技术、PCR技术、基因芯片技术等检测方法,自动化程度高,可以准确灵敏地鉴定病原微生物,未来宏基因组学在病原微生物研究与诊断疾病方面的发展和应用可能主要集中在以下几个方面:

5.1 利用营养和生境差异选择性富集目的基因组

在宏基因组文库筛选过程中目的基因仅占总DNA的一小部分,如何获得这些肠道固有微生物的基因组并有效地减少宿主的基因组和外源DNA干扰是研究动物肠道微生物宏基因组的关键。为提高检出率,需要对样品进行预富集。目前预富集技术主要分为细胞水平富集和基因组水平富集。使用较多的是营养选择及物理化学指标选择来富集目的基因组(尽管这样做丢失了菌种的多样性),基本做法是通过利用选择培养基对目的微生物进行富集培养, 如用 42 羟基丁酸作唯一的碳源和能源筛选到能够稳定利用42羟基丁酸的克隆子, 经分析这些克隆子具有42羟基丁酸脱氢酶活性, 据此可以利用该基因编码的活性物质开展实验室纯培养[33]。对于一些不可纯培养的病原微生物,实验动物上典型的如泰泽菌(Tizzer),可以以其致病靶器官(组织)为样品,构建和筛选宏基因组文库进行富集,再利用克隆测序或直接二代测序的方法来检测鉴定,增加了病原微生物检出的机会。

5.2 宏基因组数据库的建立

对于病原微生物的检测和研究,一部分工作需要做流行病学调查,因此描述疫源地病原微生物群落的基本特征,明确各生境下微生物群落的宏基因组学特征是关键的第一步,也相当于为大规模利用高通量检测技术进行预筛选和为应急快检提供标准品,其中的基因组特征(如16SrRNA序列的比对分析,是细菌种属的鉴定与群体调查分析的有效手段)、生物信息数据及描述规范就成为未来动物病原检测的重要内容和结果判定的依据。

5.3 高通量筛选

高通量测序技术和基因芯片技术作为宏基因组学最为成熟的重要技术,其全面性、准确性以及信息的深入程度都令其他传统技术无法企及。在几种高通量(二代)测序技术中,罗氏454测序技术和Illumina测序技术是目前应用宏基因组学研究中应用的主流。随着高通量测序技术的发展,功能基因芯片将微生物群落的结构和功能紧密结合,与高通量测序技术相互补充, 可用于对病原微生物群落功能结构和代谢功能的研究。

5.4 大力发展动物病原微生物宏基因组学的生物信息学

高通量测序和基因芯片等技术为病原微生物研究提供了极大的数据量,如何从这些海量数据中挖掘有效信息,成为宏基因组学研究的一大难题。特别是随着高通量检测技术成本不断下降、通量逐渐提高、准确度越来越有保障,生物信息学(bioinformatics)的发展将成为制约微生物研究的瓶颈[34]。最近,Deng等[35](2012)基于高通量数据成功构建了分子生态网络(molecular ecological networks, MENs),该网络可根据数据固有特性自动选择阈值,可较好地反映环境中微生物之间的相关性,并且对高通量技术普遍存在的高噪音问题有很好的耐受性,因此大力发展动物病原微生物信息学及其网络平台是今后的重要任务之一。

参考文献:

[1] Kellenberger E. Exploring the unkown-The silent revolution of microbiology[J]. EMBO Reports,2001,2(1),5-7.

[2] Schmidt T,DeLong EF,Pace NR. Analysis of a marine picoplankton community by16srRNA gene cloning and Sequencing[J]. J Bacteriol,1991,173(14):4371-4378.

[3] Stein JL,Marsh TL,Wu KY,etal. Characterization of uncultivated prokaryotes: isolation and analysis of a 40-kilobase-pair genome fragment front planktonic marine archaeon[J]. J Bacteriol,1996,178(3):591-599.

[4] Handelsman J, Rondon MR, Brady SF,etal. Molecular biological access to the chemistry of unknown soil microbes: a new frontier for natural products[J]. Chem Biol, 1998,5(10), R245-R249.

[5] Zengler K, Palsson BO. A road map for the development of community systems (CoSy) biology[J]. Nat Rev Microbiol,2012,10,366-372.

[6] Knietsch A,Waschkowitz T,Bowien S,etal. Construction and screening of metagenomic libraries derived from enrichment cultures: generation of a gene bank for genes conferring alcohol oxidoreductase activity on Escherichia coli[J]. Appl Environ Microbiol.,2003,69(3) : 1408-1416.

[7] Daniel R. The metagenomics of soil [ J ]. Nat Rev Microbiol, 2005,3 (6): 470- 478.

[8] Sebat JL,Colwell FS,Crawford RL. Metagenomic profiling:microarray analysis of an environmental genomic library[J]. Appl Environ Microbiol,2003,69 (8):4927-4934.

[9] Wagner M,Nielsen PH,Loy A,etal. Linking microbial community structure with function:fluorescence in situ hybridization micro-autoradiography and isotope arrays[J]. Curr Opin Biotechnol,2006,17(1):83-91.

[10] Margulies M,Egholm M,Altman WE,etal. Genome sequencing in microfabricated high density picolitre reactors [J]. Nature,2005,437(7057):376-380.

[11] Lu Y,Conrad R. In situ stable isotope probing of methanogenic archaea in the rice rhizosphere[J]. Science, 2005,309 (5737) :1088-1090.

[12] Swanson KS,Dowd SE,Suchodolski JS,etal. Phylogenetic and gene-centric metagenomics of the canine intestinal microbiome reveals similarities with humans and mice[J]. ISME J,2011, 5(4): 639-649.

[13] Qin J,Li R,Raes J,etal. A human gut microbial gene catalogue established by metagenomic sequencing[J]. Nature, 2010, 464(7285): 59-65.

[14] Breitbart M,Hewson I,Felts B,etal. Metagenomic analyses of an uncultured viral community from human feces[J].J Bacteriol, 2003, 185(20): 6220-6223.

[15] Gill SR,Pop M,Deboy RT,etal. Metagenomic analysis of the human distal gut microbiome[J]. Science, 2006,312(5778), 1355-1359.

[16] Kurokawa K,Itoh T,Kuwahara T,etal.Comparative metagenomics revealed commonly enriched gene sets in human gut microbiomes[J].DNA Res,2007,14(4):169-181.

[17] Finkbeiner SR,Allred AF,Tarr PI. Metagenomic analysis of human diarrhea: Viral detection and discovery[J]. PLoS Pathog,2008,4(2): e1000011. doi: 10.1371/journal.ppat.1000011.

[18] Keijser BJ,Zaura E,Huse SM,etal. Pyrosequencing analysis of the oral microflora of healthy adults[J]. J Dent Res,2008,87(11): 1016-1020.

[19] Zaura E,Keijser BJ,Huse SM,etal. Defining the healthy"core microbiome"of oral microbial communities[J]. BMC Microbiol,2009,9:259.doi: 10.1186/1471-2180-9-259.

[20] Willner D,Furlan M,Haynes M,etal. Metagenomic Analysis of Respiratory Tract DNA Viral Communities in Cystic Fibrosis and Non-Cystic Fibrosis Individuals[J]. PLoS ONE,2009,4(10): e7370. doi:10.1371/journal.pone.0007370.

[21] Gao Z,Tseng CH,Pei ZH,etal.Molecular analysis of human forearm superficial skin bacterial biota[J].Proc Natl Acad Sci USA,2007,104(8):2927-2932.

[22] 冯育芳,邢进,王吉,等. 普通环境长爪沙鼠肠道菌群的分离鉴定[J].实验动物科学,2012,29(3):27-30.

[23] Xu B,Xu W,Yang F,etal. Metagenomic analysis of the pygmy loris fecal microbiome reveals unique functional capacity related to metabolism of aromatic compounds[J]. PLoS ONE, 2013;8(2):e56565. doi: 10.1371/journal.pone.0056565.

[24] Zhu L,Wu Q,Dai J,etal. Evidence of cellulose metabolism by the giant panda gut microbiome[J]. Proc Natl Acad Sci USA,2011,108 (43): 17714-17719.

[25] Smith AH,Mackie RI. Effect of Condensed Tannins on Bacterial Diversity and Metabolic Activity in the Rat Gastrointestinal Tract[J]. Appl Environ Microbiol, 2004,70(2):1104-1115.

[26] Muyzer G,De Waal EC,Uitterlinen AG. Profiling of complex microbial populations by denaturing gradient gel electrophoresis analysis of polymerase chain reaction-amplified genes coding for 16SrRNA[J]. Appl Eviron Microbiol, 1993,59(3): 695-700.

[27] Satokari RM,Vauqhan EE,Akkermans AD,etal.Bifidobacterial diversity in human feces detected by genus-specific PCR and denaturing gradient gel electrophoresis[J].Appl Eviron Microbiol,2001,67(2):504-513.

[28] Zhu WY,Williams BA,Konstantinov SRetal. Analysis of 16S rDNA reveals bacterial shift during in vitro fermentation of fermentable carbohydrate using piglet faeces as inoculum[J]. Anaerobe.2003,9(4):175-180.

[29] 高倩,王友明,吴旧生. 肠道菌群变化对实验小鼠肠黏膜免疫的影响[J].中国实验动物学报,2012,20(5):45-49.

[30] 袁志辉,蓝希钳,杨廷,等. 家蚕肠道细菌群体调查与分析[J].微生物学报.2006,46(2):285-291.

[31] Rawls JF,Samuel BS,Gordon JI.Gnotobiotic zebra fish reveal evolutionarily conserved responses to the gut microbiota[J]. Proc Natl Acad Sci USA,2004,101(13):4596- 4601.

[32] López-López O,Cerdán ME, Gonzalez-Siso MI. New Extremophilic Lipases and Esterases from Metagenomics[J]. Curr Protein Pept Sci, 2014 Feb 28[Epub ahead of print],(PMID:24588890).

[33] Gabor EM,de Vries EJ,Janssen DB. Construction,characterization, and use of small insert gene banks of DNA isolated from soil and enrichment cultures for the recovery of novel amidases[J]. Environ Microbiol,2004,6(9):948- 958.

[34] Simon C,Daniel R. Metagenomic analyses:past and future trends[J]. Appl Environ Microbiol, 2011,77(4), 1153-1161.

[35] Deng Y,Jiang YH,Yang Y,etal. Molecular ecological network analyses[J]. BMC Bioinformatics,2012 May 30;13:113. doi: 10.1186/1471-2105-13-113.

猜你喜欢
基因组学文库高通量
高通量卫星网络及网络漫游关键技术
国际太空(2023年1期)2023-02-27 09:03:42
基于基因组学数据分析构建肾上腺皮质癌预后模型
专家文库
猪业科学(2021年3期)2021-05-21 02:05:36
高通量血液透析临床研究进展
优秀传统文化启蒙文库
幽默大师(2020年10期)2020-11-10 09:07:22
系统基因组学解码反刍动物的演化
科学(2020年2期)2020-08-24 07:56:44
关于推荐《当代诗坛百家文库》入选诗家的启事
中华诗词(2019年1期)2019-11-14 23:33:56
Ka频段高通量卫星在铁路通信中的应用探讨
专家文库
猪业科学(2018年4期)2018-05-19 02:04:31
中国通信卫星开启高通量时代