曹然,罗晓霞,张利莉*
(1塔里木大学生命科学学院,新疆 阿拉尔 843300)
(2塔里木盆地生物资源保护利用兵团重点实验室,新疆 阿拉尔 843300)
1943年,链霉菌首次由WAKSMAN S A等描述[1]。链霉菌是最大的放线菌属,已知放线菌所产抗生素的90%由本属产生。链霉菌能产生结构新颖、丰富的次级代谢产物,是挖掘生物活性产物的宝贵资源[2-3]。近年来,随着国内外研究学者对链霉菌活性产物挖掘的不断深入,链霉菌新物种研究逐渐成为新方向。链霉菌新物种的分离源以特殊环境土壤为主,其他分离源还包括海洋、沙漠、动植物体内等多种特殊的环境[4-6]。随着国内外研究学者对链霉菌新物种的深入研究,链霉菌新物种发表数量呈现上升趋势。目前,已有超过850个链霉菌新物种被发表。对于活性代谢产物和具有应用价值的链霉菌新物种研究逐渐成为新物种发表的重要创新点。我国地广物博,存在各种特殊环境,有待挖掘的链霉菌资源极为丰富,这也是近年来我国链霉菌新物种发表数量处于世界前列的重要原因。链霉菌新物种的挖掘为研究链霉菌次级代谢产物奠定了良好的基础。
近年来,越来越多的方法和手段被国内外研究学者用于微生物次级代谢产物的挖掘,且传统的研究方法已经难以得到满意的结果,因此对微生物进行基因水平的研究逐渐成为新的研究方向。基于基因水平的次级代谢产物的挖掘主要通过对微生物菌株进行全基因组测序,将测序后的数据进行基因组组装和注释后,运用相关生物信息学软件对其进行分析。通过对次级代谢产物生物合成基因簇及相关的预测明确微生物菌株的次级代谢潜力,从而更有针对性地进行深度挖掘,因此基于基因水平挖掘次级代谢产物已成为新药挖掘的突破点。
TRM68367是本实验分离自新疆阿克苏温宿县台兰河淤泥的链霉菌新物种,并对蜡状芽孢杆菌具有抑菌活性。本研究基于Illumina Hiseq 2000测序平台对菌株进行全基因组测序及生物信息学分析,为丰富微生物物种资源库、挖掘结构新颖、生物活性较强、具有特殊作用机制的天然产物提供理论依据。
1.1.1 菌株及来源
Streptomyces wensuensisTRM68367菌株,分离自新疆阿克苏温宿县台兰河淤泥,保藏于塔里木盆地生物资源保护利用兵团重点实验室、中国典型培养物保藏中心和比利时LMG菌种保藏中心,菌株保藏编号为Streptomyces wensuensisTRM68367T=CCTCC AA 2020004T=LMG 31944T。
1.1.2 培养基
(1)高氏一号固体培养基
可溶性淀粉20.0 g、磷酸氢二钾0.5 g、硝酸钾1.0 g、七水硫酸镁0.5 g、硫酸亚铁0.1 g/L、琼脂16.0 g、水1 L、pH 7.2~7.4。
(2)真菌:PDA培养基
土豆 200.0 g、葡萄糖 20.0 g、琼脂 17.0 g、水 1 L、pH 7.0。
细菌:MHA培养基
牛肉提取物2.0 g、酪蛋白水解物17.5 g、淀粉2.0 g、琼脂17.0 g、pH 7.3±0.1。
(3)TSB液体培养基
胰蛋白胨17.0 g、蛋白胨3.0 g、葡萄糖2.5 g、氯化钠5.0 g、磷酸氢二钾2.5 g、水1 L、pH 7.1~7.5。
1.1.3 主要试剂
10% SDS、5 mol/L NaCl、10% CTAB、3 mol/L 醋酸钠用于基因组DNA的提取,dNTP、Easy Taq酶、Easy Taqbuffer、DMSO、16S rRNA扩增引物27F(5’-GAGTTTGATCCTGGCTCAG-3’)和 1492R(5’-GGTTACCTTGTTACGACTT-3’)。
1.1.4 主要仪器
主要仪器设备见表1。
表1 主要仪器及设备
1.2.1 菌株抑菌活性实验
第一步:发酵液待测液制备:向三角瓶中装入150 mL高氏一号液体发酵培养基,120℃,30 min灭菌,挑取三个菌饼接入发酵培养基,30℃,180 r/min培养5 d。发酵液经8000 r/min,10 min离心后,上清液经过0.22 μm滤膜除菌得到无菌发酵液。第二步:病原菌菌悬液的准备:配制40%甘油,吸取甘油至培养好的病原菌平板中,用无菌竹签刮取菌丝,用移液枪将菌悬液移入无菌玻璃瓶中。将孢子悬浮液摇匀,分装至无菌甘油管中,-20℃保藏。第三步:真菌病原菌平板的制作:吸取200 μL病原菌菌悬液涂布于PDA培养基。采用滤纸片法检测放线菌发酵液对病原菌的抑制作用。吸取200 μL发酵液滴加在滤纸片上,将滤纸片放在病原菌平板上,真菌放置28℃培养箱,细菌放置在37℃培养箱中培养,测量抑菌圈大小。细菌病原菌平板的制作:吸取200 μL病原菌菌悬液涂布于MHA培养基。采用滤纸片法检测放线菌发酵液对病原菌的抑制作用。吸取200 μL发酵液滴加在滤纸片上,将滤纸片放在病原菌平板上,真菌放置28℃培养箱,细菌放置在37℃培养箱中培养,测量抑菌圈大小。
1.2.2 菌株培养及基因型特征鉴定
将TRM68367划线接种到高氏一号固体培养基中,30℃活化5 d后,挑取三个菌饼将其转接到TSB液体培养基中,30℃,180 r/min培养3 d后于50 mL离心管收集菌丝体,经8000 r/min,10 min离心后弃去上清夜保留菌丝体进行基因组DNA提取。菌株基因组 DNA采用10% CTAB法进行提取[7]。 以TRM68367基因组DNA为模板,PCR扩增菌株16S rRNA,通过克隆测序获得菌株16S rRNA基因序列,经EzBioCloud数据库比对,采用MEGA 7.0软件[8]构建系统进化树。
1.2.3 全基因组测序及基因组组装
将提取好的TRM68367基因组DNA经1%琼脂糖凝胶电泳检测,并用KAIKO K5800超微量分光光度计检测基因组DNA的浓度。将合格的样品送往上海派森诺生物信息科技有限公司进行全基因组测序。基于Illumina Hiseq 2000测序平台,利用第二代测序技术对其进行全基因组测序,对基因组数据采用SOAP denovo 1.05软件进行拼接,AbySS 2.0软件进行注释分析。
1.2.4 温宿链霉菌TRM68367完整基因组注释与分析
1.2.4.1 蛋白编码基因预测
采用 GeneMarkS[9]和 Glimmer 3.0 软件对全基因组序列进行基因组ORFs预测。GeneMarkS用于细菌基因组的蛋白质编码基因预测。此软件预测方法通过GeneMark.hmm建立相应的统计模型,利用序列中核酸使用的频率表矩阵作为基础,来预测序列中编码区域。
1.2.4.2 非编码RNA预测
使用 tRNAscan-SE 软件[10]预测 tRNA 区域和tRNA的二级结构。原核生物的rRNA分为三类:5S rRNA、16S rRNA和23S rRNA,使用RNAmmer软件[11]预测rRNA。
1.2.4.3 蛋白编码基因功能注释
蛋白编码基因功能注释的主要目的是对所有蛋白编码基因进行功能解析,从而在分子水平上对该物种进行解析。目前常见的基因功能注释数据库主要有COG,KEGG[12],GO[13]等。
1.2.4.4 次级代谢产物生物合成基因簇预测
采用 antiSMASH 5.0[14]软件预测温宿链霉菌TRM68367次级代谢产物生物合成基因簇,并对次级代谢产物生物合成基因簇进行分析。
由表2可知,菌株TRM68367对蜡状芽孢杆菌具有显著的抑菌作用,抑菌圈直径达到12.92±0.20 mm。
表2 菌株抑菌活性结果
将TRM68367基因组DNA于1%琼脂糖凝胶电泳检测,结果见图1。基于16S rRNA基因序列构建的菌株TRM68367与其相邻菌株的Neighbour-Joining系统进化树见图2。
图1 TRM68367基因组DNA琼脂糖凝胶电泳图
图2 基于16S rRNA基因序列构建的菌株TRM68367与其相邻菌株的Neighbour-Joining系统进化树
由图1可知,TRM68367基因组DNA目的条带单一,基因组DNA提取质量较好。TRM68367基因组 DNA 浓度为 32.6 ng/μL,OD260/OD280值为 1.88,DNA无降解、无污染,达到基因组DNA测序要求,将合格的样品送往上海派森诺生物信息科技有限公司进行全基因组测序,并对测序数据进行基因组拼接及注释,对注释后的基因组数据进行生物信息学分析。
对菌株TRM68367的16S rRNA进行比对分析,发现与Streptomyces hyderabadensisOU-40T菌株最相似,其相似性为97.93%,ANI值为83.62%,DNA-DNA杂交结果较低,其dDDH值为23.47%。对菌株TRM68367采用邻近法Neighbour-Joining进行系统进化树的构建,发现菌株TRM68367呈现独立的分支,推测其可能为链霉菌潜在新物种。
对基因组组装结果采用GeneMarkS和Glimmer 3.0软件预测TRM68367和S.hyderabadensisOU-40T基因组中的基因组ORFs。使用tRNAScan-SE和RNAmmer软件预测TRM68367和S.hyderabadensisOU-40T基因中的存在的tRNA和rRNA,结果统计见表3。
表3 基因组基本特征
将预测得到的9186个基因的蛋白序列与COG、KEGG和GO数据库进行比对分析,获得与各数据库相对应的基因功能信息。
KEGG代谢通路是代谢活动潜能及物种生命活动特征的重要工具。通过KEGG代谢通路分类,菌株TRM68367共有2825个基因得到注释,占总基因的30.75%。
COG按照功能一共可以分为二十五类。TRM68367基因组COG功能注释图见3。结果表明,TRM68367共有5243个蛋白质序列在COG数据库中得到注释,占总蛋白质序列的57.07%。由图3可知,TRM68367预测得到的蛋白质序列注释主要有:369个基因参与能量生产和转换(energy production and conversion,C),蛋白占比为5.81%;615个基因参与氨基酸的运输和代谢(amino acid transport and metabolism,E),其蛋白占比为9.68%;605个基因参与碳水化合物的运输和代谢(carbohydrate transport and metabolism,G),占 9.53%;753个基因参与转录(transcription,K),蛋白占比为11.86%;362个基因参与复制、重组和修复(replication,recombination and repair,L),其蛋白占比为5.7%;343个基因参与无机离子的转运和代谢(inorganic ion transport and metabolism,P),占5.4%;934个基因参与一般功能预测(general function prediction only,R),其蛋白占比 14.71% 和318个基因参与信号转导机制(signal transduction mechanisms,T),其蛋白占比为5.01%。
图3 TRM68367的COG功能注释分类图
GO总共有三个ontology,分别描述基因的分子功能(molecular function)、细胞组分(cellular component)及生物学过程(biological process)。TRM68367基因组的GO功能注释结果见图4。由图4可知,TRM68367的基因组中共有4649个蛋白质序列在GO数据库中得到注释,占总蛋白质序列的50.60%,在细胞组分方面,主要与膜(membrane)、细胞(cell)、细胞组分(cell part)单元有关;在分子功能方面,主要与催化活性(catalytic activity)、结合(binding)、转运活性(transporter activity)、核酸结合转录因子活性(nucleic acid binding transcription factor activity)单元有关;在生物学过程方面,主要与代谢过程(metabolic process)、细胞过程(cellular process)、组织过程(single-organism process)、生物调节(biological regulation)单元有关,表明菌株活性多集中于酶类、分化及代谢等,该菌株中含有的酶类可能对蜡状芽孢杆菌的活性产生抑制作用。
图4 TRM68367的GO功能注释分类图
采用antiSMASH 5.0对TRM68367基因组中潜在的次级代谢产物生物合成基因簇进行预测,TRM68367基因组中的次级代谢产物生物合成基因簇主要类型统计见表4。
表4 TRM68367基因组中次级代谢产物生物合成基因簇类型统计
通过对菌株TRM68367的antiSMASH分析,共预测到33个潜在次级代谢产物生物合成基因簇,结果表明TRM68367具有丰富的次级代谢产物生物合成基因簇,菌株含有 NRPS、PKS、terpene、RIPP类基因簇,其中Cluster4、Cluster22、Cluster26和Cluster28为NRPS类基因簇,Cluster4和Cluster28与环肽类化合物基因簇相似性分别为26%和4%,Cluster22与极光霉素生物合成基因簇相似性为4%,Cluster26与远霉素生物合成基因簇的相似性为17%;Cluster12、Cluster16为PKS类基因簇,Cluster12与烷基间苯二酚相生物合成基因簇相似性为100%,Cluster16与孢子色素生物合成基因簇的相似性为75%;Cluster3、Cluster6和Cluster17为terpene类基因簇,Cluster3与hopene生物合成基因簇相似性为76%,Cluster6与versipelostatin生物合成基因簇相似性为5%及Cluster17与土臭素的生物合成基因簇相似性100%;Cluster5为RIPP类基因簇,与informatipeptin生物合成基因簇的相似性为46%;Cluster23为丁内酯类抗生素,与新制癌菌素生物合成基因簇的相似性为4%。
通过进一步比对分析发现Cluster1、Cluster7和Cluster27为二酮哌嗪类基因簇,基因簇类型为CDPS(环二肽合酶),研究表明,环二肽合酶参与二酮哌嗪类化合物的生物合成[15]。由于该菌株对蜡状芽孢杆菌具有抑菌活性,且蜡状芽孢杆菌是二酮哌嗪类化合物典型的拮抗菌之一,因此可以确定该基因簇是导致菌株对蜡状芽孢杆菌产生抑菌活性的关键基因簇;Cluster4和Cluster28含有环肽类化合物生物合成相关基因,二酮哌嗪类化合物是环肽类化合物中的一类,发现该基因簇对蜡状芽孢杆菌具有显著的抑制作用,因此可以确定该基因簇对蜡状芽孢杆菌的活性起到抑制作用;Cluster23含有新制癌菌素核心生物合成基因,新制癌菌素是双烯二炔类抗生素,是临床上广泛应用的抗肿瘤药物,因此可以确定TRM68367是一株能够产生二酮哌嗪类化合物、环肽类化合物、新制癌菌素的潜力菌株,值得对其次级代谢产物进行深度挖掘。
通过基因型特征、形态特征、生理生化特征及化学特征鉴定菌株TRM68367的分类学地位[16],与其相似菌株比较存在显著差异,根据物种鉴定结果确定TRM68367代表链霉菌属新物种,将其命名为Streptomyces wensuensisTRM68367。基于16S rRNA基因序列对微生物物种进行鉴定的方式并不能很好的区分相似种或种内亲缘关系,作为物种鉴定的标准不具备更细致的分辨能力,相关文献报道,在细菌基因组中,物种的16S rRNA基因存在异质性,特别是极端环境来源的微生物,差异更加显著[17]。16S rRNA基因是细菌众多保守基因中的的一个,因此仅仅通过16S rRNA基因序列对物种进行鉴定是不足以的,可以通过对多个管家基因的联用和寻找分辨能力更高的物种鉴定标准在一定程度上可以减少偏差和误导,能够更快速的对相似种或种内亲缘关系进行鉴定,使更多物种资源都得以利用[18]。
TRM68367是一株分离自新疆阿克苏温宿县台兰河淤泥的链霉菌新物种,对其进行活性筛选发现该菌株对蜡状芽孢杆菌具有抑菌活性,因此对该菌株进行全基因组测序及生物信息学分析,通过对基因组次级代谢产物生物合成基因簇的预测发现,菌株TRM68367具有生物活性广泛的次级代谢产物生物合成基因簇,如:产二酮哌嗪类化合物,蜡状芽孢杆菌是二酮哌嗪类化合物典型的拮抗菌之一,对蜡状芽孢杆菌具有显著的抑菌作用;抗肿瘤抗生素的新制癌菌素和抑制RNA转录的远霉素等,可以确定该菌株具有较强的次级代谢潜力,为该菌株次级代谢产物的深度挖掘奠定了良好的理论基础。目前,通过对菌株进行全基因组测序及生物信息学分析来解析菌株次级代谢已成为天然产物挖掘的新方向,在TRM68367基因组中含有与代谢相关的次级代谢产物合成相关基因,通过对GO、COG、KEGG功能注释分析验证发现其结果具有较高的准确性。
本研究相关实验结果为链霉菌新物种的鉴定提供参考数据,同时丰富了物种资源库;通过全基因组测序分析和代谢组分分析为天然产物的深度挖掘提供理论指导。