李 鑫 罗晓霞 张利莉*
(1塔里木大学生命科学学院,新疆 阿拉尔 843300)
(2新疆生产建设兵团塔里木盆地生物资源保护利用重点实验室,新疆 阿拉尔 843300)
耐碱链霉菌是挖掘生物活性产物的宝贵资源,通常在近pH中性环境不能生长或生长缓慢,在高pH的环境下生长较好,高pH环境可能激活了耐碱微生物的某些基因使其具有独特的生理和代谢机制,能够产生特殊及多样化的代谢产物[1-3]。但目前已知微生物资源仅占实有总数的1%~10%,极端环境的微生物资源更是知之甚少,还有很大挖掘空间[4-5]。因此,极端环境微生物物种鉴定十分重要,物种鉴定是获得微生物资源、了解物种分布情况以及活性产物挖掘的重要基础。随着人类长期滥用抗生素及用药习惯不规范等因素造成耐药菌株的出现,新型药物的寻找迫在眉睫。传统的挖掘方式不能满足生产生活需要,基于基因导向的次级代谢产物挖掘策略成为目前的研究热点。基因导向的次级代谢产物挖掘策略就是对微生物进行全基因组测序,通过基因组注释、分析以及相关蛋白和基因簇的预测明确菌株的次级代谢潜能,从而有针对性地进行挖掘,避免了传统挖掘方式耗时长、随机性大等限制性因素,因此基因组信息能够为挖掘次级代谢产物快速、准确获得新的天然产物提供理论基础。
TRM49041是我室从罗布泊地区分离的一株耐碱菌株,为了明确其分类学地位及代谢潜力,本研究拟从形态特征、基因型特征、生理生化特征、化学特征和基因组测序等方面进行分析及鉴定,为丰富微生物种质资源库、寻找结构新颖作用机制独特的天然产物奠定良好工作基础。
实验菌株:菌株TRM49041分离自新疆罗布泊地区渠沟沉积物,菌种纯化后保存于实验室。
1.2.1 基因特征鉴定
参照Andreas等人的方法[6]提取TRM49041全基因组 DNA,以 27F(5’-GAGTTTGATCCTGGCTCAG-3’)和 1492R(5’-GGTTACCTTGTTACGACTT-3’)为引物,TRM49041基因组DNA为模板,扩增菌株16S rRNA基因,通过克隆测序获得菌株16S rRNA基因序列,后在EzTaxon server[7]数据库中比对,通过 MEGA6[8],采用最大简约法、最大似然法以及邻近法三种方法构建系统进化树。全基因组测序采用Illumina Hiseq平台测序。
1.2.2 形态特征鉴定
参照《放线菌快速鉴定与系统分类》[9],将菌株接种于 ISP 系列培养基(ISP1、ISP2、ISP3、ISP4、ISP5、ISP6和ISP7)[10]以及查氏培养基、NA培养基、PDA培养基中37℃培养10~14 d,观察并记录菌株生长情况,菌株电镜拍摄委托广东微生物所完成。
1.2.3 生理生化特征鉴定
生理生化指标检测方法采用《放线菌快速鉴定与系统分类》[9]进行菌株生长温度、生长盐浓度、生长pH、碳源利用、黑色素产生、硫化氢产生、明胶液化、牛奶凝固与胨化、淀粉水解、硝酸盐还原、氧化酶产生、过氧化氢酶产生、尿素酶产生、脂肪酶产生以及纤维素分解等指标测定。
1.2.4 化学特征鉴定
全细胞水解糖和氨基酸组分鉴定参照Hasegawa等[11]方法,极性脂鉴定参照Minnikin等[12]方法通过二维薄层TLC板显色鉴定,甲基萘醌鉴定参照Collins等[13]方法进行提取,通过HPLC检测,细胞脂肪酸由广东微生物所完成,按照MIDI公司微生物识别系统测定。
1.2.5 全基因组测序、注释及分析
TRM49041测序由上海派森诺公司完成。测序采用全基因组鸟枪法,构建不同插入片段文库,利用二代测序技术对文库进行双末端测序。采用A5-MiSeq和SPAdes对去除接头序列的测序数据进行从头拼装得到contig和scaffold,对所得序列进行评估比较以及碱基校对。将所得基因组序列进行相关功能元件预测以及蛋白编码基因功能注释。
2.1.1 基因型特征的鉴定
对菌株TRM49041的16SrRNA基因进行比对分析,发现与Streptomyces luozhongensisTRM 49605T最相似,相似性为99.59%,ANI值为99.97%;与菌株Streptomyces roseolilacinusNBRC 12815T的相似性为98.54%,ANI值为86.27%。分别用最大简约法、最大似然法以及邻近法进行系统进化树的构建,发现菌株TRM49041呈独立的分支,与罗中链霉菌最相近(图1)。
图1 菌株TRM49041 16S rRNA基因的系统进化分析
2.1.2 形态特征鉴定
菌株TRM49041在ISP系列培养基、NA培养基、查氏培养基以及PDA培养基上均长势良好(表1),在ISP1培养基中菌体生长良好、菌落偏小、密集,呈黄色光滑凸起状;在ISP2培养基中菌体生长良好,菌落呈黄色褶皱状;在ISP3培养基中菌落呈褶皱凸起状;在ISP4、ISP5培养基中菌落呈黄、褐色光滑凸起状;在ISP6培养基中菌体生长较弱、菌落呈白色凹陷状;在ISP7培养基中菌体生长良好,菌落呈黄、褐色褶皱状;在NA培养基中菌体生长旺盛、菌落偏小,密集,呈白色光滑凸起状;在查氏、PDA培养基中菌落呈黄色褶皱凸起状。菌株在ISP4培养基上生长最旺盛,菌体量最多且菌落形态规整呈圆形,基内菌丝呈黄色(图2-a),因此选用ISP4培养基作为摸索TRM49041最适温度、最适盐浓度、最适pH及菌株形态特征鉴定的基础培养基。通过S-3000N扫描电镜观察发现菌株气生菌丝呈灰白色,粗壮,无间隔,未见孢子及孢子囊形成(图2-b),形态特征鉴定结果表明TRM49041符合链霉菌一般特性。
表1 TRM49041在不同培养基生长情况
图2 TRM49041菌落形态及扫描电镜图
2.1.3 生理生化特征鉴定
通过最适生长温度、最适生长NaCl浓度、最适生长pH以及碳源利用情况等方面对TRM49041的生理生化特征进行鉴定,结果如表2所示。TRM49041最适生长温度为37℃,最适pH为8.0~10.0,最适NaCl浓度为1%,菌株能够利用蔗糖、D-甘露醇、可溶性淀粉、D-半乳糖醇、棉子糖、乳糖、麦芽糖和L-鼠李糖作为唯一碳源。牛奶凝固与胨化、淀粉水解、硝酸盐还原、氧化酶产生、过氧化氢酶以及脂肪酶产生实验均呈现阳性结果;黑色素产生、硫化氢产生、明胶液化、尿素酶产生及纤维素水解实验结果呈阴性。通过生理生化特征鉴定,发现菌株与Streptomyces luozhongensisTRM 49605T相似性较大,但也存在差异。
表2 TRM49041及相似菌株生理生化指标比较
2.1.4 化学指标鉴定
通过全细胞水解糖组分、氨基酸组分、磷脂类型等方面对菌株TRM49041进行鉴定,结果表明TRM49041全细胞水解糖组分为核糖、木糖、葡萄糖、甘露糖及半乳糖(图3-a);全细胞氨基酸组分为L,L-DAP(图3-b);细胞膜磷酸脂类主要有DPG(磷脂酸甘油)、PE(磷脂酰甲醇胺)、PG(磷脂酰甘油)、PIM(磷脂酰甲基肌醇)以及一个未知类型的L极性脂(图 3-c);其主要脂肪酸类型为 C16:0ω8c(12.20%)、cyclo-C19:0(12.08%)、iso-C16:0(10.34%)、C18:1ω9c(7.39%)和cyclo-C17:0(7.33%);甲基萘醌类型为 MK-10(H6)和 MK-10(H8)。通过对菌株细胞壁化学组分特征的鉴定,发现TRM49041与相似菌株Streptomyces luozhongensisTRM 49605T和Streptomyces roseolilacinusNBRC 12815T存在差异(表3),具有典型新菌种的特性。
图3 TRM49041化学指标图
表3 TRM49041及相似菌株化学指标比较
通过菌株16S rRNA基因以及基因组ANI值比对,结果显示TRM49041与罗中链霉菌为同一个种,在形态特征、基因型特征、生理生化特征及化学特征具有相似之处,同时也存在明显差异。因此将TRM49041确定为罗中链霉菌的一个亚种,根据其耐碱特性,命名为罗中链霉菌耐碱亚种(Streptomycesluozhongensissubsp.alkalitolerant)。
2.2.1 TRM49041基因组组装与注释
TRM49041全基因组测序基于Illumina Hiseq测序平台,通过构建不同插入片段的文库,进行双末端测序,插入片段大小为400 bp,测序模式为paired-end 2*150 bp,采用A5-MiSeq和SPAdes进行从头拼接基因组。
原始数据结果表明,菌株TRM49041共有70 889 032个raw reads,通过序列拼接获得68个骨架,基因组全长7 019 135 bp,GC含量为73.99%,共编码6 212个基因。通过COG数据库分析(E-value<1E-10),获得COG功能注释的基因有5 193个,主要为功能预测、转录、碳水化合物代谢、能量转化以及次级代谢产物合成等,非编码RNA中含有1个5S rRNA、1个16S rRNA、1个23S rRNA以及 66个tRNA。
2.2.2 TRM49041 KEGG代谢通路分类
KEGG分类,是对糖代谢、脂代谢以及次级代谢物生物合成途径等多种代谢途径进行归类,是了解物种生命活动特征、代谢活动潜能的重要工具。通过KEGG代谢通路分类,菌株TRM49041共有4 348个基因被注释,其中关于糖代谢基因450个,占基因总数10.35%,氨基酸代谢基因361个,占基因总数8.30%,以及跨膜运输基因138个,占基因总数3.17%(图4),进一步分析发现注释基因中含有15个链霉素产生代谢通路相关基因,因此推测此菌株是一株能够产生链霉素或链霉素类似物的菌株。
图4 TRM49041 KEGG功能归类
2.2.3 TRM49041次级代谢潜能预测
通过GeneMarks及NCBI数据库预测蛋白编码基因,TRM49041共有6 212个ORF,在NCBI NR数据库中检索到相关蛋白编码基因数量为5 967个。通过antiSMASH预测该菌株次级代谢潜能,共获得27个潜在天然产物生物合成基因簇(表4)。
表4 TRM49041antiSMASH预测次级代谢产物生物合成基因簇
antiSMASH分析结果表明:链霉菌TRM49041具有丰富的天然产物生物合成基因簇,菌株含有NRP和Polyketide类基因簇,如cluster1,与链霉素生物合成基因簇相似性为85%;cluster2为核苷类化合物,与衣霉素生物合成基因簇相似性为64%;cluster5和cluster21为非核糖体肽类化合物,cluster5与salinichelins生物合成基因簇相似性为69%,cluster21与化合物JBIR-126生物合成基因簇相似性为92%;cluster3和cluster11为萜类化合物,cluster3与Ikarugamycin生物合成基因簇相似性为100%,cluster11与hopene生物合成基因簇相似性为76%;cluster18、cluster24为聚酮类化合物,cluster18与星孢菌素生物合成基因簇相似性为66%,cluster24与尼日利亚菌素生物合成基因簇相似性为55%。通过进一步比对分析发现cluster1具有链霉素合成相关结构基因;cluster2含有衣霉素合成相关结构基因;cluster3具有Ikarugamycin生物合成相关基因;cluster18具有星孢菌素合成相关结构基因;cluster21含有JBIR-126合成相关基因;cluster24含有尼日利亚菌素核心生物合成基因,因此推测TRM49041是一株能够产生链霉素、衣霉素、星孢菌素、Ikarugamycin、JBIR-126和尼日利亚菌素的潜力菌株,极具挖掘潜力。
本研究通过形态特征、基因型特征、生理生化特征及化学特征鉴定TRM49041具有罗中链霉菌的特征[14],同时也存在明显差异,根据鉴定结果以及TRM49041独特的耐碱特性确定其为罗中链霉菌耐碱亚种(Streptomyces luozhongensissubsp.alkalitolerant)。通过基因组分析预测发现,TRM49041具有更丰富的潜在次级代谢生物合成基因簇。因此,基于16S rRNA基因序列比对相同种相似性非100%的菌株,也具有挖掘潜力。实验结果及相关文献表明,基于16S rRNA序列物种鉴定方式的辨识度并不是很高,尤其是相近种的鉴定,作为物种鉴定及生态学研究的黄金标准不具备更细致的分辨能力,有研究发现,在2 013个细菌和古菌完整基因中,物种的16S rRNA基因存在异质性,尤其是极端环境来源的微生物,差异分歧更加明显[15]。用众多保守基因中的一个基因来反映菌株亲缘关系,存在种内变异性和基因组内操纵子间的异源性,可能会出现一定的偏差[16],因此仅通过16S rRNA基因不足以很好的区分相似种或种内亲缘关系,多个看家基因联用或寻找分辨率更高的鉴定标准可能会一定程度减少偏差,能够更细致划分种群分类关系,使得更多物种资源得到充分利用[17]。
TRM49041是一株耐碱链霉菌,高pH的环境可能会激活耐碱微生物的某些沉默基因,诱导出独特的代谢途径。通过基因簇预测TRM49041具有多种生物活性的次级代谢产物生物合成基因簇,如:抗结核杆菌的链霉素;抗真菌、抗病毒的衣霉素;抗真菌、抗高血压的星孢菌素等,初步推测该菌株具有较强的代谢能力,具有非常重要的挖掘价值。通过测序分析,解析菌株次级代谢途径已成为天然产物挖掘的主流趋势,本研究通过COG分析、GO注释以及KEGG代谢途径分析发现,TRM49041基因组中含有链霉素等多个次级代谢产物合成相关基因。链霉素作为重要的临床用药,备受关注,通过代谢组分分析,从D-葡萄糖出发合成6-磷酸葡萄糖,在脒基转移酶等多种酶作用下合成链霉素。6-磷酸葡萄糖也作为新霉素、卡那霉素等合成的前体物质,因此通过选择葡萄糖作为碳源,能够提高抗生素的产量,此外通过对脒基转移酶等关键酶基因进行克隆加倍,或增加强启动子等基因修饰也可大大提高抗生素的产量,为后期抗生素挖掘提供思路。
本研究相关结果为链霉菌的鉴定、分类提供参考数据,通过基因组预测及代谢组分分析可为抗生素的挖掘提供指导思路。