摘要:采用形态学、生理生化和分子生物学方法对菌株R18进行菌种鉴定。通过基因组测序和生物信息学比较,进一步分析其分类地位和生物学特性,并在基因组水平上探讨该菌株红色素的合成基因簇和代谢路径。结果表明:菌株R18最佳生长条件为温度30~37 ℃,pH值6~8,NaCl质量浓度0~10 g·L-1;菌株R18与粘质沙雷氏菌模式菌株ATCC 13880的16S rDNA相似度为99.86%,基因组平均核苷酸均一性和数字DNA-DNA杂交值分别为98.73%,89.5%,均高于物种界定阈值,属于同一个物种;菌株R18灵菌红素合成基因簇全长35 021 bp,包含29个基因,其中,4个核心合成基因、10个补充的合成基因、1个调控基因、1个转运基因及13个其他基因,具有完整的灵菌红素合成代谢途径。
关键词: 粘质沙雷氏菌; 灵菌红素; 菌种鉴定; 基因组特性
中图分类号: Q 939.1文献标志码: A"" 文章编号: 1000-5013(2024)05-0626-10
Identification and Genomic Characterization of Prodigiosin-Producing Serratia sp. R18
Abstract: Strain R18 was identified using morphological, physiological, biochemical and molecular biological methods. Its taxonomic status and biological properties were further analyzed by comparing genome sequencing and bioinformatics, and the synthetic gene cluster and metabolic pathway of the red pigment in this strain were explored at the genomic level. The results showed that the optimal growth conditions for strain R18 were temperature of 30-37 ℃, pH value of 6-8, and the mass concentration of NaCl of 0-10 g·L-1. Strain R18 shared a 16S rDNA similarity of 99.86% to Serratia marcescens type strain ATCC 13880, the genome average nucleotide identity value and the digital DNA-DNA hybridization value were 98.73% and 89.5%, respectively, both of which were higher than the species identification threshold and belong to the same specie. Strain R18 prodigiosin synthetic gene cluster had a total length of 35 021 bp and contained 29 genes including 4 core synthetic genes, 10 complementary synthetic genes, 1 regulatory gene, 1 transporter gene and 13 other genes, it had a complete prodigiosin synthesis metabolic pathway.
Keywords:Serratia marcescens; prodigiosin; bacterial identification; genomic characterization
沙雷氏菌属于细菌界、变形菌门、γ-变形菌纲、肠杆菌目、肠杆菌科,该属包含粘质沙雷氏菌(Serratia marcescens)、嗜线虫沙雷氏菌(Serratia nematodiphila)、嗜昆虫沙雷氏菌(Serratia entomophila)和泉居沙雷氏菌(Serratia fonticola)等23个物种(https:∥lpsn.dsmz.de/genus/serratia),其中,粘质沙雷氏菌是模式种,包含产灵菌红素的A1,A2/A6生物型和不产灵菌红素的A3,A4,A5/A8及TCT等生物型。A3和A4生物型无处不在,A5/A8及TCT生物型主要来源于医院病人临床样品,A1,A2/A6生物型主要分布于自然环境中[1]。粘质沙雷氏菌也是一类生防菌,可生产多种具抗生性代谢产物,如灵菌红素、脂肽、碳青霉烯、细菌素等,具有抗菌、杀虫、杀藻、抗疟疾、抗肿瘤、免疫抑制、促进植物生长等作用[2-5]。产灵菌红素的粘质沙雷氏菌菌落呈红色、酒红色或粉红色,无明显扩散性,菌种资源容易从普通环境样品中获取,生物安全性较高,因此,近年来其成为高校“细菌画”创作中使用频率最高的菌种之一,第7届全国微生物培养皿艺术大赛153幅作品中,有62幅作品将粘质沙雷氏菌作为“红色颜料”进行作品创作,深受广大师生好评[6]。
在筹办华侨大学微生物培养皿艺术比赛时,从健康人体皮肤表面分离到一株产红色素菌株R18,其菌落颜色鲜红靓丽,是“细菌画”创作的绝佳“颜料”。为了更安全且有针对性地将该菌株应用于微生物学实验教学和学生科创活动中,本文采用形态学、生理生化和分子生物学方法对菌株R18进行菌种鉴定,通过基因组测序和生物信息学分析,进一步分析其分类地位和生物学特性。
1 材料与方法
1.1 实验材料
1.1.1 菌株 沙雷氏菌株R18来源于健康人类皮肤表面,保藏于中国海洋微生物菌种保藏管理中心,保藏号为MCCC 1K08643,生物危害等级为4类。
1.1.2 主要仪器和试剂 Multiskan FC型酶标仪(美国ThermoFisher公司);Centrifuge5417R型低温高速离心机(德国Eppendorf公司);1-14型高速离心机(德国Sigma公司);GE9612T-S型基因扩增仪(浙江省杭州市柏恒科技有限公司);DT 93-3型微量振荡器(江苏省大唐医疗器械有限公司)。胰蛋白胨(英国OXOID公司);酵母提取物(英国OXOID公司);2×premix Taq(日本TaKaRa公司);λ-Hind Ⅲ digest DNA marker(日本TaKaRa公司);DL2000 DNA marker(日本TaKaRa公司);细菌基因组DNA快速抽提试剂盒(北京市百泰克生物技术有限公司);其他试剂为国产分析纯。
1.1.3 培养基 1) LB培养基:蛋白胨1 g,酵母提取物0.5 g,NaCl 1 g,dH2O 100 mL,pH值为7.2~7.8;2) 牛奶琼脂平板:蛋白胨0.1 g,酵母提取物0.02 g,NaCl 1 g,琼脂2 g,市售脱脂牛奶50 mL,dH2O 50 mL;3) 淀粉/吐温80琼脂平板:蛋白胨0.1 g,酵母提取物0.02 g,NaCl 1 g,琼脂2 g,淀粉/吐温80 0.2 g,dH2O 100 mL。
1.2 实验方法
1.2.1 菌株鉴定 参照《常见细菌系统鉴定手册》[7]进行菌落形态、菌体形态、生长温度范围等生理生化特征测定。使用细菌16S rDNA通用引物(27F:5′-AGAGTTTGATCCTGGCTCA-3′;1492R:5′-GGTTACCTTGTTACGACTT-3′)[8]进行聚合酶链式反应(PCR)扩增,PCR产物使用10 g·L-1的琼脂糖凝胶电泳检测,并委托擎科科技有限公司进行DNA序列测定。所得序列校正后,在EzBioCloud数据库(http:∥eztaxon-e.ezbiocloud.net)进行同源性分析[9],从数据库下载相近菌种的16S rDNA序列。使用DNAMAN 5.1软件和MEGA 7软件,采用邻近连接法构建系统进化树[10]。
1.2.2 基因组测序和拼装 采用细菌基因组DNA快速抽提试剂盒提取细菌基因组DNA,使用10 g·L-1琼脂糖凝胶电泳、NanoDrop one型分光光度计和Qubit 3.0型荧光光度计检测DNA样品的质量浓度、纯度和降解程度。委托广东省美格基因科技有限公司进行基因组测序分析。采用NEB Next注册商标" Recalbon○C Ultra DNA Library Prep Kit试剂盒(美国New England Biolabs公司)构建测序文库,使用Illumina Novaseq 6000测序平台(美国New England Biolab公司)进行高通量测序,测序原始数据通过FastQC v0.11.9软件[11]和Trimmomatic v0.36软件[12]进行质控,并去除低质量数据,采用SPAdes v3.9.0软件[13]拼接构建contigs/scaffolds(gt;500 nt),并用QUAST v5.0.2软件[14]评估拼接质量。
1.2.3 基因预测和功能注释 采用GeneMarkS v4.17软件(http:∥topaz.gatech.edu/GeneMark/)[15]进行编码基因预测。采用tRNAscan-SE v1.3.1软件[16]预测tRNA基因,采用RNAmmer v1.2软件[17]预测rRNA基因,采用Rfam数据库Blast程序(https:∥rfam.org/)[18]预测snRNA基因。采用BLAST v2.14.1软件(https:∥ftp.ncbi.nlm.nih.gov/blast/executables/LATEST/)将编码基因与Gene Ontology(GO)[19],Kyoto Encyclopedia of Genes and Genomes(KEGG)[20-21],Cluster of Orthologous Groups of Proteins(COG)[22],Non-Redundant Protein Database(NR)[23],Carbohydrate-Active EnZymes Database(CAZy)[24]数据库进行比对,获得基因功能注释信息。
1.2.4 比较基因组学分析 使用EzBioCloud中的在线工具ANI Calculator(https:∥www.ezbiocloud.net/tools/ani)分析菌株R18与近源物种的基因组平均核苷酸均一性(gANI)[25]。使用Genome-to-Genome Distance Calculation(GGDC) version 2.1 formula 2(https:∥ggdc.dsmz.de/distcalc2.php)分析菌株R18与近源物种的基因组同源性,即数字DNA-DNA杂交(dDDH)值[26]。
1.2.5 次级代谢产物合成基因簇分析 采用antiSMASH 7.0在线工具(https:∥antismash.secondarymetabolite. org/)对菌株R18 中的次级代谢产物合成基因簇进行预测[27]。
1.2.6 GenBank登录号 菌株R18 的16S rDNA和基因组序列已提交到GenBank数据库,登录号分别为OR043023,JASKOU000000000.1。
2 实验结果与分析
2.1 菌株形态及生理生化特征
菌株R18不同条件下的生长状况,如图1所示。图1中:t为时间;D(620)为吸光度;ρ(NaCl)为NaCl的质量浓度;θ为温度。
菌株R18置于LB平板(LB平板直径=80 mm),在30 ℃条件下培养24 h后,形成红色菌落,直径2~4 mm,菌落表面光滑湿润、边缘整齐、突起且不透明(图1(a))。菌体为革兰氏染色阴性,形态近球形或短棒状,宽0.4~0.5 μm,长0.4~0.8 μm;氧化酶和过氧化氢酶阳性,产胞外酯酶和蛋白酶,不产淀粉酶。
菌株R18在温度20~37 ℃,pH值6.0~9.0,NaCl质量浓度0~90 g·L-1条件下均可生长,最佳生长条件为温度30~37 ℃,pH值6.0~8.0,NaCl质量浓度 0~10 g·L-1(图1(b)~(d))。菌株R18的形态和各类生理生化特征与模式菌株S. marcescens ATCC 13880一致[1]。
2.2 16S rDNA系统发育分析
菌株R18 16S rDNA基因序列全长1 530 bp,在EzBioCloud数据库中的比对结果表明,菌株R18属于Serratia属,与模式菌株S. marcescens ATCC 13880和S. nematodiphila DSM 21420相似度最高,均为99.86%。系统发育分析也显示3个菌株亲缘关系最近,处于同一个进化分支。
采用邻近连接法构建系统进化树, 沙雷氏菌R18与其近源种的16S rDNA系统发育树,如图2所示。
图2中:节点数值为大于40%的Bootstrap值;括号内为GenBank登录号;比例尺为进化距离。
2.3 沙雷氏菌R18基因组比较分析
基因组测序获得8 037 186个测序片段(reads)共1 205 577 900 nt的原始数据,去除低质量片段后,可得7 446 608个reads(1 098 126 252 nt),序列片段拼装成23个重叠群(contigs),菌株R18基因序列总长度为5 046 985 bp,GC含量(GC含量是指DNA序列中鸟嘌呤(guanine)和胞嘧啶(cytosine)两种碱基的总比例)为59.7%,基因组测序深度为217×,预测有4 872个编码基因、85 tRNA基因、1个16S rRNA基因、6个5S rRNA基因和43个sRNA基因。菌株R18与各近源物种基因组大小差异不大(标准差σ=0.16),GC含量的比例也较为接近(σ=0.58),但编码的基因数量存在较大差异(σ=175.25),可能与测序的完整度、质粒的存在状况有关。
沙雷氏菌R18与其近源物种的基因组特征,如表1所示。
表1中:1为菌株R18;2为S. marcescens ATCC 13880(GCA_006974205.1);3为S. nematodiphila DSM 21420(GCA_000738675.1);4为S. bockelmannii S3(GCA_008011855.1);5为S. surfactantfaciens YD25(GCA_001642805.2);6为S. ureilytica C7(GCA_008122445.1)。
沙雷氏菌R18与其近源物种的gANI值/dDDH值,如表2所示。表2中:1~6的含义与表1相同。
由表2可知:菌株R18与4个近源菌种基因组gANI值均高于94%,基因组的相似度较高,其中,与S. marcescens ATCC 13880和S. nematodiphila DSM 21420的gANI值高于95%~96%的物种界定阈值[28-30],分别为98.73%,96.98%;dDDH值分析结果也表明菌株R18,S. marcescens ATCC 13880和S. nematodiphila DSM 21420三者之间的dDDH值高于同一个物种界定阈值(70%)[31]。
由此可见,菌株R18,ATCC 13880和DSM 21420属于同一个物种S. marcescens。菌株ATCC 13880和DSM 21420之间的gANI值和dDDH值分别为96.93%,73.40%,其中,dDDH值符合亚种界定阈值(小于79%~80%)的要求[32],故S. nematodiphila可以重新归类为S. marcescens的一个亚种。该结果与文献[33]的结果(65.1%)不一致,主要原因在于计算DNA-DNA杂交(DDH)值的方法不同。文中采用的基于基因组序列进行的数字化DDH值计算,相较于传统的湿实验室DDH分析方法更具准确性、可重复性和可比性[31],是基因组大数据时代中可靠的替代方法,具有更高的分辨率和可信度。
2.4 沙雷氏菌R18基因组注释
沙雷氏菌R18基因组COG,GO,CAZy和KEGG功能分类,如图3所示。
由图3(a)及相关分析可知:菌株R18共注释到4 630个基因,注释率为95%;COG数据库的26种功能组中,与氨基酸转运与代谢、糖类转移及代谢和转录相关的基因数量最多,分别为480(10.4%),421(9.1%)和446(9.6%),没有发现与核结构和染色质结构及动力学有关的基因,另有180个未知功能基因。
由图3(b)及相关分析可知:菌株R18共有2 774个基因在GO数据库中被注释,GO数据库按照细胞组分、生物学过程和分子功能3个方面对蛋白进行注释,而生物学过程、细胞组分和分子功能分支分别为7,2,9个,共计18个分支;大部分基因具有多功能,可以被同时注释在不同组分或功能过程分支中,2 774个基因共被注释了6 529次,其中,2个基因被注释了9次,7个基因被注释了8次,17个基因注释了7次,46个基因被注释了6次,62个基因被注释了5次,236个基因被注释了4次,565个基因被注释了3次,1 213个基因被注释2次,626个基因被注释1次;在细胞组分中,共848个基因得到注释;生物学途径类共2 851个基因得到注释,涉及细胞内过程与代谢过程的基因最多,分别为893,924个;分子功能分支共2 830个基因得到注释,涉及结合和催化活性的基因最多,分别为908,1 296个。
由图3(c)及相关分析可知:菌株R18的基因组中共有155个基因编码的蛋白质结构域属于CAZy家族,包括糖苷水解酶(glycoside hydrolases,GHs)家族的蛋白54个、糖苷转移酶家族的蛋白(glycosyl transferases,GTs)45个、碳水化合物酯酶(carbohydrate esterases,CEs)22个、裂解酶(polysaccharide lyases,PLs)2个、辅助酶(auxiliary activities,AA)16个、碳水化合物结合组件(carbohydrate-binding modules,CBMs)16个。
由图3(d)及相关分析可知:菌株R18 的4 587个基因富集在215条KEGG代谢通路中占菌株基因总数的94.2%;基因数大于25的代谢通路有40个;KEGG富集分析显示,ABC转运蛋白、双组分调节系统、氨基酸生物合成、碳代谢是主要的4类代谢通路,分别包含236,138,134和114个基因获得注释。
2.5 次级代谢产物合成基因簇分析
沙雷氏菌R18次级代谢物基因簇,如表3所示。通过antiSMASH软件预测分析,在菌株R18基因组中共检测到10个与次级代谢产物合成相关的基因簇。这些基因簇可能编码的代谢产物包括以非核糖体肽合成酶途径(non-ribosomalpeptide synthetase,NRPS)合成的小菌素(microcin)、紫杆菌素(viobactin)等,以聚酮合酶途径(polyketide biosynthase,PKS)合成的耶尔森杆菌素(yersiniabactin)、灵菌红素(prodigiosin),以及硫肽类抗生素(thiopeptide)的O-抗原(O-antigen)和氧化还原辅因子(redox-cofactor)的兰卡杀菌素(lankacidin)等。
这些代谢产物与抗菌、抗癌、杀虫等功能密切相关,另有2个基因簇(cluster 3.2,cluster 3.3)无法匹配到已知基因簇,显示出这些基因簇具有产生新代谢物的潜能。以上基因簇中,prodigiosin,ririwpeptide,trichrysobactin和viobactin的合成基因簇与已知基因簇的相似性分别为100%,100%,46%和46%,其余的则低于20%。由此可见,从基因组水平看,菌株R18具有生产多种具有拮抗作用的次级代谢产物的功能,对其环境竞争力和适应力都具有重要意义。
2.6 灵菌红素基因簇分析
与产红色素现象相对应,菌株R18含有完整的灵菌红素合成基因簇,处于ctg002拼装片段上,全长跨度35 021 bp,包含29个基因,其中,包含4个核心合成基因、10个补充的合成基因、1个调控基因、1个转运基因及13个其他基因。
沙雷氏菌R18和粘质沙雷氏菌ATCC 13880灵菌红素合成基因簇的比较,如图4所示。
由图4可知:基因簇序列与粘质沙雷氏菌模式菌株ATCC 13880有100%的一致性;该基因簇与模式菌株ATCC 13880还存在4处小片段未知功能基因差异和一处基因位置偏差(箭头),故推测其基因组上存在基因跳跃的现象,这可能与粘质沙雷氏菌不同颜色自然突变株的高发生率有关。
沙雷氏菌R18灵菌红素合成代谢途径,如图5所示。
由图5可知:菌株R18完整的灵菌红素合成代谢途径包括3个部分:2-甲基-3-戊基吡咯(MAP)、4-甲氧基-2,2-二吡咯-5-羧甲基乙醛(MBC)的合成,以及在ATP的存在下灵菌红素缩合酶PigC催化MAP和MBC合成灵菌红素,这与早期的研究结果一致[34-35]。
3 结论
采用形态学、生理生化、分子生物学及基因组测序分析的方法对菌株R18进行物种鉴定和生物学特性分析,并着重分析菌株R18次级代谢产物灵菌红素的基因簇及代谢途径。研究结果表明,菌株R18属于Serratia属,与模式菌株S. marcescens ATCC 13880和S. nematodiphila DSM 21420的16S rDAN相似度皆为99.86%,3个菌株处在同一个进化分支上。gANI值和dDDH值分析结果也表明,3个菌株基因组的相似度极高,属于同一个物种S. marcescens。
基因组序列注释有助于深入了解菌株R18生命现象的基因本质,尤其是了解各类次级代谢产物的基因簇和代谢途径,有利于探索它们的调控机理,为基因改造和生产应用奠定基础。粘质沙雷氏菌生产的灵菌红素是目前研究较为清楚的次级代谢产物,代谢途径包括2-甲基-3-戊基吡咯(MAP)、4-甲氧基-2,2-二吡咯-5-羧甲基乙醛(MBC)的合成,以及在ATP的存在下灵菌红素缩合酶PigC催化MAP和MBC合成灵菌红素。通过antiSMASH软件预测的菌株R18灵菌红素基因簇由29个基因组成,包含了PigA-PigN及转运、调控等相关基因。
致谢: 厦门市金安小学李昊城同学为本研究提供菌种,从他皮肤表面分离得到实验菌株R18。
参考文献:
[1] GRIMONT F,GRIMONT P A D,GENUS X X X I V.Bergey′s manual of systematic bacteriology[M].2nd ed.Berlin:Springer,2005.
[2] ARAJO R G,ZAVALA N R,CASTILLO-ZACARAS C,et al.Recent advances in prodigiosin as a bioactive compound in nanocomposite applications[J].Molecules,2022,27(15):4982.DOI:10.3390/molecules27154982.
[3] ESPONA-FIEDLER M,MANUEL-MANRESA P,BENTEZ-GARCA C,et al.Antimetastatic properties of prodigiosin and the BH3-mimetic obatoclax (GX15-070) in melanoma[J].Pharmaceutics,2022,15(1):97.DOI:10.3390/pharmaceutics15010097.
[4] CHEN P,WU H,BIAN T,et al.Prodigiosin improves acute lung injury in a rat model of rheumatoid arthritis via down-regulating the nuclear factor kappaB/nucleotide-binding domain, leucine-rich-containing family, pyrin domain-containing-3 signaling pathway[J].Journal of Physiology and Pharmacology,2023,74(1):43-54.DOI:10.26402/jpp.2023.1.05.
[5] YOUNAS H,NAZIR A,BAREEN F E,et al.Metabolic profile and molecular characterization of endophytic bacteria isolated from Pinus sylvestris L.with growth-promoting effect on sunf-lower[J].Environmental Science and Pollution Research,2023,30(14):40147-40161.DOI:10.1007/s11356-022-25118-7.
[6] 中国轻工业联合会,中国生物发酵产业协会.第一届菌种培养职业技能竞赛暨第七届微生物培养皿艺术大赛[EB/OL].(2023-07-05)[2023-11-20].https:∥vote.isv.youzan.com/h5?banner_id=f.110709144~image_ad.5~0~30rBitpJamp;reft=1697538254536amp;spm=f.110709144#/h5/1681269487132774/1/122509290/0.
[7] 东秀珠,蔡妙英.常见细菌系统鉴定手册[M].北京:科学出版社,2001.
[8] DELONG E F.Archaea in coastal marine environments[J].Proceedings of the National Academy of Sciences of the United States of America,1992,89(12):5685-5689.DOI:10.1073/pna.89.12.5685.
[9] KIM O S,CHO Y J,LEE K,et al.Introducing EzTaxone: A prokaryotic 16S rRNA gene sequence database with phylotypes that represent uncultured species[J].International Journal of Systematic and Evolutionary Microbiology,2012,62(Pt3):716-721.DOI:10.1099/ij.0.038075-0.
[10] KUMAR S,STECHER G,TAMURA K.MEGA7: Molecular evolutionary genetics analysis version 7.0 for bigger datasets[J].Molecular Biology and Evolution,2016,33(7):1870-1874.DOI:10.1093/molbev/msw054%20.
[11] CHEN Shifu,ZHOU Yanqing,CHEN Yaru,et al.fastp: An ultra-fast all-in-one FASTQ preprocessor[J].Bioinformatics,2018,34(17):i884-i890.DOI:10.1093/bioinformatics/bty560.
[12] BOLGER A M,LOHSE M,USADEL B.Trimmomatic: A flexible trimmer for Illumina sequence data[J].Bioinformatics,2014,30(15):2114-2120.DOI:10.1093/bioinformatics/btu170.
[13] BANKEVICH A,NURK S,ANTIPOV D,et al.SPAdes: A new genome assembly algorithm and its applications to single cell sequencing[J].Journal of Computational Biology,2012,19(5):455-477.DOI:10.1089/cmb.2012.0021.
[14] GUREVICH A,SAVELIEV V,VYAHHI N,et al.QUAST: Quality assessment tool for genome assemblies[J].Bioinformatics,2013,29(8):1072-1075.DOI:10.1093/bioinformatics/btt086.
[15] BESEMER J,LOMSADZE A,BORODOVSKY M.GeneMarkS: A self-training method for prediction of gene starts in microbial genome: Implications for finding sequence motifs in regulatory regions[J].Nucleic Acids Research,2001,29(12):2607-2618.DOI:10.1093/nar/29.12.2607.
[16] LOWE T M,EDDY S R.tRNAscan-SE: A program for improved detection of transfer RNA genes in genomic sequence[J].Nucleic Acids Research,1997,25(5):955-964.DOI:10.1093/nar/25.5.955.
[17] LAGESEN K,HALLIN P,RDLAND E A,et al.RNAmmer: Consistent and rapid annotation of ribosomal RNA genes[J].Nucleic Acids Research,2007,35(9):3100-3108.DOI:10.1093/nar/gkm160.
[18] GARDNER P P,DAUB J,TATE J G,et al.Rfam: Updates to the RNA families database[J].Nucleic Acids Research,2009,37(Database issue):D136-D140.DOI:10.1093/nar/gkn766.
[19] ASHBURNER M,BALL C A,BLAKE J A,et al.Gene ontology: Tool for the unification of biology[J].Nature Genetics,2000,25(1):25-29.DOI:10.1038/75556.
[20] KANEHISA M,GOTO S,KAWASHIMA S,et al.The KEGG resource for deciphering the genome[J].Nucleic Acids Research,2004,32(Database issue):D277-D280.DOI:10.1093/nar/gkh063.
[21] KANEHISA M,GOTO S,HATTORI M,et al.From genomics to chemical genomics: New developments in KEGG[J].Nucleic Acids Research,2006,34(Database issue):D354-D357.DOI:10.1093/nar/gkj102.
[22] TATUSOV R L,FEDOROVA N D,JACKSON J D,et al.The COG database: An updated version includes eukaryotes[J].BMC Bioinformatics,2003,4(1):41.DOI:10.1186/1471-2105-4-41.
[23] LI Weizhong,JAROSZEWSKI L,GODZIK A.Tolerating some redundancy significantly speeds up clustering of largeprotein databases[J].Bioinformatics,2002,18(1):77-82.DOI:10.1093/bioinformatics/18.1.77.
[24] CANTAREL B L,COUTINHO P M,RANCUREL C,et al.The carbohydrate-active EnZymes database (CAZy): An expert resource for glycogenomics[J].Nucleic Acids Research,2009,37(Database issue):D233-D238.DOI:10.1093/nar/gkn663.
[25] YOON S H,HA S M,LIM J,et al.A large-scale evaluation of algorithms to calculate average nucleotide identity[J].Antonie van Leeuwenhoek,2017,110(10):1281-1286.DOI:10.1007/s10482-017-0844-4.
[26] MEIER-KOLTHOFF J P,SARD C J,PEINADO-OLARTE R L,et al.TYGS and LPSN: A database tandem for fast and reliable genome-based classification and nomenclature of prokaryotes[J].Nucleic Acids Research,2022,50(Database issue):D801-D807.DOI:10.1093/nar/gkab902.
[27] BLIN K,SHAW S,AUGUSTIJN H E,et al.AntiSMASH 7.0: New and improved predictions for detection, regulation, chemical structures and visualisation[J].Nucleic Acids Research,2023,51(W1):W46-W50.DOI:10.1093/nar/gkad344.
[28] KIM M,OH H S,PARK S C,et al.Towards a taxonomic coherence between average nucleotide identity and 16S rRNA gene sequence similarity for species demarcation of prokaryotes[J].International Journal of Systematic and Evolutionary Microbiology,2014,64(Pt2):346-351.DOI:10.1099/ij.0.059774-0.
[29] CHUN J,OREN A,VENTOSA A,et al.Proposed minimal standards for the use of genome data for the taxonomy of prokaryotes[J].International Journal of Systematic and Evolutionary Microbiology,2018,68(1):461-466.DOI:10.1099/ijsem.0.002516.
[30] RICHTER M,ROSSELL-MRA R.Shifting the genomic gold standard for the prokaryotic speciesdefinition[J].Proceedings of the National Academy of Sciences of the United States of America,2009,106(45):19126-19131.DOI:10.1073/pna.0906412106.
[31] MEIER-KOLTHOF J P,AUCH A F,KLENK H P,et al.Genome sequence-based species delimitation with confidence intervals and improved distance functions[J].BMC Bioinformatics,2013,14:60.DOI:10.1186/1471-2105-14-60.
[32] MEIER-KOLTHOFF J P,HAHNKE R L,PETERSEN J,et al.Complete genome sequence of DSM 30083T, the type strain (U5/41T) of Escherichia coli, and a proposal for delineating subspecies in microbial taxonomy[J].Standards in Genomic Sciences,2014,9:2.DOI:10.1186/1944-3277-9-2.
[33] ZHANG Chongxing,YANG Shouyun,XU Mingxu,et al.Serratia nematodiphila sp. nov.associated symbiotically with the entomopathogenic nematode Heterorhabditidoides chongmingensis (Rhabditida: Rhabditidae)[J].International Journal of Systematic and Evolutionary Microbiology,2009,59(Pt7):1603-1608.DOI:10.1099/ij.0.65718-0.
[34] HARRIS A K P,WILLIAMSON N R,SLATER H,et al.The Serratia gene cluster encoding biosynthesis of the red antibiotic, prodigiosin, shows species-and strain-dependent genome context variation[J].Microbiology,2004,150(Pt11):3547-3560.DOI:10.1099/mic.0.27222-0.
[35] LI Peishan,HE Shufen,ZHANG Xuejiao,et al.Structures, biosynthesis, and bioactivities of prodiginine natural products[J].Applied Microbiology Biotechnology,2022,106(23):7721-7735.DOI:10.1007/s00253-022-12245-x.