顾祥文 王强
摘要 以公共数据库所有组装完整的铜绿假单胞菌基因组为研究对象,针对其2个红素氧还蛋白的编码基因(rubA2和rubA1)及鉴定出的蛋白序列进行系统的演化分析。结果表明,其中一个红素氧还蛋白的编码基因来源于基因组中祖先基因的复制,而非其他物种的水平基因转移。由于基因的功能分化,rubA2编码的红素氧还蛋白可能发挥电子传递以外的生物学功能,主要为DNA的转录和RNA的生成。该研究为微生物重要基因的演化和功能分化提供了参考,同时也揭示了一种铜绿假单胞菌增强侵染人类、牲畜和家禽能力的潜在机制。
关键词 铜绿假单胞菌;基因复制;功能分化;演化分析;红素氧还蛋白;电子传递系统
中图分类号 Q36 文献标识码 A 文章编号 0517-6611(2023)12-0009-06
doi:10.3969/j.issn.0517-6611.2023.12.002
Evolutionary Analysis of Rubredoxin from Pseudomonas aeruginosa
GU Xiang-wen, WANG Qiang
(School of Life Sciences, Nanjing University, Nanjing, Jiangsu 210000)
Abstract Taking the all completely assembled P. aeruginosa genomes from public databases as the research object, a systematic evolutionary analysis was conducted on its two encoding genes for rubredoxins (rubA2 and rubA1) and the identified protein sequences.The results showed that one of the genes coding for rubredoxin originated from the duplication of an ancestral gene in the genome, rather than from the horizontal gene transfer of other species. Due to the functional differentiation of genes, the rubA2-encoded rubredoxin was likely to perform biological functions other than electron transfer, mainly for DNA transcription and RNA production. This study not only provides a reference for the evolution and functional differentiation of important microbial genes, but also reveals a potential mechanism for P. aeruginosa to enhance its infection ability to humans, livestock and poultry.
Key words Pseudomonas aeruginosa;Gene duplication;Functional differentiation;Evolutionary analysis;Rubredoxin;Electron transport system
作者簡介 顾祥文(1997—),男,江苏连云港人,硕士研究生,研究方向:植物与微生物的基因演化。*通信作者,副教授,博士,硕士生导师,从事植物的基因演化研究。
收稿日期 2022-08-23
铜绿假单胞菌是一种广泛分布于土壤、动物、植物、临床等其他环境的革兰氏阴性菌[1]。作为医院常见的条件致病菌之一,铜绿假单胞菌可能会引起泌尿道、呼吸道、烧伤创面和菌血症等严重感染[2]。除了人类之外,在牛、猪、鸡等牲畜和家禽中同样分离出了具有致病性的铜绿假单胞菌,因此可能对畜牧业造成严重危害[3-5]。此外,铜绿假单胞菌也能够利用代谢产物降解环境中的去污剂、原油等污染物[6-7]。铜绿假单胞菌的基因组大小约为6.3 Mbp,大于大多数细菌[8]。生存环境的多样性和较大的基因组意味着该物种可能获得了更多环境适应性相关的基因,这些基因可能来源于基因组中祖先基因的复制,也可能来源于其他物种的水平基因转移[9]。
红素氧还蛋白(rubredoxin)是细菌和古菌中发现的具有氧化还原活性的铁硫蛋白,大小约为6 kD[10-11]。铜绿假单胞菌的2个红素氧还蛋白分别由rubA2(PA5350)和rubA1(PA5351)编码,它们是碳代谢相关的电子传递系统中的重要成员[12-13]。尽管已经有研究解析了铜绿假单胞菌红素氧还蛋白及其互作蛋白的晶体结构,并证明了电子传递系统对铜绿假单胞菌在具有正构烷烃的环境中生长的重要性[14],但该系统可能还存在更加普遍的作用[15]。因此,研究铜绿假单胞菌2个红素氧还蛋白的进化来源和潜在的功能差异,有助于更多地发掘电子传递系统在铜绿假单胞菌生长、代谢中的功能。该研究对铜绿假单胞菌的2个红素氧还蛋白进行了系统的演化分析,推测了二者在进化上的起源,并在此基础上通过共表达基因的功能聚类探究了铜绿假单胞菌2个红素氧还蛋白的功能分化情况。
1 材料与方法
1.1 蛋白鉴定
于2022年3月从NCBI基因组数据库(https://www.ncbi.nlm.nih.gov/genome)下载铜绿假单胞菌所有公开的菌株的基因组序列。红素氧还蛋白(Pfam登录号PF00301)的氨基酸序列分别通过HMMER 3.3.2的hmmsearch和hmmscan[16]在Pfam 35.0[17]中进行鉴定。将序列比对中的参数E值<1×10-20的序列取交集合并。随后,以E值<1×10-5为阈值,连续进行多轮蛋白质Blast[18],即将匹配到的序列作为下一轮的查询序列,直到檢索不出新的序列。
1.2 进化树的构建
通过hmmsearch鉴定出用于系统发育树构建的120种细菌蛋白(bac120)[19]的氨基酸序列。用MUSCLE v3.8.1551[20]对bac120和鉴定出的红素氧还蛋白序列进行比对,并用trimAl v1.4[21]修正基于bac120序列比对较差的区域。随后使用FastTree v2.1.11[22]构建系统发育树和蛋白进化树,并用iTOL v6[23]对树进行注释。
1.3 泛基因组分析
通过PPanGGOLiN 1.2.78[24]对391株铜绿假单胞菌的基因组序列进行泛基因组分析,再通过Gephi 0.9.5[25]实现泛基因组图的可视化。
1.4 基因岛分析
于2022年3月从NCBI核苷酸数据库(https://www.ncbi.nlm.nih.gov/nuccore)下载γ-变形菌纲中相应菌株的Genebank文件,用Clinker v0.0.23[26]进行序列比对并实现基因共线性与相似性的可视化。
1.5 dN/dS计算
从NCBI基因组数据库下载所有铜绿假单胞菌菌株的2个红素氧还蛋白的CDS序列。用MEGA X[27]的Nei-Gojobori(Jukes-Cantor校正)[28]法计算非同义替换率(dN)和同义替换率(dS),最终的dN/dS为每个菌株两两配对dN/dS的平均值。
1.6 加权基因共表达网络分析(WGCNA)
铜绿假单胞菌PAO1在不同处理条件下的转录组数据集从NCBI GEO数据库和假单胞菌基因组数据库(https://www.pseudomonas.com/)下载。由于不同数据集在数据量和测序深度上存在差异,因此仅从23个归一化的GDS数据集中选取15个有GSE原始数据的进行后续分析。用R语言affy软件包[29]中的函数RMA对GSE原始数据进行标准化。203个样本按照处理条件分成40个测试组,经过3个-3个随机配对,共得到64 000个条件组合。用R语言WGCNA软件包[30]分别对2个不同的红素氧还原蛋白基因进行共表达网络分析。设定阈值>μ+2σ以筛选出具有实际统计学意义的共表达基因。共表达基因通过DAVID 2021[31]进行聚类和注释。
2 结果与分析
2.1 红素氧还蛋白在细菌中的分布情况
为了从整体上了解红素氧还蛋白在细菌中的存在情况,首先选取了来自厚壁菌门、放线菌门、衣原体门和变形菌门中15个模式生物的典型菌株,从中共鉴定出12个红素氧还蛋白。分别构建了这15个模式菌株的系统发育树和红素氧还蛋白的进化树(图1)。红素氧还蛋白主要存在于变形菌门中,而在厚壁菌门的3个菌株中均不存在。铜绿假单胞菌PAO1中鉴定出2种不同的红素氧还蛋白。
随后,以假单胞菌属为重点关注对象,系统地鉴定了红素氧还蛋白在铜绿假单胞菌所在的γ-变形菌纲中的存在情况。γ-变形菌纲的43个科中,有20个科鉴定出了红素氧还
蛋白,其中绝大多数科的红素氧还蛋白的拷贝数都不大于1。
对于铜绿假单胞菌以外的假单胞菌物种,仅产碱假单胞菌(Pseudomonas alcaligenes)、耳炎假单胞菌(Pseudomonas otitidis)和拉尔宽假单胞菌(Pseudomonas lalkuanensis)拥有3个拷贝,其他假单胞菌的拷贝数均小于2(表1)。
在391个完整组装的铜绿假单胞菌菌株的基因组中,共鉴定出783个红素氧还蛋白,它们平均分布在蛋白进化树的2个分支上,即所有铜绿假单胞菌菌株稳定拥有2个红素氧还蛋白(图2)。
2.2 铜绿假单胞菌2个红素氧还蛋白的演化来源
首先,在铜绿假单胞菌物种水平内确定2个红素氧还蛋白编码基因在基因组上的稳定性。除了最为典型的PAO1菌株外,额外选取了2个典型的铜绿假单胞菌菌株PA7和UCBPP_PA14,进行基因的相似性和共线性分析。不同菌株相同红素氧还蛋白的相似性为100%,相邻红素氧还蛋白的相似性也高达82%,且其上下游基因具有极高的共线性(图3)。
为了探究该现象在391个铜绿假单胞菌菌株中是否具有普遍性,还进行了铜绿假单胞菌的泛基因组分析,结果如图4所示,红色圆点表示的2个红素氧还蛋白的上下游均为橙色圆点代表的“核心基因”,表明红素氧还蛋白周围不存在新获得的基因。基因岛分析和泛基因组分析的结果证明,在铜绿假单胞菌物种水平内,2个红素氧还蛋白皆已稳定地存在于基因组上,需要在更大范围内进一步寻找基因的演化起源。
进一步构建了假单胞菌属水平的系统发育树和红素氧还蛋白的进化树(图5)。一方面,尽管一些假单胞菌部分菌株的红素氧还蛋白拷贝数>1(表1),但其代表性菌株仅拥有单拷贝,说明大部分假单胞菌物种并非稳定拥有2个红素氧
还蛋白,体现了铜绿假单胞菌的特殊性;另一方面,虽然铜绿假单胞菌2个红素氧还蛋白之间的相似性高达82%,但是rubA2位于进化树中相对独立的分支上,表明其序列与大部分假单胞菌的红素氧还蛋白存在一定的差异,其蛋白功能可能也因此产生了分化。
为了进一步确认铜绿假单胞菌其中一个红素氧还蛋白是否来源于其他物种的水平基因转移,构建了整个γ-变形菌纲的红素氧还蛋白的进化树(图6)。在图6中绿色标注的假单胞菌属的物种之间存在几个来源于其他科的物种,可能作为水平基因转移的来源。然而,进一步的基因岛分析(图7)表明铜绿假单胞菌的2个红素氧还蛋白与这几个物种唯一的红素氧还蛋白相似程度几乎相同(如0.78、0.76),而非其中一个拷贝与其他物种相似度较高,另一个则较低的情况。根据上述结果,铜绿假单胞菌其中一个红素氧还蛋白的编码基因来源于自身基因组中祖先基因的复制,而非其他物种的水平基因转移。
2.3 铜绿假单胞菌2个红素氧还蛋白的功能分化
重复基因是祖先基因在自然选择压力的驱动下,经历新功能化、亚功能化或无功能化后产生并在基因组中保留的[32]。计算了铜绿假单胞菌2个红素氧还蛋白编码基因的dN/dS以衡量它们受到的选择压力,发现二者的dN/dS频率分布基本相同且均小于1(图8A),表明2个编码基因皆受到强烈的负选择,在基因组中的存在较为稳定,在生物体的进化过程中发挥十分重要的作用。dS的计算结果则进一步表明rubA2的进化速率快于rubA1(图8B)。
为了进一步探究2个红素氧还蛋白来源于祖先基因的新功能化、亚功能化还是无功能化,进行了加权基因共表达网络分析,从16个公开的基因表达数据集中寻找2个红素氧还蛋白的共表达基因。值得注意的是,二者分别寻找到94和80个共表达基因,但这其中仅有4个交集基因。GO分析结果(圖9)表明,rubA1负责离子与环状化合物的结合;rubA2的功能则与rubA1有所不同,可能参与DNA的转录和RNA的生成。
因为蛋白的功能与蛋白结构有关,利用RoseTTAFold[33]预测了rubA1和rubA2编码的红素氧还蛋白的三维结构,二者几乎完全一致(图10)。查询假单胞菌基因组数据库(https://www.pseudomonas.com/)得知,尽管rubA1和rubA2在铜绿假单胞菌的基因组上相邻,但rubA2受到的转录调控可能不如rubA1完备(图11)。因此,2个红素氧还蛋白潜在的功能差异并不是蛋白结构的差异造成的,而可能是转录调控驱动的。
3 结论与讨论
该研究严格鉴定了红素氧还蛋白在γ-变形菌纲尤其是假单胞菌属中的分布情况。随后,通过系统发育树和蛋白进化树的构建、泛基因组分析及基因岛分析证明了铜绿假单胞菌的其中一个红素氧还蛋白编码基因很大程度上可能来源于自身的基因复制,而非其他物种的水平基因转移。共表达基因的GO分析结果表明,rubA1编码的红素氧还蛋白主要参与离子与环状化合物的结合,而rubA2则可能参与DNA的转录与RNA的生成。考虑到假单胞菌属水平的红素氧还蛋白进化树中,rubA2远离大部分假单胞菌物种的红素氧还蛋白,位于较为独立的分支上,该研究认为rubA1编码的红素氧还蛋白保留了原有的功能,而rubA2编码的红素氧还蛋白则经历了对生物体有利的功能分化,从而使2个红素氧还蛋白的编码基因得以在基因组中共同保留。至于rubA2的GO功能聚类得到的基因数量较少,p值也大于rubA1,很可能是因为rubA2尚未形成完整的功能网络。
至于研究过程中发现的拥有3个红素氧还蛋白的耳炎假单胞菌、产碱假单胞菌和拉尔宽假单胞菌来源于石油或农药污染的海洋或土壤,而耳炎假单胞菌则来源于临床环境。因此,驱动红素氧还蛋白基因复制的因素可能是多样的,可能源自环境中越来越多有待降解的污染物,也可能源自临床上抗生素的过度使用。
此前,曾有研究报道部分铜绿假单胞菌菌株通过水平基因转移额外获得了一个脂肪酶(LipC2)[34]。作为临床常见的条件致病菌,更强的脂肪分解能力意味着铜绿假单胞菌获得了更强的人体侵染毒力[34]。在该研究中,2个具有不同功能的红素氧还蛋白完善了电子传递系统,从而使得铜绿假单胞菌能够将人类、牲畜和家禽的脂肪分解生成的饱和脂肪酸更好地氧化分解为水和二氧化碳,并从中摄取该反应释放的大量能量,进一步增强自身的侵染毒力。该研究不仅为微生物重要基因的演化起源和功能分化的相关研究提供参考,同时也揭示了铜绿假单胞菌增强侵染毒力的潜在机制。作为临床和畜牧环境中常见的致病菌,更加深入地了解铜绿假单胞菌的侵染和致病机制,可以更好地指导预防和治理活动,降低其对于人体健康和畜牧产业造成的危害。
参考文献
[1] KLOCKGETHER J,CRAMER N,WIEHLMANN L,et al.Pseudomonas aeruginosa genomic structure and diversity[J].Front Microbiol,2011,2:1-18.
[2] 张明月,胡福泉,黄广涛.铜绿假单胞菌必需基因的研究进展[J].微生物学通报,2021,48(6):2143-2154.
[3] 刘勃兴,赵安奇,康圆圆,等.一株牛源铜绿假单胞菌的分离鉴定[J].黑龙江畜牧兽医,2020(16):69-72,165.
[4] 吴建华,芮萍,马增军.猪源铜绿假单胞菌分离及部分生物学特性研究[J].黑龙江畜牧兽医,2004(9):57-58.
[5] 李玲.鸡铜绿假单胞菌的分离鉴定及生物学特性研究[D].保定:河北农业大学,2013.
[6] HAGELUEKEN G,ADAMS T M,WIEHLMANN L,et al.The crystal structure of SdsA1,an alkylsulfatase from Pseudomonas aeruginosa,defines a third class of sulfatases[J].Proc Natl Acad Sci USA,2006,103(20):7631-7636.
[7] ABALOS A,VIAS M,SABAT J,et al.Enhanced biodegradation of Casablanca crude oil by a microbial consortium in presence of a rhamnolipid produced by Pseudomonas aeruginosa AT10[J].Biodegradation,2004,15(4):249-260.
[8] DICENZO G C,FINAN T M.The divided bacterial genome:Structure,function,and evolution[J].Microbiol Mol Biol Rev,2017,81(3):1-206.
[9] KUNG V L,OZER E A,HAUSER A R.The accessory genome of Pseudomonas aeruginosa[J].Microbiol Mol Biol Rev,2010,74(4):621-641.
[10] LOVENBERG W,SOBEL B E.Rubredoxin:A new electron transfer protein from Clostridium pasteurianum[J].Proc Natl Acad Sci USA,1965,54(1):193-199.
[11] 李瑩,柳参奎.红素氧还蛋白研究进展[J].草业科学,2016,33(6):1118-1125.
[12] MARN M M,YUSTE L,ROJO F.Differential expression of the components of the two alkane hydroxylases from Pseudomonas aeruginosa[J].J Bacteriol,2003,185(10):3232-3237.
[13] VAN BEILEN J B,NEUENSCHWANDER M,SMITS T H,et al.Rubredoxinsinvolved in alkane oxidation[J].J Bacteriol,2002,184(6):1722-1732.
[14] HAGELUEKEN G,WIEHLMANN L,ADAMS T M,et al.Crystal structure of the electron transfer complex rubredoxin rubredoxin reductase of Pseudomonas aeruginosa[J].Proc Natl Acad Sci USA,2007,104(30):12276-12281.
[15] SMITS T H M,WITHOLT B,VAN BEILEN J B.Functional characterization of genes involved in alkane oxidation by Pseudomonas aeruginosa[J].Antonie van leeuwenhoek,2003,84(3):193-200.
[16] POTTER S C,LUCIANI A,EDDY S R,et al.HMMER web server:2018 update[J].Nucleic Acids Res,2018,46(W1):W200-W204.
[17] MISTRY J,CHUGURANSKY S,WILLIAMS L,et al.Pfam:The protein families database in 2021[J].Nucleic Acids Res,2021,49(D1):D412-D419.
[18] CAMACHO C,COULOURIS G,AVAGYAN V,et al.BLAST+:Architecture and applications[J].BMC Bioinformatics,2009,10:1-9.
[19] PARKS D H,RINKE C,CHUVOCHINA M,et al.Recovery of nearly 8,000 metagenome-assembled genomes substantially expands the tree of life[J].Nat Microbiol,2017,2(11):1533-1542.
[20] EDGAR R C.MUSCLE:Multiple sequence alignment with high accuracy and high throughput[J].Nucleic Acids Res,2004,32(5):1792-1797.
[21] CAPELLA-GUTIRREZ S,SILLA-MARTNEZ J M,GABALDN T.trimAl:A tool for automated alignment trimming in large-scale phylogenetic analyses[J].Bioinformatics,2009,25(15):1972-1973.
[22] PRICE M N,DEHAL P S,ARKIN A P.FastTree 2:Approximately maximum-likelihood trees for large alignments[J].PLoS One,2010,5(3):1-10.
[23] LETUNIC I,BORK P.Interactive Tree Of Life(iTOL)v5:An online tool for phylogenetic tree display and annotation[J].Nucleic Acids Res,2021,49(W1):W293-W296.
[24] GAUTREAU G,BAZIN A,GACHET M,et al.PPanGGOLiN:Depicting microbial diversity via a partitioned pangenome graph[J].PLoS Comput Biol,2021,17(12):1-27.
[25] BASTIAN M,HEYMANN S,JACOMY M.Gephi:An open source software for exploring and manipulating networks[J].Proc Int AAAI Conf Web Soc Media,2009,3(1):361-362.
[26] GILCHRIST C L M,CHOOI Y H.Clinker &clustermap.js:Automatic generation of gene cluster comparison figures[J].Bioinformatics,2021,37(16):2473-2475.
[27] KUMAR S,STECHER G,LI M,et al.MEGA X:Molecular evolutionary genetics analysis across computing platforms[J].Mol Biol Evol,2018,35(6):1547-1549.
[28] NEI M,GOJOBORI T.Simple methods for estimating the numbers of synonymous and nonsynonymous nucleotide substitutions[J].Mol Biol Evol,1986,3(5):418-426.
[29] GAUTIER L,COPE L,BOLSTAD B M,et al.Affy:Analysis of Affymetrix Gene Chip data at the probe level[J].Bioinformatics,2004,20(3):307-315.
[30] LANGFELDER P,HORVATH S.WGCNA:An R package for weighted correlation network analysis[J].BMC Bioinformatics,2008,9:1-13.
[31] SHERMAN B T,HAO M,QIU J,et al.DAVID:A web server for functional enrichment analysis and functional annotation of gene lists(2021 update)[J].Nucleic Acids Res,2022,50:W216-W221.
[32] HIBBIT C.The princeton guide to evolution[J].Am Biol Teach,2015,77(2):151.
[33] BAEK M,DIMAIO F,ANISHCHENKO I,et al.Accurate prediction of protein structures and interactions using a three-track neural network[J].Science,2021,373(6557):871-876.
[34] ZHANG Z H,ZHANG X H.Evolution of subfamily I.1 lipases in Pseudomonas aeruginosa[J].Curr Microbiol,2021,78(9):3494-3504.