金玉兰,邢 刚,阮系真
(浙江大学农业部动物病毒学重点实验室,浙江杭州310058)
随着人类基因组的绘制成功,标志着后基因组时代的到来。由于基因的功能主要是通过其表达的蛋白质来实现,要了解该基因的全部信息,必须对其编码的蛋白质进行深入研究。蛋白质组学分析为研究微生物的生命活动和细胞功能提供了广阔的视野。因此,蛋白质组学在生命科学研究中具有十分重要的位置,随着研究的不断深入,蛋白质组学必将对人类的生活和生产带来十分重大的影响。本文主要就目前微生物蛋白质组学的研究现状进行简要阐述。
蛋白质组学是指研究一个细胞、一个组织或一种生物在给定的时期、特殊条件下表达的所有蛋白质的总和。蛋白质组学研究通过对生物体内表达的各种蛋白质进行识别和定量分析,确定其在细胞内外的定位、修饰、相互作用和功能,以期获得对生命本质和活动规律的全景式认识。相对于其他生物,微生物结构简单、易于培养和处理。同时,许多动物在代谢过程中所需基因在微生物体系中也是保守的,所以微生物是研究蛋白质网络体系的理想模式生物。为此,微生物蛋白质组学已被用于解决某些复杂的生物学问题,有众多的微生物蛋白质组学研究结果发表。本文中,我们选择了目前微生物蛋白质组学研究的一些亮点进行综述,以期为同行研究提供参考。
越来越多的微生物基因组被测序,且新一代的测序系统速度仍在加快,在对这些基因组序列进行注释的过程中遇到的最大挑战就是准确预测蛋白质的编码区。
为解决该问题,Jaffe 等(2000)[1]建议使用蛋白质组学信息对基因组注释进行系统的验证和改进。该实验小组通过对肺炎支原体M129 株689 个预测的蛋白质编码区进行验证,最后通过MS/MS 方法共验证了557 个蛋白质编码区。
另外,Jaffe 等(2000)[1]应用蛋白质组学数据鉴定了16 个新的蛋白质编码区,纠正了19 个ORFs的N 端翻译起始点,修改了9 个不编码蛋白的ORFs。这种方法其实也叫蛋白质基因组学,并被广泛用于改进某些细菌的基因组注释,例如异常球菌属,若干分支杆菌,耶尔森菌属KIM 及两个细菌菌落基因组等[2-3]。
总的来说,上述研究表明,通过蛋白质组学试验对基因组注释进行验证和校正是一种十分有用的方法。
定性蛋白质组学研究揭示了某些特殊原核生物,尚不为人知的惊奇生理活动。
例如,有研究者鉴定了硫矿硫化叶钧P2 株的磷酸烯醇式丙酮酸羧化酶,过去人们普遍认为这类古生菌没有糖原异生过程[4],还有研究者鉴定了厌氧粘细菌2CP 过去认为不存在的发酵通路。有人对既定生长条件下的表达蛋白质进行研究,鉴定了某些与特定生理过程相关的蛋白质和通路。也有人利用蛋白质组学方法对白喉棒状杆菌和结核分支杆菌等致病菌的表面蛋白特点进行分析,鉴定了新的参与宿主细胞粘附和侵袭的新蛋白[5-6]。
Ziebandt 等(2010)[7]采用同样方法分析了25株临床金黄色葡萄球菌菌株的分泌蛋白质,发现只有一个确定蛋白之间的有限重叠,表达蛋白质之间的高度异质性可能会阻碍疫苗的开发。Otto 等(2010)[8]对枯草芽胞杆菌在葡萄糖饥饿条件下的蛋白质组学变化进行了检测。作者利用N 同位素标记监测了枯草芽胞杆菌在对数期过渡到稳定期5个不同时间点的蛋白质组学变化。证实许多代谢途径,如糖降解和氨基酸合成被关闭,生长停滞,而糖异生和三羧酸循环被诱导。
目前,半定量方法已被成功应用于改善生物技术。例如,对乳酸乳球菌的蛋白质组学分析,已被用于确定人类纤维化跨膜电导调节器CFTR 异源表达潜在的瓶颈。应用差别标记和LC-MALDI-TOF MS/MS 对野生型和表达CFTR 的L.lactis 细胞进行总蛋白表达模式分析,结果发现在表达CFTR 的乳酸乳球菌中,有一些与蛋白质错误折叠相关的蛋白质被诱导。因此,作者就CFTR 的表达量整体降低提出了两个假说。一是CFTR 的正确折叠被细胞认为是错误折叠,从而引发应激。二是该蛋白要正确折叠则需其它伴侣分子的协助。在另一项研究中,蛋白组学信息被用来改善大肠杆菌中异质N-糖基化的活性。试验结果表明,提高乙醛酸循环的活性可以增加Arc A 糖蛋白的糖基化率,该推测已被其它试验所证实[9]。
除了研究细胞内的蛋白质组成,蛋白质组学方法也被用来分析蛋白质的翻译后修饰。磷酸化在真核细胞的调控中起着关键作用,但对于其在细菌内的分布范围及作用目前却知之甚少。有几种方法可以检测蛋白质的磷酸化。基于凝胶的试验中,可以通过特殊染色或放射性标记,如33P 检测磷酸化蛋白。在无凝胶分离试验中,通过亲和纯化富集试验样品后,利用串联质谱可以检测到某些磷酸盐残基。这两种方法都可以确定细菌内的磷酸化蛋白及磷酸化位点,如枯草芽胞杆菌,大肠杆菌、谷氨酸棒状杆菌和肺炎支原体。每个研究均发现有63~79 个磷酸化的蛋白质,这表明磷酸化在细菌调控和动态变化过程中可能发挥着十分重要的作用。
糖基化是另一种翻译后修饰,也是原核生物研究中的一个热点课题。糖链的精确结构特征是目前研究中的一个巨大挑战,目前很多研究还局限于糖蛋白的检测。精确的糖蛋白结构鉴定仍然需要一些专业的技术,如核磁共振技术,基于质谱鉴定分析技术的发展,这些先进技术的发展才能为研究原核生物内糖基化多样性及糖基化程度提供某些线索[10]。
大多数细菌蛋白质组学是对纯培养的细菌进行研究。但是,自然界的细菌多生长在一个相互联系的群落中,人们期待对这些细菌菌落间的相互作用及代谢交换作更深入的了解。作为标准蛋白质组学的一个自然延伸,宏蛋白质组学,也就是对细菌菌落进行全面整体蛋白质分析的一种研究方法。
长期来,基因组序列的限制和较低的蛋白质鉴定率阻碍了细菌群落的研究。全球第一个应用宏蛋白质组学研究的是对生长在加利福尼亚铁山附近酸性矿山下水道中的自然生物膜菌群落的蛋白质组学研究[11]。通过鸟枪蛋白质组学方法从含量最多的前5 个物种中共鉴定了至少2000 种蛋白质。其中约48%的蛋白质来自于含量最高的有机体生物膜,即钩端螺旋菌Ⅱ。该研究揭示了大量与氧化胁迫有关的蛋白质,表明氧化损伤是在富含金属的酸性环境中生存的一个关键挑战因素。对这个群落的后续研究表明:这些保护性蛋白是胞外多糖基质细胞的一部分,另外这些蛋白的浓度可能与生物膜的发育状态有关。
Pan 等(2011)[12]用15N 标记方法研究了生物膜群落的蛋白质组学变化。因此,同位素标记技术可能是一项被用于跟踪细菌群落中蛋白质周转和表达的新技术。
目前,宏蛋白质组学技术上的限制仍然是缺乏复杂群落的基因组信息。但由于测序技术的发展,这种情况可能不会持续很久。宏蛋白质组学技术的另一个挑战是群落的高度复杂性及某些群落物种信息的匮乏。
尽管如此,目前宏蛋白质组学研究所取得的成绩还是令人鼓舞的,随着技术的进一步发展,复杂群落的完整蛋白质组学分析乃触手可及。
[1]JAFFE J D,BERG H C,CHURCH G M.Proteogenomic mapping as a complementary method to perform genome annotation[J].Proteomics,2000,4(1):59-77.
[2]BAUDET M, ORTET P, GAILLARD JC, et al.Proteomics-based refinement of Deinococcus deserti genome annotation reveals an unwonted use of non-canonical translation initiation codons[J].Mol Cell Proteomic,2010,9(2):415-426.
[3]DE SOUZA G A,ARNTZEN M O,FORTUIN S,et al.Proteogenomic analysis of polymorphisms gene annotation divergences in prokaryotes using a clustered mass spectrometry-friendly database[J].Mol Cell Proteomics,2011,10(1):M110 002527.
[4]BARRY R C,YOUNG M J,STEDMAN K M,et al.Proteomic mapping of the hyperthermophilic and archaeon Sulfolobus solfataricus P2[J].Electrophoresis,2006,27(14):2970-2983.
[5]CHAO T C,KALINOWSKI J,NYALWIDHE J,et al.Comprehensive proteome profiling of the Fe(III)-reducing myxobacterium Anaeromyxobacter dehalogenans 2CP-C during growth with fumarate and ferric citrate [J].Proteomics,2010,10(8):1673-1684.
[6]OTT L, HOLLER M, GERLACH R G, et al.Corynebacterium diphtheriae invasion-associated protein(DIP1281) is involved in cell surface organization,adhesion and internalization in epithelial cells[J].BMC Microbiol,2010,10:2.
[7]ZIEBANDT A K,KUSCH H,DEGNER M,et al.Proteomics uncovers extreme heterogeneity in the Staphylococcus aureus exoproteome due to genomic plasticity and variant gene regulation[J].Proteomics,2010,10(8):1634-1644.
[8]OTTO A,BERNHARDT J,MEYER H,et al.Systemswide temporal proteomic profiling in glucose-starved Bacillus subtilis[J].Nat Commun,2010,1:137.
[9]PANDHAL J,OW S Y,NOIREL J,et al.Improving Nglycosylation efficiency in Escherichia coli using shotgun proteomics,metabolic network analysis,and selective reaction monitoring[J].Biotechnol Bioeng,2011,108(4):902-912.
[10]HITCHEN P G,TWIGGER K,VALIENTE E,et al.Glycoproteomics:a powerful tool for characterizing the diverse glycoforms of bacterial pilins and flagellins[J].Biochem Soc Trans,2010,38(5):1307-1313.
[11]RAM R J,VERBERKMOES N C,THELEN M P,et al.Community proteomics of a natural microbial biofilm[J].Science,2005,308(5730):1915-1920.
[12]PAN C,FISCHER C R,HYATT D,et al.Quantitative tracking of isotope flows in proteomes of microbial communities[J].Mol Cell Proteomics,2011,10(4):M110 006049.