甲型流感病毒PB1-PA蛋白作用位点的发现与分析*

2011-07-24 11:25林强乾赵艳超张淑波陈维田
关键词:复合体流感病毒结构域

何 淼,林强乾,赵艳超,张淑波,陈维田

(1. 中山大学生命科学学院,广东 广州 510275;2. 香港理工大学屋宇设备工程系,香港 九龙)

甲型流感病毒包含8个独一无二的单链RNA片段,RNA松散地包埋在许多核蛋白(Nucleoprotein,NP)分子中,其中,包含3个病毒RNA聚合酶(PB1、PB2及PA)的复合体位于病毒颗粒的内核[1]。1990年,Ayae等[2]用梯度氯化铯离心法从甲型流感病毒中分离出RNA聚合酶,随后分离出了PB1蛋白、PB2蛋白和PA蛋白。

PB1蛋白,又称为聚合酶碱性蛋白1(Polymerase Basic Protein 1),由RNA片段2编码。它在RNA聚合酶复合体中的作用是负责病毒RNA分子的延伸,同时也在模版RNA合成的延伸过程中起作用。PB1蛋白酶定位在感染细胞的细胞核中[1]。研究表明,PB1蛋白的第506-659位氨基酸的保守性不显著,但是,仍分布有许多零星的保守片断,这些保守片段是否代表蛋白表面氨基酸或相互作用位点仍需检验。

PA蛋白,又称为聚合酶酸性蛋白(Polymerase Acid Protein),由RNA片段3编码。是RNA聚合酶复合体中的最后一个蛋白,它对病毒RNA聚合过程的作用未知。有证据表明,它可能起着蛋白激酶或螺旋解构酶的作用。PA聚合酶也定位在感染细胞的细胞核中[1]。Amelia等通过重组的猿40病毒,用蛋白片断缺失法分析了PA蛋白的区域,研究显示,区域I(124-139位氨基酸)与区域II(186-247位氨基酸)具有重要功能;两个核定位信号均存在于区域I与区域II中,结论表明,PA蛋白包含一个核定位信号区域,是病毒执行繁殖复制的重要区域[3]。

大部分蛋白质需要相互作用才能发挥出其生物学作用。通过构成复合体才能发挥生物学作用的蛋白质,在相互作用面上的结构域或序列,具有比一般功能的结构域更高的保守度。Caffrey发现相互作用表面氨基酸比其它暴露在表面的氨基酸具有更高的保守度[4];Minsteris和 Wang发现相互作用的表面氨基酸具有与蛋白伴侣共进化的属性[5]。

研究表明诸如NLS序列、聚合酶功能区序列、PB2蛋白与PA蛋白结合区序列完全没有发生重叠的现象[6]。PB2蛋白需要与PB1蛋白结合才能发挥出转录酶的功能。PB1蛋白的N端78个氨基酸和PA蛋白C端的3/4个蛋白片断结合[7];PB1蛋白的第506-659位氨基酸与PB2蛋白的124个氨基酸相互作用[8]。研究显示,PB1、PB2与PA蛋白在病毒体外亦能自动形成复合体[2]。

本文基于共进化理论,从PB1蛋白的N端结构域与PA蛋白的C端结构域入手,研究了甲型流感病毒的PB1蛋白与PA蛋白间具有潜在共进化关系的肽段,创新性推测出复合体中的相互作用位点,并在三维结构上标记出相互作用位点。

1 数据和方法

1.1 数据来源

甲型流感病毒序列全部来自于NCBI的流感病毒专门数据库 Influenza Virus Resource(http://www.ncbi.nlm.nih.gov/genomes/FLU/FLU.html)。本文提取了1428株病毒的PB1蛋白序列和1580株病毒的PA蛋白序列。序列下载后,以FASTA格式保存。

PB1与PA的结构信息来自于Protein Data Base(PDB)。在PDB上检索文件名为2ZNL.pdb的蛋白结构数据,作为蛋白结构信息的来源。

1.2 计算方法

本文自主设计了CD search(Conserved Domain Search)软件,主要用于“保守九聚氨基酸肽片段(Conserved 9-mer Peptide,简记为C9MP)”的筛选,以C9MP为单位的序列比对和共进化参数计算结果为筛选依据;所谓C9MP是指九个在一级结构上连续排列的氨基酸所构成的短肽片段。利用软件进行序列比对,筛选出所有序列中90%以上完全匹配的9个连续氨基酸,即保守九聚氨基酸肽片段;计算一个蛋白所有保守片段与另一个蛋白的保守片段相关的η、Z、na、nb、NA、NB、MA、MB等8个共进化参数。

利用CLUSTALX2.0进行第1次序列比对,选择BLOSUM矩阵,输出得到PB1.fasta和PA.fasta。获得的.fasta文件中序列总数为M值,其中,MA值表示PB1.fasta中包含的序列总数,MB表示PA.fasta中包含的序列总数。

对于每一个保守多肽片段来说,相同的片段占了90%以上,不相同的片段总数N值被精确统计出来。在PB1蛋白中不相同的片段数为NA;在PA蛋白中,对应的值为NB。

提取两个病毒蛋白.fasta文件中的GI号及病毒名,构建两个仅包含GI号及病毒名的数据文件PB1_gz.txt与PA_gz.txt。提取PB1.fasta与PA.fasta所包含的共有病毒,统计共有的病毒株数,得到η值。na(0-8)值代表PB1蛋白的氨基酸位置0-8在η条件下的变异数目,nb(0-8)值代表PA蛋白的氨基酸位置0-8在η条件下的变异数目。假设PB1蛋白含有X个C9MP,在PA蛋白含有Y个C9MP,则总共有Z=X×Y个潜在相互作用位点。

假设在甲型流感病毒毒株中,我们考虑PB1蛋白的第一个显著保守片段(记为A1)和PA蛋白的第一个显著保守片段(记为B1),A1片段在MA中有NA个突变序列,B1片段在MB中有NB个突变序列,那么,在没有进化压力的情况下,A1和B1在同一个病毒株中出现变异的概率是:

如果Z值在η值范围内。在η范围能够找到包含两个变异C9MP的方法数为:

假设在η值范围内,A1片段的变异数目是na,B1片段的变异数是nb,那么在η范围(但不在Z值内)变异数目为:

由于分布在所有甲型流感病毒毒株变异方式的数目受到η以外变异数目的约束,定义wA与wB作为在η以外PB1蛋白和PA蛋白的变异方式数目:

计算在Z中可能发生重叠的变异方法总数,需要将na和nb的所有可能值累加求和:

最后,P值表示为下式:

其中,W为没有任何限制条件下,筛选自所有PB1蛋白和PA蛋白变异的总方式数。

这里P值被Wang等定义为共进化值,即文中计算的Pcov值[9]。

共进化相关变量具体计算和图形输出均利用Matlab7.0完成。

DSSP是用于计算多肽在模拟过程中二级结构变化的专用软件。将2znl.pdb输入DSSP软件,分析蛋白质氨基酸的溶剂可及性(ACC),程序自动列表会产生ACC数据。文中分别计算了PB1蛋白与PA蛋白的ACC值。根据Rost的工作,暴露于水环境中的表面积大于其整体表面积25%的氨基酸为表面氨基酸。当两个表面氨基酸相互作用,其亲水表面积减少超过1A2时,定义为相互作用表面氨基酸[10]。文中分别计算了氨基酸在形成复合体前单体状态下的ACC值和形成复合体后的ACC值。

本文采用ZDOCK2.3软件对蛋白质相互作用的三维结构进行了模拟。

2 结果与分析

2.1 CD Search结果与分析

根据CD search分析的结果,PB1蛋白具有447个C9MP,对位置重叠片段进行整合,得到26个域。这里的“域”指的是由数个C9MP连结在一起,按照前后顺序构成的一个更大片段。如386-396的KKIEKIRPLLI,实际上是由3个C9MP,386-394(KKIEKIRPL)与387-395(KKIEKIRPLL)与388-396(IEKIRPLLI),重叠构成。PA蛋白具有373个C9MP,对重叠片段整合,可以得到29个域。

2.2 共进化数值计算与分析

本文计算了PB1蛋白的447个C9MP与PA蛋白的373个C9MP所有可能的相互作用,即447×373个相互作用,包含了166 731个数值点。利用Matlab的可视化工具输出图形(见图1),图中的小色块单位是-log(Pcov)值。为了更直观找出相互作用关系,忽略渐变的可能性,直接将-log(Pcov)大于5(即Pcov>10-5)的区域用显著的红色标注出来,Wang 等[9]认为这些红色区域是“毫无疑问地”在共进化上具有高度关联的区域。蓝色区域意味着低的共进化值,蓝色区域在复合体结构和功能的稳定性方面可以被认为做出较少贡献。

图1 在假定极端保守情况下PB1-PA完整的C9MP共进化关系(图中纵轴表示PA蛋白的C9MP,横轴表示PB1蛋白的C9MP)

2.3 PB1蛋白与PA蛋白相互作用位点预测与分析

Carol等发现PB1蛋白、PB2蛋白与PA蛋白都能在宿主受感染细胞中大量表达。这三个蛋白在宿主细胞中相互作用形成一个核酸酶复合体,其中,PB1蛋白可以与PB2蛋白相互作用而不需要依赖于其它因素;PA蛋白可能需要经过修饰后才能够与PB1蛋白相互作用[11]。Yasushi研究小组找到了PB1蛋白与PA蛋白的相互作用域,分别位于PB1蛋白的1-140处与PA蛋白的201-716[12]。

依据CD Search结果,对于PB1-PA蛋白复合体来说,PB1蛋白的氨基酸位点1-140包含87个C9MP,PA蛋白的氨基酸位点201-716包含245个C9MP。

图1表明,PB1-PA的结构域有许多在进化上具有相关联的域,其中,不少具有极高的Pcov值。但是,由于目前PDB数据库中只有一个PB1蛋白与PA蛋白相互作用的结构图,为了便于验证与对照,本文选择了PDB数据库中的PB1MP1,探讨其与PA蛋白的相互作用,探究相互作用位点,该方法可以推广至其它区域相互作用位点的预测分析。

表1 PB1MP1的基本信息

计算发现PB1MP1与PA蛋白上的C9MP仅在1、10、18-22、27-33、40-46、58-59、144-145、151-154、220-221、231-234位置上(见表2)同时具有PB1MP1与PA蛋白残基201-716区域内最低的共进化值。

通过蛋白质的三维结构模拟,可以显著地发现PA蛋白上与PB1MP1可能存在共进化关系的各个C9MP与PB1MP1在结构上距离较远。但是,在这12个C9MP中,惟一例外的是编号10的C9MP,模拟显示其与PB1MP1具有显著的接触。为了便于下文引用,参照Wang的命名规则,即依据氨基酸片段的首尾字母和起始位置编码,命名10号C9MP为PAQG670。

对PAQG670片段变异统计分析发现(见表3),同为接触面的氨基酸,Q670 比R673更为保守。统计发现R673位置上共有13个R变异为K。由于相互作用位点在复合体中的功能十分重要,检索分析表明,PAQG670与PB1MP1的变异实际上没有存在于同一个病毒中,与R673对位的PB1MP1的氨基酸没有发生协同突变,因此,可以排除R673作为潜在相互作用位点的可能。在对这些变异检索过程没有发现Q670突变。在此,定义共同序列为剔除变异后的剩余序列。序列比对发现,Q670在接近1580个病毒株中没有发生突变,因此,Q670属于高度保守位点,也是可能潜在的相互作用位点。

表2 PA蛋白与PB1蛋白可能存在共进化关系的C9MP位置

表3中的黑斜体字母表明某个位置氨基酸的变异情况。在我们所关心的氨基酸Q670及R673中,Q670的保守度要远远高于R673的保守度。E677,P687,G679等位点高度保守,如果两者存在相互作用,需要确认与Q670对位的PB1氨基酸具有稳定性的特征。与Q670对位的PB1氨基酸分别是F9、V12、P13和A14。在这4个氨基酸中,A14由于其在所有病毒株的PB1蛋白变异率高于10%,因而被放弃。在表4中,黑体字母同样代表该位置氨基酸的变异情况,计算表明,除了6、8位置的氨基酸外,其它氨基酸发生变异的程度都较低;可以看出,F9、V12和P13均具有很高的保守度,表明这些位点均有参与相互作用的可能。

利用三维模拟的方式,本文重构了PAQG670和PB1MP1的相互接触情况(见图2)。局部放大了关键相互作用位点(图3)。图中的网格表示了整个蛋白的空间范围,Q670上下方的镂空区是氨基酸填充区;从图3中可以看出,Q670与PB1MP1的F9、V12和P13在复合体中是紧密结合的,此处可能是PAQG670与PB1MP1的相互作用位点之一。

表3 PAQG670变异情况

图2 PAQG670的Q670与PB1MP1的F9、V12和P13相互作用三维模拟效果

表4 PB1MP1变异情况

Table 4 The mutations of PB1MP1

PB1 1-131-8910-13PB1 14-151415共同序列…F…共同序列.A>gi|115279364| …F…>gi|110733273|.A>gi|115289089| …F…>gi|113497118| .V>gi|138392702| …F…>gi|134044411| .A>gi|145278824| …F…>gi|158454194| .A>gi|158957652| …F…>gi|189230912| .A>gi|172052953| …F…>gi|209978260| .A>gi|188504421| …F…>gi|211998317| .V>gi|218663901| …F…>gi|218874837| .A>gi|218664015| …L…>gi|218874898| .A>gi|76411281| …F…>gi|73665893| .A>gi|77746868| …F…>gi|76411281| .A>gi|91177921| …F…>gi|77543657| .A

利用DSSP程序,如果将PA蛋白与PB1蛋白分别独立计算ACC值,PA蛋白的Q670,PB1蛋白的F9、V12、P13的ACC值分别为82、117、43和103 A2;如果考虑将PA蛋白与PB1蛋白结合形成复合体后,计算ACC值,则PA蛋白的Q670、PB1蛋白的F9、V12、P13的ACC值分别下降至13、56、14和79 A2。计算结果见表5。

表5 PAQG670的Q670与PB1MP1复合体形成前后参数变化

在成为复合体前,上述4个氨基酸暴露在水环境中的面积与整体面积比(ARR)是26.8%、36.3%、16.7%和43.1%;成为复合体后,上述4个氨基酸的ARR值下降到4.2%、17.4%、5.4%和33.1%。

当PB1蛋白与PA蛋白尚未相互作用时,依据生物学定义,PA的Q670、PB1的F9和P13都是表面氨基酸。特别PB1的P13(ARRmax =43.1%)高度暴露于水环境中。当PB1蛋白与PA蛋白相互作用时,PA的Q670、PB1的F9和P13暴露在水环境中的表面积均迅速下降,降幅(比例)分别达到69 A2(22.6%)、61 A2(18.9%)和136 A2(10.0%),均显著超过了Rost(1994)[10]给出的临界值1A2;因此,它们均可成为相互作用的表面氨基酸。

3 讨 论

本文的主要结论是PAQG670的Q670与PB1的F9、P13构成了一个潜在的相互作用域,该相互作用域由这3个氨基酸构成。

研究表明,越是功能重要的区域,如果出现变异,蛋白(或蛋白复合体)失活的可能性越高[13]。类似核酸酶复合体这种关乎病毒复制、繁殖的精密蛋白复合体,出现变异的大部分结果是导致病毒无法繁殖子代病毒[14]。相互作用表面氨基酸的保守性要明显高于其它表面氨基酸[15]。

BLAST和C9MP搜索结果显示,甲型流感病毒的PB1蛋白与PA蛋白比HIV病毒的RT蛋白和IN蛋白保守许多[9]。本文的研究过程与Wang et al的显著不同,主要差异在于本文研究的PAQG670与PB1MP1的变异没有同时存在于同一个病毒中。

本研究也初步发现,共进化理论不仅可用于寻找相互作用位点,而且,也有可能用于寻找存在共进化可能性的区域。本研究结果对于临床治疗的靶标发现,疫苗和药物的研发具有重要指导意义。

参考文献:

[1]WEBSTER R G, BEAN W J, GORMAN O T, et al. Evolution and ecology of influenza A viruses[J]. Microbiol Rev,1992,56(1):152-179.

[2]HONDA A, MUKAIGAWA J, YOKOIYAMA A, et al. Purification and molecular structure of RNA polymerase from influenza virus A/PR8[J]. J Biochem,1990,107(4):624-628.

[3]NIETO A, DE LA LUNA S, BARCENA J, et al. Complex structure of the nuclear translocation signal of influenza virus polymerase PA subunit[J]. J Gen Virol,1994,75 ( Pt 1):29-36.

[4]CAFFREY D R, SOMAROO S, HUGHES J D, et al. Are protein-protein interfaces more conserved in sequence than the rest of the protein surface?[J]. Protein Sci,2004,13(1):190-202.

[5]MINTSERIS J, WENG Z. Structure, function, and evolution of transient and obligate protein-protein interactions[J]. Proc Natl Acad Sci U S A,2005,102(31):10930-10935.

[6]GONZALEZ S, ZURCHER T, ORTIN J. Identification of two separate domains in the influenza virus PB1 protein involved in the interaction with the PB2 and PA subunits: a model for the viral RNA polymerase structure[J]. Nucleic Acids Research,1996,24(22):4456.

[7]ZURCHER T, de la LUNA S, SANZ-EZQUERRO J J, et al. Mutational analysis of the influenza virus A/Victoria/3/75 PA protein: studies of interaction with PB1 protein and identification of a dominant negative mutant[J]. J Gen Virol,1996,77 ( Pt 8):1745-1749.

[8]PERALES B, de la LUNA S, PALACIOS I, et al. Mutational analysis identifies functional domains in the influenza A virus PB2 polymerase subunit[J]. J Virol,1996,70(3):1678-1686.

[9]WANG Y E, DELISI C. Inferring protein-protein interactions in viral proteins by co-evolution of conserved side chains[J]. Genome Inform,2006,17(1):23-35.

[10]ROST B, SANDEr C. Conservation and prediction of solvent accessibility in protein families[J]. Proteins,1994,20(3):216-226.

[11]ST A C, SMITH G E, SUMMERS M D, et al. Two of the three influenza viral polymerase proteins expressed by using baculovirus vectors form a complex in insect cells[J]. J Virol,1987,61(2):361-365.

[12]OHTSU Y, HONDA Y, SAKATA Y, et al. Fine mapping of the subunit binding sites of influenza virus RNA polymerase[J]. Microbiol Immunol,2002,46(3):167-175.

[13]DARLIX J L, LAPADAT-TAPOLSKY M, de ROCQUIGNY H, et al. First glimpses at structure-function relationships of the nucleocapsid protein of retroviruses[J]. J Mol Biol,1995,254(4):523-537.

[14]STEINHAUER D A, HOLLAND J J. Rapid evolution of RNA viruses[J]. Annu Rev Microbiol,1987,41:409-433.

[15]OFRAN Y, ROST B. Predicted protein-protein interaction sites from local sequence information[J]. FEBS Lett,2003,544(1/3):236-239.

猜你喜欢
复合体流感病毒结构域
丁型流感病毒在中国的流行状况及研究进展
细菌四类胞外感觉结构域的概述
滨蒿总黄酮对H1N1流感病毒感染的A549细胞先天免疫信号通路的影响
UBR5突变与淋巴瘤B细胞成熟
膝关节创伤性多发韧带损伤中后外复合体重建的临床疗效
中美科学家发现猪流感病毒H1N1已传播给狗 重组成新病毒
RAB37直接与ATG5相互作用并通过调控ATG5-12-16复合体装配促进自噬体形成
老年人颧骨复合体骨折20例临床分析
采用PCR和细胞培养方法比较流感样病例不同标本的流感病毒检出观察
PTPMeg2的PTP结构域对磷酸化STAT3入核的抑制作用