赵艳超,张淑波,陈维田,何 淼
(1.中山大学生命科学学院,广东 广州 510275;2. 香港理工大学屋宇设备工程系,香港 九龙)
1994年Sells等[1]在对前列腺癌研究的过程中,首先发现了Par-4(Pro-apoptosis response-4),它是一种重要的促凋亡蛋白。Par-4蛋白质广泛存在于脊椎动物细胞,尤其是哺乳类动物细胞中,与鼠的NLS1,NLS2区域100%的同源。近期研究发现,Par-4与前列腺癌、肝癌、子宫癌,以及神经变性疾病等有密切关系[2];相关研究包括Par-4基因的缺失,在细胞中的定位差异,以及与其它凋亡蛋白的相互作用等。研究还发现Par-4有多个伴侣分子,在细胞凋亡过程中共同起作用[2]。最近文献报道,该蛋白质与异构拓扑酶Top1具有相互作用,通过影响DNA的复制,来阻止细胞的正常功能[3]。美国肯塔基大学研究小组2007年利用转基因的方法将Par-4基因转入老鼠体内,培育出了对多种癌症免疫的老鼠[4]。由于Par-4可以选择性地引发癌细胞的凋亡,对于正常或永久性细胞却没有影响,因此,引起了研究人员的极大兴趣。
Par-4在细胞中的功能十分复杂。常规实验条件下,对Par-4与其它蛋白质间相互作用的研究可以借助于酵母双杂交、免疫共沉淀等方法。但是,实验方法只能够涉及成对蛋白质间的相互作用、或单一功能和途径的研究。目前,很多实验性工作主要针对单一类型癌细胞的研究以探索Par-4的促凋亡机理,往往会得出相互矛盾的结果;主要原因是不同细胞类型可能具有不同的凋亡途径,这也说明了Par-4促凋亡途径的复杂性和多样性。
本文基于支持向量机(SVM)技术和相关数据库数据,系统性预测Par-4蛋白质相互作用(Protein-protein Interaction,PPI)网络;同时,借助于文献信息挖掘技术和数据库实验信息,预测Par-4功能及其可能的凋亡信号转导途径。
Par-4和相关蛋白质序列获取自NCBI的相关数据库。从HPRD(Human Protein Reference Database)中下载了人类的全部蛋白质参考数据。蛋白质相互作用数据参照Guo等人的方法搜集和整理[5],构建本地数据集合。
使用Perl语言编程,从本地数据集合筛选目标蛋白质。选取的目标蛋白质要求具有以下特征:①该蛋白质在细胞中定位于细胞质或细胞核;②该蛋白质的细胞功能为细胞凋亡。
SVM算法所用的正集来自DIP(Database of Interaction Protein)的酿酒酵母子数据库,数据库版本是20070219,总共获得5 944对蛋白质相互作用数据;剔除其中同源性>40%的数据对,剩余5 594对蛋白质相互作用数据。负集是按照细胞内定位的方法进行收集;在不同细胞内位置,依据蛋白质在生物学意义上没有相互作用关系,选取了5 594对非蛋白质相互作用数据。
从DIP的人类子数据库中下载所有人类的蛋白质相互作用对,作为SVM测试数据集,版本是20090319。
参照Shen等的建模方法[6],将蛋白质序列的氨基酸按照不同的极性、电偶性、疏水性等特征分成7类,计算氨基酸三联子(即连续的3个氨基酸)在蛋白质序列中的频率,可以得到343(7×7×7)维特征向量。在此基础上,计算蛋白质对的686(即343+343)维特征向量;进一步,处理为SVM算法的输入格式。我们选用的SVM类型为C-SVC,核函数类型为RBF函数(exp(-ru-v|^2)。利用Lib-SVM-2.69软件中的Grid.by程序寻找最优参数。具体做法参照http:∥www.csie.ntu.edu. tw/~cjlin。
本文采用3-Fold检验方法,用于确定模型的准确率和稳定性。检验计算涉及4个参数和3个评判指标。相关参数包括:TP(真阳性,即相互作用的蛋白质对预测为相互作用),FP(假阳性,即非相互作用的蛋白质对预测为相互作用),TN(真阴性,即非相互作用的蛋白质对预测为非相互作用),FN(假阴性,即相互作用的蛋白质对预测为非相互作用);3个评判指标为:Sn (敏感性)、Sp(特异性)和Acc(准确率)。参数计算公式如下:
依据SVM计算结果,构建以Par-4为核心的蛋白相互作用网络。利用Cytocscape软件进行可视化处理和PPI网络输出。
从BOND(Biomolecular Object Network Databank)检索与Par-4有相互作用关系的蛋白质,该数据库中记录的相互作用蛋白质对是通过酵母双杂交技术或免疫共沉淀等实验方法得到,具有很高的可信度;另一方面,结合文献挖掘技术,检索和阅读了数百篇相关文献或摘要;交叉验证PPI预测结果。进一步,综合利用以上信息,推测凋亡蛋白Par-4的信号转导途径。
通过参数优化,得到C-SVC的主要参数C=32,g=0.031 25,校正准确率为92.11%。进一步,利用3-fold计算模型的敏感性、特异性和准确率等指标,对测试数据集的预测结果见表1。检验结果表明该模型的可信度高。
表1 对测试数据集的预测结果
文中还利用该模型测试从DIP人类子数据库下载的2 171对PPI数据,得到的准确率为80.7%,并且,对独立的非相互作用蛋白质数据预测结果也达到80%的准确率。
依据目标蛋白质特征要求,从HPRD中筛选相关蛋白质,得到152个符合条件的蛋白质。基于SVM模型,预测出其中有82个蛋白质与Par-4有相互作用。依据生物学功能注释信息,对这些蛋白质进行了有效分类,分类结果见表2。
根据生物学功能,可以将这些蛋白质划分为8类,主要类别包括:蛋白激酶、泛素化蛋白酶、死亡受体相关因子、与细胞周期或DNA复制相关蛋白质、调节蛋白质、与疾病相关蛋白质、具有特定结构域结合蛋白质和其他蛋白质。
表2 与Par-4可能有相互作用的蛋白质功能分类
基于SVM模型预测结果,成功构建了以Par-4为核心的PPI网络(见图1:A),并按照其不同的功能把相关PPI蛋白质有效进行了聚类。参照以上几类蛋白质在细胞中的功能,依托相关文献信息挖掘结果,初步推测出凋亡蛋白Par-4在细胞中可能的信号转导通路(见图1-B)。我们推测细胞首先通过细胞膜的受体接受胞外信号,信号激活与受体相联系的受体相关蛋白,受体相关蛋白与Par-4相互作用,把胞外信号传递给Par-4;并且,同时蛋白激酶激活Par-4,使其磷酸化,进入细胞核内;在细胞核内其可以与相关的转录因子结合,从而影响基因的转录和翻译,达到调节基因活性的作用;当细胞没有接到胞外信号时,Par-4被泛素化蛋白降解,或者和调节蛋白相结合而失活。根据计算模型,发现Par-4可能和某些癌症标记物有相互作用,可能还与具有特定结构域的蛋白相互作用,引起细胞的凋亡。本文首次预测到Par-4与一大类的泛素化蛋白有密切的关系。泛素化蛋白在细胞中的作用主要是促进蛋白的降解。
图1 Par-4相关PPI网络(A)与信号转导途径初步推测(B)(加P为磷酸化)
利用文献信息挖掘技术,发现了10个可以和Par-4形成复合物的蛋白质,它们分别是WT1、p62(NF-kB的一个亚基)、Dlk、14-3-3、D2DR、Amdia、F-action、ζPKC、E2F1和Top1[3, 7-9](见图2-A)。在BOND数据库中检索发现了可以与Par-4形成复合物的蛋白质,共有8个,它们分别是CaM、Sherc、Par-4、D2DR、Tat、PKC-lambda/itoa、HNF4-alpha和PKC-zeta(见图2-B)。
图2 Par-4的伴侣分子及PPI网络重构
A:文献中检索的伴侣分子;B: BOND检索的伴侣分子;C: Par-4在细胞中PPI网络重构
依托SVM预测结果,结合文献挖掘和BOND数据库检索信息,整合Par-4的PPI网络(见图2-C)。在重构的PPI网络中,发现D2DR和ζPKC是文献挖掘和数据库检索过程共同拥有的蛋白质。推测这两种蛋白可能在Par-4行使功能过程中起到关键作用。由于图2中大部分蛋白质对的PPI是经过实验验证的,确实可信。重新推测Par-4的信号转导途径见图3。
图3 重新推测的Par-4信号转导途径(加P的为磷酸化)
对图3的分析发现了两条重要的信号转导途径:Par-4、D2DR、PKA间的信号转导途径;Par-4、ζPKC、Akt,NF-kB之间的信号转导途径。在图3中,包含了Park等[10]发现的Par-4、D2DR、cAMP等之间的相互关系和信号转导途径;以及Gurumurthy等[7]发现的Par-4、cAMP、PKA间的相互关系和信号转导途径。
Par-4作为一种促凋亡蛋白,多年研究发现其与癌症和神经退化性疾病具有密切关联;并且,在不同的细胞中发现其存在相互矛盾的作用;由此判断,Par-4在细胞凋亡过程中可能具备多种功能并参与了多种凋亡通路[9]。
近期研究表明,Par-4在行使其功能的过程中,与其在细胞中的定位,以及是否和其它蛋白形成复合物具有密切的关系。在细胞质中,Par-4被PKA磷酸化时,可以促进Par-4进入细胞核;而Par-4一旦被Akt磷酸化,则被滞留在细胞质内[7]。在细胞核中,Par-4可以和具有磷酸化的蛋白质如Dlk、Amdia形成复合物而出核[10],并可以和细胞骨架结合促进肌球蛋白的磷酸化,从而导致细胞骨架裂解。Par-4可以与E2F1形成的复合物促进smac基因的转录[11],还可以与WTI形成复合物抑制Bcl-2的转录[2]。综上所述,正是由于Par-4在疾病发生过程中,与多种蛋白质相互作用,可能参与了多条信号通路。因此,只有从系统的角度开展研究,才能够对全面地整合Par-4的作用机制,准确理解、掌握其功能和在疾病产生过程所扮演的角色。
本文依据SVM计算结果、结合文献挖掘和数据库检索信息,发现了Par-4的2条可能的新的重要信号转导途径(图3)。信号转导途径中相关蛋白质之间的相互作用可能导致细胞凋亡,或维持细胞生存的某种平衡状态,一旦这种平衡状态被破坏,就会引发相应的疾病。例如,Par-4过量表达会抑制ζPKC,但ζPKC可以促进Akt的活性,Akt使Par-4与14-3-3结合滞留在细胞质,使其无法进入细胞核起作用。Par-4的缺失可能导致ζPKC和PKA的过量表达,其中,ζPKC可以激活NF-kB,引起细胞的过量增殖或癌症。本文关键的发现是Par-4可能通过ζPKC和NF-kB两种途径来阻止NF-kB起作用。
此外,我们还发现Par-4与一些疾病相关蛋白质具有重要相互作用,例如,与亨廷顿蛋白结合蛋白1(HIP1)、淀粉样蛋白(AlP1)、β-连锁样蛋白(β-Clp1)和BCL2/腺病毒E1B 19kDa结合蛋白(BNIP2)等具有相互作用。这几个蛋白质分别与亨廷顿病、老年痴呆症、结肠癌、心肌炎等相关疾病具有密切的关系。实际上,现有研究文献已经证明这些疾病与Par-4具有密切的关系[2]。
蛋白质间如果发生相互作用,可能会处于相同的调控途径,但不一定有物理上的接触。具有相同功能的蛋白质可能有效类聚在一起。为减少预测的假阳性,将预测有相互作用关系的蛋白质按照功能分成8大类。我们构建了Par-4为核心的蛋白质相互作用网络。例如,丝氨酸/苏氨酸蛋白激酶(S/TPK17A,S/TPK17B),在Par-4的结构中拥有丝氨酸和苏氨酸位点,文献证明Par-4可以被PKA、Akt等蛋白磷酸化[8-9],与预测结果吻合。预测Caspases凋亡途径与Par-4有关,在文献中得到了印证[9]。并且,预测到Par-4与DNA复制相关蛋白质具有相互作用,最新的研究表明,Par-4可以与DNA复制有关的Top1形成复合物,抑制DNA的复制,从而使细胞周期停留在DNA复制阶段[3]。我们还预测到一组与细胞周期和DNA复制有关的蛋白质,包括DNA裂解因子(DFFα)等;初步推测Par-4与DNA复制过程的相互作用,可能也是一种促细胞凋亡的途径。同时,预测发现Par-4与一些死亡受体蛋白可以相互结合,与相关的多种死亡途径建立了联系,例如,Rab、Ras、Fas、TNF等;该结果同样获得了实验的支持[2, 9]。预测指出Par-4与一些特定的结构域有关,例如,锌指、亮氨酸富集区、IAP、BH3等结构。在Par-4结构分析时,发现Par-4具有C端亮氨酸拉链结构,其特殊的结构可以和许多其他特殊结构相结合,伴侣分子WT1就具有锌指结构;而且,Par-4还可以通过亮氨酸链与自身发生相互作用,这可能也是一种平衡Par-4在细胞中起作用的主要机制。此外,本文首次预测到Par-4与一大类的泛素化蛋白有密切的关系,泛素化蛋白在细胞中的作用主要促进蛋白的降解,这对于稳定Par-4在细胞中的功能可能具有重要意义。
本研究对于完整地理解Par-4在细胞中的功能具有重要意义和价值;对于开展进一步的实验研究具有指导意义。由于Par-4可以选择性诱导细胞凋亡,在这一点上,其作为药物靶点具有很大的吸引力。
参考文献:
[1] SELLS S F, WOOD D P, RANGNEKAR V M, et al .Commonality of the gene programs induced by effectors of apoptosis in androgen-dependent and-independent prostate cells [J]. Cell Growth & Differentiation, 1994, 5:457-466.
[2] NADIA E G, VIVERK M R. Apoptosis by Par-4 in cancer and neurodegenerative diseases [J]. Experimental Cell Research, 2003, 283:51-66.
[3] GOSWAMI A, QIU S, THOMAS S D,et al. Par-4 binds to topoisomerase 1 and attenuates its DNA relaxation activity [J]. Cancer Research, 2008, 68(15):6190-6198.
[4] ZHAO Yanming, BURIKHANOV R, RANGNEKAR V M,et al. Cancer resistance in transgenic mice expressing the SAC module of Par-4 [J]. Cancer Research, 2007, 67(19):9276-9285.
[5] GUO Yanzhi, YU Lezheng, WEN Zhining, et al .Using support vector machine combined with auto covariance to predict protein-protein interactions form protein sequences [J]. Nucleic Acids Research, 2008, 36(9):3025-3030.
[6] SHEN Juwen, ZHANG Jian, LUO Xiaomin, et al. Prediction protein-protein interactions based only on sequences information [J]. PNAS, 2007, 104(11):4337-4341.
[7] GURUMURTHY S, GOSWAMI A, VASUDEVAN K M, et al. Phosphorylation of Par-4 by potein kinase A is critical for apoptosis [J]. Molecular and Cellular Biology, 2005, 25(3):1146-1161.
[8] GOSWAMI A, RANGANATHAN P, RANGNEKAR V M. The Phosphoinositide 3-Kinase/Akt1/Par-4 axis: A cancer-selective therapeutic target [J]. Cancer Research, 2006, 66:2889-2892.
[9] 秦天洁,马巍,刘陕西,等. Par-4诱导细胞凋亡发生机制的进展 [J]. 现代肿瘤医学,2008, 16(12):2216-2219.
[10] PARK S K, NGUYEN M D, FISCHER A, et al. Par-4 links dopamine signaling and depression [J]. Cell, 2005, 122:275-287.
[11] LU Chao, CHEN Jieqing, ZHOU Guoping, et al. Multimolecular complex of Par-4 and E2F1 binding to Smac promoter contributes to glutamate-induced apoptosis in human-bone mesenchymal stem cells [J]. Nucleic Acids Research, 2008, 36(15):5021-5032.