曹 睿 赵 邑 潘薇薇 曹鹏程 梁雅丽 谢海军
(山西省生物研究所 山西太原 030000)
Autotaxin(ATX)蛋白1992年首次在人的黑色素瘤细胞系A2058中发现[1],是一种自分泌活性因子,是分子量为126-kDa的糖蛋白。能够以溶血磷脂酰胆碱(1ysophosphatidyIcholine,LPC)为底物催化生成溶血磷脂酸(1ysophosphatidic acid,LPA),表现出磷酸二酯酶活性,被归为磷酸二酯酶家族(ENPP2 家族)[2]。除了磷酸二酯酶活性外,Autotaxin蛋白还同时具有焦磷酸酶和 ATP酶活性[3]。Autotaxin在肿瘤细胞中对肿瘤的发生和发展,特别是肿瘤的迁移起着重要作用,其抑制剂的开发并被认为可能为治疗肿瘤提供方法[4]。在Autotaxin蛋白的催化结构域中一些氨基酸的糖基化至关重要,已有研究表明Asn524的糖基化对于Autotaxin蛋白发挥活性是必需的。例如:在脂肪细胞中,Asn53和Asn410的N端糖基化对于Autotaxin的分泌和活性很重要[4-5]。因此研究Autotaxin蛋白的磷酸化、糖基化等催化位点非常重要,可以采取生物信息学手段完成预测工作,为进一步挖掘其生物学意义提供理论基础和研究思路。
1.1 材料 人Autotaxin蛋白fasta格式数据来自NCBI蛋白数据库,全长 915 aa,GenBank号为:AAA64785.1。
1.2 方法 Autotaxin蛋白的磷酸化位点分析分别利用软件 DISPHOS 1.3[6]、PhosphoSitePlus[7]、KinasePhos[8]、Scansite[9]、NetPhosk[10]、Musite[11]进 行预测,这些软件是现今比较常用的磷酸化位点预测软件。
Autotaxin(ATX)蛋白的糖基化位点(N-型、O-型)分别用 NetNGlyc1.0[12]、Uniprot数据库、NetOGlyc4.0[13]、YinOYang[14]1.2 软件进行预测。 各数据库软件参数如无特别说明均取默认值(表1)。
表1 预测工具软件简介
2.1 磷酸化位点分析结果 6款软件预测的所有磷酸化位点中,有4款软件同时预测到的位点有 2个,分别是:S-330,T-328;有 3款软件同时预测到的位点有3个,分别是:S-860,S-861,T-333;有2款软件同时预测到的位点有12个,分别是:S-58,S-302,S-308,S-326,S-327,S-729,S-741,S-865,T-210,T-288,T-83,T-368(表 2)。
6款预测软件中,DISPHOS 1.3预测的全部结果均与其他软件预测结果重合,其次,预测重复率较 高 的 软 件 有 :Scansite、Musite、PhosphoSitePlus。预测结果最多的为NetPhosk,KinasePhos预测结果中重复预测率较低。NetPhosk是这6款软件中预测位点最多的,共有Ser修饰位点26个,Thr修饰位点13个,Tyr修饰位点10个。Musite软件预测的位点最少,Ser修饰位点 3个,Thr修饰位点 1个,Tyr修饰位点1个。
表2 Autotaxin蛋白磷酸化位点预测
通过对预测结果分析可知,丝氨酸(Ser)修饰位点较多,被重复预测到的有11个位点;其次是苏氨酸(Thr)、酪氨酸(Tyr),被重复预测到的位点均为3个。此外,Scansite还预测到脯氨酸(Pro354、Pro735)及亮氨酸(Leu498)修饰位点。
2.2 糖基化位点分析结果 N型糖基化位点的预测通过Uniprot数据库查询及NetNGlyc1.0软件预测,重复被预测到的位点为N-54。
O型糖基化位点的预测通过NetOGlyc4.0、YinOYang1.2软件进行,重复被预测到的位点为O-695、O-696、O-712。
蛋白质翻译后修饰对细胞的调控机制起重要作用,它能影响蛋白的多种属性,包括蛋白质折叠、活性及最终功能[15]。蛋白质的磷酸化和糖基化的过程为:蛋白质在蛋白激酶催化下将磷酸集团由ATP转移到目标蛋白质上,将低聚糖转移到蛋白质骨架上,主要的生物学功能有:信号转导、酶活性调节、新陈代谢、蛋白质稳定性与溶解度,抗原性、蛋白质靶标、细胞-细胞相互作用等[16]。真核生物磷酸化位点一般有丝氨酸,苏氨酸,酪氨酸。其中,丝氨酸和苏氨酸是最常见的磷酸化位点[17],因为其结构末端含有羟基,羟基很活泼,可以与磷酸基团结合。所以说,蛋白质中如果某个丝氨酸很保守的话,很大程度上就是磷酸化位点。
本研究利用生物信息学软件对Autotaxin蛋白进行磷酸化和糖基化位点预测。大部分生物信息学软件的设计思路是基于已有数据的汇集,结合数学模型的设计和计算机技术的集成开发而成。已有实验或文献数据的提供可使预测结果具有可靠性高、可重复性强、可验证性高的优势,缺点是较少提供新的数据集,科学合理的数学模型和训练集可弥补此缺陷。
本研究磷酸化位点预测中使用到的软件,大部分利用的是隐马尔科夫模型(DISPHOS 1.3、KinasePhos)[18-19],NetPhosk 则采用人工神经网络算法[20],Musite采用机器学习方法。从软件本身预测结果及被其他软件重复预测到的比例看,预测准确 率 排 序 为 :DISPHOS 1.3、Scansite、Musite、Net-Phosk、PhosphoSitePlus、KinasePhos。 从重复被预测到的结果看,12个位点中有 5个位点(Y-83、T-210、T-288、S-302、S-308)是文献中有明确报道为磷酸化位点的。不同的数学模型、算法对于预测结果的影响是较为显著的。因此,在初步筛选数据集阶段,应该尝试多软件、换参数等方式,达到数据集尽可能精确、可验证的目的。为实验验证提供重要的依据和基础。
识别蛋白质修饰的传统方法中质谱、磷酸盐标记等实验手段能检测的修饰活性位点十分有限,费时费财,产出较慢。本项目采用高效、可靠的生物信息学手段,对Autotaxin蛋白质修饰活性位点预测,为其抑制剂的开发提供潜在靶点。