国果 吴沁怡 吴建伟 赵学军 付萍 张勇
(贵阳医学院 寄生虫学教研室,贵阳 550004)
家蝇泛素结合酶基因的生物信息学分析
国果 吴沁怡 吴建伟 赵学军 付萍 张勇
(贵阳医学院 寄生虫学教研室,贵阳 550004)
利用EST测序技术从家蝇幼虫cDNA文库中获得家蝇泛素结合酶基因(MD-E2)cDNA序列,采用NCBI、ExPASY中的相关工具,对该基因及其编码蛋白的基本理化性质、疏水性、信号肽、二级结构和亚细胞定位等方面进行预测和分析,MEGA软件构建了进化树。结果表明,家蝇泛素结合酶基因的cDNA序列具有完整的ORF框,全长480 bp,一共编码159个氨基酸。其编码的蛋白质理论分子量为18.117 9 kD,等电点8.64,无信号肽及跨膜区,属于亲水性蛋白,具有泛素结合酶家族的活性位点(FHPNVYPSGTVCLSLL),主要分布于细胞核;二级结构以无规则卷曲为主,β折叠较少。
家蝇 泛素结合酶 生物信息学
泛素-蛋白酶途径(Ubiquitin-proteasome pathway,UPP)广泛存在于真核系统中,此途径在细胞基本进程如DNA修复,细胞周期调控,机体抵御环境胁迫等一系列通路中发挥着重要作用[1]。在一般蛋白质降解的泛素化途径中,共需要泛素活化酶(UBE1)、泛素结合酶(UBE2)和泛素底物连接酶(UBE3)3种酶的参与[2],泛素结合酶(UBE2)在选择性降解靶蛋白中起决定性作用。不同的细胞内有多种UBE2基因,目前发现酵母有13种,拟南芥中有17种,而人类至少有30种。但对于昆虫UBE2研究报道较少,目前尚未见家蝇体内UBE2的相关研究报道。有学者研究显示,当机体受到病原体如细菌和病毒攻击时,UBE2的表达水平明显上升[3-6]。本课题组通过构建家蝇幼虫热胁迫的cDNA全长文库并进行EST测序,从中筛选得到了UBE2的表达序列标签,并测定了其全长序列。本研究对家蝇UBE2基因的cDNA序列进行结构与功能的信息学分析,以期为进一步揭示该基因在家蝇免疫防御体系中的功能,挖掘新型的家蝇抗菌功能基因等提供一定的理论及试验依据。
1.1 材料
热诱导的家蝇三龄幼虫cDNA质粒文库由北京华大合作构建(具体诱导条件及文库构建方法见课题组前期论文报道[7]。
随机挑选500个克隆测序得到多个EST,Wublastx 方法归并EST获得Unigene。对这些Unigene进行BLAST后,从中筛选获得编码家蝇UBE2的基因,文库质粒编码为004E02b。
1.2 方法
1.2.1 家蝇泛素结合酶基因的识别与同源性比较 通过NCBI网站的BLASTx程序,将编号为004E02b文库质粒的插入序列与GenBank 中的序列进行比对,判断该序列是否为全长编码序列,寻找该序列的同源蛋白序列,将家蝇泛素结合酶基因命名为MD-E2。
1.2.2 MD-E2理化性质分析 用DNASTAR5.0 软件分析cDNA序列和开放阅读框;利用瑞士生物信息学研究所的蛋白分析专家系统(Expert Protein Analysis System,ExPASy)提供的生物信息学工具Protparam,分析预测蛋白质的氨基酸残基性质、分子量及理论等电点、摩尔消光系数、重组产物在细菌、酵母和哺乳动物细胞中的半衰期、在溶液中的稳定性等;ProtScale 分析蛋白质的疏水性质。采用Signal P分析信号肽序列。
1.2.3 结构及功能预测 利用Interpro 和PREDICTPROTEIN 在线分析软件预测蛋白质中包含的结构域和氨基酸功能位点;利用PSORT Ⅱ在线分析网站分析蛋白质在细胞内的定位。利用PHD sec 在线服务器和SWISS MODEL在线预测网站预测蛋白质的二级结构和三级结构。
1.2.4 系统发育树 从NCBI数据库下载9个物种的泛素结合酶基因编码蛋白序列,包括果蝇、按蚊、金小蜂、拟谷盗属、水蚤拟穴青蟹、牛蛙、南美白对虾和人类,利用MEGA4.1软件构建系统进化树。
2.1 MD-E2 基因的序列比对
NCBI对MD-E2进行BLASTx分析,结果(图1)发现MD-E2基因与黑腹果蝇(Drosophila ananassae)、埃及伊蚊(Aedes aegypti)、大红斑蝶(Danaus plexippus)泛素结合酶基因的相似性分别为99%、97%和94%,从比对的高同源性判断该基因是家蝇的泛素结合酶基因,也表明泛素结合酶极度保守。ORF全长480 bp,编码159个氨基酸。
2.2 理化性质预测
利用ProtParam工具预测表明MD -E2编码蛋白的相对分子量为18.12 kD,理论等电点(pI 值)8.64,含酸性氨基酸(DE)12.58%,碱性氨基酸(KR)14.47%,亲水性氨基酸(AILFWV)、极性氨基酸(NCQSTY)和带电氨基酸(RKHYCDE)的比例分别为32.7%、20.75%和34.6%。可见,该蛋白在酵母和大肠埃希菌中表达的半衰期分别大于20 h和10 h,在溶液中的不稳定指数略高于40,为41.02,提示稳定性稍弱。
2.3 信号肽预测和分析
分泌蛋白及细胞膜蛋白都以前体物质多肽的形式合成,其N末端含有作为通过膜时指导蛋白质跨膜转移的氨基酸序列即为信号肽。利用在线网站Signal IP 3.0 Server 分析此蛋白,结果显示MD-E2基因编码的蛋白没有信号肽,属于非分泌型蛋白。
2.4 亚细胞定位
MD-E2基因编码蛋白的亚细胞定位分析结果显示,其分布在细胞核、细胞质、线粒体、细胞骨架、和分泌型囊泡的可能性分别为56.5%、17.4%、13%、4.3%和8.7%。推断MD-E2蛋白可能主要在细胞核中发挥生物学作用。
2.5 结构域分析
ScanProsite 分析显示,该氨基酸序列含有完整的泛素结合酶家族的特征性活性位点FHPNVYPSGTVCLSLL(82-97aa)。Inter ProScan 分析显示其具有泛素结合酶家族的氨基酸保守结构域(图2)。MotifScan(模序)分析显示,MD-E2含有1个酰胺化位点,1个蛋白激酶磷酸化位点;2个酪蛋白激酶Ⅱ磷酸化位点;1个N-肉豆蔻酰化位点,1个蛋白激酶C磷酸化位点;1个泛素结合酶活性位点,2个泛素结合酶家族的特征性位点。推测MD-E2蛋白功能的发挥可能与激酶磷酸化有关。
2.6 疏水性和亲水性的预测与分析
利用Protprotscale在线预测MD-E2氨基酸序列的亲疏水性,根据氨基酸分值越低亲水性越强和分值越高疏水性越强的规律可知,MD-E2基因编码的蛋白多肽链第15位具有最低的分值-2.933(最强的亲水性),第116为具有最高的分值1.867(最强的疏水性)(图3)。总体而言,除了局部的疏水区域,大部分区域为亲水性,因而整个多肽链表现为亲水性。该结果与ProtParam分析结果一致。
2.7 二级结构和三级结构预测
MD-E2蛋白没有跨膜区,Sec预测组成MD-E2多肽链二级结构的3种类型,α螺旋(H)、β折叠(E)和无规则卷曲(L)的比例是33.33∶16.35∶50.31,以无规则卷曲为主,β折叠较少。利用Swiss-Modeling对MD-E2的氨基酸序列进行蛋白质三维结构的同源建模(图4),可见结构中含有较多的α螺旋和无规则卷曲,与二级结构预测结果基本吻合。
2.8 系统发育树
MD-E2基因编码蛋白与其他物种泛素结合酶基因编码蛋白具有较高的同源性,均在90%以上。用MP法构建10个物种的系统发育树,结果表明,家蝇、果蝇和冈比亚按蚊的距离最近,双翅目昆虫与甲壳纲昆虫进化起源于共同祖先。
20个世纪80年代以来,泛素及泛素-蛋白酶体通路一直是生物学领域的研究热点之一。作为胞内重要的蛋白质降解体系,泛素系统在免疫信号转导过程中发挥着重要作用[8]。研究表明,泛素蛋白是调节昆虫适应外界环境的过程中的重要蛋白之一[9],在果蝇体内,泛素-蛋白酶体途径通过降解免疫缺失的Reli蛋白而促进了果蝇体内抗菌肽基因的激活和表达[10]。研究者把鳗弧菌(Vibrioan guillarum)注入到贝壳的肌肉内发现,泛素结合酶的表达量有所增加,而Boname 和Lehner[11]也证实了当病毒侵入机体时,泛素结合酶基因的表达明显上调。对植物体内泛素体系的研究结果亦表明,泛素结合酶在植物抗胁迫反应中具有重要的作用,如在热激和重金属诱导条件下,番茄中的泛素结合酶表达增强[12],疣粒野生稻中泛素结合酶基因在受百叶枯病病原菌胁迫120 h内随着时间延长表达逐渐增强[13],因此我们推测,家蝇泛素结合酶可能也参与了家蝇抗病反应的过程,也是家蝇强大的免疫防御系统中重要的活性分子之一。
本研究对MD-E2的分析表明,该蛋白主要定位于细胞核,概率为56.5%,蛋白上具有多个磷酸化位点,是一个功能活跃的蛋白质。同源性比较分析结果显示,其碱基序列与已经报道的其他9物种的形似性较高,均为90%以上,提示泛素结合酶是一种高度保守的蛋白。本研究采用生物信息学方法分析了MD-E2的理化特性和结构,不仅丰富了泛素结合酶蛋白家族基因信息,同时为进一步研究在外界刺激诱导下,家蝇泛素结合酶的功能与抗病特性之间的关系,进一步开发家蝇体内丰富的抗菌物质奠定了一定的理论基础。
家蝇MD-E2基因含有完整的开放阅读框(480 bp),编码159个氨基酸。编码的蛋白质理论分子量为18.1 179 kD,等电点8.64,无信号肽及跨膜区,属于亲水性蛋白,具有泛素结合酶家族的活性位点,主要分布于细胞核;二级结构以无规则卷曲为主,β折叠较少。
[1] Pickart CM. Back to the future with ubiquitin review[J]. Cell, 2004, 116(2):181-191.
[2] Dikic I, Robertson M. Ubiquitin ligases and beyond[J]. BMC Biol, 2012(10):22.
[3] Núñez-Acuña G, Aguilar-Espinoza A, Chávez-Mardones J, et al. Ubiquitin-conjugating enzyme E2-like gene associated to pathogen response in Concholepas concholepas:SNP identification and transcription expression[J]. Fish & Shellfish Immunology, 2012, 33(4):1065-1068.
[4] Haas TL, Emmerich CH, Gerlach B, et al. Recruitment of the linear ubiquitin chain assembly complex stabilizes the TNF-R1 signaling complex and is required for TNF-mediated gene induction[J]. Mol Cell, 2009, 36(5):831-844.
[5] Li YP, Lecker SH, Chen Y, et al. TNF-alpha increases ubiquitinconjugating activity in skeletal muscle by up-regulating UbcH2/ E220k[J]. Federation of American Societies for Experimental Biology Journal, 2003, 17(9):1048 -1057.
[6] Nagy V, Dikic I. Ubiquitin ligase complexes:from substrate selectivity to conjugational specificity[J]. Biol Chem, 2010, 391(2-3):163.
[7] 刘红美, 张洁. 热胁迫后家蝇幼虫cDNA文库构建与随机EST测序分析[J]. 免疫学杂志, 2010, 26(9):772-775.
[8] 金伟军, 姚祥春, 吕美巧, 等. 泛素-蛋白酶体系统的结构、作用和调控机制[J]. 科技通报, 2008, 24(1):29-34.
[9] 金丰良, 许小霞, 张文庆, 等.家蝇泛素编码区cDNA序列的克隆及在原核细胞中的表达[J].昆虫学报, 2008, 51(5):473-479.
[10] Khush RS, Cornwell WD, Uram JN, et al. A ubiquitin proteasome pathway represses the Drosophilaimmune deficient signaling cascade[J]. Curr Biol, 2002, 12(20):1728-17371.
[11] Boname JM, Lehner PJ. What has the study of the K3 and K5 viral ubiquitin E3 ligases taught us about ubiquitin-mediated receptor regulation?[J]. Viruses, 2011, 3:118-131.
[12] Lau OS, Deng XW. Effect of Arabidopsis COP10 ubiquitin E2 enhancement activity across E2 fa milies and functional conservation among its canonical homologs[J]. Biochem J, 2009, 418:683-690.
[13] 蒋春苗, 黄兴奇, 付坚, 等. 疣粒野生稻泛素结合酶基因的全长cDNA 序列克隆与分析[J]. 作物学报, 2012, 38(5):808- 813.
(责任编辑 狄艳红)
Bioinformatics Analysis of the Gene and Protein of Ubiquitinconjugated Enzyme from Musca domestic
Guo Guo Wu Qinyi Wu Jianwei Zhao Xuejun Fu Ping Zhang Yong
(Department of Parasitology,Guiyan Medical College,Guiyang 550004)
A cDNA sequence of Musca domestic ubiquitin-conjugated enzyme(MD-E2)was obtained by in EST technology. Some characters of the MD-E2 gene and encoded protein sequence were predicted and analyzed by bioinformatics methods in the following aspects, such as general physical and chemical properties, hydrophobicity, signal peptide, secondary structure and localization sites in cells. Results showed that the MD-E2 contains a complete ORF(480bp)encoding 159 amino acid with a predicted molecular weight about 18.117 9 kD and pI 8.64. The protein encoded by MD-E2 gene has no signal peptide, and no transmembrane domains, and it is a hydrophilic protein which is mainly located in cell nucleus. The secondary structures are mainly composed of random coil.
Musca domestic Ubiquitin-conjugated enzyme Bioinformatics
2013-07-19
国家自然科学基金项目(81160204),贵州省科技厅基金[黔科合(2010)3160],高校博士点学科专项科研基金(20105215120001)
国果,女,博士,副教授,研究方向:昆虫分子免疫学;E-mail:guoguojsc@163.com