贾杏林,邹亚文,刘思远,程天印
猪附红细胞体基因的克隆与生物信息学分析
贾杏林,邹亚文,刘思远,程天印
(湖南农业大学动物医学院,湖南长沙410128)
为研究猪附红细胞体蛋白质的结构与功能,应用巢氏PCR技术克隆出1 011 bp的猪附红细胞体基因,构建系统进化树并进行生物信息学分析。系统进化树分析结果显示,猪附红细胞体与小附红细胞体之间的亲缘关系较近。生物信息学分析结果显示,基因编码336个氨基酸,理论等电点()为6.21,相对分子质量为36 745.8,无信号肽和跨膜区,抗原指数较高,具有较大的免疫原性。蛋白质的柔韧性区域较多,蛋白质3D结构显示为“X”立体结构,外周区域结构松散。
猪附红细胞体;基因;生物信息学分析;克隆
猪附红细胞体()属于支原体科(Mycoplasmataceae)、支原体属()血营养型支原体,引起的疾病被称为猪传染性贫血综合征(infectiousanaemia in pigs,IAP)[1]。不能在体外进行长期的连续培养,目前仅能在体外连续培养280 d左右。体外连续培养方法的缺乏在一定程度上制约着对该病原的深入研究[2]。Guimaraes等[3]和Joern等[4]均于2011年报道了猪附红细胞体的全基因组序列。基因编码的蛋白质是位于表面的一种粘附蛋白,能特异性粘附在红细胞表面,在侵染宿主机体红细胞的过程中具有粘附功能,并能引起动物机体强烈的免疫反应[5]。本研究中采用巢氏PCR对基因进行克隆,利用生物信息学软件分析蛋白的抗原性、跨膜区、信号肽、预测二级结构等,以期为该蛋白功能的进一步研究提供参考。
1.1样品与试剂
猪附红细胞体病原由湖南农业大学动物输血与血液病研究实验室保存。2×MasterMix、DL2 000 DNA Marker、DL5 000 DNA Marker购自北京天根生化科技有限公司;PMD19–T载体、大肠杆菌 ()DH5α感受态细胞、胶回收试剂盒、质粒小量提取试剂盒购自南京金斯瑞生物技术有限公司。
1.2DNA模板的提取与引物设计
取500 μL猪附红细胞体培养物,按DNA提取试剂盒操作提取病原的DNA,从GenBank中下载猪附红细胞体的全基因组序列(登录号NC_015153.1)与基因的序列(登录号AM407404.1),使用DNA Star软件来确定基因在全基因组序列中所在的位置。利用Primer 5.0设计外引物(F1,5–CA TTCATTATTGGCGACTT–3;R1,5–GCTATTACCT TCAGGCTCT–3),目的基因大小为1 841 bp。用Primer 5.0设计内引物(F2,5–ATGACAATCCACAA AGT–3;R2,5–TTAA AGAGAAATGTAGT –3),目的基因大小约为1 011 bp,引物由南京金斯瑞生物技术有限公司合成。
1.3巢氏PCR反应
第一轮PCR反应体系:DNA模板1 μL,2×MasterMix 25 μL,外引物F1、R1各1 μL,加ddH2O至50 μL。反应条件为94 ℃预变性4 min;94 ℃变性30 s,58 ℃退火30 s,72 ℃延伸100 s,35个循环后总延伸7 min,4 ℃保存。将胶回收试剂盒回收的第1轮PCR产物作为第2轮PCR的模板,随后进行第2轮PCR反应。反应体系:第一轮胶回收产物2.5μL,2×MasterMix 25 μL,内引物F2、R2各1 μL,加ddH2O至50 μL。反应条件为94 ℃预变性4 min;94 ℃变性30 s,55 ℃退火30 s,72 ℃延伸60 s,35个循环后总延伸7 min,4 ℃保存。
1.4基因的克隆与鉴定
将第2轮的PCR产物进行回收,于16 ℃与PMD19–T载体进行连接,将连接产物转化进大肠杆菌DH5α,并接种于含氨苄的LB培养板中,筛选出阳性的单克隆菌落,用质粒小量提取试剂盒提取质粒,送至南京金斯瑞公司进行测序。
1.5基因全长序列的生物信息学分析
在DNA Star的Editseq区域中将核酸序列转变成氨基酸序列,利用ProParam(http://web.expasy. org/protparam/)分析该蛋白质的氨基酸等电点、相对分子质量等。用MEGA 6.0构建系统进化树。用SignalP 3.0 Server(http://www.cbs.dtu.dk/services/ SignalP–3.0/)分析预测信号肽。用ProtScale (http:// web.expasy.org/protscale/)分析该蛋白质的疏水性。用TMHMM Server v.2.0(http://www.cbs.dtu.dk/services/ TMHMM/)分析蛋白的跨膜区。采用DNA Star软件中的Protean功能分析预测蛋白质的二级结构、柔韧性、表面可及性等,结合IEDB在线分析软件(http://tools. immuneepitope.org/bcell/)分析抗原表位指数信息。采用SWISS–MODEL(http:// swissmodel. expasy.org/)与PyMOL软件预测蛋白质的三级结构。
2.1基因的克隆与鉴定结果
根据GenBank中猪附红细胞体的全基因组序列(登录号NC_015153.1),发现基因(登录号AM407404.1)位于猪附红细胞体全基因组碱基序列的41 589至42 599处。第1次PCR得到与预期片段大小相符的条带(图1),大小为1 841 bp。第2次PCR得到的目的条带为1 011 bp(图2),克隆测序结果基因长度为1 011 bp,与基因序列(登录号AM407404.1)的同源性为100%。
M DL 5 000 DNA Marker;1 PCR产物。
M DL 2 000 DNA Marker;1 PCR产物。
2.2系统进化分析
在NCBI数据库中用基因编码的氨基酸序列进行在线Blast,找出同源性较高的不同种类的支原体,将其序列下载后采用邻接法构建系统进化树(图3)。由该系统进化树可见,猪附红细胞体与小附红细胞体()处于同一个分支,亲缘关系较近,并与猫血巴尔通氏体()、温氏附红细胞体()、羊附红细胞体()之间具有一定的相关性。
2.3猪附红细胞体蛋白质的生物信息学分析
基因的编码序列是一个完整的开放阅读框,编码336个氨基酸,其中,极性氨基酸(M、N、S、Y、C、Q、W、T)96个,占28.6%;非极性疏水性氨基酸(A、F、G、V、P、L、I)156个,占46.4%;碱性氨基酸(R、H、K)45个,占13.4%;酸性氨基酸(E、D)39个,占11.6%。蛋白质的原子组成为C1628H2612N450O500S8,相对分子质量为36 745.8,理论等电点值()为6.21。正电荷残基(Arg+Lys)总数是35,负电荷残基(Asp+Glu)总数为39,不稳定系数为25.00,脂肪系数为102.8,属于稳定性蛋白。
MSG1蛋白质无信号肽,无跨膜区,位于膜外。疏水性分析结果显示,MSG1蛋白质的最小疏水值为–2.25,最大疏水值为2.21。亲水区主要位于50~90、110~120、180~210、260~280、310~350位,疏水区主要位于25~40、150~180、210~250、285~300位。
2.4二级结构、柔韧性、抗原指数以及表面可及性分析
二级结构主要由α–螺旋、β–折叠、β–转角与无规则卷曲构成。对二级结构的预测方法分为Gamier–Robson与Chou–Fasman共2种方法。α–螺旋约占二级结构的30.65%,2种方法预测α–螺旋的结果一致的区域主要集中在51~55、107~~124、201~207、249~255、260~268、272~282位。预测β–折叠的结果一致的区域分布在5~9、12~24、29~35、76~80、181~185、210~215、235~239、285~289、328~336位。Gamier–Robson法预测β–转角的区域较少,能见到单个氨基酸,β–转角约占二级结构的11.01%,2种方法预测β–转角结果一致的区域为361–324。无规则卷曲的分布较分散,约占二级结构的29.17%,出现较长的位点为24~26、70~75、175~179、195~199位。对蛋白质骨架的柔韧性进行预测,柔韧区域主要分布在50~59、70~78、103~111、143~155、187~204、251~265、289~310位。蛋白质的抗原指数预测结果显示,该蛋白抗原指数偏高的区域主要集中在47~70、72~81、85~93、104~112、114~118、128~136、144~156、170~182、188~210、223~236、251~274、285~301、311~319位,抗原指数平均值为1.044。表面可及性主要存在区域为130~139、183~205、268~275、315~326位。
2.5三级结构预测
预测的氨基酸位置为第5~336位,模拟出该蛋白质的3D基本模型如图4所示。MSG1蛋白质的3D结构类似于字母“X”的立体形状。β–折叠位于蛋白质的中心,主要是由疏水性氨基酸构成,成为一个疏水中心。无规则卷曲主要分布在蛋白质外部,与蛋白质松散的结构有关。
α–螺旋、β–折叠和无规则卷曲分别用红色、黄色、绿色标记。
猪附红细胞体引发疾病的前提是能够粘附在红细胞表面,而引起粘附的主要蛋白质是MSG1。用生物信息学分析基因的序列,并对其结构、编码蛋白质的氨基酸序列、生物学功能等进行分析能为后期的研究提供基础[6]。亲缘关系分析结果表明,猫血巴尔通氏体、温氏附红细胞体、羊附红细胞体与猪附红细胞体的亲缘关系较近,猪附红细胞体与小附红细胞体的亲缘关系最近。小附红细胞体能感染猪群,引起的症状与猪附红细胞体感染猪群后的症状相似[7]。上述的支原体都属于血营养型支原体,宿主不同,因此不同的生存条件引发进化的方向不一样[8–9]。
MSG1蛋白没有信号肽,目前已知该蛋白质具有粘附在红细胞表面的功能,并且还能够粘附在HeLa细胞、BHK–21、HEK–293上[10]。该蛋白质的结构与甘油醛–3–磷酸脱氢酶的结构相似。该蛋白质可能参与动物机体的糖代谢,获取能量用以生存,从而引起动物机体产生低血糖等症状[11]。MSG1蛋白质没有跨膜区,分析结果显示,该蛋白质完全处于膜外,这与其在入侵动物机体时具有的粘附功能相关。疏水性分析得出,约46.4%的非极性疏水性残基在蛋白质中,疏水性残基一般位于蛋白质内部,在蛋白质的表面一般为亲水残基。柔韧性指数较高时,蛋白质骨架的可塑性强,这些区域有利于抗体插入而发挥作用。蛋白质空间结构对蛋白的功能及抗原表位有重要影响。在蛋白质的二级结构中,β–转角一般位于蛋白的表面,形成的突起结构有利于与抗体嵌合。可见,在蛋白质的氨基酸序列中,利用生物信息学预测的结果的抗原指数高,具有表面可及性区域与亲水残基区域,柔韧性强,这些区域成为抗体识别抗原表位的可能性高,可为具有生物活性药物靶向位点的确定提供有利证据。蛋白质的空间结构、空间模型显示,该蛋白质呈“X”立体结构,蛋白质中心结构相对于外围结构更加紧密。外围结构主要以无规则卷曲为主,这与该蛋白质的粘附性质关系密切,有较大的可塑性,从而容易粘附在动物机体细胞表面。
[1] Hoelzle L E.Haemotrophic mycoplasmas:recent advances in[J].Vet Microbiol,2008,130(3/4):215–226.DOI:10.1016/j.vetmic.2007.12.023.
[2] 李晓云,贾杏林,石德时,等.猪附红细胞体的体外连续培养[J].畜牧兽医学报,2008,39(8):1142– 1146.DOI:10.3321/j.issn:0366–6964.2008.08.024.
[3] Guimaraes A M,Santos A P,SanMiguel P,et al. Complete genome sequence ofand insights into its biology and adaption to an erythrocyte niche[J].PLoS ONE,2011,6(5):e19574.DOI:10.1371/journal.pone. 0019574.
[4] Oehlerking J,Kube M,Felder K M,et al.Complete genome sequence of the hemotrophicstrain KI3806[J].J Bacteriol,2011,193(9):2369–2370.DOI:10.1128/JB.00187–11.
[5] Hoelzle K,Doser S,Ritzmann M,et al.Vaccination with therecombinant adhesion proteinelicits a strong immune response but fails to induce protection in pigs[J].Vaccine,2009,27(39):5376–5382.DOI:10.1016/j.vaccine.2009.06.072.
[6] 张伟,方梅霞,聂庆华,等.猪基因的电子克隆及生物信息学分析[J].湖南农业大学学报(自然科学版),2010,36(6):672–677.DOI:10.3724/SP.J.1238.2010. 00672.
[7] do Nascimento N C,dos Santos A P,Chu Y,et al. Microscopy and genomic analysis ofstrain Indiana[J].Vet Res,2014,45:86.DOI:10.1186/s13567–014–0086–7.
[8] de Morais H A,Guimarães A M,Vidotto O,et al. Co– infection withand ‘Candidatus’ in three cats from Brazil[J].J Feline Med Surg,2007,9(6):518–520.DOI:10.1016/j.jfms.2007.05.005.
[9] dos Santos A P,Guimaraes A M,do Nascimento N C,et al. Complete genome sequence ofstrain Massachusetts[J].J Bacteriol,2012,194(19):5458–5459.DOI:10.1128/JB.01240–12.
[10] Zhang Y,Zou Y,Ma P,et al.Identification ofinteraction proteins on porcine erythrocytes[J].Arch Microbiol,2015,197(2):277–283.DOI:10.1007/s00203–014–1050–7.
[11] Hoelzle L E,Zeder M,Felder K M,et al.Pathobiology of[J].Vet J,2014,202(1):20–25.DOI:10.1016/j.tvjl.2014.07.023.
Clone and bioinformatics analysis ofprotein gene
Jia Xinglin, Zou Yawen, Liu Siyuan, Cheng Tianyin
(College of Veterinary Medicine, Hunan Agricultural University, Changsha 410128, China)
To investigate the structure and function ofgene of, a 1 011 bp genewas cloned using nested PCR and a phylogenetic tree was constructed, bioinformatics analysis was hence studied. From the results of phylogenetic tree showed that thewas the most homogeneous to the, and from the results of bioinformatics analysis showed that the sequence encoded 336 amino acids. Its isoelectric point and molecular weight were 6 210 and 36 745.8 respectively, and the protein had no signal peptide and transmembrane region, and had higher antigen index and immunogenicity. The protein had lots of flexible regions, and its 3D structure presented as capital letter X, the peripheral structure was looser.
;gene; bioinformatics analysis; clone
S852.6;Q786
A
1007-1032(2016)05-0524-04
2016–01–05
2016–09–02
湖南农业大学博士后基金
贾杏林(1970—),男,湖北天门人,博士,主要从事动物输血与血液病研究,1376163191@qq.com
投稿网址:http://xb.ijournal.cn
责任编辑:王赛群
英文编辑:王库