核受体结合SET域蛋白1催化活性区域B细胞优势表位的预测与分析

2022-05-06 09:12陈旭东
现代实用医学 2022年3期
关键词:结构域活性蛋白

陈旭东

组蛋白赖氨酸甲基化酶(HMTases)可以催化组蛋白的甲基化,参与多种生物学事件,对DNA复制、DNA损伤应激、细胞周期循环、胞质分离及转录调节等多方面有重要作用[1]。HMTases可以特异性地将甲基从s-腺苷甲硫氨酸(AdoMet)转移到组蛋白末端的几个特定的赖氨酸[2]。核受体结合SET域蛋白家族(NSDs)是HMTases中的一支亚家族,包括NSD1、NSD2(MMSET/WHSC1)和NSD3(WHSC1L1),都包含具有催化活性的SET结构域,该结构域高度保守[3]。NSD1、NSD2及NSD3在小鼠发育中是必须的,敲除NSD1及NSD2的基因会导致小鼠死亡[4]。研究表明,NSDs的突变和扩增与多种发育异常疾病和肿瘤相关[5-6]。NSD1的SET结构域可以特异性地催化H3K36[7]。NSD1的异常表达及活性改变和多种肿瘤有关。现已有多项研究以甲基化酶为靶标,开发抑制药物,以期待治疗相应的疾病[8-9]。本研究拟预测NSD1催化活性区域(NSD1-CD)的B细胞优势表位,来为应用多肽小片段制备单克隆抗体、表位疫苗及研究其蛋白功能提供重要的依据。报道如下。

1 资料与方法

1.1 NSD1-CD段氨基酸序列的获取 NSD1全长氨基酸序列检索于uniProt蛋白质数据库(http://www.uniprot.org/),NSD1-CD段的范围参考Qiao等[10]研究。

1.2 NSD1-CD蛋白的二级结构获取 自PDB数据库(https://www.rcsb.org/)获取NSD1-CD(PDB ID 300I)的三级结构,使用蛋白质二级结构词典DSSP(Definition of Secondary Structure of Proteins,DSSP)获取其二级结构。

1.3 NSD1-CD蛋白亲水性、极性、抗原性和表面可及性的预测 利用EXPASY服务器提供的亲水性参数(Hopp&Woods)、极性参数(Zimmerman)和DNAstar软件的Protein进行的表面可及性参数(Emini)、抗原性参数(Jameson-Wolf)和柔韧性参数(Karplus-Schulz)方法来对NSD1-CD蛋白B细胞表位进行预测。

1.4 综合分析 综合以上预测方法,兼顾各项预测参数推断NSD1蛋白B细胞表位,采用吴玉章等[11]建立的抗原性指数(AI)综合评判NSD1-CD B细胞表位的优势区域。

1.5 结合蛋白质三级结构分析 在PYMOL软件上标出优势表位在NSD1-CD上的位置,在uniProt蛋白质数据库网站上通过Structure模块的Toggle controls panel工具进行测距。

2 结果

2.1 NSD1-CD的氨基酸序列 NSD1全长为2 696个氨基酸(长型),相对分子质量为296.65 kDa。NSD1-CD的范围是1 852~2 082,其中包含3个结构域:PRE-SET(AWS)1 890~1 940,SET 1 942~2 059,POST-SET 2 066~2 082;长为231个氨基酸,相对分子质量为26.53 kDa,具体序列如下:KELRQLQEDRKNDKKPPPYKHIKVNRPIGRVQIFTADLSEIPRCNCKATDENPCGIDSECINRMLLYECHPTVCPAGGRCQNQCFSKRQYPEVEIFRTLQRGWGLRTKTDIKKGEFVNEYVGELIDEEECRARIRYAQEHDITNFYMLTLDKDRIIDAGPKGNYARFMNHCCQPNCETQKWSVNGDTRVGLFALSDIKAGTELTFNYNLECLGNGKTVCKCGAPNCSGFLG。

2.2 NSD1-CD的二级结构 自PDB获取NSD1-CD的三级结构,使用蛋白质二级结构词典DSSP获取其二级结构,提示NSD1-CD蛋白的二级结构中以无规卷曲为主-螺旋、-转角相对较少。可见无规则卷曲主要位于NSD1全长N端的1 865~1 870、1 879~1 887、1 893~1 910、1 917~1 926、1 940~1 943、1 949~1 953、1 959~1 966、1 992~1 997、2 022~2 026、2 045~2054及2 057~2082。见封二彩图1和表1。

表1 NSD1-CD的二级结构的构成比 例(%)

2.3 多参数预测NSD1-CD蛋白表位 按照Hopp& Woods、Zimmerman、Jameson-Wolf、Karplus-Schulz及Emini方案分别预测NSD1-CD蛋白的亲水性、极性、抗原性、柔韧性和表面可及性。其中高于阈值的肽段即为预测的抗原表位(抗原指数≥0,亲水性指数≥0,表面可及性指数≥1,极性指数≥12)。综合分析NSD1-CD的亲水性、极性、柔韧性、表面可及性和抗原性显示:应用不同参数预测的B细胞抗原表位肽段略有差异,但位于N端的1 856~1 870,1 900~1 902,1 938~1 942,1 957~1 964在多种预测方法中一致。见封二彩图2和表2。

表2 NSD1-CD亲水性、极性、柔韧性、抗原性、表面可及性等参数的预测结果

2.4 NSD1-CD蛋白表位的综合预测 综合以上预测方法及AI计算方法,计算NSD1-CD的B细胞表位平均AI,结果显示人NSD1-CD的1 865~1 869、1 959~1 964平均AI较高,提示其可能为B细胞表位的优势区域。见表3。

表3 NSD1-CD B细胞表位的平均抗原性指数

2.5 结合蛋白质三级结构分析 自PDB获取NSD1-CD(PDB ID 300I)的三级结构文件,通过PYMOL标记出SET结构域和优势表位的位置,可见SET结构域形成了一个“口袋”状结构,口袋中即为其活性区域,内侧可容纳一个AdoMet,可催化其转移甲基至组蛋白上。优势表位KTDIKK(1 959~1 964)位于SET结构域上,但位于“口袋”的外侧底部,距离活性区域较远(封二彩图3a)。而优势表位KKPPP(1 865~1 869)位于PRE-SET(AWS)上,在“口袋”的“口”附近(封二彩图3b)。在uniProt蛋白质数据库网站上通过Structure模块的Toggle controls panel工具进行测距,测量1 961号天冬氨酸(位于优势表位KTDIKK的中央)和AdoMet的距离,结果为24.22Å(封二彩图4a),测量1 867号脯氨酸(位于优势表位KKPPP的中央)和AdoMet的距离,结果为13.25Å(封二彩图4b)。

3 讨论

使用生物信息学预测B细胞表位是现如今广泛使用且高效方便的方法[12-13],目前有多种B细胞表位的预测方法,但由于各种方法的差异性及局限性,不同方法预测的表位差异较大,故研究人员正不断地改进与完善预测评价体系,使B细胞表位的预测、评价标准化。目前得到公认的具有较好预测结果的方法有二级结构、亲水性、抗原性、表面可及性等参数的预测,本研究将以上参数与吴玉章等[11]建立的AI相结合,从而初步地做出科学、合理的预测分析。

由于NSD-1蛋白的甲基转移活性主要是通过SET结构域实现的,本研究通过截取其中的一部分(NSD-CD),包括包含三个结构域(PRE-SET 1 890~1940,SET1 942~2 059,POST-SET2066~2082),从而减少预测的难度。用多种方法对其B细胞表位进行预测,最终得到了2段优势B细胞表位,分别位于N端的1 865~1 869及1 959~1 964,其中优势表位KTDIKK(1 959~1 964)位于SET结构域上,但是距离AdoMet所在的活性区域较远,1 961号天冬氨酸(位于优势表位KTDIKK的中央)和Ado-Met的距离为24.22Å,影响其活性的可能性较小;而优势表位KKPPP(1 865~1 869)位于PRE-SET(AWS)上,且距离AdoMet所在的活性区域较近,在uniProt蛋白质数据库网站上通过Structure模块的Toggle controls panel工具进行测距,测量1 867号脯氨酸(位于优势表位KKPPP的中央)和AdoMet的距离,结果为13.25Å,对SET结构域的甲基转移活性有影响的可能性较大。

在Qiao等[10]的研究中,POST-SET结构域如同一个“盖子”,覆盖在SET结构域的活性区域表面,被认为对其活性有重要作用,具有作为药物靶点的可能。但本研究显示POST-SET段亲水性及表面可及性较弱,难以预测出优势B细胞表位。本研究成功预测了NSD1的B细胞优势表位,为应用多肽小片段制备单克隆抗体、表位疫苗及研究其蛋白功能提供重要的依据。

猜你喜欢
结构域活性蛋白
RNA结合蛋白与恶性肿瘤发生发展关系的研究进展
细菌四类胞外感觉结构域的概述
锌指蛋白与肝细胞癌的研究进展
米卡芬净对光滑假丝酵母菌在巨噬细胞内活性的影响
航天器表面抑菌活性微生物的筛选与鉴定
细砂糖对法式蛋白糖的质量影响研究
水通道蛋白的发现
结核分枝杆菌蛋白Rv0089的生物信息学分析
黄星天牛中肠中内切葡聚糖酶的鉴定与酶活性测定
蛋白质功能预测方法研究进展