陈旭东,程开,吕开绩,张丽芳,朱冠保
(1.温州医科大学附属第一医院 胃肠外科,浙江 温州 325015;2.温州医科大学 微生物学与免疫学教研室 分子病毒与免疫研究所 热带医学研究所,浙江 温州 325035)
程序性死亡受体(programmed cell death protein 1,PD-1)作为一种免疫检查点,表达于T细胞表面,而T细胞在肿瘤免疫中起到重要的作用。而程序性死亡受体配体-1(programmed cell death ligand 1,PD-L1)作为其配体可与其结合,并抑制T细胞的活性[1-3]。PD-L1是一种I型跨膜蛋白,全长为290个氨基酸,相对分子质量为33 kDa,广泛表达于多种肿瘤细胞表面[4-6]。肿瘤细胞产生的PDL1可以使之免受免疫细胞的细胞杀伤作用,而拮抗PD-L1与其受体PD-1结合,能够让T细胞正常活化,并发挥肿瘤杀伤作用[7]。现在已有针对人PD-1或PD-L1的多种单克隆抗体和小分子亲和体上市或处于临床试验阶段,包括Nivolumab[8-9]、Pembrolizumab[10-11],Atezolizumab[12-13]、Avelumab[14],并在多种肿瘤的治疗中展现出令人瞩目的效果。B细胞表位是抗原上能和抗体的互补决定区互补结合的区域。B细胞表位可用于疫苗的制备,单克隆抗体的研制和小分子亲和体的高通量筛选,具有针对性强、作用稳定等特点,因此B细胞表位的研究是免疫学研究的重要部分。PD-L1 B细胞的表位的研究已有报道[15],但其为构象表位,位于β折叠中,难以用人工合成多肽的方式模拟。故本研究利用生物信息学方法,以PD-L1的全长氨基酸序列为基础,对人和小鼠PD-L1 B细胞表位进行预测和分析,期望找到可以用人工合成多肽模拟的B细胞表位,可为单克隆抗体的研制和高通量小分子亲合体筛选等提供理论依据。
1.1 人与小鼠PD-L1全长氨基酸序列的获取 人与小鼠PD-L1全长氨基酸序列检索于uniProt蛋白质数据库(http://www.uniprot.org/),提供氨基酸序列编号。
1.2 人与小鼠PD-L1全长蛋白的二级结构预测 结合EXPASY服务器提供的GOR4、SOPMA、Scratch Protein Predictor(SPP)程序对人与小鼠PD-L1胞外段氨基酸序列进行二级结构的分析。
1.3 人与小鼠PD-L1胞外段蛋白亲水性、极性、抗原性、柔韧性和表面可及性的预测 人与小鼠PD-L1胞外段氨基酸位置来自uniProt蛋白质数据库已有的生物信息学预测结果。利用EXPASY服务器提供的亲水性参数(Hopp&Woods)、极性参数(Zimmerman)和DNAstar软件的Protein进行的表面可及性参数(Emini)、抗原性参数(Jameso-Wolf)和柔韧性参数(Flexible regions)分析来对人与小鼠PD-L1胞外段蛋白B细胞线性表位进行预测。其中高于阈值的肽段即为预测的抗原表位。
1.4 人与小鼠PD-L1胞外段蛋白空间结构的获取和预测 人PD-L1胞外段蛋白(PDB ID:3BIS)空间结构的预测采用RCSB Protein Data Base(PDB)蛋白质数据库检索,获取人PD-L1的空间结构。小鼠的PD-L1的胞外段空间结构预测:以人PD-L1胞外段蛋白(PDB ID:5ius.1,同源性73.64%)作为模板,在swiss model(https://www.swissmodel.expasy.org/)上进行预测。将各表位和PD-L1与其配体PD-1结合的部位用PYMOL软件标记到三维模型上,并进行观察分析。
1.5 综合分析 结合上述方法的预测结果,并运用吴玉章等[16]建立的抗原性指数综合评判PD-L1 B细胞表位的优势区域,并与Avelumab与PD-L1的结合位点进行比较(PDB ID:5GRJ)。
1.6 同源性分析 将人和小鼠PD-L1的B细胞优势表位进行比较,并与多个物种进行同源性分析。
图1 人和小鼠PD-L1二级结构预测
表1 GOR4、SPP、SOPMA 3种方法预测人和小鼠PD-L1的二级结构的构成比[ n=290,n(%)]
2.1 PD-L1蛋白的二级结构 人与小鼠PD-L1全长氨基酸序列如图1所示。PD-L1蛋白的二级结构采用EXPASY服务器的GOR4、SOPMA、SPP 3种方案预测二级结构,提示人PD-L1蛋白的二级结构中以无规则卷曲为主,α-螺旋、β-转角相对较少。同时在这3种方案的预测结果中,取至少2种方案预测结果一致的重叠区,且与柔韧性参数的预测相结合,可见无规则卷曲主要位于N端的23~26、32~35、40~45、60~63、69~73、107~110、118~124、131~139、146~151、158~163、170~172、176~178、182~186、200~205、212~220、227~238。小鼠PD-L1蛋白的二级结构中以无规则卷曲为主,α-螺旋、β-转角相对较少。同样的方法结果显示,无规则卷曲和抗原性显示:应用不同参数预测的B细胞抗原表位肽段略有差异,但人PD-L1的氨基酸片段40~45、60~63、69~73、118~124、131~139、146~151、158~163、212~220、227~238在多种预测方法中一致,小鼠PD-L1的氨基酸片段40~48、58~63、72~88、118~126、131~139、144~148、157~162、168~177、183~187、212~220、226~237在多种预测方法中一致(抗原指数≥0,亲水性指数≥0,表面可及性指数≥1,极性指数≥12)。见图2。主要位于N端的19~26、33~35、40~48、58~61、72~88、94~96、107~110、118~123、131~139、144~148、157~162、168~177、183~187、199~204、212~220、226~237。见图1,表1-2。
2.2 多参数预测PD-L1蛋白表位 uniProt蛋白质数据库显示,人PD-L1的胞外段位于N端的19~238,小鼠PD-L1的胞外段位于N端的19~239。因此选择上述氨基酸作为预测表位的候选区段。综合分析PD-L1的亲水性、极性、柔韧性、表面可及性
表2 人和小鼠B细胞表位的平均抗原性指数
2.3 3D模型和功能定位 人和小鼠的PD-L1的三维结构模拟如图3所示。LIN等[17]成功晶体化了小鼠PD-1和人PD-L1的结合体,用X线衍射的方法,证明了人PD-L1通过19、20、26、54、56、66、115、117、121、122、123、124、125这几个氨基酸与小鼠PD-1相结合的,这几个氨基酸位于其V区(IgV like domain)的AGFCC’C’上,且在小鼠和人PD-L1上是高度保守的,仅有两个位置不同(54、115),而人-54(异亮氨酸)和小鼠-54(颉氨酸)同为非极性氨基酸(疏水性氨基酸),而人-115(甲硫氨酸)和小鼠-115(异亮氨酸)也同为非极性氨基酸。而PD-1上与结合相关的氨基酸也具有较高的一致性(15/18)。所以可以认为人和小鼠的PD-L1与PD-1的结合位置是十分类似的(见图4)。通过对人和小鼠PD-L1的三维立体结构的分析,若表位位于其V区的AGFCC’C’上或周围,而不在BED上,可以认为表位接近PD-L1与其配体PD-1结合的部位,可以发现人的40~45、60~63、69~73、118~124和小鼠的40~48、58~63、72~88、118~126距离上述位置较为接近,并有部分重叠(见图5)。
图2 人和小鼠PD-L1不同参数的预测结果
图3 人和小鼠的PD-L1的三维结构模拟
图4 人和小鼠的PD-L1与其配体PD-1结合的部位
2.4 PD-L1蛋白表位的综合分析 人PD-L1的41~46、60~63、71~75和小鼠PD-L1的41~50、58~62、72~80平均抗原指数较高(见表2),提示其可能为B细胞表位的优势区域(见图6)。Avelumab与PD-L1的结合位点与本研究所预测的人PD-L1 B细胞表位如图7所示。
2.5 同源性分析 人和小鼠PD-L1的B细胞优势表位进行比较,两者的位置十分接近,最多相差5个氨基酸,将人和鼠的表位所在的位置取并集,把人PD-L1的上述位置的氨基酸与多种实验动物的PD-L1上相应的氨基酸序列进行对比,计算相同的氨基酸占所有氨基酸的百分比,结果见表3。
图5 人和小鼠的PD-L1的结合面与优势B细胞表位
图6 人和小鼠的PD-L1的结合面与优势B细胞表位
图7 Avelumab与PD-L1的结合位置和本研究预测的B细胞表位
由于PD-L1作为一种抗肿瘤的靶标,单克隆与其结合后,阻碍PD-L1与PD-1相结合,具有显著的抑瘤效果和相对较低的不良反应,因而是目前研究的前沿和热点[18-20]。Avelumab是一种以PD-L1为靶点的单克隆抗体,已在多种肿瘤的治疗中表现出良好的反应率,对于该单克隆抗体的研究发现,它是通过与PD-L1相结合,从而阻碍PD-L1与其受体PD-1相结合,从而拮抗PD-L1的抑制肿瘤免疫的作用[14],其结合面就位于PD-L1与PD-1的结合面附近[21],并有部分重叠,并且其结合的位置与本研究所预测的B细胞线性表位在多个位置(73、75、63、61、60、62)有重叠(见图7),说明本研究所预测的B细胞表位具有较好的抗原性和免疫原性,并在拮抗PD-L1与其受体PD-1相结合的方面可能有重要作用。但由于PD-L1与PD-1的结合面位于β折叠的区域,受限于现有的B细胞表位的预测和多肽合成技术的限制,仍无法直接预测和人工合成模拟位于β折叠的区域B细胞表位。
表3 人和不同动物PD-L1的41~50、58~62、71~80氨基酸序列及同源性(%)
针对PD-L1的单克隆抗体需要通过免疫系统来发挥其肿瘤抑制作用,因而对其研究具有一定的困难,早期研究无法在人体内进行体内实验,现在也尚无法建立与人类有相同免疫系统的模型用作科学研究,此类实验往往通过动物实验来代替[22]。因此本研究对预测的人和小鼠的B细胞表位进行对比,发现两者的位置十分接近,并且序列也有较好的同源性,再将人和多种常见的实验动物的这几个区域的氨基酸序列进行同源性分析,发现都有较好的同源性。但这些序列的交叉免疫原性如何,尚有待于之后的研究证实。
使用生物信息学预测B细胞表位已被广泛使用,并取得了不错的结果和很大的进展[23-24]。目前有多种B细胞表位的预测方法,但由于各种方法的差异性及局限性,使各研究团队预测准确率差异较大,故研究人员正不断地改进方法、开发更好的预测评价体系,使B细胞表位的预测、评价标准化。目前得到公认的具有较好预测结果的方法有二级结构、亲水性、抗原性、表面可及性等参数的预测,本研究将以上参数与吴玉章等[16]建立的抗原指数相结合,从而初步地做出科学、合理的预测分析。本研究首先通过上述方法分析预测了人和小鼠的PDL1氨基酸序列中优势B细胞表位,再结合模拟3D结构找出在PD-L1与PD-1的结合面附近的B细胞表位,进一步将两者的结果进行比对,并与多种实验动物进行同源性分析,结果发现人PD-L1的41~46、60~63、71~75是较好的B细胞表位,并在PD-L1与PD-1的结合面附近,与多种实验动物有较高的同源性。本研究为更高效地筛选针对PD-L1的单克隆抗体或小分子亲合体提供了理论基础。