罗宇翔,黄 静,李惠琳
(中山大学药学院,广东 广州 510006)
2019年年底暴发的新型冠状病毒肺炎(COVID-19,简称新冠)疫情给人类生命健康和社会发展带来了巨大的冲击和挑战。根据世界卫生组织(WHO)的数据,截至2022年3月5日,新冠肺炎全球感染累计病例突破4.4亿例,死亡病例突破597万例[1]。新冠肺炎由SARS-CoV-2病毒感染引起,伴随咳嗽、发烧、肌肉疼痛、嗅觉味觉减退等症状,严重者可致死亡[2]。SARS-CoV-2病毒主要由刺突蛋白(S蛋白)、核衣壳蛋白(N蛋白)、膜蛋白(M蛋白)、包膜蛋白(E蛋白)和RNA核酸链构成[3],其中,表面的S蛋白在病毒入侵宿主过程中起关键作用,介导病毒与宿主细胞的识别以及膜融合过程[4-6]。SARS-CoV-2在入侵机体时,S蛋白与宿主细胞膜表面的血管紧张素转化酶2(ACE2)的结合是触发膜融合的关键步骤。S蛋白分为S1和S2两个结构域,其中,S1的受体结合区域(RBD)与ACE2直接结合[7-8]。研究发现,干扰RBD和ACE2的结合对阻止病毒入侵有一定功效,以该过程为靶点是药物研发的一个思路[9-10],例如我国自主研发并上市的安巴韦单抗/罗米司韦单抗[11]。
糖基化修饰是一类常见的蛋白质翻译后修饰(PTMs),可以影响蛋白质结构稳定性、增加蛋白溶解性,还可以参与蛋白-蛋白间的相互作用[12]。病毒包膜上的糖蛋白具有调节病毒指向性、稳定蛋白及免疫逃逸的作用[13]。因此,考察糖基化的作用可为理解病毒入侵机制、揭示病毒致病机理以及为疾病治疗和药物设计提供思路[14]。SARS-CoV-2的S蛋白上有22个N-糖基化位点以及多个可能的O-糖基化位点,RBD中有4个糖基化位点,其中,N331、N343位点的糖修饰类型为N-糖基化,T323、S325位点为O-糖基化[13, 15-16]。目前普遍认为[17-18],S蛋白中众多的糖基化修饰会影响S蛋白的折叠以及疫苗的免疫原性和免疫优势,介导免疫逃逸。由此可见,S蛋白中的糖基化不仅蕴含翻译后修饰信息,而且在蛋白结构和功能上也发挥重要作用。但S蛋白和ACE2蛋白上的糖基化修饰对二者结合稳定性以及结构的影响尚不明确。
结构质谱(structural MS)在近十年来得到快速发展,因其具有高灵敏度、低样品消耗量、高通量等优势,已成为蛋白质结构分析中广泛应用的方法之一[19-21]。其中,非变性质谱(native MS)是常用的结构质谱分析方法,可以在气相中保留蛋白样品中的非共价相互作用,提供结合化学计量比、复合物结构动态性及稳定性、亚基空间排列等信息,被广泛应用于蛋白-配体、蛋白-蛋白复合物以及多蛋白复合物的结构分析中[22-24]。
本研究拟采用native MS方法研究RBD、ACE2及二者形成的复合物。首先对PNGase F切除RBD上N-糖的条件进行优化,并用native MS/MS分析切N-糖后的RBD异质性。随后,将切糖前后的RBD与ACE2进行结合实验,以揭示RBD中N-糖基化修饰对RBD-ACE2复合物稳定性的影响,旨为糖蛋白复合物的后续结构研究提供见解。
Synapt G2-Si三重四极杆飞行时间质谱仪:美国Waters公司产品,配有纳电喷雾离子源(nano-ESI);P-97微电极拉制仪:美国Sutter公司产品;Centrisart A-14C小型台式冷冻离心机:德国Sartorius公司产品;Nanodrop 2000超微量分光光度计:美国Thermo公司产品;JXH-100恒温加热混匀仪:上海净信有限公司产品。
Amicon Ultra-0.5超滤离心管:美国Sigma公司产品;BF100-58-10硼硅酸毛细管:美国Sutter公司产品。
Spike-RBD蛋白(片段319-532)、ACE2蛋白(片段18-740):上海恺佧有限公司产品;PNGase F酶及配套反应缓冲液:美国New England Biolabs公司产品;乙酸铵(痕量金属级):美国Sigma公司产品。
1.3.1切N-糖 PNGase F酶的原始状态为溶液,母液浓度为500 000 units/mL,用15 mmol/L Tris-HCl (pH 7.4)缓冲液将其稀释至25 000或50 000 units/mL。用15 mmol/L Tris-HCl(pH 7.4)缓冲液溶解RBD冻干粉至浓度为15 μmol/L。随后加入1 μL 25 000或50 000 units/mL PNGase F酶,体系中酶的终浓度为2 500或5 000 units/mL,于37 ℃恒温加热混匀仪中反应4、8、14 h。实验过程中未添加任何变性剂。
1.3.2蛋白孵育 将未切糖和切糖后的RBD和ACE2按1.5∶1(物质的量比)的比例,于37 ℃孵育2 h,对孵育后的样品除盐。
1.3.3蛋白样品除盐 将未切糖和切糖后的RBD分别加入10 ku超滤离心管,ACE2加入50 ku超滤离心管,于4 ℃下用500 mmol/L乙酸铵溶液离心超滤1次后,用100 mmol/L乙酸铵溶液离心超滤2次,收集截留液。将孵育后的蛋白复合物样品溶液加入10 ku超滤离心管,于4 ℃下用100 mmol/L乙酸铵超滤3次,收集截留液。使用Nanodrop 2000 Protein A280法定量分析截留液中的蛋白浓度。
1.3.4Native MS条件 将制备好的样品加入拉制好的毛细管喷针中,置于质谱仪nano-ESI离子源处。质谱参数如下:毛细管电压 0.9~1.3 kV,采样锥(sampling cone)电压40/140 V,源补偿(source offset)电压80 V,锥孔气体流速(cone gas flow)0 L/h,纳流气压(nanoflow gas pressure)0 Pa,清洗气体流速(purge gas flow)800 mL/h,脱溶剂化气体流速(desolvation gas flow)800.0 L/h。串联质谱条件:选择离子m/z3 101.0,捕获池碰撞能量(trap collision energy)80 V。
注:蓝色框表示RBD单体峰;黄色框表示ACE2单体峰;红色框表示ACE2二聚体峰;绿色框表示ACE2与RBD形成的蛋白复合物峰图1 RBD(a)、ACE2(b)、RBD-ACE2复合物(c)样品的native MS谱图Fig.1 Native mass spectra of RBD (a), ACE2 (b), RBD-ACE2 complex (c) samples
首先分别对RBD和ACE2样品进行native MS检测。RBD的native MS谱图(图1a)显示,RBD以单体形式存在,主要电荷态为9+、10+、11+,但谱峰较宽,表明样品存在高度异质性。根据文献[25]报道,RBD上的糖基化位点N331和N343的N-糖链主要为复杂型;N331主要的糖链分支为四天线型,同时存在少量的三天线型;N343主要的糖链分支包括双天线、三天线和四天线型;2个位点主要的单糖分子包括唾液酸(NeuAc)、半乳糖(Gal)和岩藻糖(Fuc);T323、S325中的O-糖链结构包括HexNAc(1)(N-乙酰己糖胺)、HexNAc(1)Hex(1)(己糖)和HexNAc(1)Hex(1)NeuAc(2)等,主要单糖分子包括Gal、N-乙酰半乳糖胺(GalNAc)、NeuAc及N-乙酰葡萄糖胺(GlcNAc)[15-16]。复杂多样的N-糖及O-糖修饰是导致RBD谱峰较宽的主要原因。RBD中N-糖的存在可能起到抗原屏蔽效应,且与受体ACE2的结合相关,而O-糖主要与ACE2的结合有关[16,26-27]。Yang等[28]报道的RBD样品(片段319~541)谱图也出现了因糖基化修饰、异质性较强导致的峰展宽现象,且主要电荷态为9+、10+,10+电荷态质心位置为m/z3 256,与本研究结果m/z3 240接近。不同的是,文献[29]中RBD出现了二聚体信号。根据文献[29-33]报道,样品浓度过高、表达体系或离子传输参数以及检测参数的差异均可能导致产生蛋白寡聚体信号。
ACE2中存在6个N-糖基化位点(N53、N90、N103、N322、N432和N546),主要糖链为复杂型,同时含有少量的高甘露糖型和杂合型[18, 34],其native MS谱图示于图1b。众多糖基化位点及多样、复杂的糖型是导致ACE2谱峰展宽、电荷态无法分辨的主要原因。ACE2的主要谱峰质心约在m/z7 500处,推测其为ACE2二聚体信号,m/z5 500处出现的少量蛋白信号为ACE2单体。在文献[29]报道中,ACE2的native MS谱图主要以二聚体形式存在,也存在少量的单体,尚可实现电荷态分辨,二聚体质心位于约m/z7 000处,单体质心位于m/z5 200处。这可能是由于不同表达体系引入的糖基化程度不同[25],在质量和异质性上出现差异。
ACE2和RBD的解离平衡常数(Kd)达4.7 nmol/L,表明RBD与ACE2结合能力较强[35]。本研究对孵育后的RBD-ACE2复合物进行检测,结果示于图1c。可见,谱峰仍较宽,糖基化修饰带来的高度异质性以及电喷雾过程中盐和溶剂的加和是造成谱峰展宽、电荷态难以分辨的根本原因,但相比于图1b中ACE2二聚体峰,质量中心发生了明显位移(约700 u),表明形成了RBD-ACE2复合物。通过与文献[28]对照,可以推断本实验中1分子ACE2二聚体与2分子RBD形成了复合物(RBD-ACE2)2,这一结合化学计量比与冷冻电镜(cryo-EM)数据吻合[36]。为进一步确证化学计量比,可以利用Igor课题组开发的charge reduction法,即通过选择母离子并利用电子转移解离(ETD)所产生的电荷还原效应,实现高度异质性蛋白的电荷分辨[28, 37-38]。此外,Exactive Plus EMR和Q Exactive-UHMR(美国Thermo公司产品)等基于Orbitrap质量分析器的仪器具有较强的脱溶剂化效率,可以在很大程度上减小盐和溶剂加和,提高高度异质性蛋白的电荷态分辨能力[39]。
注:a.加入终浓度2 500 units/mL PNGase F于37 ℃孵育4 h;b.加入终浓度2 500 units/mL PNGase F于37 ℃孵育8 h;c.加入终浓度2 500 units/mL PNGase F于37 ℃孵育14 h;d.加入终浓度5 000 units/mL PNGase F于37 ℃孵育14 h图2 不同条件切糖后的RBD native MS谱图Fig.2 Native mass spectra of removing N-glycans in RBD under different conditions
本研究对RBD切糖条件进行优化。当添加反应终浓度2 500 units/mL PNGase F于37 ℃孵育4 h时,谱图中出现了切N-糖后产生的蛋白峰,但同时存在一定量未完全切N-糖的RBD蛋白,示于图2a。增加孵育时间至8、14 h,未完全切N-糖的RBD信号逐渐降低,示于图2b、2c。提高PNGase F的反应终浓度至5 000 units/mL,于37 ℃酶切14 h,此时切N-糖较彻底,完全切N-糖的蛋白峰较窄,谱图中未充分切N-糖的RBD丰度极低,示于图2d。因此,选择反应终浓度5 000 units/mL的PNGase F 于37 ℃孵育14 h作为最优的RBD切N-糖条件。
此外,发现切糖前RBD的主要电荷态为10+,切糖后为9+。造成电荷态位移的因素很多,如糖结构中的羟基或羧基可以与带正电荷基团(如K,R)发生静电相互作用,糖的切除可以暴露K/R侧链氨基导致电荷增加[40];切糖也可能导致蛋白结构溶剂可及性的一定程度变化,从而造成电荷态的增加或减少。
在完全切糖的RBD中,除了主要蛋白类型外,还存在一些信号强度较低、伴随在主峰后的小峰,推测这类蛋白峰是由于RBD中存在O-糖基化带来的蛋白异质体。如与主峰差异365 u的异质体,示于图3a,根据质量位移和Unimod数据库检索,推测该异质体在主要蛋白类型基础上加和了Hex(1)HexNAc(1)。该糖链在文献[15-16]中有过报道,并提示具体组成可能为GalNAcGal或GlcNAcGal。此外,通过碰撞诱导解离(CID)对主峰(m/z3 101)进行串联质谱分析,示于图3b。当CID能量为80 eV时,低质荷比处出现了2个裂解产物,裂解产物之间相差1分子唾液酸(NeuAc,291 u),表明切N-糖后RBD主峰中存在2分子NeuAc,与文献[15-16]报道呼应。可以发现,该RBD样品中的O-糖修饰至少包含了NeuAc(2)、GalNAc(1)Gal(1)NeuAc(2)或GlcNAc(1)Gal(1)NeuAc(2)。此外,不同表达体系、蛋白四级结构、检测方法、检测仪器得到的O-糖修饰信息,其丰度和种类存在一定差异[15-16, 41]。本研究检测基于哺乳动物细胞体系表达的重组RBD的O-糖类型,可为RBD的O-糖修饰提供参考。
研究表明[13,41],S蛋白中N-糖与O-糖的出现频率可能存在一定的关联,S蛋白上的糖基化存在“O跟随N(O-Follow-N)”规律,即O-糖修饰有一定概率出现在N-糖修饰之后。这一现象产生的原因可能与GalNAc-转移酶识别N-糖位点并在附近催化O-糖加和有关。基于此,需留意糖蛋白中N残基后的S/T残基,其可能成为潜在的O-糖基化位点。
将切糖前后的RBD(下文分别用“RBD”、“RBDdeglyco”表示)与ACE2孵育并进行native MS分析,比较2组复合物的差异。结果发现,RBD和RBDdeglyco均能与ACE2二聚体形成复合物,示于图4a和4c。通过提高离子源采样锥(SC)能量至140 V,使蛋白复合物在离子源内发生裂解。发现RBD与ACE2复合物组中RBD丰度上升,且出现少量的ACE2单体信号,表明部分(RBD-ACE2)2复合物发生解离,示于图4b。相比于图4a,该谱图中的复合物峰向低质荷比位置发生了位移,推测这是由于SC电压提高而产生的除加合物效应。在RBDdeglyco与ACE2复合物组中,RBDdeglyco和ACE2单体的丰度上升较多,而(RBDdeglyco-ACE2)2复合物的丰度下降明显,其峰几乎消失,示于图4d。表明相同碰撞能量下,(RBDdeglyco-ACE2)2复合物的相互作用力更弱,容易发生碎裂。由此可以看出,RBD中的N-糖对于维持复合物稳定性具有重要作用。
注:红色五角星表示主要蛋白类型峰;绿色正方形表示加和1分子己糖和1分子N-乙酰己糖胺的蛋白类型图3 切糖后的RBD native MS谱图(a)及RBD(9+电荷态)(m/z 3 101)的串联质谱图(b)Fig.3 Native MS spectrum deglycosylated RBD (a) and MS/MS spectrum of 9+ charge state of deglycosylated RBD (m/z 3 101) (b)
注:a,c.SC=40 V;b,d.SC=140 V;蓝色框表示RBD峰;红色框表示(RBD-ACE2)2复合物峰;黄色框表RBDdeglyco峰;绿色框表示(RBDdeglyco-ACE2)2复合物峰;ACE2mono表示ACE2单体图4 切糖前(a,b)、后(c,d),RBD与ACE2形成复合物的native MS谱图Fig.4 Native mass spectra of the complex formed by glycosylated (a,b)/deglycosylated (c,d) RBD with ACE2
有研究[42]表明,S蛋白中的糖基化位点区域高度保守,如RBD的S325、N331和N343位点。多个突变实验[42-43]表明,将RBD上的N-糖基化位点N331和N343突变后,病毒的感染能力降低,表明这些位点在病毒入侵时发挥着重要作用。此外,一系列分子动力学(MD)模拟实验[18, 27]表明,S蛋白的部分N-糖(N74、N165)与ACE2的N-糖直接作用,部分N-糖(N165、N234)具有调控RBD构象转变的作用,同时N343上的糖基化也与RBD和ACE2的结合密切相关。因此,当切除RBD的N-糖后,RBD-ACE2复合物稳定性降低。这一结果表明,在进行RBD结构和功能分析(尤其是与ACE2结合相关的实验)时,不建议切除RBD的糖基化修饰。
糖基化修饰除了在维持蛋白及蛋白复合物结构方面的作用,在SARS-CoV-2的免疫逃逸方面也发挥着重要作用。有研究[44]表明,S蛋白通过构象变化来改变糖基化屏蔽区域,从而掩盖表位信息。如N165和N234对RBD构象的调整作用可以改变聚糖对S蛋白的屏蔽表面积,同时RBD上的N331、N343始终对该位点起到保护作用,从而实现免疫逃逸[27]。
此外,本研究尝试对ACE2上的N-糖进行同样的去糖基化处理,但结果表明,ACE2上的糖不能被有效去除。其原因可能为ACE2二聚体上的糖比RBD多,且在非变性状态下ACE2的高阶结构较RBD复杂,干扰了糖链与PNGase F的相互作用,使其无法有效发挥去糖功能。据文献[18,45-47]报道,ACE2中的糖同样参与S蛋白的结合过程,ACE2中N90上的糖干扰了ACE2与S蛋白的结合,将其移除后,ACE2与S蛋白的亲和力增强,而N322和N546上的糖可分别与S蛋白的残基和糖发生作用。
采用非变性质谱对RBD和ACE2样品进行检测,发现RBD和ACE2的糖基化均会对检测结果产生影响,且二者谱峰较宽。通过优化切糖条件,最终选择反应终浓度5 000 units/mL的PNGase F 于37 ℃孵育14 h作为最优的切N-糖条件。切除N-糖后,RBD的结构和功能发生改变,导致其与ACE2结合产生的复合物稳定性降低。上述结果表明,RBD上的糖基化修饰在支撑RBD结构中起到重要作用,且参与RBD与ACE2形成复合物的过程,并影响RBD-ACE2复合物的稳定性,在病毒入侵过程中扮演着重要角色。
除了native MS外,结构质谱法还包括氢氘交换质谱法[48]、native top-down法[25,49]、交联质谱法[50]以及共价标记质谱法[51]等,这些方法与主流结构生物学手段(X-射线晶体学、核磁共振波谱法及冷冻电镜法)形成了良好的互补与印证。面对具有挑战性的糖蛋白分析,通过整合多种结构生物学方法对蛋白质结构进行分析,可为蛋白质等生物大分子的结构解析提供更精细、更准确、多维度、多层次的信息和视野。