贾翼菲,王雅梅,李功玉,2*
(1南开大学化学学院,分析科学研究中心,天津市生物传感与分子识别重点实验室,天津 300071;2物质绿色创造与制造海河实验室,天津 300192)
糖基化(glycosylation)是一种普遍且重要的翻译后修饰类型,在调控蛋白结构、信号传导、免疫应答、胚胎发育等过程中发挥重要作用[1]。糖基化是在糖基转移酶的作用下将单糖或寡糖转移至蛋白质,并与蛋白质上的氨基酸残基形成糖苷键的过程。根据糖苷键类型,糖基化主要包括与天冬酰胺的侧链氨基连接的N-糖基化,以及与丝氨酸、苏氨酸的羟基连接的O-糖基化[2](图1)。目前已有许多研究表明,异常的蛋白糖基化修饰与肿瘤、糖尿病和阿尔茨海默病等疾病密切相关[3-4]。因此,表征糖基化修饰对于深入了解正常的生理活动或疾病发病机制具有重要意义。
Figure1 Classification of protein glycosylation[18]
糖蛋白结构深度解析一直是结构生物学领域的挑战之一,糖基化位点确定、糖链结构解析以及定量糖型相对丰度等都属于蛋白质糖基化研究范畴。由于聚糖存在较多的同分异构体,单糖组成和连接方式复杂多样,且糖基化连接位点也存在差异,因此糖基化修饰具有较强的宏观异质性与微观异质性。糖基化的异质性导致传统的结构解析方法(如冷冻电镜、X射线晶体衍射)很难对糖蛋白进行全面表征[5-7]。同时,单一的分析技术很难将不同类型的糖进行有效的识别与鉴定,为了解析糖链结构和评价糖基化与蛋白的构效关系,往往需要结合多种互补的方法。
质谱(mass spectrometry,MS)因其灵敏度高、分析速度快和耗样量少等优点,已经成为表征蛋白质糖基化的有力工具,可在完整蛋白、糖肽或游离聚糖水平上对糖蛋白进行解析[8]。基于质谱的组学技术能够准确地对聚糖结构、蛋白质序列、翻译后修饰种类、位点和相对丰度进行确证,但这种分析方式往往无法直接获取蛋白质高阶结构及动力学等信息[9-10]。而非变性质谱技术(native mass spectrometry,nMS)则允许蛋白质在非变性溶液条件、保持完整结构的状态下进行检测,不仅能够鉴定聚糖组成,还能辅助探究糖基化与蛋白质之间的构效关系;但是该技术对质谱分辨率要求较高,且难以直接鉴定单糖结构及其修饰位点[6-7]。因此,越来越多的研究将nMS 与糖组学、糖蛋白质组学提供的测序信息结合起来,以更全面地揭示糖基化的异质性及其与蛋白之间的构效关系[11-12]。
随着商业化仪器推陈出新式地更新迭代,离子淌度质谱技术(ion mobility-mass spectrometry,IM-MS)在完整蛋白表征方面的技术进展与应用研究报道与日俱增[13-15]。这主要得益于离子淌度的分离性能和质谱的高分辨检测,因此在确定蛋白质相对分子质量的同时还能提供气相蛋白质的空间结构与构象信息,甚至可对蛋白质复合物的亚基组成和拓扑结构等进行表征[16]。最新研究表明,IM-MS 经过精细的实验设计,可以在分子水平上实现糖基化亚型和蛋白微小差异构象的有效分辨,因此可直接用于表征糖基化修饰调控蛋白构效关系的相关分子机制研究[14-15,17]。本文从非变性动态构象分辨质谱技术、蛋白糖型分辨质谱技术及其在3 类常见糖蛋白的构效解析中的应用等出发,总结基于离子淌度质谱的糖基化蛋白结构研究最新进展,并讨论了该领域存在的挑战与前景。
解析糖基化修饰的异质性对于深入了解糖蛋白结构和功能十分重要。基于质谱的糖组学和糖蛋白质组学可直观、准确地解析糖的微观异质性和宏观异质性,但其样品制备过程较为繁琐,对数据库的依赖性较高,且不能提供蛋白高阶结构信息[10,19]。nMS 则利用温和、易电离的缓冲液体系(如醋酸铵溶液)维持蛋白质的非变性状态,尽可能地保留一些非共价相互作用,能够更好地实现完整糖蛋白及其复合物的检测,将糖蛋白结构的异质性与复合物相互作用的化学计量学和动力学联系起来,完成糖链水平和蛋白质水平的同步解析[20-22]。例如,大多数哺乳动物细胞表面含有一层由多糖-蛋白质复合物构成的糖萼(glycocalyx),由于糖链的高异质性和强灵活度,常规结构生物学研究往往缺乏有效解析手段,而近期有报道通过利用nMS 技术成功揭示高异质性的糖基化修饰对膜转运蛋白和受体蛋白构象的差异性调控作用[23-24]。目前nMS 技术用到的质谱仪可大致分为两类:一类是基于轨道阱质谱分析仪(Orbitrap),如赛默飞Q-Exactive UHMR(质荷比范围高达m/z80 000,且四极杆选择范围高达m/z25 000);另一类是基于飞行时间(time-of-flight,TOF)分析器,常与离子淌度串联使用以实现二维气相分离,最终提升离子检测与鉴定的结构分辨率。
离子淌度质谱是一种将离子淌度仪与质谱联用的二维质谱分析技术,其基本工作原理是待测物离子在电场作用下飞行穿过一定距离的漂移管,并与管中填充的缓冲气体发生碰撞,由于离子的形状、尺寸及所带电荷不同,导致其迁移速率不同,即通过离子淌度池的时间(arrival time distribution,ATD)不同,进而实现快速分离。而ATD 可通过Mason-Schamp 方程转换为离子结构相关参数“碰撞横截面积”(collisional cross section,CCS),可广泛用于不同实验室的不同仪器测定结果之间的直接对比分析[25]。IM-MS 可通过碰撞诱导解离(collision-induced unfolding,CIU)监测气相中蛋白质离子的构象动态转化过程与其稳定性。具体而言,CIU 是指通过依次增加碰撞电压来逐级活化蛋白质离子,被活化的蛋白质离子的构象会发生碰撞电压依赖型的动态转变,系列构象随后经过离子淌度分离,采集不同电压下的ATD 或CCS,通过可视化软件如CIUSuite 即可获得目标蛋白去折叠指纹图谱[26]。基于CIU-IM-MS 的新兴结构质谱技术已经逐渐用于糖蛋白的构象解析中,例如Robinson 课题组利用该技术发现O-糖基化修饰位点数目与糖蛋白DC-SIGN 的构象稳定性呈正相关[15]。同时,可视化软件的升级也加速了该方向的发展,例如Ruotolo 课题组开发的第二代CIUSuite2软件,可兼容多种不同商业化仪器原始数据的直接导入处理,通过构建的定量参数CIU50和差谱分析中的RMSD[27],实现多电荷态离子信息的同时提取分析,快速提供蛋白质构象稳定性、结构域数量和结合动力学等信息[28]。
受溶液成分、pH等影响,电喷雾产生的蛋白质一般同时携带多种电荷态,而不同电荷态很可能会呈现不同的构象状态。然而传统的CIU 技术一次只筛选一种蛋白质电荷态进行分析。一方面,这种基于单一电荷态的分析模式对于通量、分析速度以及蛋白的整体构象采集均有不同程度的牺牲;另一方面,对于异质性较高、难离子化的糖蛋白而言,随着碰撞电压升高会发生电荷态偏移,基于单一电荷态的分析模式会由于电荷态偏移引起的干扰从而造成较大的误差。因此,Phetsanthad等[29]发展了去折叠蛋白离子操控和数据采集新模式,即全离子去折叠技术(all-ion unfolding,AIU)。与CIU 不同之处在于,AIU 在离子活化去折叠之前省略了四极杆离子筛选的过程,对电喷雾产生的所有蛋白离子进行同时活化(图2)。为了最大程度提取蛋白所有的构象信息,作者还开发出同时提取所有离子去折叠信息的工具包,并提出新的构象参数CCSacc,用于生成非电荷态依赖型构象去折叠指纹图谱。这样有效提高了分析速度和通量的同时,还保留了所有蛋白构象信息。研究者发现,AIU操作模式针对大部分蛋白可以节约至少75%的数据采集时间,而且对于高异质性糖蛋白的结构分辨性能明显提升[30]。
Figure2 High-resolution characterization of both conformation (A) and glycoform (B) of bovine transferrin with native AIU-IM-MS strategy [17, 29]
离子淌度质谱具有较灵敏的分离能力,在寡糖区分上具有较大的潜力。例如,Feng 等[31]充分发挥了质谱和离子淌度的优势,通过碰撞诱导解离(collision-induced dissociation,CID)将N-糖链从糖肽中释放,随后在漂移管中进行离子淌度分离,成功区分出α2,3和α2,6连接的唾液酸,并能进行相对定量分析。2019 年Waters 公司推出了一款“环形离子淌度质谱仪”(cyclic IM-MS),其紧凑型环形离子导向装置替代了传统的线性离子淌度模块,可控制待测物离子进行一圈或多圈的淌度分离,淌度分辨率最高可达750[32],目前已有一些研究利用该仪器对糖同分异构体、连接方式进行鉴定[33-35]。
同时,一些特征离子可用来表征糖型修饰。例如,氧鎓离子(oxonium ion)是糖蛋白或糖肽中的单糖或双糖经碎裂得到的碎片离子,可根据其种类和丰度来确认糖型结构[36](表1)。在nMS 检测过程中通过提高气体碰撞能将糖蛋白表面的糖链打碎,进而可在低质荷比区观察到相应的氧鎓离子。N-乙酰氨基葡萄糖(N-acetyl glucosamine,GlcNAc)更容易碎裂产生m/z138 和m/z168 离子,而N-乙酰氨基半乳糖(N-acetyl galactosamine,Gal-NAc)更容易生成m/z126 和m/z144 两种特征离子,因此可根据4 种氧鎓离子相对丰度的比值(GlcNAc/GalNAc)来推断糖型[37]。
Table1 Common types of saccharide oxonium ions[37]
此外,还可通过不同的样品前处理方法辅助解析糖链信息。不同的糖苷水解酶对糖型组成和连接方式具有独特的选择性。糖蛋白经糖苷水解酶处理后,在保持蛋白非变性状态的同时又降低了糖蛋白异质性,利于质谱检测,并可通过相对分子质量偏移确定糖型组成。通过联合使用唾液酸水解酶、β-半乳糖苷酶、β-N-乙酰氨基葡萄糖苷酶和O-糖苷酶,可辅助鉴定具有复杂糖基化修饰的人源转铁蛋白、牛源胎球蛋白、促红细胞生成素(erythropoietin,EPO)和人源α1 酸性糖蛋白(alpha1-acid glycoprotein,AGP)的糖型[38]。凝集素是一种能与糖特异结合的蛋白质,一般具有多个糖结合位点,目前被广泛应用于糖蛋白纯化[39]。有研究将糖蛋白经Aleuria Aurantia凝集素(特异性识别岩藻糖)与Phaseolus vulgaris白细胞凝集素(特异性识别GlcNAc)纯化后,再利用nMS检测,成功解析出人源AGP的糖型分布[40]。
大多数蛋白质药物以N-糖修饰为主,包括单克隆抗体(monoclonal antibody,mAb)、激素、生长因子和疫苗。糖基化修饰会影响该类药物的疗效与安全性,因此阐明糖型组成与鉴定修饰位点对药物研发与监管具有重要意义[7]。Tian 等[26]首次利用CIU 技术在完整蛋白水平上探究了人源免疫球蛋白(IgG)4 种亚型的构象差异(RMSD 10% ~28%);蛋白质在气相中的构象转变以及不同构象的CCS 的差异能进一步扩大微小的糖基化修饰带来的结构改变[41]。Wu 等[21]利用了非变性自上而下质谱技术系统地揭示了糖基化修饰在结构与功能方面对细胞因子和激素的影响,例如,干扰素β(IFN-β)是一种参与调节免疫反应的抗炎细胞因子,高分辨nMS 能够同时检测到蛋白的单体和二聚体,并发现Asn101 位N-糖修饰不影响蛋白形成二聚体。肿瘤坏死因子α(TNF-α)是参与调节炎症反应、细胞增殖和凋亡的重要细胞因子之一,其Ser80 位O-糖修饰则会促进蛋白形成稳定的二聚体。卵泡刺激素(FSH)与女性发育和生殖密切相关,它由α 亚基和β 亚基组成,每个亚基都带有两个N-糖修饰,具有更高的异质性。通过提高nMS中气体碰撞解离能量,能实现蛋白亚型和糖型的检测鉴定,研究发现,α 亚基Asn52 位N-糖参与调控蛋白二聚体的形成;随后通过分子动力学模拟发现该位点的糖链能够与β 亚基产生氢键相互作用,从而稳固蛋白二聚体。这些结果帮助更好地了解蛋白类药物的构效关系,为糖基化蛋白质药物的表征与生物制剂的质量控制开辟了新的途径。
血浆中存在数百种糖蛋白,并具有重要的生理意义,如在FDA 批准的血浆蛋白生物标志物中超过三分之一是糖蛋白[42],探究血浆蛋白糖基化修饰可帮助更好地了解一些疾病的病理机制[43-44]。Yang 等[11]结合nMS 和蛋白质组学,在完整糖蛋白和糖肽水平上对高异质性人源EPO 和备解素(properdin)的糖基化结构、修饰位点及丰度进行全面表征。Wu 等[45]利用高分辨nMS 发现糖基化修饰会影响人源AGP 和结合珠蛋白(haptoglobin, HP)与药物或其他蛋白之间的相互作用。转铁蛋白(transferrin,TF)是血浆中的一种含铁蛋白质,是铁离子的重要载体,其表面的唾液酸修饰被认为与阿尔茨海默病发病机制有关,Li 等[17]通过CIU-IM-MS 策略以及细胞毒性实验证实了唾液酸修饰Neu5Ac会促进TF对铁离子的转运,进而削弱了由铁离子介导的β-淀粉样蛋白毒性。
SARS-CoV-2 属于冠状病毒科,为不分节段的单股正链RNA 病毒。它编码两个大的重叠开放阅读框(ORF1a 和ORF1b),4 种结构蛋白(S、E、M 和N蛋白),以及9种辅助蛋白[46]。其中,S蛋白(又称“刺突蛋白”)是一种三聚体形式的跨膜糖蛋白,由两个功能亚基S1和S2组成,其中S1亚基能和宿主细胞受体蛋白结合,而S2 亚基主要发挥膜融合功能。刺突蛋白表面约40%被糖基化修饰覆盖,可帮助病毒逃逸宿主先天免疫等生理过程[47-48];同时其RBD 结构域(regional-binding domain)的糖基化修饰可介导病毒与宿主血管紧张素转换酶2(ACE2)受体结合,进而达到侵袭宿主细胞的目的[49-50],因此,表征刺突蛋白的糖基化修饰对深入了解其侵袭机制具有重要意义。有研究结合nMS和蛋白质组学技术表征了刺突蛋白三聚体中的66个N-糖修饰和受体蛋白ACE2 二聚体中的12 个N-糖修饰[22],同时还利用nMS 技术提供的化学计量发现ACE2 中的Asn432 位糖基化更利于蛋白形成二聚体进而与刺突蛋白结合[22]。然而,刺突蛋白中仍存在许多复杂、低丰度的O-糖修饰未被鉴定[51]。Roberts 等[14]首先将刺突蛋白RBD 经PNGase F 水解以去除N-糖,随后利用基于捕集离子淌度(trapped ion mobility)的非变性质谱和自上而下蛋白质组学鉴定到了8种O-糖的完整结构,其中包含一种从未被报道过的带有岩藻糖的Core 2型聚糖。
目前为止仍无法通过单一方法实现糖蛋白结构信息的完整表征,最近发展的基于IM-MS 的非变性动态构象分辨模式和糖型分辨解析模式,在结构分辨率和分析通量方面均有了明显提升,配合高分辨构象操控技术,可在表征精细糖型结构的同时,提供蛋白质的微小动态构象变化和结构稳定性信息。构象操控实验的数据采集模式与数据处理方法的进一步发展也将有效推动糖蛋白结构质谱表征的结构分辨率和分析通量,如将靶向CIU 技术发展成非靶向AIU 技术后,针对异质性较高的糖蛋白构象分辨能力和分析速度均有显著提升。未来一大发展方向是构象操控技术的规模化,这对于将传统非变性质谱技术拓展至组学水平上应用是关键步骤。同时,还可基于IM-MS 数据对蛋白结构进行分子动力学模拟,以更为直观地阐明糖蛋白动态构象变化与构效关系[21,52-53]。此外,结构质谱仪器硬件升级对于复杂多构象糖蛋白的高级结构和构象解析至关重要,这也将是未来学术界和工业界共同关注的主要方向之一。