钟 力,朱 林,蔡宗苇
(环境与生物分析国家重点实验室(香港浸会大学),香港特别行政区 999077)
2019年底,我国武汉市爆发了一种未知的严重急性呼吸道疾病。引发疾病的病原体很快被中国科学家分离、测序,并鉴定为一种新型冠状病毒。该冠状病毒是一种有包膜的正单链RNA病毒,含有29 903个碱基[1-4]。由于该病毒与严重急性呼吸道综合征冠状病毒(SARS-CoV)在核苷酸水平上具有高达79%的同源性,世界卫生组织(WHO)将此病毒和引发的流行病分别命名为严重急性呼吸综合征冠状病毒2(SARS-CoV-2,以下简称“新冠病毒”)及2019冠状病毒病(COVID-19,以下简称“新冠肺炎”),并在2020年3月11日宣布疫情进入“全球大流行”阶段,并延续至今[4-7]。COVID-19是人类历史上第一次全球性的冠状病毒大流行,在世界范围内造成了不可估量的损失,截至2021年6月14日,已导致超过 1.76亿的感染病例和381万人死亡[8]。
SARS-CoV-2属于冠状病毒科β型冠状病毒属,是已知的第7种可感染人类的冠状病毒。新冠病毒主要的传播途径是飞沫传播,但也有其他传播途径和系统伤害的报道[9-11]。与 SARS-CoV和中东呼吸综合征(MERS)冠状病毒类似,新冠病毒通过与宿主细胞中的血管紧张素转换酶Ⅱ(ACE2)结合,可感染多个器官、大量复制并影响其正常功能[12-14]。该病毒可引起咳嗽、气喘、呼吸困难等症状,此外也有发热、腹泻、头痛、嗅觉和味觉丧失等症状的报道[5,15-16]。一些无症状新冠病毒携带者在观察14天后仍携带大量的病毒并且保有传染性[17-18]。此外,随着免疫逃逸病毒株(如近日出现并席卷全球的Delta病毒株)的出现,COVID-19 可能会像季节性流感一样成为人类的常见健康威胁,或在局部地区形成新的风土病[19-21]。因此,加深对新冠病毒的理解,尤其是探寻可表征其临床结果的生物标志物或感染的特征分子指纹具有重要的意义[22-24]。
生物标志物是反映特定生物或疾病状态相关的生物分子[25]。病毒会影响宿主的蛋白质组,病毒和宿主之间的蛋白质相互作用是病毒适应宿主过程的决定性因素[26-28]。更重要的是,免疫反应蛋白的丰度和修饰状态可直接反映宿主的免疫状态[29-30]。蛋白质在生物的病理和免疫过程中发挥着关键作用,已有报道指出在寨卡病毒(Zika)、埃博拉病毒(Ebola)、H1N1病毒中发现蛋白质生物标志物[31-33]。蛋白质的翻译后修饰(PTMs)是蛋白合成后在其氨基酸残基上由酶诱导形成的可逆共价修饰,是调节蛋白质位置、结合亲和力和活性的关键步骤之一[34]。作为寄生者,病毒完全依赖宿主细胞的新陈代谢机制实现自身复制。因此,这些源自宿主信号传递及调控通路所产生的翻译后修饰经常被病毒劫为己用,以达到其最高复制效率。糖基化作为最常见也是最重要的一种翻译后修饰种类,在病毒的生命周期中起着不可替代的作用,包括调节蛋白质折叠、干预受体结合、影响蛋白质降解率、调控宿主偏好和屏蔽免疫系统识别的免疫原性表位等[35]。病毒引起的疾病同样会显著影响宿主的蛋白质糖基化状态,影响糖的丰度和种类,增加或减少其表达,甚至使糖结构缺失[36-37]。蛋白质糖基化的水平和种类与细胞微环境中的化学状态密切相关,而细胞微环境可能因疾病而变化,因此长期以来糖基化水平、位点和修饰的糖种类也是疾病生物标志物的主要来源之一[38]。蛋白质的磷酸化同样深刻影响蛋白质的活性和功能。磷酸化和去磷酸化由蛋白激酶和蛋白磷酸酶催化完成,可以增强或减弱蛋白质活性、稳定或降解蛋白质、启动或停止蛋白之间的相互作用,乃至促进或抑制蛋白质在亚细胞结构之间的迁移[39]。病毒通过靶向特定的蛋白激酶和磷酸酶导致的磷酸化异常是许多人类疾病的起因或结果,这使磷酸化蛋白成为一种不可忽视的生物标志来源[40-41]。
据报道,约20%的新冠肺炎患者会发展为需要临床监护的重症,乃至死亡[42]。虽然已知年龄、性别、既有长期疾病和亚健康的生活方式是影响疾病严重程度的重要因素,但尚不能直接用来评估病人的预后[43]。基于对新冠发病机制和临床特征的广泛研究,其临床表现已经被确信与宿主的免疫反应密切相关[44-47]。病毒感染从本质上指的是作为病原体的病毒侵入宿主细胞后,适应了宿主细胞的代谢环境,并操控细胞的代谢来繁殖、入侵其他宿主细胞。因此,了解病毒利用宿主代谢的致病作用,是未来阻止病毒流行和击败病毒的基础[48-49]。通过对新冠肺炎患者的蛋白质以及代谢组状况进行全面和详细的分析,深入发掘关于宿主对病毒感染的免疫反应知识,进而阐明代谢状况与临床表现的潜在联系[50]。另一方面,基于质谱的组学方法,特别是基于质谱的蛋白质组学被广泛用于探索宿主对病原体的反应,包括感染、入侵、复制和发病机制,并能初步指导诊断,防止疾病发展为重症[51-52]。基于质谱的蛋白组学的独特优势在于,它以高通量、非偏倚的方式描绘了患者的蛋白质特征图谱[53]。通过纵向及横向比较新冠肺炎患者的分子图谱,诸多研究应用基于质谱的蛋白组学来探索新冠病毒的相关生物标志物[22-23,54-57]。本文将侧重于新冠病毒蛋白及其细胞受体的翻译后修饰的研究进展,尤其是糖蛋白质组学及磷酸化蛋白质组学的应用,以及这些 PTMs在寻找新冠肺炎临床生物标志物方面的潜在用途,并分析基于质谱的蛋白质组学在寻找生物标志物过程中的挑战。
糖蛋白组学(glycoproteomics)在细菌和病毒的鉴定以及免疫学和药物方面具有重要意义,是探寻生物标志物的一个新兴前沿领域。病毒通过与宿主细胞表面的碳水化合物相互作用实现入侵,新冠病毒也不例外:糖基化蛋白参与了病毒的入侵、病毒细胞受体蛋白的水解、以及宿主免疫系统对病毒的识别和中和[58-60]。目前,已有许多关于糖基化的刺突蛋白(spike protein)及其在新冠感染机制的糖蛋白组学的研究报道[61-65]。根据以往对 SARS-CoV和MERS-CoV的糖蛋白组学研究,糖蛋白在SARS-CoV-2表面的修饰值得深入研究[66-67]。为剖析新冠肺炎患者血浆中蛋白质的糖基化状态,需要进行的分析流程包括富集、消化、质谱分析和数据采集。糖蛋白的特异性富集能降低非糖肽的干扰,提高低丰度糖肽的检测效果,富集方法包括凝集素亲和技术、肼化学富集法、亲水色谱法、β-消除米氏加成反应等[68-71]。除了富集技术,糖基化修饰研究的另一个重要部分是蛋白鉴定/糖基化位点确定方法,需要将糖链消化分离,并分别解析糖链与修饰位点,应用最多的释放方法是酶法和化学法。与肽骨架的连接不同,单糖和糖胺聚糖(GAGs)的N-糖基化(N-linked glycosylation)和O-糖基化(O-linked glycosylation)需要选择相应的释放方法。例如,对于具有共同结构(即Man3GlcNAc2,其中Man为甘露糖,GlcNAc为N-乙酰葡糖胺)的N-聚糖,使用PNGase F酶可以分割天冬酰胺和N-聚糖的核心GlcNAc之间的键[72]。化学法,如肼解法和高碘酸氧化-β消除法也可以用来释放N-聚糖,但效果不如酶解法[73-74]。由于Ser/Thr连接的聚糖的多样性,没有酶能实现O-聚糖的完全释放。因此,一般倾向使用化学方法,但由此带来的问题是难以完整的分析具体修饰的糖结构及组分[75]。
质谱已成为分析糖和糖肽的主要工具。与其他手段(如核磁共振、外糖苷酶处理或凝集素分析)相比,质谱分析可以获得大量的结构信息,不仅可以检测糖类成分,二级或多级质谱还可以阐释位置和连接异构体[76-77]。基质辅助激光解吸电离(MALDI)和电喷雾电离(ESI)是主要的电离方法,LC-ESI-MS具有高灵敏度、低离子抑制的特点,可用于位置和连接异构体的解析[78-79]。此外,为了使多糖池的理化性质均匀化,从而减少离子抑制,常对糖类进行衍生,如稳定同位素过甲基化[80]。用 MALDI进行糖蛋白组学分析,具有样品制备简单、自动化程度高、数据采集快、能观察到单一离子等优点[81]。而且MALDI与甲基化等衍生技术相结合,可以避免电离过程中酸性基团的损失,使其成为定性分析中最常用的方法。糖类和糖肽的详细分析方法已经有了很好的回顾和总结,特别是在 SARS-CoV-2中的应用[82]。
体液是寻找疾病生物标志物最具潜力的途径,因为它们与各种组织直接相关,在这些组织中发现有蛋白质的分泌或释放[83]。早在2006年,Mann等[84-86]已经利用高精度、高分辨质谱对各种体液进行大规模分析,构建了第一张源于人类的体液蛋白图。2014年,Kim等[87]利用高分辨傅里叶变换质谱对体液(包括血清、唾液、尿液等)进行了2次大规模的人类蛋白质组图谱研究。在各种体液中,血浆广泛用于生物标志物分析,主要因为其在一定程度上影响了其他体液,而且可以通过简单、非侵入性的方法获得[88-89]。血浆成分极其复杂,血浆蛋白的动态范围是所有体液中最高的,大概超过10个数量级,因此,在质谱分析前需要去除高丰度的蛋白质以减少背景的复杂性[89]。常用的去除血浆中高丰度蛋白的方法有抗体亲和法和分馏法,有时还需要特定方法以分离并富集目标蛋白[90]。
病毒包膜蛋白的糖基化是病毒掩盖相关蛋白表位的主要方式[91]。病原体利用糖基化来逃避宿主免疫系统的识别,并可能干扰宿主的适应性免疫,甚至增强病毒的传染性[92-93]。包括HIV、H1N1、SARS和寨卡病毒在内的几种致病病毒,都是利用宿主的糖基化,在病毒体表面构建其糖蛋白,如N-糖基化和O-糖基化,以感染其目标宿主细胞[91]。与其他冠状病毒类似,SARS-CoV-2中糖基化的不同类型不仅影响单个糖的组成,而且影响整个病毒蛋白表面的免疫压力,从而暴露出表面密集碳水化合物层中的脆弱区域[58,66]。病毒包膜的糖蛋白不仅与免疫有关,还具有与受体结合的作用。糖蛋白的这种作用不仅解释了一些冠状病毒的跨物种传播机制,而且还为病毒溯源提供了线索。据Hulswit等[94]报道,β1-冠状病毒上的糖基化9-O-Ac-Sia特异性受体结合点能够与受体的糖蛋白结合。Qing等[95]报道了冠状病毒的2个受体结合位点,S1A会与宿主的唾液酸结合,S1B会识别宿主的跨膜蛋白,从而有可能引发从人畜共患到人与人之间的感染。对新冠刺突蛋白的糖基化分析可以揭示其来源及中间宿主的信息,并作为潜在的预测病毒传播能力及毒性的生物标志物。然而,由于糖基化的丰度相对较低,以及富集和分析糖肽存在的技术挑战,目前在生物标志物的发现方面仍处于早期阶段。
SARS-CoV-2通过高度糖基化的刺突蛋白进行细胞入侵[61-65]。作为一个三聚体的Ⅰ类融合体,刺突蛋白由2个亚单位S1和S2组成,它们由宿主的蛋白酶裂解产生[61,63]。S1含有受体结合域(RBD),对受体识别具有决定性作用;S2负责膜融合,对细胞粘附和免疫保护至关重要[96]。当S1与宿主细胞的ACE2受体结合时,S1将从刺突蛋白上脱落,使病毒能够利用S2与宿主细胞膜融合[61,97]。有报道认为,新冠病毒的刺突蛋白是中和抗体的一个主要目标[67]。因此,冠状病毒的刺突蛋白的糖基化是否能使病毒蛋白表位充分暴露,或在免疫规避中起基本作用,仍是一个关键问题。
以 COVID-19、spike protein和glycosylation为关键词,在Web of Science搜索相关报道,关于刺突蛋白的N-糖基化情况报道列于表1。新的实验证据以及生物信息学分析均指出,刺突蛋白被高度糖基化修饰。根据序列特征,刺突蛋白至少有22个潜在N-糖基化位点(因此每个三聚体有66个N-糖基化位点)[105-108]。在刺突蛋白的N端域(NTD)有8个位点(17、61、74、122、149、165、234、282),在受体识别域(RBD)有2个位点(331和343),在连接域(CD)有2个位点(1 098和1 134),其他位点则在已知功能域之外[102],示于图1a。由于O-糖基化修饰的种类繁多、糖链结构复杂等特点,关于刺突蛋白的O-糖基化状况尚不能详尽所有的可能性[105-108]。Andersen等[105]通过氨基酸序列预测至少有3个O-糖基化位点位于S1亚单位内:Ser673、Thr678和Ser686[105,108]。值得注意的是,Shajahan等[109]在RBD的Thr323处发现了一个预期之外的O-糖基化位点,另一个则是Ser525,这2个位于受体识别域的O-糖基化位点很可能在病毒-受体的结合中起到关键作用。Sanda等[108]率先在刺突糖蛋白的furin裂解位点(即S1和S2亚单位的连接位)附近发现了另外8个O-糖肽。这些O-糖基化位点被认为可以保护刺突蛋白表位或关键残基免受免疫系统攻击,对病毒的免疫逃逸有重要影响[105,109-110]。所有的糖基化是否都会同时且持久存在,抑或会受到宿主环境或其他因素的影响而变化,仍然是一个有待探索且意义重大的问题。
表1 新冠病毒刺突蛋白N-糖基化修饰的部分报道Table 1 Partial reports of N-glycosylation of SARS-CoV-2 spike protein
注:a.SARS-CoV-2刺突蛋白的翻译后修饰位点;b.常见的N-和O-糖基化类型;c.人类血管紧张素转换酶Ⅱ(hACE2)的翻译后修饰位点;图a与图c的刺突蛋白和hACE2示意图上的不同色块表示蛋白结构域;不同颜色文字标记了不同种类的翻译后修饰和对应位点,黑色表示糖基化,橙色表示磷酸化,紫色表示甲基化,粉色表示羟基脯氨酸位点图1 SARS-CoV-2刺突蛋白和人类血管紧张素转换酶Ⅱ(hACE2)的翻译后修饰位点以及常见的N-和O-糖基化类型Fig.1 Sites of post-translational modifications of SARS-CoV-2 spike protein and human angiotensin-converting enzyme Ⅱ (hACE2) and common N- and O-glycosylation types
发生在糖基化位点上的糖类组成与变化是理解病毒与宿主相互作用的另一个关键问题。利用基于质谱的糖蛋白组学,发现刺突蛋白上的糖主要是高甘露糖、混合糖和复合糖,示于图1b[106-109,111]。具体来说,8个N-糖基化位点主要是高甘露糖型,其他位点主要是复合糖[102,109]。刺突蛋白上2个重要的高甘露糖型位点(含有80%以上的高甘露糖)是N234和N709[102]。除了N234有Man9GlcNAc2外,刺突蛋白上其他7个位点的主要高甘露糖型糖结构是Man5GlcNAc2,使这些位点容易成为α-1,2-甘露糖苷酶的底物,但不能与GlcNAcT-Ⅰ反应,因此,不能被加工成混合型和复合型糖类[102]。此外,当S1和S2分别表达时,其糖的组成和各自位点的占有率可能不同[109]。哪些因素导致了这种分歧,以及它们将如何影响分子功能,值得探究。
SARS-CoV-2刺突蛋白的糖基化异质性已有报道,从不同的宿主细胞中分离出的刺突蛋白呈现出不同的N-聚糖的种类和数量[102,107,109]。Zhang等[107]预测,新冠病毒上刺突蛋白的原生N-糖基化处理产生的成熟糖应该与人类细胞中表达的重组蛋白相同,人类细胞表达的刺突蛋白主要是复合型糖基化,而昆虫上则以高甘露糖为主。Miller等[106]通过电荷检测质谱法评估了刺突蛋白质上N-聚糖位点的糖基化异质性,确定了高度异质性蛋白质的质量分布,指出“自下而上”的糖蛋白组学可能低估了较大、较复杂的糖丰度。同时他们提出,刺突蛋白糖基化的异质性可能会强化其三聚体结构,从而有迷惑宿主免疫系统的作用。Shajahan等[109]使用高分辨质谱法对刺突蛋白的N-和O-糖基化进行定量分析,并同时应用生物信息学工具和详尽的人工分析来研究所得到的数据,以证实 SARS-CoV-2的糖基化复杂性。此外,一些研究表明,刺突蛋白上的糖基化位点在全球快速传播过程中是相对保守的[110,112]。这种保守性表明,其在病毒的生命周期和宿主的适应中具有关键功能。刺突蛋白与ACE2受体的结合主要是由于RBD与ACE2的结构域之间极性残基的相互作用[13, 62,112]。三聚体、复杂糖基化的刺突蛋白在与受体结合方面比单体、不成熟的糖基化变体具有更强的亲和力[113]。刺突蛋白上的RBD发生的铰链式动态运动,加强了RBD 对ACE2的亲和力,使新冠病毒与受体的结合亲和力比SARS提高了10~20倍,这部分解释了病毒的高传播性[61-62,114]。相反,如果在低聚糖阶段阻断了N-聚糖或O-聚糖的生物合成或成熟,将促使刺突蛋白的分解,从而降低病毒与ACE2结合的可能性[115]。
ACE2是一种Ⅰ型膜蛋白,在人类或动物的肺部、心脏、肾脏和肠道中广泛表达[116-118]。ACE2由1个N端的肽酶区(peptidase domain)和1个C端的Collectrin样结构域(collectrin-like domain)组成[118-119]。ACE2主要通过将血管紧张素Ang Ⅰ和Ang Ⅱ分别转化为Ang 1-9和Ang 1-7来发挥肾素-血管紧张素系统的主调控功能[120-121]。ACE2具有多重作用,包括作为多种底物的催化剂、SARS病毒和SARS-CoV-2的功能受体、以及氨基酸的转运蛋白[121-125]。
作为新冠病毒的受体,ACE2为免疫、炎症和心血管疾病之间提供了一个关键联系。Shajahan等[126]利用质谱技术对人类ACE2的N-和O-聚糖表征进行鉴定,指出7个潜在的N-糖基化位点(53、90、103、322、432、546 和 690)和1个意料之外的O-糖基化位点Thr730,示于图1c。在所有的N-糖基化位点中,复合型、双天线型糖比高甘露糖和混合型糖更丰富,而Thr730上97%被Core-1粘蛋白类型占据。Mehdipour和Hummer[127]利用原子分子动力学模拟,发现ACE2受体的糖基化对病毒的结合有很大贡献。有趣的是,2个糖基化位点N90和N322的糖对刺突蛋白的结合有相反的影响。N90位点的聚糖部分覆盖了刺突体RBD的结合界面,可以干扰刺突蛋白和ACE2的结合,保护病毒与细胞的对接。与之相反,N322位点的聚糖加强了RDB和ACE2的结合作用。值得注意的是,N322聚糖与刺突蛋白的一个保守区域结合,该区域先前被确定为中和抗体的一个隐性位点。
虽然ACE2在SARS-CoV-2入侵细胞的过程中担当受体的关键作用,但在寻求抗病毒的疗法上,抑制ACE2的表达和活性会引起肾素-血管紧张素系统失衡,从而导致高血压、心血管受损和脏器损伤等严重后果[128]。因此,干预ACE2的糖蛋白修饰是在不影响ACE2表达的前提下一种更有效的抗病毒方案。
蛋白质的磷酸化对蛋白质的功能具有重要影响,可以改变细胞的信号传导、发育和分化以及周期控制和代谢[129]。磷酸化的作用类似一个开关,以可逆的方式“打开”或“关闭”一个蛋白质的活性或者一个细胞的通路[130]。据估计,真核细胞中约有1/3的蛋白质在其生命周期的某个阶段被磷酸化[131]。负责磷酸化和去磷酸化的是蛋白激酶和蛋白磷酸酶,其基因编码占人类基因组的2%[132-133]。但仅从基因序列来预测蛋白质的磷酸化修饰是不准确的,对磷酸化位点的实验测定仍是最可靠和重要的技术。尽管多年来已建立和发展了各种确定蛋白质磷酸化位点的方法,但这项技术仍然面临诸多挑战[134]。由于磷酸化蛋白低丰度、高复杂性和高动态范围的性质,在进行质谱分析前,需要对磷酸化的丝氨酸、苏氨酸和酪氨酸残基的肽段进行富集。从细胞总肽段肽的复杂样品中富集磷酸化肽最流行的策略是,先对磷肽进行分馏,再利用固相金属离子亲和色谱(IMAC)或金属氧化物亲和色谱(MOAC)进行二次磷肽富集[135-139]。常见的分馏方法包括强阳离子交换色谱法(SCX)和高pH反相色谱法(HPRP)等[140-141]。IMAC富集磷肽的原理是利用螯合在磁珠或硅颗粒上过渡态金属阳离子(如Fe3+、Ga3+、Zr4+、Ti4+等)的亲和作用去除样品中的非磷酸化肽,从而保留磷肽[138,142-143];而MOAC则利用氧化金属(如TiOx和Fe3O4)可以与磷酸根基团中的氧结合的特性,实现磷肽富集[144-145]。但 IMAC 和 MOAC 都对样品pH值有严格要求,经过富集的样品需要脱盐处理,操作较繁琐[146]。近年来,由Matthias等[135]开发的EasyPhos技术克服了这些缺陷。EasyPhos技术优化了蛋白质酶解、简化了磷肽脱盐和分馏步骤,是快速且高通量的磷肽富集法。质谱具有高灵敏度、高通量和快速扫描的优点,大多数磷酸化蛋白质的分析和位点研究采用串联质谱(MS/MS)进行检测[147-150]。尤其Orbitrap在磷酸化蛋白质分析的应用,能通过快速扫描显著提高数据的覆盖度和样品的检测效率[151]。
SARS-CoV-2膜蛋白和宿主细胞进入因子的磷酸化是新冠肺炎相关研究的热点。Davidson等[152]利用串联质谱法在病毒感染的细胞中发现了500多个病毒肽和44个磷肽,几乎涵盖了预测由SARS-CoV-2基因组编码的所有蛋白质。在分析病毒蛋白的磷酸化状态时,使用凝胶内胰蛋白酶消化和基于TiO2与Fe-NTA的磷肽富集,在LC-MS/MS的DDA 模式下检测到这些磷肽分布于N、M、ORF 3a、nsp3、nsp9、nsp12和刺突蛋白上。尤其在刺突蛋白上检测到的磷酸化位点是以往研究中从未发现的,揭示了磷酸化对三聚体组装的潜在影响,在基于该蛋白的疫苗开发上具有重要意义。Bouhaddou等[55]分析了SARS-CoV-2感染Vero E6细胞期间,蛋白质丰度和磷酸化的扰动情况。利用IGEPAL裂解和FeCl3富集磷酸蛋白的方法,再通过LC-MS/MS在DDA和DIA两种模式下的分析,确定了SARS-CoV-2病毒的nsp3、nsp14、ORF9b、M和N上分布的25个磷酸化位点,与Davidson等[147]的报道相互佐证。Bouhaddou等[55]揭示了宿主和病毒蛋白上磷酸化的重构,激活了酪蛋白激酶Ⅱ(CK2)和 p38 MAPK,使各种细胞因子的产生关闭了有丝分裂激酶导致的细胞周期停滞。通过对全局磷酸化图谱与失调的激酶和途径进行映射,确定了87种药物和化合物在COVID-19治疗上的可行性。Klann等[57]报道了感染 SARS-CoV-2 病毒后宿主细胞的全局、差异化的磷酸化分析。蛋白裂解液通过Fe-NTA富集和TMT同位素标记,经过LC-MS/MS分析发现,33个磷酸化位点分布于pp1ab、nsp6、ORF3a、ORF9b、M和N蛋白。然而,这些位点的功能意义需要相当长的时间通过点突变和/或生化技术来独立验证和研究。这些位点的磷酸化水平也需要更多的研究加以阐明。一个合理的猜测是,新冠病毒蛋白的磷酸化事件在新冠病毒生命周期的某一个特定步骤起到了关键作用,是新冠病毒劫持宿主信号通路调控机制的一个表现,同时也会是潜在的抗病毒药物的靶点。通过对这些磷酸化的分析,可以深入理解新冠病毒的宿主适应过程,启发抗新冠乃至广谱抗冠状病毒药物的开发。
除此以外,通过分析宿主磷酸化水平的变化,也可以推测出新冠入侵所依赖的关键蛋白激酶。Liu等[56]应用透射电子显微镜从时间维度上考察了SARS-CoV-2进入宿主细胞前30 min的图像,发现5 min和15 min分别是病毒附着及开始膜融合的关键时间节点。通过定量磷酸化蛋白质组学分析手段,并辅以自制的蛋白激酶活性预测流程,鉴定了这2个关键时间点上共同被调控活性的蛋白激酶,并进一步发现 PKC 激酶的β亚族,而非α或ε亚族,对病毒入侵起到了关键作用。Klann等[57]确定了病毒蛋白的磷酸化,并定义了感染后磷酸化驱动的宿主细胞信号传导变化,发现对生长因子受体下游信号的抑制可以防止新冠病毒在细胞中的复制。Yang等[40]研究了被新冠病毒感染的单核细胞衍生的树突状细胞的宿主反应,指出树突细胞对病毒的免疫反应减弱与病毒对STAT1磷酸化的拮抗作用有关。这些研究解释了新冠病毒的传播特征和免疫行为,为COVID-19的治疗提供了新的策略。
在众多蛋白翻译后修饰种类中,糖基化和磷酸化最具代表性且被研究详尽。超过600种的翻译后修饰将各种功能基团引入蛋白质,使其功能种类得到巨大扩充,并且影响了蛋白质的折叠、稳定性、活性以及蛋白质的相互作用[34]。病毒作为特定细胞内的寄生者,依靠宿主细胞的蛋白质合成机制来支持其复制,因此病毒蛋白同样受到PTMs的影响。例如,蛋白酶解和二硫键的形成改变病毒蛋白的结构,糖基化、磷酸化、乙酰化和生物素化等则为病毒蛋白添加了功能团[153]。正如前文提到,这些源自宿主信号传递及调控通路所产生的翻译后修饰已经被新冠病毒劫持并为己所用,以达到其在宿主细胞内的最高复制效率。换言之,如果能够分析并理解新冠病毒蛋白上的翻译后修饰事件在其复制周期的具体功能,会极大地加深人们对新冠病毒分子机理的了解,有助于进一步的药物研发。因翻译后修饰种类繁多,物化性质各有不同,并没有一套通行的分析方法。但大致上都以基于质谱的鸟枪法蛋白质组学手段作为鉴定方式,遵循蛋白提取—酶解—基于特异性抗体的免疫共沉淀富集—质谱分析的流程[154-155]。以质谱分析为主的方法在鉴定翻译后修饰的点位及定量方面具有独特优势,而近年来兴起的DIA、PRM等针对微量蛋白样品的质谱新方法,则进一步提升了对翻译后修饰多肽的鉴定能力。
针对新冠病毒蛋白的翻译后修饰,大多集中在已具备成熟富集-分析方法的糖基化和磷酸化上;其他翻译后修饰的质谱分析研究则十分有限。Sun等[156]报道了刺突蛋白和ACE2上额外的翻译后修饰,对刺突蛋白和ACE2进行胰蛋白酶、糜蛋白酶和内切蛋白酶Lys-C裂解处理,并通过LC-MS/MS分析蛋白位点,发现刺突蛋白和ACE2都包含多个甲基化位点,而ACE2还具有多个羟基脯氨酸位点。这项发现为研究病毒的宿主附着和免疫反应机制提供了额外的结构细节,也为开发急需的治疗方案和疫苗提供了支持。由于大多数甲基转移酶位于细胞核,刺突蛋白的甲基化可能发生于蛋白分泌过程[157]。尽管已有研究通过分子动力学、分子演变和生物信息学预测了刺突蛋白和ACE2上可能存在的其他翻译后修饰,如ADP-核糖基化、苏木酰化、棕榈酰化或泛素化,这些修饰后的蛋白可能存在相互作用[158-162],但目前还没有基于实验数据的研究来支持这些观点。可以想象的是,正如同其他已知的病毒,这些发生于新冠病毒蛋白上的翻译后修饰对于病毒蛋白的功能起到了不可或缺的调节功能,有利于新冠病毒在宿主细胞的复制、装配和释放。这方面的研究对深入理解新冠病毒的毒性机制有独特的价值,亟待深入发掘。
新冠病毒与其他冠状病毒在基因层面具有同源性,因此发生在其他冠状病毒蛋白上的PTMs同样有机会出现在新冠病毒蛋白上,且其功能、机制和调控都可能类似。鉴于对新冠病毒蛋白非糖基化/磷酸化翻译后修饰的研究还十分有限,我们或许可以从针对其他冠状病毒的研究结论中探究新冠病毒的面目。目前已知的部分冠状病毒蛋白的PTMs及其功能列于表2[153,163]。针对新冠病毒其他蛋白的翻译后修饰,如起到类似组蛋白功能的N蛋白,以及除刺突蛋白外另一个膜蛋白E蛋白的进一步分析,将会具有重要意义。
表2 冠状病毒蛋白的翻译后修饰及其功能[148]Table 2 Post-translational modifications in coronavirus proteins and proposed functions
本文回顾了基于质谱以糖蛋白组学、磷酸化蛋白质组学为代表的病毒蛋白翻译后修饰水平的研究。面对新冠肺炎咄咄逼人的流行趋势,迫切需要对新冠肺炎患者进行快速和精确的分级诊断,以便在感染早期阶段采取适当的医疗措施。自新冠肺炎爆发和流行以来,基于质谱的多种组学主要用于寻找生物标志物,以识别感染者、寻找药物目标、评估医疗效果,或阐明发病和疾病严重程度的分子机制[164]。尽管目前新冠病毒已经在传播中产生4种已知的变异毒株(Alpha、Beta、Gamma和Delta),其发病机制和症状的复杂性也在发生相应的改变,但考虑到基于质谱的组学技术在寻找生物标志物和开发新治疗方法上的显著优势,有理由相信这项技术在帮助人类了解变种病毒方面仍拥有深厚潜力[165]。
对蛋白翻译后修饰的质谱分析而言,最大的挑战在于样品的富集。翻译后修饰作为对蛋白活性瞬时微调的主要手段,出现的频率偏低。单个蛋白上会被修饰的氨基酸残基点位往往是有限的,而数量众多的不同修饰种类还会互相争夺同一个修饰位点,从而导致具备特定修饰的多肽所占比例很小。以出现频率最高的磷酸化修饰为例,磷酸化肽段在样本中的比例大约是千分之一[135],而另一种常见的乙酰化修饰则小于万分之一[166]。如果不加以纯化富集,修饰过的多肽质谱信号会被占绝大多数的无修饰多肽的信号抑制,从而无法鉴定。目前新冠领域对翻译后修饰的研究集中于磷酸化和糖基化,主要原因是这两种修饰的相对丰度最高,且富集纯化的手段相对成熟。而其他翻译后修饰,一般必须使用成本昂贵的特异性单抗对目标多肽通过免疫共沉淀法富集,才能得到足够的样本进行质谱分析。幸运的是,随着质谱技术的不断发展,仪器的灵敏度有了长足的进步:一方面,最新推出市场的具备双重离子淌度的质谱仪将对样本量的要求下降1~2个数量级;另一方面,随着新的非数据依赖采集方法(如DIA及PRM)的开发,我们可以更有针对性地开发新的质谱分析方法,靶向检测特定修饰过的多肽。这些技术和仪器上的进步,使得针对其他微量存在的翻译后修饰事件的质谱分析成为可能,并完全可以移植到新冠研究的领域中,进一步加深对新冠病毒分子机制的理解。
即便如此,进行复杂样品分析时,质谱检测的动态范围仍然是有限的。为达到最佳的分析效果,对样品前处理进行优化同样至关重要。例如,为了分析新冠肺炎患者的血浆蛋白,需要克服血浆蛋白浓度范围大所带来的挑战。常用的策略包括:1) 去除高丰度蛋白质,特别是血浆中的白蛋白和免疫球蛋白,以避免掩蔽血浆中的低丰度蛋白质,使低丰度蛋白质得以被检测;2) 通过色谱法、凝胶电泳或其他方法对血浆蛋白质进行分馏,以降低复杂性;3) 使用ELISA等策略分离目标蛋白质或多肽的目标组,从而实现对目标组的直接分析。蛋白质可能包含多个糖基化修饰位点,每个位点的糖基化修饰类型(N-或O-糖基化)和聚糖链占有率可能不同(宏观不均匀性),而且在一个位点可能包含多个不同的聚糖链结构(微观不均匀性)[167]。在糖蛋白结构分析中,糖链结构的宏观和微观不均匀性需要逐一解决,因此建立高效、高特异性、高灵敏度的富集方法和批量分析方法是深入研究糖基化的关键。
在新冠肺炎肆虐全球的当下,用于发掘生物标志物的多组学和分子网络研究是对新冠肺炎进行全面认识的可靠方法和宝贵工具。新兴的糖蛋白组学和基于质谱的翻译后修饰研究可以提供蛋白活性调控的信息,将其应用于寻找新冠的生物标志物,可以促进在分子水平上对感染和发病机制的深入探索,并可能最终发现新的治疗策略。基于质谱的蛋白组学具有高通量和无偏见的优势,有望成为破解新冠肺炎大流行的关键法宝。
致谢:感谢郭钟宝芬慈善基金为设立郭一苇环境与生物分析教授席所做的捐赠。