邵文亚,梁 玉,梁 振*,张丽华,张玉奎
(1.中国科学院大连化学物理研究所 中国科学院分离分析化学重点实验室,辽宁 大连 116023;2.中国科学院大学,北京 100049)
蛋白质的糖基化作为生物体最重要、最常见的蛋白质翻译后修饰之一,在蛋白质相互作用、分子识别、免疫应答[1]、信号传导[2]等关键生物学过程发挥了重要作用。生物体内糖基化位点以及糖基化水平的异常与多种疾病密切相关,如肿瘤的发生和转移、神经退行性疾病、代谢相关疾病等[3-4]。目前,已有很多糖蛋白质作为生物标志物或药物靶标用于临床上疾病的预警、诊断和治疗[5-7]。糖蛋白质组学作为蛋白质组学的重要分支,已经成为蛋白质组学研究中的热点领域[8]。
糖蛋白质是在蛋白质的特异氨基酸残基上通过共价键方式连接上糖链所形成,一般可按糖链所连氨基酸残基以及连接方式的不同将蛋白质糖基化分为以下类型:N-糖基化、O-糖基化、C-糖基化以及糖基化磷脂酰肌醇锚(GPI-anchored)等[9]。其中,N-糖基化是糖链还原端的半缩醛羟基通过N-糖苷键连接到蛋白质特定氨基酸序列的天冬酰胺残基(Asparagine,Asn)侧链酰胺基上所形成,其特定氨基酸序列是指N-X-S/T/C(X为除了脯氨酸以外的任意氨基酸,S 为丝氨酸,T 为苏氨酸,C 为半胱氨酸)。在糖链组成方面,N-连接糖链一般由一个三甘露糖-壳二糖的核心五糖结构以及若干糖单元组成,根据糖单元的组成可分为高甘露糖型、复合型和杂合型3类。N-糖链可被肽N-糖苷酶F(Peptide N-glycosidase F,PNGase F)高效、特异性的切除,再加上N-糖基化发生于特定的氨基酸序列,因此N-糖基化可以依靠质谱分析和数据库检索手段实现大规模位点鉴定,成为目前研究最多的糖基化类型,已有许多规模化的N-糖基化数据库发布,但其鉴定数量仅占理论预测的5%~10%。主要原因是糖基化虽然是生物体内普遍发生的一种翻译后修饰,哺乳动物体内糖蛋白质的比例高达50%,但其丰度通常较低,且糖基化蛋白质酶解肽段中仅有2%~5% 为糖基化肽段,另外在质谱中糖肽的离子化效率不高,糖基化蛋白质/肽段往往不易被质谱所鉴定[10-11]。因此,为实现糖基化蛋白质/肽段的深度覆盖分析,对糖基化蛋白质/肽段进行高选择性富集对于糖基化蛋白质组学研究具有重要意义。本文对目前N-糖基化蛋白质组样品富集方法的原理、特点以及最新研究进展进行了综述。
目前,N-糖基化蛋白质组样品的富集方法根据其富集机理不同,主要分为凝集素亲和法、酰肼化学法、亲水作用色谱法及硼亲和法等。
凝集素作为一类非抗体类糖蛋白质,具有1个或多个功能性结构域,该结构域能够专一与糖蛋白质/肽连接的聚糖内部或末端某些特定单糖或者寡糖精细结构特异性地可逆结合。因此,凝集素可用以捕获特定的糖蛋白质或糖肽,之后再通过用特定的单糖竞争结合的方式将其洗脱下来[12-13]。不同的凝集素对不同类型的糖链具有特异性的识别能力,可以使用单一凝集素对某特定类型的糖蛋白质/糖肽进行特异性富集,也可使用多种凝集素(Multi-lectin affinity)[14],或者连续凝集素亲和层析(Serial lectin affinity chromatography,SLAC)[15]对样品中的糖蛋白质/糖肽进行全谱富集。Mann等[16]将凝集素亲和法与滤膜辅助样品预处理技术相结合,使糖蛋白质的富集和酶解同步进行,通过该技术对鼠组织及血浆中的 N-糖基化蛋白质进行分析,共鉴定 6 367 个糖基化位点,对应于 2 352 个糖蛋白质。该课题组[17]进一步将相对定量技术Super-SILAC与上述凝集素富集策略结合,通过对糖基化位点的定量分析,研究了11 种代表乳腺癌不同发展时期的细胞系中分泌蛋白糖基化位点的变化情况,以寻找乳腺癌的疾病标志物。Allmaier等[18]将带有凝集素的磁性纳米颗粒用于木霉菌(Trichoderma atroviride)中糖蛋白质的富集,之后通过凝胶电泳(SDS-PAGE)结合质谱技术,发现木霉菌中存在两个关键的糖蛋白,该研究首次将凝集素富集方法用于真菌类糖蛋白质组学鉴定。
凝集素亲和法操作简单,可在糖蛋白和糖肽水平上实现富集,且能保持糖链结构的完整性,对于研究某些含有特定单糖的糖蛋白(如:唾液酸化或核心岩藻糖化的N-糖基化蛋白质)具有一定优势,这些糖基化在某些病理和生理过程中发挥着重要作用[19-20]。但是,凝集素的亲和专一性使大规模的糖基化富集需要同时使用多种凝集素,成本较高,限制了该方法的广泛应用。
酰肼化学法是将糖蛋白或糖肽糖链上的顺式邻二羟基通过高碘酸氧化转化为醛基,利用醛基与含有酰肼基团的基质材料共价作用,从而实现对糖基化蛋白质/肽段的选择性富集[21]。具体过程如下:首先是氧化反应,通过高碘酸盐将糖蛋白/肽上糖链中的顺式邻二羟基氧化成醛基;其次是共价偶联反应,通过生成的醛基与基质材料上的酰肼共价结合形成腙键,从而实现对样品中糖蛋白/糖肽的特异性捕获;最后是洗脱与酶解,先通过洗脱液将未发生共价结合的蛋白质或肽段从体系中去除,再利用糖苷酶将N-糖基化蛋白质/肽段释放,进而进行质谱分析。目前,该方法可分为糖蛋白质水平的富集及糖肽水平的富集两种策略。但由于蛋白质溶解性差,空间位阻大,后续需酶解等因素限制,因此基于酰肼化学的富集方法已逐渐发展为以糖肽水平的富集策略为主[22-23]。该方法于2003年由Aebersold等[24]首次提出并用于人血浆样品中糖蛋白的富集,结合标记定量技术,对血浆中的N-糖蛋白质进行了差异分析。该方法已成功应用于唾液、细胞质膜、血浆等具有重要生物学意义样品中N-糖基化蛋白质组的分析与鉴定[25-26]。
酰肼化学法中糖链结构在富集过程中会被破坏,且其步骤繁琐,Zhang等[27]开发了一种可逆酰肼固相萃取的富集策略。过程如下:首先,糖链中的糖环在苯胺的催化下形成醛的结构;其次,具有酰肼基团的固相颗粒与糖链的醛基反应形成共价腙键捕获糖蛋白质/肽,通过洗脱液将未与固相颗粒结合的非糖蛋白质/肽洗去,从而实现糖蛋白质/肽的选择性富集;最后,在pH值约为1.0~2.0的强酸性环境中腙键水解释放出糖链,从而实现可逆过程。
酰肼化学法一般是将酰肼基团修饰于固相颗粒表面,利用固相颗粒与溶液中的糖蛋白质/肽作用,实现糖蛋白质/肽的特异性富集。因此,固相基质的类型也会对富集效果产生影响,Najam-Ul-Haq等[28]将纤维素、聚合物、金刚石作为基质材料修饰酰肼基团后,进行酰肼化学富集,并对其富集效果进行了评估,其中poly(GMA/DVB)基质的回收率达到89%,优于纤维素与金刚石(回收率分别为83%和71%),实验结果表明基质材料的亲疏水性对于富集效果具有较大的影响。
此外,近年来发展了同样基于醛基的胺化反应[23]和肟点击化学法[29]用于N-连接糖肽的富集。胺化反应是利用固相载体中的氨基活性基团与糖链中邻二羟基氧化生成的醛基反应,从而实现糖蛋白或糖肽的选择性富集。肟点击化学法是利用羟胺与醛基能够发生亲核加成生成稳定肟键,相比于酰肼反应,羟胺由于α-效应的亲核能力更强,且反应条件温和、产物稳定。这两种方法与酰肼化学法类似,均不存在歧视效应,结合材料的不同特点,可满足不同类型样品的需求,提高糖基化蛋白质组的富集选择性和特异性以及鉴定效率。
该类方法采用共价结合的方式,富集效率高且对糖链不存在歧视效应。同时可通过同位素或亲和试剂进行标记,进行糖蛋白质组定量分析,因此,在高通量的N-型糖基化位点鉴定中得到了较好的应用。然而,富集过程中采用了强氧化剂进行氧化反应,这些氧化过程往往伴随复杂的副反应,且会破坏糖链结构,从而严重限制了该方法在糖型解析上的应用。
糖链中通常包含甘露糖、半乳糖、葡萄糖等单糖分子,这些单糖分子含有大量的羟基,因此糖基化肽段均具有较强的亲水性,故亲水作用色谱法(Hydrophilic interaction liquid chromatography,HILIC)也常用于糖肽的分离和富集[30]。该方法富集效果不受糖型的影响,不破坏糖链结构,且具有操作简单、易于实现在线分析、与质谱兼容性好等优点,而被广泛应用于糖蛋白质组样品分析中。亲水作用色谱基于亲疏水性对糖肽进行富集,当样品中存在含较多亲水性氨基酸的非糖肽或疏水性较强的糖肽时,该方法的特异性不高。对此,可通过调节流动相或加入离子对试剂来提高亲水作用色谱的选择性,Kolarich等[31]采用ZIC-HILIC材料,比较了乙腈、甲醇、乙醇和异丙醇4种不同流动相对糖肽富集的影响,发现乙腈对于亲水或者疏水的糖肽均具有较好的保留能力,乙醇和异丙醇对于疏水性糖肽具有较好的富集效率。Kelly等[32]通过采用加入离子对试剂(50 mmol/L的NaCl)中和多肽上的电荷,扩大了糖肽与非糖肽的亲水性差距,从而提高了糖肽的富集选择性。
近年来,各种适用于糖蛋白质/糖肽富集和分离的新型固定相不断涌现,早期有裸硅胶基质固定相[33],之后梁鑫淼等通过“点击化学”的方法在硅胶基质上修饰亲水性功能单体,形成各种HILIC固定相,如点击麦芽糖亲水固定相[34]、点击L-半胱氨酸亲水固定相[35]、点击谷胱甘肽亲水固定相[36]等,Selman等[37]也通过“点击化学”的方法制备了多聚糖硅胶基质亲水固定相,这些硅胶基质修饰的固定相均实现了糖肽的高选择性富集。除上述在硅胶基质上修饰形成亲水固定相外,Wang等[38]利用聚二乙氨基乙醇(DEAE)颗粒作为亲水固定相进行糖肽富集,利用该亲水材料对血浆中糖蛋白质组学进行分析,共鉴定出115个N-糖蛋白质和219个N-糖基化位点。张丽华等[39]发展了基于氢键辅助的亲水作用富集材料并应用于小鼠脑组织N-连接糖肽的富集,共鉴定1 997条N-糖基化肽段,对应于686个N-连接糖蛋白,其中N-连接糖肽的富集选择性高达94.6%。
由于金属有机骨架(Metal-organic frameworks,MOFs )材料具有比表面积高、纳米孔道有序、酸耐受能力高以及化学修饰性良好等特点,被越来越多地应用于生物样品的预富集中。Yang等[40]通过在磁性石墨烯(Magnetic graphene,MG)表面合成引入ZIF-8,形成MG与MOFs的复合物MG@Zn-MOFs,利用该材料对1 μL的人血浆中糖蛋白质组学进行分析,共鉴定出151个唯一性糖蛋白质和517个N-糖肽。除了直接使用MOFs颗粒作为功能基团外,Bai等[41]以MOFs颗粒作为基质材料制备了表面富含半胱氨酸的亲水富集材料,该材料具有高比表面积和超强的亲水性等优势。利用该材料对糖蛋白IgG的酶解产物进行糖肽富集检测,其最低检测限达1 fmol/L。利用该材料对溶菌酶中糖蛋白质组进行分析,共鉴定出1 123个N-糖基化位点,对应于1 069个N-糖肽和614个N-糖蛋白质。
HILIC 法具有富集条件温和、操作简单、糖链结构不被破坏、溶剂温和以及易与质谱联用等优点,被广泛应用于实际样品中糖肽的富集。然而,该策略对于亲水性物质具有广谱的富集效果,选择性略低,并且由于糖蛋白质与非糖蛋白质在亲水性上差异较小,限制了其在糖蛋白质水平上的使用。
硼亲和法也是常用的糖蛋白质/糖肽富集策略。该方法原理是在碱性溶液中,硼酸分子中硼原子的杂化轨道由平面型的sp2杂化转化为四面体型的sp3杂化,分子构型从平面三角形转化为四面体,此时,硼酸分子可与带有1,2位或者1,3位顺式二羟基结构的糖链发生羟基化反应生成环状二酯;当溶液环境转变为酸性后,环状二酯水解释放出结合的糖链和硼酸分子,从而实现对糖基化蛋白质/肽的富集[42-43]。
近年来,以硼酸及其衍生物作为亲和配体的硼酸类亲和材料得到了迅速发展和应用。在早期的研究中,硼酸大多被作为流动相来实现对糖蛋白质/肽的选择性富集,而目前已转变为用作亲和配体被修饰到磁性纳米颗粒[44-45]、聚合物颗粒和硅胶颗粒[46-47]、整体材料[48]上。除上述基质材料外,Li等[49]发展了以MOFs材料为基质的硼亲和材料:在Fe3O4表面生长MOFs晶体ZIF-8,之后将硅烷化的硼酸功能单体修饰于Fe3O4/ZIF-8上,形成复合物Fe3O4/ZIF-8/APBA。由于具有较大的比表面积,该材料对于糖蛋白OVA的饱和吸附量达到833.33 mg/g。
与糖蛋白质/糖肽的其它富集方法相比,硼亲和法通过硼酸配基和糖链之间可逆的共价反应来实现对糖蛋白质/糖肽的富集,能够保持糖链的完整性,为后续糖链的解析提供了可能;另外通过简单的pH值调节,即可实现糖蛋白质/糖肽的富集与洗脱,操作简单,且洗脱液多为酸性水溶液与质谱条件兼容。但是,硼亲和法中硼酸与不同糖型之间的相互作用力强弱不同,若目标糖蛋白质/肽中糖链为相互作用力较弱的糖型则富集能力较差。近期有报道[50]以苯硼酸的衍生物作为单体制备了含有硼酸功能基团的聚合物,大大提高了与糖肽的结合能力和富集效率,在酵母细胞中鉴定到超过1 000个N-糖基化位点,在鼠脑中鉴定到4 691个N-糖基化位点,在人源细胞中鉴定到4 691个N-糖基化位点。
除以上方法外,还发展了其它的N-糖肽富集策略:①与非糖肽相比,糖肽的分子构型一般大于非糖肽,Zhang等[51]采用SBA-15的介孔材料,利用其多孔性质,将样品中的非糖肽吸附于孔道,从而实现了糖肽与非糖肽的分离;②某些含有唾液酸的糖链在酸性条件下带负电,可通过二氧化钛富集唾液酸糖肽,之后再利用HILIC分离降低样品的复杂度,将该策略用于Hela细胞中糖蛋白质组分析,共鉴定出1 632条N-连接唾液酸糖肽,对应于817个N-糖蛋白质[52]。
目前,N-糖基化蛋白质组富集技术得到了快速发展,为N-糖基化蛋白质的规模化分析提供了技术支撑,极大地推动了糖蛋白质组学的进步。但目前大多数的N-糖基化蛋白质和糖基化位点仍未得到解析,因此,新富集方法的开发以及与质谱技术的更好结合对于糖蛋白质组学的研究及其生物学功能的解析仍然是十分必要的。另一方面,异常的糖基化修饰(包括特定糖蛋白质量的变化和糖基化结构的改变)与诸多病理过程密切相关,而且由于糖基化修饰的异质性使其具有宏观和微观不均一性,因此,针对特定糖基化修饰或糖链结构的专一性富集技术引起了研究者的极大兴趣。随着富集方法的不断创新以及各类分析手段的发展,人类对糖基化修饰的认识会更加深入,糖蛋白质组学将会在疾病诊断、药物靶点研究等方面发挥更大的作用。