马心悦 黄纯翠 赵 耀 李 岩**
(1)中国科学院生物物理研究所,北京 100101;2)中国科学院大学,北京 100049;3)重庆医科大学附属儿童医院,重庆 400015)
人 乳 寡 糖 (human milk oligosaccharides,HMOs)是乳汁中除乳糖和脂肪外的第三大固体成分。成熟乳和初乳中分别含有12~13 g/L 和22~24 g/L的HMOs[1]。母乳中游离的HMOs 虽然大部分无法被婴儿消化吸收,却是一种天然益生元,可以促进双歧杆菌等有益菌的增殖,调节婴儿肠道菌群平衡[2]。不仅如此,HMOs 发挥多种生理功能,竞争性抑制病原体与肠道上皮细胞的表面聚糖结合,阻碍病原菌黏附,增强肠道屏障功能,预防坏死性小肠结肠炎,防止诺如病毒感染[3]。HMOs可以发挥免疫调节作用,减轻免疫应激反应[4]。在小鼠和乳猪的认知功能研究中发现,含唾液酸的HMOs对神经发育有重要作用,有助于增强学习能力和记忆力[5]。为了研究HMOs 对婴儿健康发挥的作用,需要对HMOs进行深入表征。母乳基质复杂,HMOs 种类繁多、丰度跨度大,并且结构多样、存在众多异构体,这都使得检测面临诸多挑战。基于紫外或荧光检测的液相色谱和毛细管电泳在分离HMOs方面效果显著,耦合质谱分析极大提高检测灵敏度。随着糖组学技术的逐渐发展,特别是生物质谱在表征聚糖方面的突破,现已发现大约200 种不同的HMOs 分子,表征了150 种低聚糖结构[6-7]。此外,核磁共振、质谱、红外多光子解离光谱实现了对HMOs 结构的完整解析。本文拟对HMOs分离和结构解析的多种技术手段进行综述。
HMOs 是聚合度为3~20 的直链或支链聚糖,基本组成单位是5种单糖:D-葡萄糖(Glc)、D-半乳糖(Gal)、L-岩藻糖(Fuc)、N-乙酰葡萄糖胺(GlcNAc)、N-乙酰神经氨酸(Neu5Ac)。HMOs的还原端是一个乳糖(Galβ1-4Glc)核心,其后连接不同数量的乳糖胺单元Galβ1-3GlcNAc(Ⅰ型)或Galβ1-4GlcNAc(ⅠⅠ型)延伸糖链。人乳中Ⅰ型结构HMOs含量高于ⅠⅠ型结构,这与其他哺乳动物的情况恰好相反[8]。随着聚合度增加,不同类型的糖苷键使得HMOs 立体构型更为复杂。Ⅰ型乳糖胺通过β1-3/6连接时,糖链延长发生中止[9]。ⅠⅠ型乳糖胺可以通过β1-3 连接不断延长直链骨架,若β1-6连接同时存在,则形成分支型寡糖结构。
不同位置或数量的岩藻糖基化、唾液酸化修饰使得HMOs 结构更具多样性。根据修饰糖基的不同,HMOs被分为3类:含唾液酸的酸性寡糖、仅有岩藻糖修饰的中性寡糖和非岩藻糖基化中性寡糖。酸性寡糖中Neu5Ac 通过α2-3/6 连接到Gal 非还原端,或α2-6 连接到GlcNAc。岩藻糖基化大多是Fuc以α1-2形式连接非还原性的Gal。此外,Fuc也可以通过α1-3连接在Glc还原端,或α1-3/4键添加到GlcNAc上[10]。
岩藻糖基化的类型受到岩藻糖基转移酶(fucosyl transferase,FUT)催化介导,该酶受到乳腺内2 个编码岩藻糖基转移酶基因表达的调控。Secretor基因编码岩藻糖基转移酶2(FUT2),控制α1-2 键形成。Lewis基因编码岩藻糖基转移酶3(FUT3),该酶作用于α1-3/4 修饰的岩藻糖基化。根据基因表达情况,母乳可以分为分泌型Lewis阳性(Se+Le+)、分泌型Lewis 阴性((Se+Le-)、非分泌型Lewis 阳性(Se-Le+)和非分泌型Lewis 阴性(Se-Le-)4 种类型[11]。不同分泌型母乳的HMOs对婴儿健康的影响存在差异,如分泌型母乳能增强针对大肠杆菌和弯曲杆菌的保护[12]。常见HMOs如图1所示。
HMOs是一系列具有生物活性的低聚糖,极性大并且不含发色团。经过化学衍生后,HMOs通过高 效 液 相 色 谱 (high performance liquid chromatography,HPLC)或毛细管电泳(capillary electrophoresis,CE)实现有效分离,传统的紫外检测或荧光检测简单、有效,但只能依靠标准品进行定性分析,标准品不可用或价格昂贵时会受到限制。目前,亲水相互作用色谱和多孔石墨化碳色谱常 用 于 分 离HMOs, 并 通 过 质 谱 (mass spectrometry,MS)依据保留时间和准确质量确定寡糖成分,从而对HMOs进行有效的成分分析。
2.1.1 阴离子色谱
阴离子交换色谱(high performance anion exchange chromatography,HPAEC)是分离天然低聚糖的传统方法。强碱性溶液中,弱酸性的人乳寡糖以阴离子形式存在,其分子的结构和大小与在阴离子交换柱上的保留密切相关。分离后HMOs通过脉冲安培检测(pulsed amperometric detector,PAD),该方法检测线性范围较宽,但灵敏度低于荧光检测。HPAEC-PAD 方法定量HMOs 简单、可靠,可用于开展大队列母乳样本中HMOs 系统表征,追踪不同泌乳时间和母体分泌型中HMOs浓度变化[13-14]。HPAEC-PAD 法无需衍生,能够同时分析中性和酸性HMOs。由于不能在线与质谱联用,该方法只能依靠标准品定性[15]。受限于阴离子色谱的分离能力,长时间运行也无法完全分离HMOs到基线,寡糖异构体如p-LNnH 和LNnH 出现共洗脱现象。
2.1.2 亲水相互作用色谱
亲水相互作用色谱(hydrophilic interaction chromatography,HⅠLⅠC)对于分离极性化合物十分有优势,已广泛应用于N/O-聚糖的分析。HⅠLⅠC适合分离唾液酸化寡糖,保留能力受单糖残基数量的影响,分离长链寡糖效果较好,但对于较小的三糖分离效果不佳。荧光检测(fluorescent detection,FL)分离物是一种快速简单的方法,不过HMOs缺少荧光基团,通常需要在酰胺柱分离前采用2-氨基苯甲酰胺衍生,这也增加了样本处理步骤[16]。许多报道通过HPLC-FL大规模测定了母乳样本中HMOs含量,包括巴西、美国、西班牙、中国等国际队列,分析了HMOs含量变化与人群、哺乳期、地理位置、母亲状况之间的联系[17-19]。HⅠLⅠC 使用的流动相是甲酸铵-乙腈缓冲体系,可与质谱兼容,使检测灵敏度进一步提高。HⅠLⅠC和三重四极杆质谱联用,采用多反应监测模式监控离子对以明确HMO成分[20-22]。两级质量选择极大地减少了背景基质的干扰,具有出色的灵敏度。
2.1.3 多孔石墨化色谱
多孔石墨化碳色谱(porous graphitized carbon chromatography,PGC)具有显著的寡糖异构体分离能力,PGC 与质谱结合使用已成为分析母乳样品中HMOs 的强有力工具。PGC 出色的分离能力可以从高度异构化的HMOs 中将α/β 端基差向异构体分开。同种寡糖因此产生两个峰,反而为谱图解析造成麻烦,通常使用NaBH4将天然HMOs还原为相应的糖醇从而避免这个问题[23]。Tonon 等[24]开发PGC-ESⅠ-MS 方法,成功分离6 对异构体。但该方法运行时间长达60 min,另一个限制是无法分离乳酰-N-四糖(lacto-N-tetraose,LNT)和乳酰-N-新四糖(lacto-N-neotetraose,LNnT)。Mank 等[25]开发负离子模式的LC-ESⅠ-MS2方法,通过PGC 柱分离后,对20 多种重要寡糖进行选择离子监控,实现对多种HMOs丰度的快速测定。同样也有研究在ESⅠ正离子模式下通过选择离子监控模式成功分析HMOs 异构体[26-27]。另外,在蛋白质组学研究中,已有广泛应用的同位素标记的质谱分析策略被引入HMOs 的分析。Robinson 等[28]用串联质谱标签(TMT)标记人乳寡糖还原端,PGC 分离后通过ESⅠ-Q-TOF 在一次运行中同时对5 个样本的15种HMOs分析。TMT标记扩展了多路复用的能力,极大地缩短运行时间,减缓了仪器性能漂移引起的电离差异。
毛细管电泳利用带电粒子在电场中的迁移作用,分离纯化蛋白质、多肽、核酸等多种物质。天然形式的酸性寡糖本身带有电荷,无需衍生可直接经CE 在飞摩尔水平测定。中性寡糖经过2-氨基吖啶酮衍生后通过CE的分离度得到了提高[29-30]。CE分离所需样品量少,快速简便,分离能力强。基于简单的毛细管电泳-紫外检测方法可同时定量17种HMOs,即使在乳糖含量较高的干扰下,仍能得到较 好 分 离[31]。 激 光 诱 导 荧 光(laser-induced fluorescence,LⅠF)是CE 分离寡糖后常用的检测手段,研究使用CE-LⅠF调查了20周哺乳期中国母乳的HMOs谱,并发现Lewis阳性分泌亚群[32]。
寡糖在CE 中的迁移时间具有极高重现性,多路毛细管并用能够高通量表征HMOs[33]。相较于色谱分离30~60 min运行时间,CE分离HMOs的速度明显更快[34]。由于分析物在毛细管中的迁移率与分子尺寸和所带电荷有关,异构体容易出现共洗脱现象,例如LNT/LNnT,3'-唾液酸化乳糖(3'-sialyllactose, 3'-SL)/6'- 唾 液 酸 化 乳 糖(6'-sialyllactose,6'-SL)无法分离[35]。与其他分离技术相比,CE 的主要缺陷在于共洗脱水平突出,优化设置可在一定程度改善[36]。此外,CE 与MS在连接处存在一定困难,需要引入挥发性分离缓冲液,延长毛细管长度以接入MS 入口。Albrecht等[37]尝试将CE-LⅠF-MS在线联合,明确了母乳和婴儿粪便样本中21 个寡糖峰,由此关注HMOs 在肠道的代谢命运。不过CE 与MS 联用时,分辨率和分离时间通常都会受到影响。
分离技术与紫外/荧光检测联用为HMOs 分析提供了简便快速的方法(表1)。分离技术中不可避免的共洗脱现象,使得样品中的信号识别不明确,结合质谱法能通过离子的准确质量确定HMOs组成。分离技术与质谱的结合为HMOs混合物的分析提供了理想工具,已应用于真实样本的深入分析。
Table 1 The separation methods of human milk oligosaccharides表1 人乳寡糖分离方法
此外, 新型离子迁移谱(ion mobility spectrometry,ⅠMS)的出现,为异构体分离增添另一个维度。差异微小的异构寡糖在ⅠMS中由于碰撞界面不同,在施加电场的漂移管中以不同的漂移率实现毫秒级快速分离。迁移率与离子的碰撞截面(CCS)有关,一般离子越小、电荷越高、CCS 越小,迁移速度越快。ⅠMS-MS作为一种新型的糖化合物分析技术,使得质谱表征未知寡糖的能力更进一步,极好地补充了传统LC-MS 方法。LNH/LNnH 在行波离子迁移谱(TWⅠMS)中的[M-H]-迁移率显著不同,轻松实现基线分离[41]。新技术捕集离子迁移谱(TⅠMS)、循环离子迁移谱(cⅠMS)的出现,足以分离差异很小的异构寡糖,极大改善了ⅠMS在糖组学中的应用。TⅠMS-TOF联合已应用于实际样本中4 对异构体分离表征[42]。cⅠMS-MS 对[M+Na]+或[M-H]-离子分析,成功识别了7对HMOs异构体,实现人乳二糖和三糖中不同糖苷键类型的鉴别[43]。ⅠMS-MS虽然增强了聚糖异构体的分离能力,但是异头物分离以及复杂的迁移率曲线给异构寡糖的鉴定增加了难度。
真实样本中识别特定HMOs时,主要通过检索文献或数据库中已报道的结构进行分配,有些情况下只能获得单糖组成信息,无法明确异构体类型。然而,完整的结构解析对于研究HMOs生理功能以及理解生物合成路径十分重要。核磁共振(nuclear magnetic resonance,NMR)、MS和红外多光子解离(infrared multiple photon dissociation,ⅠRMPD)光谱是解析糖链结构的常用技术。此外,聚合度大的复杂寡糖解析起来往往有一定难度,通常需要不同技术的结合才能表征完整结构。
人乳寡糖结构解析的一个重要工具是NMR。NMR 显著优势在于没有可用标准品的情况下,通过化学位移即可解析单糖连接序列和糖苷键类型,甚至可以分辨α/β 异头构型[44]。NMR 可以在混合物中识别抗原表位等特异性的结构信息[45],但是在解析完整结构时要求样品纯度较高,需要相对大量(微摩尔量级)的寡糖,限制了其应用范围。NMR 测定时存在的谱峰重叠现象,有时无法完全表征HMOs结构。有报道在NMR添加第三个13C维度,采用3D HSQC-TOCSY 结合2D 光谱的策略解决了2D NMR中光谱重叠问题,成功分配LNDFH Ⅰ结构。Chai 等[46]将ESⅠ-MS/MS 与1H-NMR 信息结合,首次分离并鉴定了双分支的十糖核心寡糖,解决了NMR 鉴定高聚合度的分支寡糖时,因相同单糖残基信号重叠无法确定分支模式的难题,两种技术的互补实现了复杂聚糖的从头测序。
MS 具有高分辨率、高灵敏度、所需样品量少等特点,是解析HMOs 结构的主流方法。MS 解析HMOs 结构,主要是依据一级MS 中准分子离子测得的相对分子质量推测其单糖组成,并结合多级MS 中产生的碎片离子进一步分配详细的结构。Domon和Costello[47]建立的在多级MS中糖链碎片离子命名方法被沿用于HMOs,离子碎片包括糖苷键处断裂产生的B/Y离子、C/Z离子,以及糖环环内碎裂产生的A/X离子,并采用数字标记表示断裂位置。目前,基质辅助激光解析电离质谱和电喷雾电离质谱主要用于HMOs的结构表征。
3.2.1 电喷雾电离质谱
电喷雾电离质谱(electrospray ionization mass spectrometry,ESⅠ-MS)表征聚糖结构的能力十分强大,可以确定寡糖的组成和连接信息。高灵敏度ESⅠ-MS 结合碰撞诱导解离(CⅠD)仅需飞摩尔量级的未衍生寡糖就能获得碎片信息。ESⅠ正离子模式产生的碎片离子信息较少,需要多级MS才能确定完整结构[48]。已证实未衍生的中性寡糖由于其半缩醛羟基带有弱酸性,完全能够在MS中产生脱质子离子[M-H]-。ESⅠ负离子模式下[M-H]-产生丰富的碎片离子,同时较低的化学背景噪音和较少的阳离子加合物,对于结构解析极为有利。许多研究利用ESⅠ-CⅠD-MSn方法完成了HMOs标准品结构解析,总结出详细的断裂规律和特征碎片,可以判断HMOs 序列、分支点、修饰连接、糖苷键类型[49-50]。
Chai 等[51-52]在ESⅠ-CⅠD-MS/MS 负离子模式对于未衍生中性寡糖碎片进行总结,HMOs的单糖序列信息可由[M-H]-产生的一系列C 型离子推出,而A/X 离子则显示部分连接信息,如1-4 连接的GlcNAc/Glc发生0,2A环内裂解。不同类型糖苷键连接的糖环在断裂时产生的独特碎片可用于区分异构体,推导详细结构信息。例如,Glc/GalNAc 在相邻1-3 糖苷键连接时易发生C/Z 双断裂,产生特有D 型离子m/z=202、m/z=348、m/z=364(表2)。对于具有分支的中性寡糖结构,需要结合[M-H]-和[M-2H]2-两个产物离子的碎裂信息,确定分支点和完整结构。[M-H]-双断裂C2β/C3产生D2β-3碎片为1-6分支,D2β-3离子二级质谱进一步确认1-6分支结构;[M-2H]2-一级谱获得D1β-2β离子可推测1-3分支内部信息。
Table 2 Characteristic fragments of oligosaccharide isomers in the negative mode electrospray ionization表2 ESI负离子模式中寡糖异构体特征碎片
酸性HMOs中2种唾液酸的连接方式表现出不同碎裂模式。若Neu5Ac 修饰以α2-6 连接在Gal,易出现特异性的跨环断裂,产生脱羧离子0,4A2-CO2(m/z=306);唾液酸α2-3 连接则易脱羧形成B2-CO2离子,或特征D离子(m/z=493)[53-54]。相同碰撞能量条件下,同种人乳寡糖的碎裂模式具有相似性。Remoroza 等[55]使 用HⅠLⅠC 分 馏 混 合 物,通 过Orbitrap MS 对从100 位母亲乳汁中汇集的74 种HMOs结构完全表征,利用谱图匹配和混合搜索全面注释MS2子离子。LC-ESⅠ-MS2也可以采用代表特定结构的特征离子作为监测离子,增强了结构选择性,从而区分异构体类型,正确辨别分泌组[56]。
3.2.2 基质辅助激光解吸电离质谱
基质辅助激光解吸电离质谱(matrix-assisted laser desorption ionizationmass spectrometry,MALDⅠ MS)优势在于灵敏度高、速度快、动态范围宽,适合于高分子质量聚糖的检测[58]。HMOs的MALDⅠ谱图相比ESⅠ MS更为简单,通常显示为单电荷准分子离子,依据分子质量推测单糖组成可获得寡糖指纹谱。尽管在快速分析方面取得了进展,MALDⅠ MS 由于电离效率低,对结构相似的异构寡糖表征存在一定局限性。ESⅠ鉴定中性寡糖时,[M-H]-在负离子模式的碎裂提供了丰富的结构信息,但这在MALDⅠ中难以实现。不过最近有研究展示了MALDⅠ解析HMOs 结构的潜力。[M+Cl]-被证明在MALDⅠ中容易形成前体离子,其产物离子谱可用于寡糖表征[59]。此外,MALDⅠQ-TOF中[M+Na]+可作为前体离子,产生诊断离子和条件诊断离子可用于推测HMOs存在的异构体结构。MALDⅠ Q-TOF 中CⅠD 能量低,且缺少跨环碎裂,因此表征完整结构的能力有限[60]。
MALDⅠ与其他方法组合允许对鉴定到的寡糖分配唯一结构。Amano 等[61]利用MALDⅠ-QⅠTTOF MSn分析1-芘丁酰肼标记的中性寡糖,在负离子模式观察到2,4A4、D4β-3、Yα/β/γ碎片离子,帮助鉴定分支内部结构,确定岩藻糖连接方式。联合特异性外切糖苷酶,α2-岩藻糖苷酶和β4-半乳糖苷酶消化,解析了具有三分支的十糖核心HMO 完整结构,共鉴定到22 种不同数量岩藻糖修饰的十糖核心寡糖异构体。Lebrilla 等[62-64]联合多种技术开发了基于微芯片液相色谱HPLC-Chip/TOF MS平台的HMOs注释策略,构建了包括精确质量、单糖组成和保留时间的200多种HMOs注释文库。该策略被进一步扩展到傅立叶变换离子回旋共振质谱MALDⅠ-FT ⅠCR MS,采用红外多光子解离联合外切糖苷酶消化方法,确定了70 多种HMOs 的糖苷键连接和分支结构。
由于糖苷键的弱键合,B/Y、C/Z 离子是传统CⅠD碎裂时的主要碎片离子。为了获得分支和连接信息,交叉环片段对于完整的结构表征也很重要。HMOs 链在MS 中的碎裂遵循一定的断裂规律,这为高聚合度寡糖结构解析提供了思路,相似的碎裂模式可对未知寡糖从头表征。特征离子可以实现对真实母乳样本的快速分型和寡糖鉴定。必须注意的是,CⅠD碰撞中可能发生聚糖重排,往往采取全甲基化衍生防止岩藻糖重排,改善电离中不稳定的唾液酸部分,提供丰富的诊断离子。
LC-MS 作为分析HMOs 主流方法,满足了常规分析的需要,但当出现共洗脱或缺乏诊断离子的情况,依靠保留时间、前体离子和特征碎片鉴定寡糖结构会受到限制。识别寡糖异构体的另一种新型技术是ⅠRMPD 光谱,它可以在离子阱中实施,其本质可以看作是一种特殊的二级MS[65]。选定的离子经特定波长的红外线照射时才能发生共振,从而吸收多个红外光子的能量,出现结构特异性的解离[66]。根据吸收光谱的特征吸收峰可以识别物质结构,有报道使用ⅠRMPD 直接鉴定HMOs 中唾液酸的修饰类型,如α2-6 连接的唾液酸在3 600 cm-1附近有3 个吸收峰,α2-3 连接显示在3 500 cm-1附近具有最大吸收。二级MS不产生特征碎片的加钠离子也可以通过ⅠRMPD谱进行识别[67]。
低温红外光谱和ⅠMS-MS 两种技术的组合对HMOs异构体高特异性区分意义重大,即使对于在ⅠMS中漂移时间相差不大的异构寡糖,借助于其不同的振动光谱能够实现稳健的区分,已应用于现有技术特别难以区分的三糖至六糖的寡糖异构对[68]。Abikhodr 等[69]使用一组LNFP 寡糖纯品创建了小型光谱数据库。在该数据库支持下,寡糖混合物即使不能被完全分离,通过算法分解红外光谱可成功区分异构体。振动光谱利用分子的自身属性,能够高灵敏度地分辨微小结构变化。结合分离技术、机器学习方法减少扫描范围和光谱采集时间,ⅠRMPD技术进一步推动了聚糖结构的解析。
HMOs在酶促合成过程中产生巨大的结构多样性和异质性,极大地增加了结构解析的难度。多种技术手段如NMR、MS、ⅠRMPD,通过不同方式成功解析HMOs的结构,并且多种方法组合提供了解析复杂糖链结构的完整信息。其中MS方法应用最为广泛,通过耦联LC、ⅠMS 等分离方法,能够在混合物中依据生物合成规则,结合前体离子、特征离子分配HMOs结构,实现未知寡糖结构的从头表征。早期糖链结构解析完全依赖人工经验手动完成。现如今借助多种算法策略,可以实现高通量糖组 学 的MS 谱 图 解 析 工 作。 FragLib[70]、Kameyama’s Method[71]软件将实验MS 与数据库中真实谱图比对,从而报告糖链结构。此外,GlycosidⅠQ[72]、GlycoFragment/GlycoSearchMS[73]等软件可通过糖结构库搜索的方式实现寡糖结构的快速解析。
HMOs表征一直是具有挑战性的难题。随着糖组学分析技术的发展,特别是LC-MS 的应用,减轻了对于标准品的依赖,可以实现复杂基质中HMOs成分的常规分析。质谱通过断裂规律和特征离子解析糖链结构,分辨异构寡糖类型。对于HMOs快速分析和无偏测量的通用平台还有待进一步开发。虽然没有统一的分析技术,但是多技术的交叉应用可以满足不同目的的研究需要,为理解HMOs 生物学功能,探究构效关系提供技术支持。多种技术的联合进一步提升了对于异构寡糖快速分离和高特异性分析的能力,有助于探究HMOs在婴儿体内的代谢命运、肠道菌群与HMOs的联系、婴儿配方奶粉开发等问题。此外,生物MS等技术的不断进步,推动了HMOs分析向着高通量、自动化方向发展,为下一步HMOs研究提供有力帮助。