李 明,吴佩泽
(中国计量科学研究院,北京 100029)
二硫键是由多肽链内或链间的2个半胱氨酸侧链巯基(-SH)共价交联形成的一种非常重要的翻译后修饰。在生物医药领域,大多数激素、生长因子和单克隆抗体等蛋白质分子含有二硫键,其对于稳定这些蛋白质分子的空间结构、维持正确的折叠构象、保持及调节生物活性和行使生理学功能等具有重要作用。这类含二硫键的药物在合成过程中容易发生二硫键的还原和重排,这些副反应可导致非原生二硫键(nonnative disulfide bond)的形成、蛋白质的聚集,进而可能诱发免疫原性,使药物失活。因此,对多肽和蛋白质类药物中二硫键的定位和分析是生物医药领域的研究重点之一[1]。鉴于全球肽类和蛋白质类药物的迅速发展,二硫键的表征已成为生物制药安全性和有效性质量审评[2-3]中不可或缺的重要环节。
二硫键的表征主要包括构型构象(与空间结构相关的三维参数)[4]、位置或配对方式(与化学键键合相关的二维参数)的识别定位和数目的确定(一维参数)等3方面[3,5-6]。二硫键的S—S伸缩振动频率对其所处的构象非常敏感,因此可以采用拉曼光谱探测肽和蛋白质的构象特征。处于550~500 cm-1区域内的拉曼光谱吸收归因于二硫键的伸展运动,即v(S—S),所以一般对该区域内的拉曼谱带进行构象确认。确定二硫键的数目相对简单,通过比较加入还原剂完全还原前后,多肽或蛋白质的相对分子质量之差即可获得。对二硫键位置或配对方式的识别是最具挑战性的,二硫键的定位对进一步揭示蛋白质的高级结构、指导评估化学和生物学合成[6-7]都具有重要意义。
二硫键的定位方法主要包括X射线衍射晶体法[8-9]、核磁共振波谱法[8,10]、Edman降解法、质谱法等。X射线衍射晶体法利用蛋白质晶体衍射图中的二硫键间连续的电子密度情况,实现蛋白质中的二硫键定位[8];核磁共振波谱法依据形成二硫键的2个半胱氨酸间的Hα和Hβ在空间上因二硫键的存在而产生奥弗豪塞尔核效应(nuclear overhauser effect, NOE)。上述两种方法可在分子水平上提供二硫键的信息,但要求样品量很大,纯度很高。另外,X射线衍射晶体法还需依赖于高度有序的蛋白结晶。Edman降解法无法直接对含有链内二硫键和N端被封闭的多肽和蛋白质进行测序。
质谱法相对简单,对二硫键组成简单的小肽或蛋白质,如多肽序列中含有4个半胱氨酸且相邻半胱氨酸以邻接的形式两两形成二硫键的情况,可采用质谱法在保留完整二硫键的情况下直接分析,利用串联质谱的碰撞诱导解离(CID)模式在保留二硫键的情况下断裂肽骨架,通过识别特征碎片,对产物离子进行分析归属,实现二硫键的定位。但对于二硫键组成更复杂的多肽或蛋白质(如半胱氨酸结Cys knots等),大多数质谱法采用断裂二硫键的方式实现定位。根据这些方法中断裂二硫键时所处的介质可分为溶液中断裂和气相中断裂两类。在溶液断裂过程中,主要通过“湿”化学反应手段进行断裂,如基于化学试剂的氧化/还原反应断裂和基于电极反应的电化学还原断裂等,质谱在这类断裂定位方式中通常作为检测终端;而气相断裂则包括基于分子间碰撞的断裂、基于获得电子的断裂、基于吸收光子的光催化断裂和基于离子-离子反应的氧化断裂等,质谱在这类断裂定位方式中通常既作为断裂二硫键的手段和“容器”,也作为检测定位的终端。本文将根据上述不同断裂机理的分类方式和对基于质谱技术二硫键的分析方法进行综述。
基于化学试剂的还原是指通过化学试剂还原二硫键,主要涉及反应条件、还原剂以及还原后产生的自由巯基封端试剂的选择等问题。首先,碱性或中性条件下,还原反应产生的自由巯基易与原生二硫键发生交换反应形成非原生二硫键和自由巯基,导致二硫键错配,这类副反应称为二硫键交换反应,示于图1。在碱性或中性条件下,R1SH和R3SH以硫醇阴离子形式存在,当离去基团R3S-的pKa值比R1S-低时,会发生交换反应;当R3S-的pH值低于pKa值时,巯基-二硫键的交换率则随pH值降低而降低。因此,溶液pH值对巯基与二硫键交换的副反应影响较大。在碱性或中性条件下,含有自由巯基的半胱氨酸易形成巯基阴离子,从而发生二硫键交换,所以还原反应需在酸性条件下进行。传统的生化还原试剂(如β-巯基乙醇和二硫苏糖醇(DTT))能有效地还原二硫键,但不能在酸性条件下进行。这是因为β-巯基乙醇和二硫苏糖醇分子内含有自由巯基,依据巯基与二硫键间的交换反应机理,还原剂分子中的自由巯基与样品中的二硫键发生交换反应,使样品分子中的二硫键断裂而被还原,而酸性条件会抑制这类反应的发生,因此这2种还原剂只能在碱性或中性条件下使用。由于DTT一般用于二硫键完全还原的实验,无需获得二硫键成键模式,无需考虑二硫键的交换反应,因此,DTT在蛋白质组学研究中应用较多。三(2-羧乙基)膦(TCEP)[6,11]对二硫键还原反应活性强,而且几乎没有副反应。与其他还原剂相比,TCEP[3,6]和其他生化试剂有更好的兼容性,并且能在更宽的pH值范围(包括酸性条件)下使用,从而减少二硫键交换的发生。虽然TCEP不易挥发,但由于进行二硫键还原所需的浓度较低,不影响后续的质谱分析。有研究采用TCEP作为还原剂,实现了降钙素、加压素等多肽药物中结构类似物杂质的分析[12-13]。
图1 巯基-二硫键交换反应机理Fig.1 Mechanism of thiol-disulfide bond exchange reaction
由于还原反应产生的自由巯基易与二硫键发生交换反应,所以要迅速用封端试剂对自由巯基进行修饰。这样既可以保护部分还原中间体,防止上述副反应的发生,又可作为衍生化标记物,以确定多肽中半胱氨酸的存在形式。目前通常采用烷基化试剂或氰基化试剂,通过亲核取代反应产生巯基修饰产物而实现封端。在封端反应后会伴随二级质谱碎裂,根据产生的子离子来推断修饰产物的位置,进而推断二硫键的位置。
对于烷基化封端,常用的烷基化试剂[3,14]有碘乙酸(IAA)、碘代乙酰胺(IAM)和N-乙基马来酰亚胺(NEM)。研究表明[15],NEM与IAM、IAA相比,反应更快、单位摩尔自由巯基所需的试剂更少,并且在酸性条件下(pH 4.3~7.0)非常有效,更适合用作蛋白质巯基的烷化剂。基于烷基化封端的常用定位方法主要可分为轮廓比较法和部分还原法。轮廓比较法通过对2份蛋白质样品进行酶切,将其中1份酶切产物加入还原剂进行还原(通常是完全还原),再对未还原的和已还原的样品分别进行高效液相色谱(常用紫外检测器)分离,对比总离子流图(TIC),寻找含二硫键的肽段,当还原后总离子流图上的色谱峰消失,即该色谱峰所代表的肽段含有二硫键,随后对其进行烷基化封端和MS/MS分析,即可定位肽段中的二硫键[3,5]。这种方法可简单直观地确定含二硫键的肽段,但存在样品处理和实验步骤较繁琐,样品需要量较大等问题。部分还原法是部分还原蛋白质或多肽中的二硫键并烷基化,获得不同还原程度的产物,随后用质谱法分析定位二硫键。Klapoetke等[16]使用蛋白质水平上的部分还原法,完成了对人类因子Xa中12个二硫键的定位。
与二硫键的还原-烷基化方法不同,氰基化试剂在碱性条件下会发生独特的自发性化学裂解反应,这一现象可以代替二级质谱碎裂进行定位,以此发展了基于氰基化裂解的二硫键定位方法。早在1996年,Wu等[17]利用2-硝基-5-硫氰苯甲酸(NTCB)在不破坏分子中二硫键的条件下选择性地氰基化游离巯基,然后在碱性条件下,被化学修饰的半胱氨酸残基的N端肽键断裂,形成一个氨基端肽以及系列2-亚氨基噻唑-4-羧肽(ITC),再经还原剂TCEP还原后进行MALDI-TOF/TOF分析。实验成功地确定了木瓜蛋白酶、卵白蛋白等蛋白中含有自由巯基的半胱氨酸和形成二硫键的半胱氨酸的数目和位置。该方法的优势在于可以确定蛋白质分子内含自由巯基的半胱氨酸的数目和位置。因为分子内的自由巯基会与还原生成的巯基结合产生非原生二硫键,对二硫键的定位造成干扰。使用NTCB的氰基化方法可在不破坏蛋白质分子中二硫键的条件下,将自由巯基特异性封闭,有助于后续的二硫键定位分析。但由于NTCB氰基化反应以及后续的化学裂解反应是在碱性条件下进行,容易发生二硫键的交换重排,从而干扰正确的二硫键定位识别。并且,碱性环境虽有利于自由巯基作为亲核试剂进攻NTCB的氰酸酯基团产生氰基化产物,但也提高了β-消除副反应发生的概率。β-消除反应和化学裂解是竞争反应,会导致裂解碎片减少,关键碎片丢失。因此,Wu等[18]将氰基化试剂改为1-氰基-4-二甲基氨基-吡啶四氟硼酸盐(CDAP),其可在酸性缓冲液中进行衍生反应,减少二硫键交换反应和β-消除反应的发生。通过优化氰基化条件、增强断裂产物检测,该方法逐渐完善[18-19],更加简单、高效、灵敏,尤其适用于含紧密间隔或相邻半胱氨酸的蛋白质检测[6,14]。为提高对含有超过4个二硫键蛋白质的数据处理能力,Qi等[20]开发了“负标志质量算法”,通过输入氨基酸序列和质谱数据消除理论上可能存在的不合理配对方式,从而构建一种最合理的二硫键配对方式。
基于化学试剂的还原反应断裂定位分析方法是最常用的,适合分析含有相邻半胱氨酸、复杂二硫键连接方式的多肽,如半胱氨酸结(Cys knots)或半胱氨酸之间无合适酶解位点的多肽。对于二硫键数量较少的多肽,该方法具有准确可靠、分析直观方便等优点,但存在反应步骤相对繁琐,分析时间较长等问题。
硫的多价态决定了二硫键既可以被还原,也可以被氧化,相对于二硫键还原,其更易被氧化。通常采用过甲酸氧化断裂二硫键[21],过甲酸可使二硫键断裂,并进一步将半胱氨酸中的硫醇基团氧化成磺酸基(—SO3H)。该反应使半胱氨酸残基发生48 u的质量位移,在氧化断裂二硫键的同时,完成了对半胱氨酸标记衍生化,为后续的质谱检测定位二硫键提供了理论依据。相比于传统的还原-烷基化方法,二硫键的氧化具有高效、可显著增加序列覆盖率等优势[14]。Willams等[22]在过甲酸蒸气中氧化完整牛胰岛素和牛核糖核酸酶,并利用MALDI靶向分析实现二硫键定位。
除了使用化学试剂还原二硫键之外,电化学中的电极反应也可以提供还原反应所需的电子与氢离子,因此可用于定位二硫键。Cramer等[23]直接使用电化学部分还原人胰岛素和溶菌酶,随后进行MS/MS(CID模式)分析,成功实现了分子中的二硫键定位,同时确定了蛋白质的序列覆盖率。此外,还建立了LC-EC-MS平台进行在线电化学还原蛋白酶切产物,有利于表征含复杂二硫键的蛋白质。相比于传统的柱前还原法,该方法可节省样品处理时间,但还原条件有待优化。
为提高二硫键的还原效率,本课题组研制了一种成本低廉的新型电极材料——铅[24]。铅电极具有较高析氢电位、免维护(只需抛光)、操作简便、可重复使用等优势。通过对溶剂配比、流速、电压的优化,铅电极可使奥曲肽的在线还原效率达到82%。利用该方法实现了网状结构蜂毒明肽和重组人生长激素中2对二硫键的定位。
柱后还原对二硫键定位分析的实验步骤与上述几种方法存在明显差异。一般来说,前几种方法的定位步骤是先将样品水解,对含二硫键的肽段进行还原后封端衍生化,随后进入LC-MS/MS分析。而柱后还原是将蛋白样品酶切后,直接进入液相色谱柱分离后再还原,随后进行质谱分析,即还原反应在LC与MS之间进行。这种方法可以简化定位二硫键的分析流程,通过具有相同保留时间的含二硫键的肽即可进行确认。
柱后化学还原法中,在液相色谱分离后仅发生二硫键的部分还原,未还原二硫键连接的肽和还原产物具有相同的保留时间,并且均能在质谱全扫描模式下被检测。比较所有含Cys的肽段提取离子流图(EIC),同一二硫键所键连的肽段在EIC图上具有相同的保留时间[25-26],据此可快速确定二硫键的配对方式。Liu等[27]加入DTT进行在线柱后还原,实现了IgG2的二硫键定位。
基于分子间碰撞导致二硫键断裂的质谱碎裂方式主要有碰撞诱导解离(CID)和高能碰撞解离(HCD),二者都属于“慢热技术”。基于振动激发模型,通过碰撞或高能碰撞吸收能量,发生分子内振动能量重新分布,经历多态过程发生断裂解离。
碰撞诱导解离是一种经历多态的过程,当分子内能在各自由度重新分布之后发生解离。在碰撞池或离子阱中,母离子和惰性气体(如He、N2等)发生中性碰撞使振动能量活化,从而断裂化学键。这种通过振动激发导致键断裂的方式,一般优先引起蛋白质或肽骨架断裂,而不会导致二硫键断裂。在正、负离子模式下,碰撞能较大或富含精氨酸的多肽的CID谱图中可以观察到由二硫键断裂产生的离子,如S—S或C—S键断裂产生的含半胱氨酸残基、半胱氨酸硫代醛(-2 u)、半胱氨酸二硫化物(+32 u)或脱氢丙氨酸(-34 u)的b/y离子[5,28]。对于二硫键成键模式较简单的、分子质量较小的肽,尤其是其氨基酸序列中含有近邻的脯氨酸难以产生c/z离子,也可使用CID来定位二硫键[29]。此外,引入金离子可促进二硫键在CID中的断裂,进而产生更丰富的序列信息[30]。向多肽溶液中加入甲醇,在紫外光照射下甲醇与二硫键反应产生甲氧基加合物特征离子,随后采用CID碎裂,也可实现二硫键的定位[31]。
高能碰撞解离(HCD)也可用于表征二硫键[32],其碎裂方式与CID相似,会产生b/y离子,并且可以使二硫键断裂产生系列特征离子,提供定位二硫键的有效信息。董梦秋等[32]利用HCD碎裂二硫键产生的特征离子,通过pLink-SS软件分析了HCD的肽谱图,精确定位了单克隆抗体IgG2b和10个标准蛋白中的所有二硫键。
基于获得电子导致二硫键断裂的质谱碎裂方式主要有电子捕获解离(ECD)和电子转移解离(ETD),这两种方式为非遍历性过程,即断裂发生在分子内能在各自由度的重新分布之前。
ECD是由多电荷多肽正离子与低能电子发生反应产生奇电子多肽正离子,随后在飞秒内进行重排和碎裂产生c和z离子。ETD是ECD进一步的发展,是由电子亲和力足够低的负离子作为电子供体,通过将电子转移给多肽离子从而触发氢自由基的释放。释放的氢自由基可以结合到多肽骨架的羧基基团,导致肽链N-Cα键发生断裂产生c和z离子。对于二硫键分析,在ECD和ETD中会同时发生二硫键和多肽骨架的断裂,其中二硫键断裂为主要裂解途径,这是因为二硫键对氢自由基的亲和能较大,在含二硫键的多肽中,氢自由基会优先加成在二硫键上,使二硫键还原断裂,其次引起骨架断裂[33]。基于这一特点,ECD和ETD不仅可得到丰富的序列信息,也可提供二硫键断裂信息以实现二硫键定位。Clark等[34]将含有半胱氨酸肽段的提取离子色谱图与ETD结合,实现了重组HIV包膜蛋白gp120中的二硫键定位。Massonnet等[35]将离子淌度与CID结合,表征ETD断裂后的产物,实现了多肽中2个二硫键的定位。
此外,基于ETD和HCD综合技术的电子转移高能碰撞解离(EThcD)在表征二硫键领域取得了一些进展[36]。作为新兴的双重质谱碎裂技术,EThcD先进行ETD使多肽离子中的二硫键断裂并产生c/z离子,然后将所得离子进行HCD,从而获得b/y和c/z离子的混合物。EThcD技术可以通过支持ETD技术的LTQ线性离子阱串联轨道阱质谱仪实现,其所产生的离子结合了ETD和CID中的碎片离子,比ETD效果好[5]。Liu等[36]通过胃蛋白酶酶切结合SlinkS搜索引擎,可直接鉴定EThcD断裂产物,含二硫键的多肽在EThcD裂解中优先断裂S—S键,随后诱导肽骨架断裂。SlinkS通过将EThcD产物离子与线性肽数据库比对,提供二硫键断裂产生的肽段的精确单同位素质量和序列,从而实现二硫键分析。
有报道表明[37],在负离子模式下,基于电子脱离机理的电子脱离解离(EDD)技术分析含二硫键的肽时,优先断裂C—S和S—S键,是一种二硫键定位新方法。在EDD中,前体离子被大于10 eV的电子辐照,导致电子脱离并碎裂。
基于吸收光子能量导致二硫键断裂的质谱碎裂方式主要有基质辅助激光解吸电离源内衰变(MALDI-ISD)、紫外光解离(UVPD),需要指出的是,MALDI-ISD导致的二硫键断裂实际发生在固相基质结晶处。
MALDI-ISD具有样品用量少、检测快速、耐较高浓度缓冲液和盐等杂质的优点[6],对定位二硫键具有非常大的应用价值。MALDI-ISD在激光照射后几百纳秒内发生,其发生过程受激光能量密度和基质的影响[14,38]。MALDI-ISD可由氧化性基质和还原性基质引发,但通常用于二硫键定位的为还原性基质,因为氧化性基质在正离子模式下一般不会引起二硫键的断裂。当采用还原性基质时,由基质向肽段转移氢自由基引发[38-40],类似ECD/ETD中的热氢自由基附着机理,氢自由基结合到多肽骨架的羰基基团,导致肽链N—Cα键发生断裂,产生c和z离子。此过程发生在基质结晶处,为整个ISD的速控步[41]。在含二硫键的多肽和蛋白质的ISD谱图中,可以发现二硫键还原的产物离子,这是由于二硫键对氢自由基的亲和能较大,氢自由基会优先加在二硫键上,发生二硫键的还原断裂,其次引起骨架断裂[40-41]。同时,在MALDI气相卷流中,会产生基质与还原肽段的加合物离子峰[42-43],且信号较强。基于骨架断裂和二硫键还原产生的特征离子(包括加合物离子),MALDI-ISD在二硫键的定位表征中发挥着重要作用。基质对MALDI-ISD还原影响显著,有研究表明[44],常用基质的供氢能力顺序为:1,5-二氨基萘(1,5-DAN)>5-氨基水杨酸(5-ASA)>2,5-二羟基苯甲酸(2,5-DHB)>水杨酸(SA)≈α-氰基-4-羟基肉桂酸(CHCA)。
为避免有机基质对谱图的干扰,可以使用还原性无机基质还原二硫键。Qiao等[45]采用TiO2修饰的不锈钢靶板,以葡萄糖作为空穴清除剂和质子供体,在激光解吸电离过程中发生光催化反应,实现了二硫键的源内还原。在激光作用下,纳米TiO2颗粒吸收光子使价带的电子受激跃迁至导带而产生电子-空穴对。葡萄糖提供质子,二硫键捕获被激发到导带的电子和葡萄糖氧化产生的质子被还原。由于TiO2层与样品的共晶是分离的,使样品不能获得较好的分散,因此该方法的分辨率有待提高。虽然该体系目前应用较少,但随着新基质材料的开发,将有助于二硫键分析甚至蛋白质组学研究。
近年来,发展了一种光致断裂二硫键的新方式,即紫外光解离(UVPD)[46]。通过选择适当激光波长使样品本身含有的官能团或化学键吸收相应波数的激光能量,使得样品分子跃迁到激发态,并发生不同特定断裂途径的解离。该方式需要一种能够使来自激光束或高强度光源的光子束与所选离子交叉的装置,一般需要光源和可以装载所选离子的“容器”2个要素。光源一般采用Nd:YAG激光器、准分子(excimer)和光学参量振荡器(OPO):YAG激光器[46];选择质谱的质量分析器(如傅里叶变换离子回旋共振、三维四极离子阱、二维线性离子阱)就可以满足装载所选离子的“容器”。使用UVPD分析多肽或蛋白质时,可产生a/x、b/y、c/z系列离子,同时可直接断裂S—S和C—S键。这不仅有利于增加序列覆盖率,而且可以实现二硫键定位。Agarwal等[47]首次将UVPD应用于生物大分子分析,蛋白质酶切产物经HPLC分离后进入MS,采用4次谐波激光脉冲(266 nm)照射线性离子阱中多肽离子,发现UVPD可在保留磷酸化修饰的同时,选择性地仅断裂酶切产物中的二硫键。Montana等[48]利用193 nm的UVPD表征了溶菌酶中的4个二硫键和血清转铁蛋白中的19个二硫键。另外,UVPD也可通过电喷雾离子源实现,即采用ESI电喷雾离子化时,使用低压汞灯(LP-Hg lamp)产生紫外光,对喷雾进行照射。这里的紫外光照射发生在离子源中而非质量分析器。Durand等[31]在多肽溶液中加入甲醇,通过此方法,在低压汞灯产生254 nm紫外光照射激发下,二硫键因甲醇的亲核进攻发生选择性断裂。在其中一个半胱氨酸残基上形成亚磺酸甲酯(—SOCH3)标记,在另一个半胱氨酸残基上形成硫醇(—SH)。
红外多光子解离(IRMPD)也是一种潜在的二硫键分析手段,同样属于“慢热技术”。基于振动激发模型,通过红外光照射被分析物(如离子化的多肽等),多肽中的肽键、二硫键等化学键吸收多个红外光子的能量发生分子内振动,能量重新分布,经历多态过程后发生断裂解离,产生类似CID的b/y系列离子。但IRMPD并没有CID的低质量端质量截止效应,因此可产生较丰富的序列信息。Kalli等[37]对含有3个二硫键的胰岛素进行研究,发现IRMPD可特异性断裂肽阴离子中的S—S和C—S键。
不同质谱碎裂技术断裂二硫键产生的特征离子列于表1。
表1 不同质谱碎裂技术断裂二硫键产生的特征离子Table 1 Characteristic ions produced by different mass spectrometry fragmentation techniques by breaking disulfide bonds
气相离子/离子反应也可以被用于二硫键的定位分析[49]。本课题组采用自主研发的离子/离子反应装置,利用高碘酸根负离子与多肽正离子的气相反应,实现了分子内和分子间二硫键的氧化断裂及定位分析[50]。
本文总结了基于质谱技术对蛋白质中二硫键的分析方法,根据断裂二硫键所处介质和断裂机理进行定位方法的综述。对于定位二硫键研究领域,仍然存在诸多挑战:对含多个二硫键的短肽,很难准确测量二硫键的配对方式。例如,对于含有4个二硫键,8个半胱氨酸的铁调素,其理论所产生的可能二硫键配对方式多达105种[51]。此外,即使对仅含2个二硫键的多肽,但二硫键成键顺序的不同,也将影响多肽的空间结构,进而影响其功能。对二硫键成键顺序的研究是该领域面临的另一重要挑战。另外,UVPD和离子-离子反应质谱仪等仍处于实验室方法开发阶段,有待进一步完善,尚不能广泛服务于制药、蛋白质组学等领域。在方法学研究方面,未来发展方向将以质谱结合强大的数据处理工具进行“自上而下”的分析策略为主流。同时,“自下而上”的分析策略中,随着新的电离方式和碎裂方式的开发,可能出现新的特征离子以及相应的数据处理工具,必将对这一领域产生重要影响。