范学海 朱颐申 陈兰婷 李文惠 韦萍
(南京工业大学生物与制药工程学院,南京 211816)
液质联用在多肽及蛋白质定性方面的研究进展
范学海 朱颐申 陈兰婷 李文惠 韦萍
(南京工业大学生物与制药工程学院,南京 211816)
随着液质联用技术的不断发展,液相色谱—质谱联用系统广泛应用于药物分析、食品分析、环境分析等多方面,该技术将液相色谱的高分离能力与质谱强大的结构鉴定功能相结合,具备了高分离度、高灵敏度、高选择性以及提供丰富结构信息等一系列优点。这些优点决定了液相色谱—质谱联用系统将在越来越多地相关领域得到应用,尤其是近年来在生物大分子方面开展了大量研究,结合这些研究对液质联用技术在多肽及蛋白质定性方面进行了系统归纳。
液质联用(LC-MS) 多肽和蛋白质 定性分析
多肽及蛋白类药物自20世纪90年代初应用于临床以来,经过20多年的发展已经在全球医药市场上广泛使用,如治疗糖尿病的胰岛素,2009年国内的销售额就已超过10亿元。
多肽和蛋白质属于生物大分子,其分析难点在于肽段离子化过程中就发生碎裂而无法检测。1966年,Muson等[1]提出了一种软电离方法——化学电离技术(Chemical ionisation,CI),软电离技术的出现使高精密度分析生物大分子结构成为可能。1981年,Morris等[2]发展了快原子轰击技术(Fast atom bombardment,FAB),使质谱能用于分析包括多肽及蛋白在内的高极性、难挥发和热不稳定样品。1988年,Tanaka等[3]发明了基质辅助激光解析电离技术(Matrix assisted laser desorption ionisation,MALDI),使生物大分子的相对分子质量可测得值高达25 kD。Fenn[4]于1989年提出的电喷雾离子化(Electrospray ionisition,ESI)技术大大推动了多肽及蛋白质化学的发展,使得液相色谱-质谱联用(Liquid chromatography-mass spectrometry,LC-MS)研究生物大分子成为可能,Fenn也于2002年因该贡献获得了诺贝尔化学奖。此后质谱技术飞速发展,已成为目前最热点的分析手段之一。
LC-MS技术结合了LC的高分离能力和MS的高选择性、高灵敏度,使其在生物大分子分析方面更加快速、准确。目前最为广泛应用的是LC-ESI-MS,本文重点讨论LC-ESI-MS方法在多肽及蛋白质定性
方面的研究应用。
ESI过程第一步是在喷雾毛细管管口加一高电压,作用于经毛细管进入离子化室的溶液,将3-6 kV 的电压加到毛细管和对应的电极之间,电压导致毛细管末端液滴表面的电荷增加,高电压导致液体表面分裂和形成多电荷液滴,与毛细管对应的电极携带的正电荷或负电荷以产生正电荷或负电荷液滴。因此ESI可分为正离子和负离子两类。随后的离子化过程是进行质谱分析的关键步骤。带电液滴形成分子离子的机理有两种假设,分别是离子蒸发假设机理和带电残基假设机理。Iribane 和 Thomson[5]提出了离子蒸发假设机理,该机理认为:带电溶液在电场作用下向带相反电荷的电极运动,并形成带电液滴,由于小雾滴分散,比表面积增大,溶剂在电场中迅速蒸发,结果带电雾滴表面单位面积的场强高达108,从而产生液滴的“爆裂”,重复这一过程,最终产生分子离子。而Schmelzeisen-Redeker和Röllgen 等[6]提出了带电残基假设机理:处于毛细管尖端的极性溶液液滴在强电场中积累电荷,带电的雾滴在电场作用下运动,由于溶剂迅速蒸发,库伦斥力大于表面张力导致液滴破裂成较小液滴,再蒸发溶剂,液滴再破裂,溶液中分子所带电荷在去溶剂化时被保留在分子上形成离子化分子,最终形成气相离子。
多肽或蛋白质通过LC分离时能在强电场作用下部分质子化,也能经气相分子离子反应,在 ESI腔内形成[M+H]+,[M+2H]2+,[M+ 3H]3+,……,[M+nH]n+等一系列电荷离子。由于多肽或蛋白质中含有较多的碱性氨基酸(Arg,Lys和末端NH2),在酸性溶液中更容易质子化,因此多肽或蛋白质在ESI中多数情况下是以正离子方式进行。测定时只要适当提高溶液的酸度,如加入甲酸或乙酸增大离子化效率便可以提高灵敏度,得到理想的测定结果。不同的多肽或蛋白质质子化的程度各异,容易发生质子化的多肽或蛋白质可以获得更好的灵敏度。
LC-ESI-MS对多肽及蛋白质可进行多种定性分析,如分析准确的相对分子质量、一级结构序列、二硫键位置等。对于侧链糖基、磷酸盐、硫酸盐等多肽及蛋白质,还能测定取代基的结构和位置。
2.1 多肽及蛋白质相对分子质量的测定
多肽及蛋白质的相对分子质量是分析检测的一个重要参数,目前常规测定多肽及蛋白质相对分子质量的方法有很多,包括凯氏定氮法、渗透压法、光散射法、考马斯亮蓝法和凝胶过滤等。但这些方法操作复杂,灵敏度低,使测得的相对分子质量不准确。ESI-MS测定多肽及蛋白质相对分子质量优点在于:准确性好、易于操作及灵敏度高。
ESI测定多肽及蛋白等生物大分子的相对分子质量主要原因是在电喷雾过程中能形成稳定多重电荷离子,这样就使得单电荷质量范围为0.05-3 kD的质谱仪可以测定高达几百kD的相对分子质量,而这是过去的接口技术无法做到的。据报道,75 kD相对分子质量以内化合物的准确度可达到5×10-6,即使是复杂的蛋白质混和物,经LC-ESI-MS测定也能得到令人满意的结果。
李萌等[7]利用LC-ESI-MS技术分析了重组抗肿瘤抗病毒蛋白(乐复能),测得的相对分子质量为19.311 63 kD,与理论相对分子质量(19.311 27 kD)的相对误差为0.2 ×10-6。
Kou 等[8]从鸡豆白蛋白的水解产物中分离纯化出了抗氧化多肽——Cpe-Ⅲ,并与水解产物中其他肽类比较,结果表明Cpe-Ⅲ表现出了最高的抗氧化能力,利用LC-ESI-MS对Cpe-Ⅲ进行鉴定,确定其相对分子质量为1.155 kD,为十肽化合物RQSHFANAQP。
Wang等[9]用木瓜蛋白酶、碱性蛋白酶、胰蛋白酶将芝麻蛋白进行酶解,其中胰蛋白酶酶解的产物最容易进行金属螯合。用锌离子固定金属亲和色谱法(Immobilized metal affinity chromatography,IMAC)对其进行处理,从水解产物中分离得到6个容易与锌离子螯合的多肽,最后用LC-ESI-MS 对其进行结构鉴定分析,结果表明,6个多肽的相对分子量与理论值相符,Ser-Met二肽的相对分子量为0.236 kD,Leu-Ala-Asn三肽的相对分子量为0.316 kD,Ile-Ala-Asn三肽的相对分子量为0.316 kD,Arg-Lys-Arg三肽的相对分子量为0.458 kD,Arg-Gln-
Arg三肽的相对分子量为0.458 kD,Asn-Cys-Ser三肽的相对分子量为0.322 kD。
2.2 多肽及蛋白质一级结构的测定
在20世纪50年代,Edman降解是氨基酸测序的唯一选择,后来又发明了自动测序仪,但这些方法存在很多缺点:速度慢;需高纯度的蛋白质样品;需自由的氨基端。由于基因组学、蛋白质组学研究的深入开展,大量的功能蛋白迫切需要快速准确的测定蛋白质序列的技术。经过几十年的探索及发展,LC-ESI-MS在多肽及蛋白质测序方面已经成熟完善。
LC-ESI-MS/MS在多肽及蛋白质测序方面广泛应用:LC高效分离样品后通过ESI离子化,多肽的分子离子进入质谱得到分子离子峰和一系列碎片离子,经过解析得到肽段序列。李响等[10]分别采用四级杆-飞行时间串联质谱( Quadrupole time-of-flight tandem mass spectrometry, Q-TOF-MS)和离子阱串联质谱(ion trap tandem mass spectrometry,Ion-Trap-MS)技术测得了融合蛋白FP3的一级结构,通过胰蛋白酶酶解蛋白并除去多肽混合物中糖肽的糖基后,将脱糖多肽进行LC-ESI-MS/MS分析,运用Q-TOF和Ion-Trap两种串联质谱进行测定,结果表明通过LCESI-Q-TOF-MS测定完成了融合蛋白FP3的76%的氨基酸序列,随后采用高灵敏度的Ion-Trap串联质谱进行测序,进一步补充了Q-TOF串联质谱未检出的24%序列。
多酶酶解能更充分地酶解蛋白,与单酶酶解相比,可以提高LC-ESI-MS对蛋白的鉴定能力。Chen等[11]应用胰蛋白酶、胃蛋白酶、嗜热菌蛋白酶对人肝脏组织分别酶解,通过糖蛋白质组学分析发现,3种酶酶解能够发现单酶酶解所未发现的位点,能够获得更多肽段信息,还可提高蛋白鉴定时氨基酸序列覆盖率。苗兰等[12]采用胰蛋白酶和V8 酶分别酶解牛血清白蛋白(BSA)、大肠杆菌及复杂血清样品,与单酶酶解比较,双酶酶解的蛋白总发现率增加了11%,蛋白总覆盖率增加了10%以上。
经过LC-ESI-MS的分析,能得到大量肽段信息,目前有以下两种方法对这些信息进行分析:数据库检索法和从头测序法(de novo),从而准确的鉴定多肽及蛋白质的一级结构。
数据库检索法鉴定蛋白的一级结构:酶解后的蛋白片段通过质谱精确测定了每个肽段的相对分子质量,通过与数据库中已知蛋白的理论酶解肽段相对分子质量比较从而鉴定蛋白结构,数据库检索结果强烈依赖于数据库中所收录的蛋白质序列以及搜索引擎的算法。例如数据库中不存在相应的序列则无法鉴定出相应的蛋白质,而数据库过于庞大则蛋白鉴定的概率会降低,因此选择适合的蛋白数据库尤为重要;常用的搜索引擎有 Mascot[13]、Sequest[14]、X!Tandem[15]等,生物资源设施协会(The Association of Biomolecular Resource Facilities,ABRF)在2010年的蛋白质组研究工作中,采用了多种搜索引擎来鉴定蛋白结构,其中采用Mascot的实验室占55%,Sequest占21%,X!Tandem占3%,其他的一些搜索引擎占21%。该研究表明,Mascot和Sequest是最常用的搜索引擎。Fernández等[16]采用胰蛋白酶酶解β-乳球蛋白,利用LC-ESI-MS技术测定酶解多肽的一级结构并进行MASCOT数据分析,在NCBInr 201011数据库中进行搜索,结果表明测得的β-乳球蛋白的氨基酸序列覆盖率达到85.8%。
从头测序方法不依赖现有的数据库,根据肽段规律裂解的特点,直接从裂解图谱中推导出肽段的序列,具有数据库搜索方法不可替代的优势,其基本步骤包括:质谱图的构建,离子类型的确定和测序算法。Zhou等[17]从海参刺参蛋白中提炼出抗氧化蛋白——TP2b-1,利用LC-ESI-MS进行鉴定其氨基酸序列,结合从头测序方法并利用BioLynx分析软件进行分析,结果表明TP2b-1的氨基酸序列为GPEPTGPTGAPWLR。
2.3 翻译后修饰(post-translational modifications,PTMs)多肽及蛋白质的结构分析
蛋白质的功能是多种多样的,PTMs使得蛋白质的功能更加丰富,对蛋白质的功能和结构产生巨大影响。目前已报道了约200多种PTMs类型,如糖基化[18]、磷酸化[19]、乙酰化[20]、甲基化[21]等,最受关注的是糖基化修饰和磷酸化修饰。LC-ESI-MS在PTMs分析方面主要解决以下两个问题:(1)修饰基团的类型;(2)修饰位点、数量。
蛋白质的糖基化修饰是低聚糖以糖苷的形式与
蛋白上特定的氨基酸残基形成共价结合。Hua等[22]利用非特异性蛋白酶水解糖蛋白,通过LC-ESI-MS分析得到在牛核糖核酸酶B上有一个N-糖基化位点——第60位天冬氨酸,连接13条糖链;在牛乳铁蛋白上有5个N-糖基化位点——第252、200、387、495和564位天冬氨酸,共连接59条糖链;在牛κ-酪蛋白上有4个O-糖基化位点——第142、152、154和163位苏氨酸,共连接20条糖链,糖蛋白上糖链结构的改变能够体现特定的生理或病理状态改变。Wang等[23]利用胰蛋白酶水解HurecA1PI,酶解后在含有PNGase F的37 H2O18中放置16 h,进行同位素标记,然后进行LC-ESI-MS 分析,结合PNGase F的催化作用以及同位素标记,得出了Hu-recA1PI含有3个N-糖基化位点,分别为第46位的Asn——连接双链聚糖,有一部分三链聚糖以及极少的四链聚糖;第83位的Asn——连接三链以及四链聚糖;第247位的Asn——连接二链聚糖。
蛋白质的磷酸化修饰是通过蛋白质磷酸化激酶将ATP的磷酸基转移到蛋白的特定位点上的过程,磷酸化修饰的作用位点为蛋白上的Ser、Thr和Tyr残基。Zhu等[24]利用LC-ESI-MS分析了酪蛋白磷酸化多肽(CPPs),考察了β-CN f1-25 4P上的丝氨酸磷酸化在酪蛋白磷酸化多肽水解过程中的稳定性,试验研究了温度在75℃时,pH分别为6、7、8时丝氨酸磷酸化的稳定性,结果表明pH7时其稳定性较好,同时发现温度和pH是影响磷酸化修饰稳定性的两个重要因素。Zhu等[25]在此基础上利用钙聚集、乙醇沉淀和镓离子IMAC富集CPPs,然后进行LC-ESI-MS分析鉴定CPPs,结果表明镓离子IMAC结合钙聚集和乙醇沉淀是富集CPPs的有效方法,该实验得出的结论对产业化生产CPPs和CPPs产品的质量控制有很大帮助。
2.4 蛋白质分子内二硫键的定位
许多蛋白质内部都是通过二硫键形成稳定的空间结构,如人胰岛素含有两个二硫键。二硫键位置为研究蛋白立体结构与催化活性之间的关系提供了依据,已有很多学者将LC-ESI-MS技术应用于二硫键定位。Chen等[26]在研究蛋白质的剪接作用时,利用LC-ESI-MS技术检测到在极端嗜热菌PolⅡ中的蛋白质剪接过程中存在着分子内二硫键的作用,结果表明二硫键的位置存在于第7位的Cys和第192位的Cys之间,该分子内二硫键阻碍了蛋白质的剪接作用。Krudysz-Amblo等[27]分析了一种含有两个二硫键的跨膜蛋白——组织因子(Tissue factor,TF),利用LC-ESI-MS技术测定了TF的一级结构,结果表明两个二硫键分别位于Cys49-Cys57,Cys186-Cys209。Li等[28]利用LC-ESI-MS技术测定出溶解酵素中二硫键的位置及其数量,溶解酵素经过胰蛋白酶酶解,通过LC的分离找到含有Cys的肽段,再经过MS以及MS/MS的数据分析,结果表明溶解酵素中含有4个二硫键,位置分别为Cys24-Cys146、Cys48-Cys134、Cys83-Cys99和Cys95-Cys113。
ESI接口拓展了LC-MS在生物大分子方面尤其是在多肽及蛋白质方面的应用,LC-ESI-MS现已发展成为分析蛋白质的常规工具。随着基因重组技术和蛋白表达技术的日益成熟,生物技术产品的大规模工业化生产技术也在不断完善和发展。各种各样的重组类蛋白药物层出不穷,但这些蛋白药物因其一级结构、PTMs、二硫键位置的不同而引起空间结构的变化,进而引起生物活性的差异,因此对其定性的研究显得尤为重要。科学、有效、快捷的鉴定方法是发展趋势,LC-ESI-MS因其灵敏、准确、快速的特点,将在各类多肽及蛋白药物的定性方面发挥重要作用。
[1] Munson M, Field F. Chemical ionization mass spectrometry. I. General introduction[J]. Journal of the American Chemical Society, 1966, 88(12):2621-2630.
[2] Morris HR, Panico M, Barber M, et al. Fast atom bombardment:A new mass spectrometric method for peptide sequence analysis[J]. Biochem Biophysi Res Commun, 1981, 101(2):623-631.
[3] Tanaka K, Waki H, Ido Y, et al. Protein and polymer analyses up to m/z 100 000 by laser ionization time-of-flight mass spectrometry[J]. Rapid Commun Mass Spectrom, 1988, 2(8):151-153.
[4] Fenn JB, Mann M, Meng CK, et al. Electrospray ionization for mass spectrometry of large biomolecules[J]. Science(New York,
NY), 1989, 246(4926):64-71.
[5] Iribarne J, Thomson B. On the evaporation of small ions from charged droplets[J]. J Chem Phys, 1976, 64(6):2287-2295.
[6] Schmelzeisen-Redeker G, Bütfering L, Röllgen F. Desolvation of ions and molecules in thermospray mass spectrometry[J]. Int J Mass Spectrom, 1989, 90(2):139-150.
[7] 李萌, 裴德宁, 陶磊, 等. 液质联用法分析重组抗肿瘤抗病毒蛋白的一级结构[J]. 中国生物制品学杂志, 2012, 24(12):1473-1476.
[8] Kou X, Gao J, Xue Z, et al. Purification and identification of antioxidant peptides from chickpea(Cicer arietinumL.)albumin hydrolysates[J]. LWT-Food Science and Technology, 2013, 50(2):591-598.
[9] Wang C, Li B, Ao J. Separation and identification of Zinc-chelating peptides from Sesame protein hydrolysate using IMAC-Zn2+and LCMS/MS[J]. Food Chemistry, 2012, 134(2):1231-1238.
[10] 李响, 高向东, 陶磊, 等. LC-MS/MS 法对融合蛋白 FP3 的氨基酸全序列测定[J]. 药学学报, 2012, 47(2):216-222.
[11] Chen R, Jiang X, Sun D, et al. Glycoproteomics analysis of human liver tissue by combination of multiple enzyme digestion and hydrazide chemistry[J]. J Proteome Res, 2009, 8(2):651-661.
[12] 苗兰, 孙明谦, 林雪, 等. 非标记液相色谱 -质谱联用蛋白组学并行分析策略研究[J]. 分析化学, 2011, 39:1021-1026.
[13] Lenney W, Perry S, Price D. Clinical trials and tribulations:the MASCOT study[J]. Thorax, 2011, 66(6):457-458.
[14] Diament B, Noble WS. Faster sequest searching for peptide identification from tandem mass spectra[J]. Journal of Proteome Research, 2011, 10(9):3871-3879.
[15] Vaudel M, Barsnes H, Berven FS, et al. SearchGUI:An opensource graphical user interface for simultaneous OMSSA and X!Tandem searches[J]. Proteomics, 2011, 11:996-999.
[16] Fernández A, Suárez A, Zhu Y, et al. Membrane fractionation of a β-lactoglobulin tryptic digest:Effect of the pH[J]. Journal of Food Engineering, 2013, 114(1):83-89.
[17] Zhou X, Wang C, Jiang A. Antioxidant peptides isolated from sea cucumberStichopus Japonicus[J]. European Food Research and Technology, 2012, 234(3):441-447.
[18] Vermassen T, Speeckaert MM, Lumen N, et al. Glycosylation of prostate specific antigen and its potential diagnostic applications[J]. Clinica Chimica Acta, 2012, 413(19-20):1500-1505.
[19] Lam MPY, Scruggs SB, Kim TY, et al. An MRM-based workflow for quantifying cardiac mitochondrial protein phosphorylation in murine and human tissue[J]. J Proteomics, 2012, 75:4602-4609.
[20] Šustáčková G, Kozubek S, Stixová L, et al. Acetylation-dependent nuclear arrangement and recruitment of BMI1 protein to UV-damaged chromatin[J]. Journal of Cellular Physiology, 2012, 227(5):1838-1850.
[21] He Y, Korboukh I, Jin J, et al. Targeting protein lysine methylation and demethylation in cancers[J]. Acta Biochimica et Biophysica Sinica, 2012, 44(1):70-79.
[22] Hua S, Nwosu C, Strum J, et al. Site-specific protein glycosylation analysis with glycan isomer differentiation[J]. Analytical and Bioanalytical Chemistry, 2012, 403(5):1291-1302.
[23] Wang Z, Hilder TL, van der Drift K, et al. Structural characterization of recombinant alpha-1-antitrypsin expressed in a human cell line[J]. Anal Biochem, 2013, 437(1):20-28.
[24] Zhu YS, FitzGerald RJ. Direct nanoHPLC-ESI-QTOF MS/MS analysis of tryptic caseinophosphopeptides[J]. Food Chemistry, 2010, 123(3):753-759.
[25] Zhu YS, FitzGerald RJ. Caseinophosphopeptide enrichment and identification[J]. International Journal of Food Science & Technology, 2012, 47(10):2235-2242.
[26] Chen W, Li L, Du Z, et al. Intramolecular disulfide bond between catalytic cysteines in an intein precursor[J]. Journal of the American Chemical Society, 2012, 134(5):2500-2503.
[27] Krudysz-Amblo J, Jennings II ME, Knight T, et al. Disulfide reduction abolishes tissue factor cofactor function[J]. Biochim Biophys Acta, 2013, 1830(6):3489-3496.
[28] Li X, Xu W, Paporello B, et al. Liquid chromatography and mass spectrometry with post-column partial reduction for the analysis of native and scrambled disulfide bonds[J]. Analytical Biochemistry, 2013, 439(2):184-186.
(责任编辑 狄艳红)
Applications of Liquid Chromatography-Mass Spectrometry in the Qualitative Analysis of Peptides and Proteins
Fan Xuehai Zhu Yishen Chen Lanting Li Wenhui Wei Ping
(The College of Biotechnology and Pharmaceutical Engineering,Nanjing University of Technology,Nanjing 211816)
With liquid chromatography-mass spectrometry(LC-MS)technology developing continuously, the system of LC-MS is widely used in pharmaceutical analysis, food analysis, environmental analysis and related fields. LC-MS provides powerful function of structure identification, which includes the ability of separation by LC and the advantages of high resolution, high sensitivity, high selectivity by MS. These advantages demonstrate that LC-MS will be applied in more related fields. In recent years, many researches were carried out in the identification of biological macromolecules by LC-MS. The analysis of peptide and protein qualitatively by LC-MS is reviewed.
Liquid chromatography-mass spectrometry(LC-MS) Peptides and proteins Qualitative analysis
2013-10-23
江苏高校优势学科建设工程资助项目
范学海,男,硕士研究生,研究方向:多肽合成及其分析;E-mail:fxh19890119@163.com
朱颐申,男,副教授,硕士生导师,研究方向:多肽合成、分析及制剂;E-mail:zhuyish@njtech.edu.cn