李 娜 蔡潭溪 杨福全**
(1)中国科学院生物物理研究所,北京 100101;2)中国科学院大学,北京 100049)
低分子量蛋白与多肽(low molecular weight proteins and peptides,LMWPs)通常指复杂生物样本中分子质量≤30 ku 的所有蛋白质及多肽,也被称作多肽组。LMWPs 是继基因组、转录组及蛋白质组之后,更复杂的一种分子组合,造成其复杂程度如此高的原因主要有:a.体内具有多种蛋白酶(超过550种)[1];b.底物多样性,即同种酶有多种底物;c.体内存在多种蛋白酶抑制剂和激活剂。在庞大的蛋白酶调节网络中,体内上百万的蛋白质变体(proteoforms)可产生数量巨大的酶解产物[2]。血浆作为循环系统的一部分,不仅可以协助细胞、组织或器官之间进行物质交换,还可以携带大量来源不同的多肽、蛋白质及其降解物等,而LMWPs以其分子质量较小的优势,可通过血脑屏障、肿瘤等从组织或病灶进入血浆。与血浆蛋白相比,LMWPs 的组成或丰度差异与疾病的相关性更强[3]。因此,血浆LMWPs 可用于病理生理的探究、生物标志物的挖掘、治疗靶点的发现等。此外,通过血浆LMWPs也可以发现新的分子并进一步探究其功能,例如新型活性肽[4]以及小开放阅读框编码的多肽(sORF‑encoded peptides,SEPs)。本文立足于当前的研究热点,综述LMWPs的分类(图1)及其应用,以期为血浆LMWPs的研究与发展提供参考。
血浆中常见的完整小蛋白包括激素、白介素、趋化因子、生长因子和干扰素等,它们可参与调控细胞生长、增殖、分化、炎症、组织修复和免疫反应等多种重要生物学过程,在肿瘤治疗[5]、造血功能障碍[6]、自身免疫性疾病[7]等方面具有广阔的应用前景。近年来,完整小蛋白的研究热点是表征样本中的蛋白质变体,即来自同一基因所有形式的蛋白质分子的集合,包括由遗传变异、RNA 转录本选择性剪接和翻译后修饰(post‑translational modifications,PTMs)引起的各类变化[8]。不过,随着分子质量增加,蛋白质的离子化效率降低、质谱信号抑制作用与扩散作用增强,使得谱图解析更加困难,从而阻碍了完整蛋白质的检测[9]。因此,在组学水平表征血浆中小蛋白的完整序列是一件充满挑战性的工作。
Fig.1 The classify of plasma LMWPs图1 血浆LMWPs的组成
大部分LMWPs 是由蛋白质经酶解作用产生的多肽组成。根据催化机理,蛋白酶可分为5 大类,包括天冬氨酸类、半胱氨酸类、丝氨酸类、金属蛋白酶类和其他类。在哺乳动物体内,蛋白酶可选择性地切割特定的蛋白质底物,以影响细胞的行为、存活和死亡[10]。研究发现,它们在肿瘤中的功能更加复杂与多样[11‑12]。转移性癌症的多种特征是蛋白酶活性发生变化直接导致的结果。蛋白酶通过介导蛋白质、细胞外基质降解过程来影响肿瘤细胞侵入间质、血管生成和转移;级联蛋白水解相互作用控制着细胞凋亡,癌细胞在其发展为恶性肿瘤的过程中必须逃脱该调控过程;蛋白酶通过特异性裂解前体蛋白来激活其他蛋白酶或信号分子,如激酶和细胞表面受体,控制信号在肿瘤细胞与其他细胞之间进行传导。肿瘤中失调的蛋白酶可改变LMWPs的分子组成,而这些LMWPs不同于高分子质量蛋白质,易分泌至细胞外间质,通过血管屏障最终释放到循环系统中。Li 等[3]研究发现,与健康对照相比,羧肽酶N(carboxypeptidase N,CPN)在乳腺肿瘤组织中的表达水平上调,但在血浆中的含量没有显著变化。不过其催化产物C3f_R1310‑L1319在血浆中的含量显著增加,且该增加主要与早期乳腺癌相关,表明肿瘤微环境中失调的蛋白酶催化而产生的多肽片段可在血浆中被检测到,且含量与肿瘤早期的病理变化有相关性,提示蛋白降解物可作为疾病早期的诊断标志物。
在神经元之间传递信号的一类多肽被称为神经肽。神经肽来源于前体蛋白质,以一种受调控的方式释放,并通过与细胞表面的G蛋白偶联受体或酶偶联受体(如胰岛素受体)结合,在中枢和周围神经系统中发挥作用。它们作用的靶点包括神经元、胶质细胞或非神经元靶细胞,如腺体或肌细胞[13]。不同于经典的神经递质,这些神经肽生理功能的调节不是通过特定的突触再摄取机制实现,而是通过降解机制实现。它们不仅在神经元中表达,也在大脑其他类型细胞(如胶质细胞)和外周组织细胞(如内分泌细胞)中表达[14],影响着广泛的生理过程,包括进食、体重调节、昼夜节律、睡眠、疼痛、恐惧、焦虑、学习和记忆,以及奖励机制等[15]。中国肥胖人群队列研究显示,神经肽Y(neuropeptide Y,NPY)在血清中的含量增加与代谢异常型肥胖(metabolically unhealthy obesity,MUO)表型存在正相关性[16],且NPY过表达可导致转基因小鼠出现肥胖表型和胰岛素抵抗[17],表明NPY 与肥胖相关,提示神经肽在血液循环中的含量变化可作为评价生理功能失调程度的指标。此外,值得注意的是,根据人类基因组分析,100多个G 蛋白偶联受体的配体未知[18],因此识别特定细胞、组织或体液中与G 蛋白偶联受体结合的配体,可用于新型神经肽的发现[19]。
免疫多肽组指由主要组织相容性复合体(MHC)分子(在人类中称为人类白细胞抗原,HLA)呈递到细胞表面的所有多肽。其中,部分呈递到细胞表面的HLA 分子及其结合的多肽被释放到血浆中,形成血浆可溶性HLA 多肽组(soluble HLA‑peptidome,sHLA)。sHLA 与呈递到细胞表面的膜多肽组(membranal peptidomes,mHLA)类似,均由细胞蛋白质降解产生的多肽组成[20]。当处于病理状态时,细胞产生并降解疾病相关的蛋白质,然后将降解产生的多肽呈递出来,因此HLA 多肽组可作为癌症免疫治疗靶点候选物来源之一[21]。此外,正常情况下,HLA 多肽组在人体内保持相对稳定,但在特定疾病影响下,细胞会向血浆中释放比正常状态下更多的sHLA 分子,所以血浆sHLA与疾病严重程度相关,可用于疾病潜在生物标志物的挖掘[22]。Shraibman 等[23]通过对142 份多形性胶质母细胞瘤(glioblastoma multiforme,GBM)患者血浆样本的sHLA 和其中10例肿瘤样本的mHLA进行大规模质谱鉴定分析,发现无论是分子组成还是含量sHLA和mHLA均有较强的相关性。此外,经过数据库筛选,作者也提供了多个GBM 早期诊断的潜在生物标志物(如仅在GBM 中检测到的来自SOX11 的多肽AHSASEQQL和NFSDLVFTY)以及免疫治疗的潜在靶点(如来自ETV5的6条多肽)。这强有力地说明,在癌症生物标志物和免疫抑制剂候选物筛选中,血浆sHLA 研究意义重大。总之,系统表征HLA多肽组有助于诊断、预防和治疗感染性疾病、自身免疫病和癌症等。
相较于其他类型的多肽,sHLA 多肽在富集技术上更具有优势,它们主要是利用HLA‑A/B/C 单克隆抗体(W6/32)进行富集纯化,该方法简单且高效。
血浆中蛋白质浓度的高动态范围是限制血浆蛋白质组及LMWPs研究的重要因素之一,例如白蛋白(albumin)是血浆中丰度最高的蛋白质,含量高达50 g/L,远大于细胞因子等低丰度蛋白质的含量(ng/L),严重阻碍了LMWPs 的发现与检测。因此,在富集和提取血浆LMWPs时,去除被视为“污染蛋白”的高丰度蛋白质是实验方法中的首要步骤。不过,白蛋白具有多种功能,包括维持血浆渗透压,作为脂蛋白、小分子和药物的载体等,同时,因分子质量高于肾脏过滤和清除功能的界限,白蛋白成为LMWPs 常见的天然循环载体。Mehta等[24]在其研究中提出了以下几个发现与观点:a.LMWPs 在循环载体蛋白上的累积极大地放大了潜在生物标志物在血浆中的总浓度;b.血浆LMWPs 的浓度主要由载体蛋白而非其本身清除速率决定;c.与特定载体蛋白结合的LMWPs可能包含重要的诊断信息。随后,许多研究人员将焦点转向载体蛋白结合的LMWPs,试图分析载体蛋白结合的LMWPs 与各类疾病之间的关系,包括卵巢癌[25]、子宫内膜癌[26]、阿尔茨海默病[27]、脑卒中[28]、酒精滥用[29]等。例如,Kikuchi等[26]在研究子宫内膜癌患者和健康对照的血清白蛋白结合的多肽时,发现3 种多肽(m/z4769、6254 和11792)的质谱信号强度在两组之间存在显著性差异。在这些研究中,质谱技术分析载体蛋白结合的LMWPs已被证明是一种识别疾病潜在生物标记物的有效手段。
一直以来,大多数寻找开放阅读框(ORF)的算法都将300 个核苷酸或100 个氨基酸作为最小检测限,以降低假阳性编码区被检测的可能性。然而,这种过滤方法直接导致一些小的具有蛋白质编码潜力的转录本被错误地归类为更大类别的非编码RNA(ncRNAs)。近年来,核糖体图谱结合质谱技术加速了这类SEPs或小蛋白(microproteins)的发现[30]。与经典的多肽类激素或神经肽不同,SEPs不是由前体蛋白经酶解产生,而是由sORF直接翻译而来,也属于LMWPs。
迄今为止,许多研究发现了SEPs 的存在,并表明这类多肽在生长发育[31]、机体调节[32],以及疾病发生中(如癌症[33])具有重要作用。例如,由pri 基因编码的SEP,可以引发转录因子Svb 的截短,使之从阻遏物转变为激活物,影响果蝇的表皮分化过程[34];在D’lima 等[35]研究中,lncRNA翻译而成的NoBody 被证实位于P‑bodies 中,与mRNA 脱帽蛋白(尤其是EDC4)存在相互作用,可调节P‑body 的数量。该研究揭示,NoBody 是mRNA 脱帽复合物中的一个新成分,为SEPs 作为调节因子参与重要生物过程提供了新的证据;Pauli 等[36]发现,在斑马鱼原肠胚形成过程中,lncRNA 编码的多肽Toddler,通过与APJ/Apelin 受体结合激活G 蛋白偶联信号,促进细胞运动;Humanin 是Hashimoto 等在筛选阻止阿尔茨海默病患者神经元死亡的相关因子时发现的,它可以影响Bax 定位,进而阻止细胞死亡[37‑38]。目前,SEPs的存在已被广泛接受并引起了越来越多的关注。
虽然生物信息学结合核糖体图谱技术在多种物种中预测发现了大量SEPs[39‑40],但是证实这些SEPs 的表达较难。质谱技术作为一种高通量的发现及验证手段,能够检测蛋白质/多肽的分子质量和氨基酸序列,目前已广泛应用于SEPs 表征和验证中。不过,SEPs 分子质量小且浓度低,它们在高丰度蛋白质的掩盖下很难被有效地富集和鉴定,所以如何有效地富集SEPs 至关重要。为此,Ma等[41]比较了几种富集K562 细胞中SEPs 的方法,包括酸沉淀、30 ku分子截断超滤法及反相C8固相萃取法,结合其他参数的优化,建立了一套高效表征细胞中SEPs 的方法。截至目前,细胞、组织、体液等样本中均有大规模SEPs的鉴定报告。Zhang等[42]系统开展了SEPs富集和鉴定方法学研究,从人源和鼠源细胞或组织中共鉴定到762条SEPs。Li等[43]首次报道了在血浆中鉴定到19 条SEPs,而Cai 等[44]也首次报道了在血浆外泌体中鉴定到48条SEPs。
相较于蛋白质组学持续、蓬勃的发展,LMWPs 相关研究处于相对滞后状态,主要是因为血浆样本具有蛋白质丰度的高动态范围和组成的高度复杂性。长期以来,研究血浆LMWPs受限于富集与分析方法。不过,近年来,随着新方法、新技术的应运而生,LMWPs的研究也取得可喜进展。
在富集血浆LMWPs 的策略中,去除高丰度蛋白质是关键的一步,常用的方法有:有机溶剂沉淀法、分子截断超滤法、固相萃取法、亲和法和凝胶分离法(图2a)。虽然这些方法在一定程度上可降低血浆样本的复杂性和动态范围,但高丰度蛋白质去除的效果有限,质谱定性分析的再现性差,例如,固相萃取法三次技术重复的结果仅有40%重叠[45]。所以,LMWPs相关研究迫切需要一种更高效、稳定、便捷的富集或分离方法,以进一步降低样品的复杂性,便于利用组学手段研究其组成和变化情况。2017 年,悉尼大学Parker 等[46]运用三氯乙酸(trichloroacetic acid,TCA)沉淀法开展了运动相关的血浆多肽组研究。在这项研究中,该团队首先将TCA 沉淀法与乙腈沉淀法、丙酮沉淀法和分子截断超滤法进行了比较,发现TCA 法鉴定的LMWPs数目最多(近550个)。虽然TCA沉淀法展现出较好的鉴定结果,但是血浆样本基质的复杂性,例如大量脂质小分子存在,依然干扰着LMWPs 的富集与鉴定。2019 年,Harney 等[47]发表 了SPEA(small‑protein enrichment assay)方法学研究工作。该方法的卓越之处是在单针非靶向进样分析的前提下,共定性到100多种低分子质量蛋白质,有效地提高了小蛋白的鉴定率。虽然该方法结合分子排阻色谱法实现了小蛋白与载体蛋白的分离、高丰度蛋白质和脂质的去除,但整个实验流程过于繁琐,难以应用于大规模临床样本制备中。Li等[43]提出了一种新的富集血浆LMWPs 的方法——顺序沉淀脱脂法(sequential precipitation and delipidation,SPD),该方法的再现性及定量稳定性显著高于经典的乙腈沉淀法与近期报道的TCA沉淀法(图2b)。
Fig.2 Strategies for enrichment of plasma LMWPs[43,48]图2 血浆中LMWPs的富集策略[43,48]
除了富集方法上的进步,质谱鉴定策略也趋于多样化,不断更新。基质辅助激光解吸电离飞行时间质谱(matrix‑assisted laser desorption/ionization time‑of‑flight mass spectrometry,MALDI‑TOF‑MS)是表征LMWPs 常用的质谱技术,具有灵敏度高、检测快速、通量高和成本低等优势,已广泛应用于癌症[49‑51]、慢性肾病[52]、感染性疾病[53‑54]、认知障碍[55],甚至是当前全球流行的COVID‑19[56]等疾病潜在生物标志物的挖掘中。不过,该技术无法在较宽的质量范围内实现多肽组可靠的定性定量分析。随着高分辨、高灵敏度质谱仪器与相应软件的不断发展,多肽组学研究也变得越来越全面和系统。
LMWPs 鉴定策略的进步主要包括:a.蛋白质组学研究策略的进步。在自下而上蛋白质组学(bottom‑up proteomics,BUP)技术中,质谱采集速度的大幅提升显著增加了蛋白质组的鉴定深度,推动了该技术的广泛应用;作为表征完整小蛋白的理想手段之一,自上而下蛋白质组学(top‑down proteomics,TDP)的技术策略是结合多种质谱碎裂模式,直接使样本中的LMWPs实现有效碎裂并最终完成氨基酸序列的完整解析[57]。相较于BUP,TDP 的技术优势是保留了LMWPs 的原始序列信息,但是由于完整LMWPs的分子质量较大,该技术难以产生信息丰富的串联质谱数据,不过新一代Orbitrap仪器的开发为TDP技术的快速发展奠定了坚实的基础。b.质谱碎裂模式的多样化应用。例如Parker 等[46]利用具有高效分离能力的纳流速超高效毛细管液相色谱与新一代超高分辨三合一质谱联用技术,在EThcD 和HCD 两种质谱碎裂模式下分别对样本进行数据采集,极大地提高了多肽的鉴定数目。c.质谱数据采集方法的进步。近年来,随着数据非依赖采集(data‑independent acquisition,DIA)技术的蓬勃发展,LMWPs 的相关研究也得到了进一步延伸。Lin 等[58]首次运用DIA 技术开展了肾透明细胞癌相关的血清LMWPs研究,在该临床研究中,研究人员将DIA 技术与传统的数据依赖采集(data‑dependent acquisition,DDA)技术进行了对比,虽然两种技术在3次重复实验中鉴定的多肽数目相差无几,但DIA 技术定性结果的重现性与定量结果的稳定性均显著高于DDA,具有巨大的发展潜力。d.各类数据检索软件及算法的进步。例如,具有de novo未知序列解序功能的PEAKS 软件[59]、第一个TDP 质谱鉴定算法ProSight[60]、高谱图解析率的新一代开放式搜索引擎Open‑pFind[61]以及DIA 数据解析软件Spectronaut[62]等。
从葡萄糖调节(胰岛素)到免疫识别(MHC分子),以各类生物活性肽形式存在的LMWPs,构成了众多生理稳态调节机制。在细胞和组织中,蛋白酶/肽酶密切参与了这些多肽的产生、降解和信号转导,调控着LMWPs的组成、浓度及生物活性。探究体内LMWPs,一方面可发现具有生物活性的新分子;另一方面可揭示内源性多肽代谢的途径以及体内调节生物活性肽水平和信号转导的新靶点。
Taguchi等[4]利用肽组学技术鉴定到几千个多肽,通过化学合成多肽序列及功能研究,他们发现了3 种来自表皮分化标记蛋白suprabasin 的新型生物活性肽。当向小鼠腹腔注射SBSN_HUMAN[279‑295]时,该多肽可有效地抑制食物/水的摄入,并诱导小鼠运动,而SBSN_HUMAN[225‑237]和SBSN_HUMAN[243‑259]通过激活血管细胞内NF‑κB信号,刺激炎症前细胞因子的表达。该研究基于从头测序的数据库检索方式生成多肽库,结合功能研究,为发现血浆中未知生物活性肽提供了新的途径。
研究蛋白酶‑多肽的关系可以揭示蛋白酶调节生理功能的机制以及疾病潜在的治疗靶点。二肽基肽酶IV(dipeptidyl peptidase IV,DPPIV 或CD26)参与了多种激素和趋化因子生物活性的调节,包括胰高血糖素样肽1(glucagon‑like peptide 1,GLP‑1)和葡萄糖依赖性促胰岛素多肽(glucose‑dependent insulinotropic polypeptide,GIP)[63‑64]。尽管完整的GLP‑1‑(7‑36)‑酰胺和GIP‑(1‑42)可以增强葡萄糖刺激的胰岛素分泌,但是当它们N端二肽在体外被DPPIV 剪切后即失去这种活性[65]。N 端截短的GLP‑1 和GIP 可以在血液循环中被检测到[64,66],提示蛋白质降解可能是调节它们生理活性的机制。因此,Marguet等[67]利用CD26基因靶向失活的小鼠探究了该酶在血糖控制中的作用,发现在葡萄糖的刺激下,CD26‑/‑小鼠血液中的胰岛素与完整形式的GLP‑1含量增加,同时CD26酶活性特异性抑制剂可以提高野生型小鼠的葡萄糖耐受性,表明CD26 很可能通过调节GLP‑1 或其他底物的活性控制血糖,提示CD26可作为II型糖尿病的潜在治疗靶点。
成纤维细胞生长因子21(fibroblast growth factor 21,FGF21)是一种参与调节葡萄糖稳态、胰岛素敏感性、脂质代谢和体重的激素,是治疗代谢紊乱的潜在靶点。但是FGF21 在血液循环中的快速水解降低了其潜在的生物活性。为探究FGF21的调控机制,Zhen等[68]利用质谱技术系统地研究了人FGF21 的加工过程,证明了DPPIV 是负责其在Pro‑2和Pro‑4残基后N端裂解的主要蛋白酶,以及成纤维细胞活化蛋白(fibroblast activation protein,FAP)是负责FGF21 在Pro‑171 后C 端裂解的蛋白酶。FAP可使FGF21失活,该功能的发现不仅扩展了FGF21 的信号通路,也在治疗上为增强FGF21 生物活性提供了新的方法。与之类似,Sierra 等[69]发现,细胞表达、分泌的完整趋化因子基质衍生因子1α(stromal cell‑derived factor 1α,SDF‑1α)经血清处理后以截短体的形式存在,同时,与其结构对应的生物功能随之降低,揭示了蛋白质降解是调节SDF‑1α 生物功能的重要机制。该团队还进一步从人血清中分离、纯化和鉴定了这种特异性剪切SDF‑1α C 端赖氨酸的蛋白酶,即羧肽酶N[70]。SDF‑1α 是造血、淋巴细胞归家、B 细胞生长和血管生成的重要调节因子,该发现阐明了SDF‑1α功能活性精细调控的重要分子机制。
临床上,癌症等重大疾病的高发病率及高死亡率威胁着全球人口的健康,而当前老龄化社会的发展也凸显了各类慢性病对人们生活质量的影响。因此,目前迫切需要发展各类疾病早期诊断的生物标志物。Anderson[71]分析了2008年美国食品和药物管理局批准的所有蛋白质类的实验项目,结果显示在这些实验中来自血浆的蛋白质共有109个,其中第一类高丰度蛋白质约占50%,由组织分泌到血浆中的蛋白质约占25%,剩余则是一些异常分泌的蛋白质或者激素、受体等。在回顾利用血浆蛋白质组学技术挖掘生物标志物的研究时,Geyer 等[72]提出血浆蛋白质组鉴定深度达1 500 个蛋白质时才能覆盖由组织分泌出来的蛋白质,在此鉴定深度下,将蛋白质按丰度高低进行排序,依照前300个蛋白质中约23%的蛋白质为生物标志物这一比例进行推算,在后续1 200 个蛋白质中应该还存在许多生物标志物。
一般认为,源自组织的蛋白质分子质量较大,无法以被动运输的方式通过内皮扩散到循环系统中,而LMWPs以其分子质量较小的优势,可作为细胞间信息交流的媒介。同时,LMWPs 富含更多可用于临床诊断的信息,包括多肽数目、序列信息、蛋白质归属、酶切位点信息等。因此,来源广泛的LMWPs中尚有大量生物标志物有待挖掘,具有巨大发展潜力。
在肿瘤微环境中,蛋白质水解异常可促进肿瘤生长、细胞外和组织的重塑、炎症、细胞侵袭和转移[73]。因此,与癌症生物学相关的蛋白酶催化而产生的蛋白质降解物可以用作指示癌症发生、发展及治疗情况的生物标志物。据Petricoin 等[74‑75]报道,在卵巢癌与前列腺癌中,血浆/血清中多肽组合模式在癌症及其早期诊断中展现的临床特异性与灵敏度均显著高于临床上已有的生物标志物——分别是癌症抗原(cancer antigen 125,CA125)[74]与前列腺特异性抗原(prostate‑specific antigen,PSA)[75]。随后,Zhang等[76]利用交叉验证和独立的多中心样本鉴定出3 个LMWPs,这些潜在生物标志物结合CA125 提高了早期卵巢癌检测的灵敏度与特异性。此外,Bedin 等[51]探索了与结肠癌进展相关的多肽组,通过研究发现,蛋白质降解模式在结肠癌的不同阶段各不相同。相较于健康对照,患者的蛋白酶活性更高,揭示了疾病进展与LMWPs 变化的相关性。癌症的早期检测是治疗恶性肿瘤的关键,因此,早期生物标志物的发现将极大地帮助患者进行疾病控制,显著提高患者的生存率。
除了癌症之外,基于质谱技术探究LMWPs 已被广泛应用于各类疾病潜在生物标志物的发现中,例如代谢综合征[77‑78]、精神类疾病[79‑80]和感染性疾病[81]等。不过,随着研究的逐渐增多与深入,越来越多的结果表明,血浆中与不同疾病相关的差异多肽大部分源自高丰度蛋白质,这些蛋白质似乎没有特异性,因为它们在不同类型的疾病中也有差异表达。这可能是因为高丰度蛋白质确实与多种疾病之间存在显著性关联[82]。另外,在复杂生物体中,多种因素调控着多肽的产生,因此,与疾病生理病理直接相关的或许不是差异多肽,而是与多肽产生相关的蛋白酶或其调控因子,丰度发生改变的多肽是疾病间接相关标志物;LMWPs 富集方法的局限性也是一个重要原因,血浆样本中高丰度蛋白质及其衍生的多肽片段的存在极大地掩盖了低丰度LMWPs 的鉴定,现有的检测深度降低了其他可能具有诊断作用的低丰度多肽的检出率,这也再次强调了推动方法学及研究策略进展的必要性。不过,从多种研究结果来看,比起单一的生物标志物,多肽组合或指纹图谱有望满足更高的临床敏感性和特异性的要求[73‑75]。因此,无论是什么原因导致了差异多肽的产生,LMWPs 在生物标志物的挖掘方面仍具有无限的潜力。
随着样本处理技术、质谱技术以及计算机技术的高速发展,大量关于血浆LMWPs的质谱数据已产生,如何从多肽数量、含量和序列组成等信息中寻找与临床应用、生理病理现象相关的分子,需要生物信息学等多种技术的支持。其次,LMWPs 的研究策略仍需进一步优化。事实上,受限于疾病的异质性、研究方法的再现性以及研究队列的有限性与延伸性,研究发现的差异多肽并没有得到很好的队列或功能验证,因此,研究策略的转变与升级将是促进LMWPs 研究进展的重要环节。实践证明,多中心、多样本、多疾病的研究策略将有助于挖掘临床有效的差异分子。最后,探究差异多肽的来源、功能作用将有助于疾病病理学的理解,并推动其向临床转化的速度。未来,血浆LMWPs全面而深入的研究将为多种疾病的早期诊断、病理分型、预后判定和精准治疗带来新的希望。