闫馨予 高俊珍
1 内蒙古医科大学,内蒙古呼和浩特市 010059; 2 内蒙古医科大学附属医院呼吸与危重症医学科
肺癌是发病率及死亡率一直居高不下的恶性肿瘤之一,世界卫生组织国际癌症研究署(International Agency for Research on Cancer,IARC)2018年发布的报告显示:2018年世界排名前10的癌症类型中,肺癌不仅是最常见的癌症(占新发病例的11.6%),而且是癌症里的主要死因(占死亡总病例的18.4%)[1]。肺癌分类中,非小细胞肺癌(Non-small cell lung cancer,NSCLC)是其最常见的组织学类型,超过60%的肺癌患者在诊断时已为晚期,患者通常无法选择手术切除治疗,只能寄希望于现在主要的治疗手段如常规化疗和放射治疗[2]。目前常用的医学诊断方法主要是低剂量螺旋CT、支气管镜检等技术,虽然低剂量螺旋CT的应用相比胸部X线片明显提高了非小细胞肺癌早诊率,使死亡率下降了20%[3],但是其非小细胞肺癌的早期诊断率仍然不能令人满意,肿瘤标志物的识别也是恶性肿瘤诊断的可用方法[4],但其灵敏度和特异度并不算高。故为了提高5年生存率,迫切需要及时有效的、更早于影像学诊断的、灵敏性和特异性更高的、无创便捷的早期诊断方法。
代谢组学作为一门广泛应用于多个领域的飞速发展学科,是基因组学、蛋白质组学的延展。肿瘤在发生发展过程中,有特定的代谢过程[5],或可利用代谢组学技术监测这些代谢物的变化或波动情况,识别未知代谢产物达到早期诊断的目的。
1.1 代谢组学的定义 代谢组学主要通过分析体内小分子代谢产物(相对分子质量<1 000)来推测机体的内环境是否遭受了病毒入侵或摄入含有毒素的食物药物并评估机体整体状态。目前人们普遍认为代谢组学可用来推测机体受到疾病或外部因素等干扰而产生的最终应答,通过探究生物体受到外部刺激而产生的最终代谢产物的变化。
1.2 代谢组学的特点 圆满完成人类基因组的测序让我们在分子医学领域进入新纪元。虽然整个生命活动中是基因组提供蓝图,蛋白组提供所需结构并催化激活相应蛋白,但最后生动反映生物体在环境中的表达仍是通过它的动态代谢及产物[6-7]。代谢组学具有以下特点:(1)基因和蛋白表达的有效微小变化会逐步放大呈现在最终的代谢物上,许多不能从基因组、蛋白质组体现的变化也可从代谢组中体现。(2)代谢组学位于系统生物学最下游,直接反映机体病理状态下所产生的所有代谢产物的最终状态,故相较于基因组、转录组、蛋白质组更准确[8]。(3)人类基因组大约有4万,编码多达100万个蛋白质[9],但代谢产物估计只有几千种,其种类远少于基因和蛋白的数目,研究起来相对方便。(4)可选取获取方式便捷的体液如血液、唾液等作为代谢组学的研究标本。(5)不需要全基因组测序或建立大量表达序列标签的数据库。这些特点使得代谢组学成为比蛋白质组学更吸睛的研究热点,但是代谢组学为什么最近才逐渐开始兴起呢?之前的分子研究为何始终只围绕在转录组和蛋白质组学方面?部分缘由为代谢组学的技术所限。
1.3 代谢组学的检测技术 核磁共振(NMR)、液相色谱—质谱法(LC-MS)、气相色谱—质谱法(GC-MS)、MALDI-TOF-MS等是代谢组学常用技术。NMR是最早的可测量生物标本代谢物的技术,该技术虽然在选取肿瘤标志物[10]、判断预后[11]、病理分型[11]、早期诊断[12]等方面已成功应用。但它有着不少缺点:光谱分辨率不高;导出的图谱上受到多种化合物峰值互相干扰的影响以至于解析成果受限,其敏感性也较LC-MS低[13]。LC-MS和GC-MS技术的灵敏度及特异性均高,也被大量应用于各种肿瘤代谢研究中。但它们的局限也让人无法忽视,GC-MS没法应用于高极性代谢物,只能在稳定的化合物上作用。不能广泛应用于所有样本,而且不具备完整的图谱库,想要继续深入研究,还需要自己建立分析图库。所以目前这两种技术仍处在建立庞大且可供对比的代谢物图谱阶段。随着代谢组学技术的不断更新,基质辅助激光解吸电离飞行时间质谱(MALDI-TOF-MS)技术成为了最常用的新型软电离生物质谱技术之一[14]。
1.3.1 MALDI-TOF-MS技术的原理及特点:它的原理是将合适波长的激光照射在检测样品与基质混合形成的共结晶薄膜上,利用基质对激光的强吸收将所测分子链逐出并使其离子化,同时基质可使该分子链免遭超强激光直接照射而导致的不可逆损伤。最后将生物分子运送至质量分析器中分析具体分子量。MALDI-TOF-MS具有以下特点:(1)方法便捷;(2)样本简单预处理即可,低样本量也能直接研究;(3)快速大范围检测的同时还可以保证高灵敏度;(4)更耐盐、去垢剂和较高浓度缓冲溶液的污染;(5)质荷比值可对应于代谢小分子等的分子量。这些功能使MALDI-TOF MS成为常规临床分析的关键平台,非常适合生物活性物质快速、大范围、高通量的筛选。非小细胞肺癌的早期代谢变化相比于正常细胞很可能只有细微的差别,普通的分析技术也许无法鉴定出这究竟是不是肿瘤细胞,更无法明确这是否属于非小细胞肺癌,但MALDI-TOF-MS技术极其敏感,即使在接近亚飞克(Sub-femtomole)分子水平的浓度范围内仍可检测到生物大分子[15](如多肽、蛋白质),不仅可以研究细胞内各种基因表达产物的多项代谢过程,而且可以在分子水平上直接分析微量代谢小分子、蛋白质、多肽和它们的一级结构信息(相对误差仅为0.01%~0.1%)。该技术对于癌症的诊断具有一定价值[16],也让我们对于非小细胞肺癌的早期诊断燃起了希冀。而MALDI-TOF-MS也因其可在细胞层面识别分子与组织病理学特征,更具先进性而成为比其他技术更好的工具,也让代谢组学在非小细胞肺癌的早期诊断方面更具优势。
1.3.2 MALDI-TOF-MS技术的应用及局限性:现在很多研究者关于组织或组织切片、完整细胞的蛋白全质谱图分析都直接采用快速便捷的MALDI-TOF质谱技术。一些研究者开始根据肿瘤细胞在发展过程中会产生与正常细胞不同的蛋白质和代谢产物这一特性应用于胃癌[17]、肺癌[18-19]、前列腺癌[20]等研究中,并在肺癌的早期诊断和筛查及病理分型中取得了一定的进展。还有报道提出NSCLC血清中存在的4种差异表达蛋白(α1-AG、Tf、TTR、ITIH2)有望成为 NSCLC 新型血清诊断标志物。刘晓晴教授的团队通过MALDI-TOF-MS技术发现了NSCLC患者血清及尿液样本中与健康人不同的多肽,并建立了灵敏度和特异度均高的诊断模型和病理分类模型,更为NSCLC的早期诊断和病理分型诊断提供了强力的补充和凭证。同时还有研究表明质谱成像可以将NSCLC快速而准确的分出亚型。也发现了可能的耐药模型和预测分子,为实现肺癌个体化化疗提供依据,助推精准医疗。这都提示了该技术在非小细胞肺癌的早期诊断方面未来可期,但是由于MALDI-TOF-MS技术是一项新兴且具有一定局限性的技术,在研究结果的验证和解释缺乏统一的实用性的操作手册,目前在非小细胞肺癌的早期诊断的研究数量并不可观。 目前MALDI-TOF-MS技术已批准用于临床微生物学以及制药行业的常规使用中,取代了微生物学里传统的生化测试,但尚未全面进入临床应用中,尤其是非小细胞肺癌方面的研究,无论是从研究数量或者是研究结果的可靠性都不能达到100%。该技术目前的局限性有以下几点:(1)MALDI-TOF-MS技术经常出现所获蛋白质的峰值表达相近或重叠交错,增加了潜在肿瘤标志物的分析鉴定难度。(2)MALDI-TOF-MS技术无法确定差异蛋白数量。(3)样品的选择会影响结果的有效性。(4)需要对样本标准化处理,以确保高度可重复的分析。(5)由于样品的极端异质性及其动态蛋白质含量,需对样品预处理来进行全面分析。(6)该技术本身的分析特性具有相对较低的重现性和分离度。
目前代谢组学在肿瘤诊断方面的研究主要还是集中在乳腺癌、卵巢癌、前列腺癌等方面,更具说服力的就是Odunsi团队因当前可用的血清生物标记物不足以可靠地区分上皮性卵巢癌(EOC)患者和健康个体。该团队利用1H-NMR光谱分析从38例EOC患者、12例卵巢良性肿瘤患者(术前血清)及53例健康女性的血清样本进行了分析研究,发现能100%识别正常绝经前妇女、卵巢良性肿瘤和卵巢上皮性癌,对绝经后妇女和卵巢癌的识别率也高达97.4%和97%。然而即使在研究较多的妇科肿瘤方面,也离真正建立完整的诊断模型以及实现诊断系统化有着不小的距离。虽然研究者们已经获得了大量能反映机体病理变化的生物代谢物,但是这些潜在的肿瘤标志物之间并没有很强的关联性,而且缺乏交叉验证,虽然血液、尿液、唾液等发现了越来越多的潜在生物标志物,但目前仍处于基础研究中。在NSCLC细胞中持续特异高表达的生物标志物(癌胚抗原等)在临床实践中成为常规检测项目,但这些标志物虽能辅助诊断非小细胞肺癌,但阳性率和敏感度较弱。故而特别期望能多角度寻找特异性、灵敏度均高的NSCLC早期诊断标志物。
NSCLC的早期诊断及病理分型最开始还是从蛋白质组学方向出发研究。杨洋等研究者应用SELDI-TOF-MS结合SVM对NSCLC患者和对照组(两组分别为112、123)进行血清蛋白质质谱的研究分析,筛选出3个差异性显著的蛋白标记物(载脂蛋白C-Ⅰ触珠蛋白α1链和S100A4蛋白),发现了这3种差异蛋白的协同应用有利于NSCLC的早期检测和诊断。随后有研究报道指出碳酸酐酶1可成为非小细胞肺癌的早期诊断血清标志物。他们采用二维凝胶电泳(2DE)联合MALDI-TOF-MS技术分别提取了肺癌组、良性对照组、健康组(三组分别为11、12和10)的血清蛋白,得到12种差异表达的蛋白质,并利用ELISA和蛋白质印迹在扩大样本量中(三组分别为22、18和18)验证了所得蛋白,其中碳酸酐酶1(CA1)的表达在肺癌组明显升高。Klupczynska团队利用ZipTip技术联合MALDI-TOF-MS对癌症患者(n=153)和对照组(n=63)的血清样本分析研究发现C3和纤维蛋白原α链的片段具有显著差异,该组研究不仅找到了蛋白标志物,而且进行了验证,步骤更加严谨。有学者在300例肺部良性病变患者和NSCLC患者之间观察到疾病特异性触珠蛋白-β,该蛋白的糖基化可以将NSCLC与BLD区别开来。还有研究团队甚至通过MALDI-TOF MS对50例参加厄洛替尼和索拉非尼Ⅱ期试验的NCSLC患者进行了血清肽谱分析。在所有出现严重毒性反应的患者的血清中检测到两种特异性肽,为助推精准医疗提供了新思路,但是样本量偏小,代表性不高。后续随着研究技术的不断更新,大家开始将目光放在了能够更好地反映细胞究竟发生了什么的代谢组学上。Zhang的研究团队想评估肿瘤发展过程中的血清代谢物变化,选取了25例Ⅰ期肺癌患者和相匹配的健康对照组,用1H-NMR联合RRLC确定了25个能高灵敏度区分两组的代谢产物,提示了早期肺癌确实可用代谢组学来分析探究。还有研究团队采用高灵敏度、高分辨率的UPLC-Q-TOF检测健康人(对照组)和肺癌患者(病例组)尿液中微量分子代谢物,成功发现11个常见的代谢标志物可以用来描述肺癌的病谱特征,其中4例具有诊断肺癌的潜力[曲线下面积(AUC)>0.8]。随着技术不断发展,Miyamots利用GC-MS分析研究了NSCLC和其他肺癌患者的血清样本,赖氨酸、色氨酸和组氨酸的浓度在NSCLC明显降低,而乙醇胺、甘油、麦芽糖、乳酸、谷氨酸和棕榈酸的浓度中明显升高。这些代物都有显著差异,有可能具有NSCLC的早期诊断意义。而Leonor等使用1H-NMR对非小细胞肺癌患者在疾病不同阶段的血清代谢谱研究,发现与对照组相比非小细胞肺癌的代谢谱里有18种代谢物的浓度具有统计学意义的变化。这无疑为寻找非小细胞肺癌的早期诊断生物标志物提供了强力的补充证据;同时还发现有17种可反映NSCLC患者不同疾病发展阶段的代谢物,为NSCLC患者的早期发现、与健康个体的鉴别以及了解疾病各阶段的病理生理机制提供助力,单单通过传统的血液指标可无法做到区分NSCLC的发展阶段。Mu等使用伪靶向GC-MS研究了136例非吸烟女性受试者(65例NSCLC患者,6例良性肺肿瘤患者和65例健康对照)的代谢谱,发现代谢谱出现了能量代谢、氨基酸代谢和脂质代谢紊乱,氧化应激等变化。该研究为NSCLC的诊断提供了半胱氨酸、丝氨酸和1-单油酰甘油作为生物标记物。还有研究团队利用代谢组学技术对156例Ⅰ/Ⅱ期NSCLC患者和60例健康对照者的血浆样本研究发现β-羟基丁酸,柠檬酸和富马酸显著不同。Ruiying研究团队对142例NSCLC患者和159例对照组患者进行了非靶向代谢组学分析并发现了6种代谢物可作为潜在生物标志物用于NSCLC。该结果也通过TCGA数据库中的1 027例NSCLC患者和108个癌旁组织的转录组学分析得到了进一步验证。还有研究提示含胆碱的磷脂可能是早期NSCLC的标志物。磷脂组的进一步研究对于更好地描述肺癌患者体内代谢物组成的变化至关重要。有研究证明使用UPLC-MS分析 99例NSCLC患者和112例对照者的血浆样本发现皮质醇,可的松可作为早期诊断标志物,且同时具备高敏感性和特异性,还观察到特定血浆代谢物与NSCLC的病理类型或分期之间存在显著关联。这都表明代谢组学确实拥有无限潜力。
当然,非小细胞肺癌等方面的研究也在逐步开展,但由于之前所提的诸多限制如技术分析问题以及现在的研究数量情况、验证方式的选择和实验结果的准确性,代谢组学在非小细胞肺癌的早期诊断研究仍无法进入临床应用中。虽然说正向着临床实用性方向发展,但还只是在初始阶段,仍需要不断拓展代谢组学在非小细胞肺癌应用方面的广度和深度。
非小细胞肺癌的早期诊断目前仍是研究者们聚焦的方面,目前多组研究显示非小细胞肺癌患者与健康人群的血清多肽存在差异,我们希望采用MALDI-TOF-MS技术结合代谢组学数据处理手段,建立一种新的NSCLC早期诊断模式,从血清学角度发现早期非小细胞肺癌潜在生物标志物,而MALDI-TOF-MS测定和鉴定不同类型和阶段肺癌生物分子的能力已被肯定。但该技术所需费用高,且仍需要大量数据来支持研究结果,包括研究质量也需要提升,如果能够增进可靠的交叉验证方法就能更进一步扩展研究平台。相信随着MALDI-TOF-MS技术不断应用于非小细胞肺癌,会更加深刻、全面认识发生机制、代谢网络改变等方面,在早期诊断方面也一定会获得长足进步。