裴 斌,樊志敏
(1. 南京中医药大学,江苏 南京 210029;2. 南京中医药大学附属南京中医院,江苏 南京 210001)
结直肠癌(colorectal cancer,CRC)是发生于下消化道的一种恶性肿瘤,据WHO统计报道,全球每年有超百万人被诊断为结直肠癌,其中死亡人数更是超过50万,其发病率在全球癌症中仅次于肺癌和乳腺癌位于第三位,病死率排在第四位[1],在国内发病率和病死率则分列第三位和第五位[2-3]。CRC因肠镜、肿瘤标志物等筛查手段的普及在以美国为代表的发达国家中发病率呈下降趋势,而在我国随着生活水平的提高,人们喜食高油盐、高脂食物,加之运动不足等,目前发病率一直处于上升状态[4],且呈现年轻化趋势,给社会发展及人民健康造成严重威胁。结直肠癌早期缺乏典型临床表现和体征,诊断困难,大多数患者发现时已属中晚期。CRC患者的生存时间与肿瘤的分期息息相关:Ⅰ期患者根治术后治愈率常超过90%、Ⅱ期患者手术配合辅助治疗其5年生存率亦能达到85%左右;而中、晚期患者的生存率往往下降迅速,Ⅳ期肠癌患者只有不到12%的五年生存率,且手术治疗后仍有超过30%的患者会出现复发[5]。目前治疗CRC的主要方法是手术结合放化疗,但对于有转移者预后仍较差。
目前CRC诊断方法主要有:早期症状观察(如有排便性状改变、便血、腹痛、腹泻等常见症状建议进一步的检查),大便隐血试验(一种检查消化系统疾病的简便方法,阳性者建议做胃肠镜、明确出血病因),肛门指检(可检查肛管直肠下段有无肿物、出血、疼痛等),结肠镜检查(是结直肠癌诊断的金标准,在进行检查时,能同时进行预防性切除及取活检,但因结肠镜检查具有倾入性,患者耐受性差,并发穿孔、出血等风险,检查费用高,其在我国未得到大规模推广应用)。上述常规筛查方法因敏感性、特异性较低,检查费用高,患者配合度差等原因难以广泛应用于临床[6],而目前临床常用的肿瘤标志物CEA、CA19 -9 等蛋白组学指标的检测,p53 、APC等基因检测也存在自身灵敏度和特异性不高等局限性,因而临床深入研究CRC,寻求特异性强、灵敏性高的早期诊断方法迫在眉睫,代谢组学的兴起为其提供了新的方法手段。本文主要介绍了代谢组学的概况及其在结直肠癌中的研究进展。
作为系统生物学新的分支学科,代谢组学效仿基因组学和蛋白质组学的研究思想,利用高通量技术手段动态监测分析生物体受生理、病理刺激或基因修饰时发生的代谢产物的变化[6-7],判断某一时刻生物体所处的整体状态。代谢组是指生物体内源性代谢物质的动态整体,是参与生物体新陈代谢、维持生物体正常生长功能的分子化合物的集合,其研究目标常是相对分子量≤1 000的小分子代谢物,这些小分子代谢物包括脂质、氨基酸、糖类、脂肪酸等。
代谢组学研究流程一般由样品收集预处理、数据采集-代谢物分析、数据分析、生命现象阐释几部分构成,目前代谢组学研究使用的生物体样本范围广泛,常包括组织、体液、排泄物、细胞等[8]。血液和尿液等生物体液常被应用于恶性肿瘤方面研究,但亦有相关学者认为肿瘤组织比血液和尿液等体液稳定,能更好地体现肿瘤本身的代谢特点,主要技术手段包括核磁共振(nuclear magnetic resonance,NMR)以及质谱(mass spectrum,MS)等联用技术[9]。结直肠癌是遗传、饮食、肠道炎性病变等因素综合作用的结果,代谢组学通过探索肿瘤发生发展过程中的各项生化反应,能够筛选鉴定出新的肿瘤标志物,从而为肿瘤早期诊断、分期、评估疗效和预测预后等提供帮助。
1.1代谢组学技术分析平台 目前代谢组学研究的两大主要分析技术即核磁共振波谱和质谱,两种方法各有其优劣。NMR通过核自旋、能级裂分、共振吸收特定频率的射频辐射来检测不同的代谢物。NMR的优势在于样品前处理较为简单,高通量,能对生物样本进行无创、无偏倚性检测,被认为是描述代谢物结构的金标准,而NMR技术也存在敏感性低、样本需求量大等缺点[10-11]。其中,研究最常用的检测方法是核磁共振氢谱(Proton Nuclear Magnetic Resonance1H-NMR)。质谱(MS)因其广泛的动态范围,目前被广泛用于代谢组学的研究。由于检测样本种类复杂,为了尽可能多地检测代谢物,在质谱分析之前往往需要进行分离,常有GC-MS、LC-MS、CE-MS等联用方式。 GC-MS是分析挥发性化学物质的有效组合,样本一般需要进行衍生化处理,而需检测的代谢物往往在衍生化过程中有所损失。因此,GC-MS主要适用于有针对性的代谢组学分析[12],气相色谱-四级-质谱、气相色谱-飞行时间-质谱是GC-MS常用的方法。LC-MS可以分离热不稳定的、无挥发性、未衍生化的代谢物,因此,LC-MS检测的化合物种类范围比GC-MS更广,适合作为未知代谢物研究中的探索办法,但缺少代谢物数据库是LC-MS技术的缺点,超高效液相色谱(ultraperformance liquid chromatography,UPLC)、电喷雾(electrospray ionization,ESI)是常用的两种电离技术。CE对分析物的分离范围较宽,包括小的无机离子和大分子蛋白质[13]。毛细管电泳近年来发展较快,以其分离效率高、样本需要量少、运行成本低等优点得到广泛应用,当CE联合高灵敏度的质谱检测器,代谢物最小检测限会降低。但是毛细管电泳因进样量少,因此限制了检测的灵敏度。由上可知,想对临床种类、性质各异的样品进行全面、无偏向性代谢组学分析,分析检测技术需要具有高通量、高特异性、高敏感度等特点。目前还没有任何一个分析平台能够满足上述所有要求,因此为了自身研究需要,多平台联合检测的方法日趋流行。
1.2代谢组学数据分析平台 技术分析平台采集的原始数据不能直接用于分析,因而在统计分析前运用模式识别技术对这些数据进行预处理可以从中获得正确有效的信息,将其变成可识别的数据模式,才能运用于下一步的分析。根据技术平台的变化,数据预处理主要有过滤噪声、峰识别、谱图去卷积、标准化和归一化等步骤,在操作中根据实际情况选择相应的步骤进行即可。常用的化学计量方法主要分为两类,包括非监督性和有监督性的学习方法。前者包括非线性映(nonlinear mapping,NLM)、主成分分析(principal components analysis,PCA)、自组织映射图(self-organizing maps,SOM)等,后者常用的有神经网络的改进、偏最小二乘法一判别分析(partial least squares-discriminant analysis,PLS-DA)、正交偏最小二乘法一判别分析(OPLS-DA)等[14-15],PCA和PLS-DA在研究中较为常用,通过各类数据分析技术,将多维、分散的数据进行分类、归纳和总结,对组间差异代谢物可进行初步的筛选,之后结合差异性代谢产物,挖掘相关的代谢调控途径,可以为肿瘤早期诊断、分期、评估疗效和预测预后等方面奠定良好基础。
肿瘤细胞与正常组织相比常发生代谢紊乱,其代谢旺盛,具有超强的增殖能力与逆境生存能力。体内肿瘤细胞的任何改变都会引起其生化反应过程中代谢产物发生变化,而代谢物作为肿瘤细胞生存发展过程的产物,能够对肿瘤的整体状态进行准确的判断反映[16-17]。代谢组学因研究思想独特和技术手段发展迅速的优势被广泛地用于研究肿瘤领域,目前,国内外已有多个专家学组对结直肠癌进行代谢组学研究。
2.1组织中的代谢组学研究 Phua等[18]应用GC-TOF-MS技术对11例结直肠癌患者的肿瘤组织和10例健康人黏膜样本进行分析,显示3-磷酸甘油酸盐(3-phosphoglycerate)、葡萄糖、柠檬酸及半乳糖在CRC患者组织样本中的含量明显低于健康对照组,而尿苷、肌苷(inosine)、脯氨酸等代谢物的含量升高。Williams等[19]基于分期因素对收集的结直肠癌组织与癌旁组织进行代谢组学分析,发现筛选鉴定出的代谢物标志对CRC的早期诊断及评估预后有警示作用。Tian等[20]用高分辨率魔角旋转和气相-色谱-质谱技术分别对50例CRC患者(分Ⅰ~Ⅱ、Ⅲ ~ Ⅳ期)癌组织及相邻的正常组织进行代谢组学分析,结果显示:相较于正常组织,胆碱、磷酸胆碱(PC)、甘油磷酸胆碱(GPC)、鲨肌醇、磷酸乙醇胺 (PE)在癌组织中含量较高,且与早期肿瘤组织相比,Ⅲ ~ Ⅳ期CRC患者癌组织中的脂质含量高、而胆碱含量低。联合应用 PCA、OPLS - DA分析法,发现Ⅰ期癌组织与正常组织间的脂质组学差异最大。早晚期、正常组织间脂质含量及类型的不同,可帮助指导临床CRC诊断并判别分期。杨静[21]研究发现miR-135b在结直肠癌患者组织中的表达高于癌旁组织,且水平随TNM分期增加而增加,认为肿瘤细胞可能与调节miR-135b表达密切相关,并且通过调节miR-135b的表达来影响CRC患者的预后。2018年有研究者对51例结直肠癌组织标本进行分析,其中25例转移型结直肠癌显示了明显更低百分比的二十碳五烯酸(EPA)和更高水平的γ-亚麻酸(GLA),由此可见,脂肪酸分析对于转移型结直肠癌有良好的诊断价值[22]。
2.2血液中的代谢组学研究 Ritchie等[23]基于脂肪酸代谢途径对不同区域CRC患者血清样本进行分析,结果显示:CRC患者拥有较低水平的28 ~ 36含碳量的羟基化多不饱和超长链脂肪酸。Montrose等[24]研究结直肠癌血浆标本代谢物发现,肌氨酸、甘氨酸、丝氨酸和二甲基甘氨酸明显升高,且血浆中氨基酸代谢改变发生在早癌阶段。这表明氨基酸代谢通路对肿瘤细胞早期增殖分化和生存有着重要作用,因此氨基酸代谢指标的变化可作为结直肠癌早期诊断的潜在标志物。Zhu等[25]在对20例CRC患者连续的49份血清样本进行LC-MS技术分析时,共发现162个代谢物,其中N2、N2-二甲基鸟苷、1-甲基鸟苷、甲基丙二酸盐、琥珀酸盐、腺嘌呤、焦柠檬酸在疾病恶化患者血清中的水平显著高于疾病稳定和完全缓解者,建立由上述差异代谢物表征的模型,其受试者工作曲线、灵敏度、特异性均优于传统的标志物CEA,该研究表明代谢物轮廓分析可以用于CRC病程监测。Kühn等[26]通过LC-MS法对163例CRC患者血液标本进行脂质和己糖方向的代谢组学分析,结果发现溶血磷脂胆碱(lysoPCs)表达水平越高,结直肠癌发病风险越低,且恶性肿瘤被诊断出的时间往往比血清中脂质代谢物变化发生要迟数年,相较于目前临床常用的肿瘤标志物对CRC诊断及预防缺乏特异性,溶血卵磷脂可以作为早期诊断CRC的代谢指标运用于临床。Nishiumi等[27]运用代谢组学技术分析CRC(分期为 0、Ⅰ、Ⅱ期)患者血清标本,其中发现一组由丙氨酸、鸟氨酸、赖氨酸、3-羟基异戊酸、羟基乙酸、棕榈酸、延胡索酸色氨酸构成的新组合。上述代谢物组合预测CRC的特异性为99.3%,敏感性为93.8%,随肿瘤分期的增加,其敏感性、特异性逐渐降低。在一项涉及250例CRC血样本的队列研究中,发现包括4个有机化合物、5个有机酸、7个芳香族化合物、9个非甘油磷脂脂类、12个甘油磷酸脂类在内的共35个代谢产物失调与结直肠癌发生相关[28],结直肠癌高风险性与甘油磷酸脂类失调关系最为密切,具有诊断价值。
2.3尿液中的代谢组学研究 Chen等[29]及樊静等[30]运用基于MRB的CE-MS技术分析结直肠癌患者(早期8例、晚期12例)以及14例健康人尿液样本中的9种有机酸和20种游离氨基酸,结果发现:与正常对照组相比,精氨酸、亮氨酸、缬氨酸、乳酸和异亮氨酸这5种氨基酸在肠癌患者尿液标本中的含量较高,而苹果酸、琥珀酸盐、门冬氨酸、柠檬酸、组氨酸、甲硫氨酸、丝氨酸含量显著降低;随结直肠癌病理分期的提高,缬氨酸、异亮氨酸含量逐渐降低。由此可见,结直肠癌患者与健康人之间、早期与晚期肠癌患者之间的尿液代谢轮廓差异都存在统计学意义。Cheng等[31]收集61份CRC患者和62份正常对照者的尿液样本,联合运用UPLC-QTOFMS、GC-TOFMS技术,构建了由2氨基丁酸盐、犬尿酸、枸橼酸、马尿酸盐、腐胺、十四酸盐和对甲酚7个代谢物组成的模型,并后续利用健康对照组和结直肠癌患者各40份的尿液样本进行了验证。该诊断模型通过ROC曲线分析,在测试组和确认组中诊断结直肠癌的特异性与灵敏度均超过97%。有研究发现,肝再生磷酸酶3(PRL-3)通过诱导HK2、PKM2、葡萄糖转运蛋白1(Glutl)和LDHA表达促进糖酵解和减少胞内ROS水平,在肝转移型结直肠癌的代谢调节中起重要作用[32]。
2.4粪便中的代谢组学研究 徐梅华等[33]利用端粒酶PCR-ELISA法分析端粒酶在健康对照者、结直肠腺瘤患者及大肠癌患者的粪便肠脱落细胞中的活性表达,结果显示按健康对照者、结直肠腺瘤患者及大肠癌患者顺序,端粒酶阳性表达率逐渐上升。由此可以看出,粪便肠脱落细胞端粒酶活性表达对大肠癌的早期筛查有潜在意义。2017年有研究证实,与正常对照组相比,结直肠癌患者中熊去氧胆酸、丁酸盐、亚油酸等水平明显降低。2018年Ahmed等[34]研究证实,miR-135b在对照组、腺瘤组到肠癌组中的表达水平依次增加,并由此证明了粪便标本中的miR-135b可作为晚期腺瘤和CRC诊断的代谢标志物。Song等[35]收集粪便标本进行代谢组学分析发现,肠癌患者与健康对照组的脂肪酸代谢轮廓显著不同,提示粪便脂肪酸可以成为CRC筛查的新型工具。Bosch 2019年对11项研究进行分析总结,提出短链脂肪酸和氨基酸在粪便气相中水平升高,而多元醇和胆汁酸水平降低[36]。
综上所述,CRC患者的组织、血、尿、粪便中的代谢物均发生改变,通过检测其中各种代谢产物,如糖类、脂质、脂肪酸、氨基酸和miRNA等,可筛选鉴定出差异代谢物,联合运用数据库信息分析,能得到相关的紊乱代谢通路,代谢组学因自身固有优势在CRC临床研究中有着良好的应用前景。但是我们也发现随着样本种类、数量,研究人员,技术方法等因素的变化,代谢组学研究分析的结果也存在差异。标本收集处理标准不一、无标准化实验流程、技术平台操作复杂、数据分析软件功能较少等局限使代谢组学的运用还需要进行更多的实验和临床研究探索。笔者相信随着技术手段的不断完善和优化,运用代谢组学技术对结直肠癌进行研究分析会出现更多的成果,从而为肿瘤诊断、分期、评估疗效和预测预后等提供更多的信息和帮助。
利益冲突:所有作者均声明不存在利益冲突。