方梦婵, 鄢爱平, 万益群*,
(1.南昌大学化学学院,江西南昌 330031;2.南昌大学分析测试中心,江西南昌 330031)
乳腺癌是女性最常见的肿瘤,是导致女性癌症死亡的主要原因之一[1 - 3]。早期乳腺癌的治愈率可达90%,然而大多数乳腺癌在发现之时已到中、晚期[4],导致治愈率下降。目前最普及的乳腺癌筛查和确诊方法主要有X-射线检查、组织病理学以及血液检查。这些方法对乳腺癌的中、晚期诊断有较好的准确性,但对早期乳腺癌的诊断缺乏特异性和灵敏度[5]。因此,寻找乳腺癌早期诊断新方法,对有效提高乳腺癌患者的治愈率意义重大。
肿瘤标志物能够较好地反映癌症的发生、发展过程,且具有简便、客观和便于连续动态观测等优势,对于肿瘤的临床诊断和治疗具有较好的辅助作用。近年来,国内外学者通过代谢组学技术对乳腺癌患者的血清、尿液、组织等样本中的小分子代谢物进行了研究,并取得一定的成效[6 - 9]。Porto-figueira等[10]研究了乳腺癌 (BC)和结肠癌(CC)患者以及健康个体的尿液排泄生物特征。Yu等[11]应用毛细管电泳联合质谱方法,分析了晚期乳腺癌患者和健康人的尿液样本,发现与健康人相比,在对化疗敏感的患者中,化疗后半胱氨酸、甘氨酸、组氨酸和色氨酸水平显著下降,而对化疗不敏感的患者,大部分氨基酸均未显现明显差异。目前,关于乳腺癌肿瘤标志物筛查研究的样本大多来自中、晚期[12],且样本的可控性差,有可能导致分析结果也会产生一定差异。基于此,本文通过构建大鼠乳腺癌模型,以获得可控的尿液样本,应用气相色谱-质谱联用技术,建立了大鼠尿液代谢指纹图谱,并用随机森林(RF)算法对实验数据进行了分析[13,14],对乳腺癌标志物的筛查进行了有益的探索。
Agilent 5977A/7890B气相色谱-质谱仪(美国,安捷伦公司);AR124CN电子天平(奥豪斯仪器有限公司);TG20.5台式高速离心机(上海卢湘仪离心机仪器有限公司);IKA MS3型迷你振荡器(艾卡广州仪器设备(中国)有限公司);MD200-2型氮吹仪(杭州奥盛仪器有限公司)。
N,O-双甲氧基三氟乙酰胺(BSTFA)+1%三甲基氯硅烷(TMCS)(美国Sigma公司);甲氧胺盐酸盐(美国Sigma公司);脲酶(分析纯,美国Sigma公司);吡啶(无水级,99.8%,美国Aladdin公司);甲醇、乙腈、丙酮、正庚烷(色谱纯,国药集团化学试剂有限公司);正二十二烷(美国Aladdin公司);7,12-二甲基苯并[a]蒽(Sigma,D3254-1G)。实验用水由MILLI-QS超纯水器(美国Millipore公司)制备。
SD雌性大鼠购自湖南斯莱克景达实验动物有限公司,重量为150~160 g(5周龄)(合格证编号:43004700033214)。将大鼠随机分为两组,对照组为20只,模型组为50只。适应一周后,乳腺癌诱导模型组大鼠给予一次性灌胃7,12-二甲基苯并[a]蒽(DMBA)玉米油溶液,剂量为80 mg/kg,正常对照组大鼠灌胃等体积玉米油。常规饲养,观察大鼠成瘤情况,并做记录,同时进行组织病理学分析。
DMBA诱导16周后,统计成瘤率。大鼠断颈处死,仰卧位固定在解剖板上,用剃毛器剃除腹部和胸部体毛,观察成瘤数量、位置和大小,剪开瘤体皮肤,摘下瘤体,用生理盐水冲洗瘤体,并用4%多聚甲醛固定,用于HE染色。另外,打开成瘤大鼠胸腔,暴露肺脏,观察肺脏有无明显转移病灶,并剪取部分肺脏用4%多聚甲醛固定,做HE染色。未成瘤大鼠则每只取第2对和第4对单侧乳房,4%多聚甲醛固定,用于HE染色。正常对照组随机取3只大鼠取第2对和第4对单侧乳房,4%多聚甲醛固定,用于HE染色。将固定的标本包埋在石蜡中,每只制备4~5 μm厚的水平切片,进行常规苏木精和伊红染色。然后由相同的病理学家使用普通白光通过光学显微镜检测准备的病理切片。根据组织病理学分析结果,至第十六周时,DMBA诱导成瘤大鼠共计33只,未成瘤大鼠17只。
每周用代谢笼收集对照组和模型组大鼠24 h尿液一次。尿液样品以14 000 r/min的速度离心10 min,去除蛋白质。取50 μL上清液于1.5 mL离心管中,加入20 μL尿酶溶液(80 mg/mL),混合均匀,然后在37 ℃ 条件下加热15 min分解尿样中的尿素。加入180 μL甲醇∶乙腈=2∶1(V/V)混合溶液,涡旋1 min, 14 000 r/min离心10 min。取上清液150 μL,在温和的氮气流下蒸发至近干,然后加入50 μL甲氧胺吡啶溶液(20 mg/mL),于60 ℃反应1 h。冷却至室温,加入100 μL BSTFA+TMCS(99∶1,V/V),60 ℃反应1 h后,再加入450 μL正庚烷(含0.05 g/L二十二烷内标)终止反应。衍生化完成后进行气相色谱-质谱分析。
HP-5MS毛细管柱(30 m×0.25 mm×0.25 μm);进样口温度:250 ℃;升温程序:70 ℃保持4 min,以6 ℃/min升至150 ℃,以4 ℃/min升至190 ℃,再以9 ℃/min升至250 ℃,最后以5 ℃/min升至280 ℃,保持5 min;载气:高纯氦气,流速为1.0 mL/min;进样量1.0 μL;分流进样:分流比为 2∶1。
电离方式:电子轰击离子源(EI);电离能量:70 eV;离子源温度:230 ℃;四极杆温度:150 ℃;采集方式:全扫描m/z35~800;溶剂延迟5.8 min。
大鼠尿液成分较为复杂,其中的内源性代谢物种类多,极性差异大,浓度范围广。为了获得更多内源性代谢物的信息,实验分别考察了有机溶剂甲醇、乙腈和丙酮对尿液样品中内源性代谢物的提取效率。结果表明,甲醇和乙腈的混合溶剂性能优于其他溶剂。本实验选择甲醇∶乙腈=2∶1(V/V)混合溶剂作为尿液样品的提取溶剂。
尿液样品中尿素含量高,若不加处理,在进行色谱分析时,会影响其他化合物的分析。本实验采用脲酶对尿素进行分解,并对脲酶用量、分解温度和分解时间等条件进行了优化。最终选用在50 μL尿液样品中加入20 μL脲酶溶液(80 mg/mL),在37 ℃下反应15 min,尿素分解效果最佳。
为了使尿样中的内源性代谢物达到较好的分离效果,实验分别考察了下列4种升温程序下物质的分离效果:(1) 80 ℃保持5 min,15 ℃/min升温到300 ℃保持10 min;(2) 100 ℃保持3 min,以8 ℃/min升温到280 ℃保持2 min;(3) 70 ℃保持4 min,以6 ℃/min升至150 ℃,以4 ℃/min升至190 ℃,再以9 ℃/min升至250 ℃,最后以5 ℃/min升至280 ℃保持5 min;(4) 70 ℃保持5 min,以5 ℃/min升温到250 ℃,再以8 ℃/min升温到300 ℃,保持5 min。综合考虑色谱峰的数量以及组分的分离效果,本实验选择升温程序(3)。样品的总离子流(TIC)色谱图如图1所示。
图1 大鼠乳腺癌尿液样品的总离子流(TIC)色谱图Fig.1 TIC chromatogram of urine samples from rats with breast cancer
本实验采集了对照组大鼠尿样20例、未成瘤大鼠尿样17例、乳腺癌大鼠尿样33例,在优化的实验条件下进行分析,得到48个共同峰。为了鉴定尿液中的复杂代谢物,将代谢物分为:氨基酸、碳水化合物和脂肪酸三类。脂肪酸衍生物直接用NIST数据库鉴定,而氨基酸和碳水化合物衍生物则通过标准化合物鉴定。实验以正二十二烷为内标,定量结果以代谢物峰面积(Ax)与内标物峰面积(Ai)比值的形式表示。 最后成功鉴定了48个共同峰,定性和定量分析结果列于表1。
表1 大鼠尿样中48个色谱共有峰分析结果Table 1 Analytical results of 48 common chromatographic peaks in the rat urine samples
(续表1)
在本实验中,我们采用RF算法对三组大鼠尿液样本中的代谢物分析结果进行分类。RF算法是一种受监督的机器学习分类器,由于能够有效地区分不同组样本之间的差异,因此得到了广泛的应用[15,16]。该方法能处理高维度的数据,并在训练过程中得到各代谢物的变量重要度信息。其中重要度越高的变量说明对分类的贡献越大,可能是潜在的生物标志物。
如图2所示,不同组之间的差异明显,乳腺癌组可以与健康组、未成瘤组有效地区分开。其中乳腺癌组样本点与健康组的样本点距离较远,未成瘤组样本点分布位于乳腺癌组与健康组之间。未成瘤组大鼠因受药物诱导虽未成瘤,但其代谢与健康组大鼠会有一定差异。图3列出了各代谢产物的变量重要度。结果表明,在乳腺癌组样本和非乳腺癌组样本中具有显著性差异的物质主要有甲基丙二酸、3-羟基丁酸、苏糖酸、对羟基苯乙酸、D -麦芽糖。甲基丙二酸是丙二酸的衍生物,是脂肪和蛋白质代谢中的重要中间体。甲基丙二酸含量出现显著性差异说明乳腺癌可能导致脂肪和蛋白质代谢过程发生异常。3-羟基丁酸是支链氨基酸(主要是缬氨酸)的典型部分降解产物,3-羟基丁酸显著减少显示了氨基酸代谢异常。以上结果表明,由于乳腺癌的存在,导致了生物本身的一些代谢发生了改变,其差异性代谢物有可能是乳腺癌潜在的标志物。
图2 三类样本的随机森林算法分析结果Fig.2 Analytical results of three group samples with random forest algorithm
图3 各代谢产物的变量重要度Fig.3 The variable importance of metabolites
本研究通过构建大鼠乳腺癌模型,获得了可控的样本,采用气相色谱-质谱联用技术对大鼠乳腺癌尿液中的代谢物进行了系统研究,结合随机森林算法,对对照组、未成瘤组和乳腺癌组进行了分类,筛选出具有显著性差异的5种代谢物:甲基丙二酸、3-羟基丁酸、苏糖酸、对羟基苯乙酸、D -麦芽糖。这5种物质出现了明显的差异,说明乳腺癌疾病导致了大鼠代谢发生异常,有可能成为潜在的乳腺癌标志物。