刘伟强,符洋
(郑州大学第一附属医院 胃肠外科,河南 郑州 450052)
结直肠癌是国内外常见的恶性肿瘤之一,也是目前恶性肿瘤相关死亡的主要原因之一[1-2]。既往文献统计结果显示,结直肠癌在男性中是第三常见的恶性肿瘤,在女性中是第二常见的恶性肿瘤,发病率分别占全球恶性肿瘤总患病人数的10%和9.2%[3]。近年来,结直肠癌的发生逐渐出现年轻化的趋势,可能与遗传因素、不良的饮食和生活习惯有关,此类患者的预后相对更差[4]。目前治疗结直肠癌的手段以手术联合化疗、放疗、免疫治疗的综合治疗为主。随着蛋白质组学、转录组学、单细胞组学等高通量技术的发展,临床对结直肠癌的生物学行为和发展有了更深的理解,但结直肠癌的治疗效果仍欠佳,患者的预后仍然较差,迫切需要寻找更加有效的生物标志物和治疗靶点。因此,深入探讨结直肠癌中分子水平的变化及其机制,对更好地理解结直肠癌的发生发展机制具有重要意义,也有助于精准治疗的发展。蛋白质组学是一种利用液相色谱和质谱联用的手段,根据质荷比测定细胞、组织或其他样本中蛋白质相对含量的高通量测序手段[5]。由于蛋白质组学具备高通量、精准、快速的优点,目前被广泛用来测定生物样本中的蛋白质含量。近些年来,依托于蛋白质组学技术,越来越多的研究瞄准肿瘤中蛋白质表达的变化,同时结合生物信息学手段对肿瘤组织进行深入的分子分型及药物靶点预测,极大地提升了对恶性肿瘤的认知。本研究旨在利用蛋白质组学结合组织芯片探讨结肠癌中蛋白质表达的变化,并利用生物信息学方法分析脑源性神经营养因子(neuron-derived neurotrophic factor,NENF)与临床因素及患者预后的相关性。
1.1 样本来源选择2019年10月至2020年3月病理确诊为结肠腺癌且未进行术前化疗的10对癌组织及对应的癌旁组织,做好标记放入液氮储存(样本信息见表1)。另选择2008—2015年手术后的结肠癌患者,通过电话等随访,收集临床病理数据,筛选具有完整随访记录和病历信息的75例癌组织和63例癌旁正常组织制作组织微阵列。将总生存时间作为观测终点。本研究所使用的生物样本均已经获得郑州大学第一附属医院医学伦理委员会批准。
表1 结肠癌蛋白质组学样本基线资料
1.2 主要仪器和试剂高分辨轨道阱液质联用质谱仪( Q-Exactive HF-X)购于赛默飞公司;E2695高效液相色谱仪购自沃特世;研磨机器购自于上海净信;4 ℃离心机购于艾本德公司;制冰机购于松下;鼠NENF多克隆抗体购于艾博抗 Abcam(上海)贸易有限公司;抗鼠 IgG 二抗购于北京中杉金桥生物技术有限公司。
1.3 蛋白质组学相关实验方法
1.3.1蛋白提取 从-80 ℃冰箱中取出组织样本放置于冰上,使用灭菌后的组织剪剪取组织,并称量约30 mg。用预冷过的磷酸缓冲盐溶液洗涤组织2~3次。剪碎组织,加入600 μL ripa裂解液。在离心管中加入3.2 mm的研磨珠3粒及1.0 mm的研磨珠6粒,置于组织研磨仪中。研磨仪参数设置为:频率65 Hz,运行30 s,2次,每次间隔10 s。在冰上裂解30 min。之后8 000 r·min-1离心20 s,并将上清液转移至新的离心管中;4 ℃下离心,10 000 r·min-1离心10 min,取上清液移入新的离心管中。将5倍体积的预冷丙酮加入离心管中,涡旋混匀60 s,然后置于-80 ℃冰箱沉淀60 min。取出离心管,4 ℃ 10 000 r·min-1离心10 min后弃上清液,加入500 μL预冷的80%(体积分数)丙酮洗涤沉淀2次,弃上清液并吸尽残留丙酮。然后加200 μL的25 mmol·L-1碳酸氢铵溶液,涡旋60 s后,冰浴超声40 min,使蛋白沉淀,充分溶解。使用碧云天试剂盒并按照试剂盒说明书采用BCA法测定蛋白浓度。
1.3.2蛋白酶解 将提取的蛋白移出120 μg进行酶切,按总蛋白∶胰酶= 50∶1加入胰蛋白酶,混匀后,延离心管口缓慢吹入氮气,置于混匀仪上,调整温度为37 ℃,频率为700 r·min-1,持续酶切12 h。然后按100∶1加入胰酶,37 ℃震荡二次酶切,时间为2 h。使用C18小柱将多肽脱盐。
1.3.3肽段分级 使用反向高效液相色谱法(high performance liquid chromatography,HPLC)对肽段进行分级,将样本分为10个馏分。流速为每分钟0.5 mL。收集流出液,收集第1~56 min之间的馏分,共56管,按照间隔10个馏分合瓶的顺序进行合瓶,如2-12-22-32-42-52合为1瓶。打开冻干机冻干肽段,后储存于-80 ℃冰箱备用。
1.3.4质谱检测 使用Easy-nLC 1200纳升级液相色谱仪作为液相与Thermos Q Exactive HF-X-Orbitrip液质联用质谱仪进行数据采集。流动相A相为体积分数为0.1%的甲酸水,B相为体积分数为80%的乙腈。使用数据依赖的采集模式采集质谱仪数据。采用高能碰撞解离方式进行离子碎裂,设置碎裂能量为28%。扫描范围为350~2 000 m·z-1。然后选取相对数量排名前25位的母离子再次碎裂,二级质谱扫描的质量分析器同样使用离子阱,分辨率为15 000,最大离子注入时间为45 ms。设置阈强度为5×104,设置动态排阻为50 s,生成质谱检测原始数据。
1.3.5数据搜库和差异分析 将原始数据导入到蛋白质组学发现2.4(Proteome Discovery 2.4,PD 2.4)软件中,结合从Uniprot数据库(https://www.uniprot.org/)中下载的人类蛋白质比对数据库,利用PD内置的SEQUEST算法进行蛋白质组学数据的搜库。参数设置:组成肽段的氨基酸数目超过6个,只允许最多2个漏切位点,母离子的质量容差为10 ppm(1 ppm=10-6),碎片离子的质量容差为20 ppm(1 ppm=10-6),设置甲硫氨酸氧化和N端乙酰化修饰为可变修饰。FDR值为1%。对10对结肠癌组织与癌旁组织进行配对Student’st检验分析两组蛋白质表达的差异,定义对数转化后的差异倍数(log2FC)>1且P<0.05为上调蛋白,而log2FC<-1且P<0.05为下调蛋白。
1.3.6差异蛋白注释及功能富集分析 利用偏最小二乘判别法(partial least squares discriminant analysis,PLS-DA)将样本所包含的大量蛋白质表达量信息降维为少数几个互相无关的主成分,以进行样本间的比较。利用g:profiler(https://biit.cs.ut.ee/gprofiler/convert)数据库进行基因本体(gene ontology,GO)分析,根据基因的分子功能、细胞成分及定位、可能参与的生物学过程将差异蛋白的信息对差异蛋白进行注释。应用KOBAS(http://kobas.cbi.pku.edu.cn/)对差异基因进行富集分析。借助蛋白质图谱数据库(https://www.proteomaps.net/)分析差异蛋白的富集权重。其中不同区域代表蛋白质丰度,大小代表加权,模块越大代表权重越大[6]。
1.4 公共数据库下载分析分别下载了癌症基因组图谱(the cancer genome atlas,TCGA)中的结肠癌mRNA表达数据,包括GSE20970、GSE83889、GSE39582。提取各个数据集中NENF的mRNA表达量,并用t检验分析NENF在结肠癌组织及癌旁正常组织中的表达差异。同时利用GSE17536中的预后数据,使用log-rank检验NENF的表达异常对患者无病生存时间的影响。利用KMplot数据库分析NENF在结肠癌转移组织、癌组织和癌旁组织中的表达差异。
1.5 组织微阵列制作及分析将138例样本放置在体积分数为10%的甲醛中固定,后将标本分别浸入体积分数为30%、50%、70%、80%、90%、100%的乙醇中,按顺序依次脱水处理。利用二甲苯与无水乙醇混合液、纯二甲苯进行透明化处理。用液体石蜡包埋制作蜡块,最后使用组织微阵列点样仪连续切片,并设置切片厚度为4 μm,随后放置在烘干机烤片。按照抗体说明书对抗体进行适当的稀释,然后将切片置于二甲苯、梯度酒精、抗原修复盒中,在4 ℃环境下完成抗体孵育过夜,低钾3,3N-二氨基苯胺四氢氯化物(3,3N-diaminobenzidine tertrahydrochloride,DAB)液显色后,在显微镜下观察并掌握染色程度。使用组织切片数字扫描仪采集免疫组化切片上的图像,利用赛维尔图像分析系统自动读取组织测量区域,并计算出组织化学评分。此方法将每张切片内阳性数量及其染色强度转化为相应的数值,达到对组织染色半定量的目的。组织化学评分数值越大,说明综合阳性强度越强[7-8]。
1.6 统计分析及可视化使用R-4.03或者Grahpad 8.3进行数据分析和作图。对于两组连续变量之间的比较使用配对或者非配对student’st检验;对于两组以上的数据比较使用Kruskal-Wallis检验方法。在组织微阵列数据中以NENF表达中位数分组,采用Kaplan-Meier方法绘制生存曲线,评估其高低表达对患者总生存时间的影响,采用log-rank进行统计学检验。P<0.05为差异有统计学意义。
2.1 蛋白质组学蛋白鉴定及差异分析结果本研究利用10对结肠癌组织进行蛋白质组学测序,共鉴定得到10 809种蛋白质。进一步过滤掉在总体样本中表达缺失值>30%的蛋白质后,纳入9 695种蛋白质进行后续分析。根据质谱蛋白数据,PLS-DA分析显示,结肠癌组织样本和癌旁组织之间蛋白质表达谱有一定差异(图1A)。进一步利用配对t检验进行癌组织与癌旁组织的差异蛋白分析,以差异倍数|log2FC|>1同时P<0.05作为差异的标准,最后总共鉴定出429种差异表达蛋白,其中333种在结肠癌组织中上调,96种在结肠癌组织中下调。根据差异倍数,排名前10位的上调蛋白有:CRABP1、NSRP1、ABHD17C、GLYCTK、HLA-DRB1、CBLB、SEMA4D、SPIRE1、ATF7、KRT4(表2)。同时绘制火山图展示差异蛋白结果(图1B)。
表2 上调倍数前10位的差异蛋白
2.2 上调蛋白的GO分析在生物学过程中,结肠癌组织样本主要与细胞大分子代谢、对外界刺激反应的调节、蛋白质代谢、rRNA代谢、细胞代谢调节等相关。细胞内定位和成分分析结果显示,上调蛋白主要分布在细胞质、细胞核、内膜系统。在分子功能方面,上调蛋白主要与蛋白结合、酶结合、磷脂酰肌醇磷酸5-磷酸酶活性、催化活性等功能相关。见图2。
2.3 差异蛋白注释及京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)分析利用蛋白质图谱描绘在结肠癌组织样本中高表达蛋白质的分布发现,上调蛋白主要与信号转导、折叠排列和降解、转录、生物合成、信号分子相互作用、免疫系统相关(图3A)。进一步分析发现,上调蛋白主要与转录因子、MAPK信号通路、剪切体、脂质和类固醇代谢等通路相关(图3B)。KEGG分析显示,上调的蛋白主要富集的通路包括癌症相关通路、PI3K-AKT信号通路、磷脂酰肌醇信号系统、磷脂酶D信号通路、mTOR信号通路、MAPK信号通路(图3C)。
A为生物学功能;B为细胞内定位;C为分子功能。
A、B为蛋白质图谱富集结果; C为KEGG富集结果。
2.4 NENF在结肠癌中的表达及蛋白质互作(protein protein interaction,PPI)网络分析为了分析结肠癌中的关键蛋白质,进一步对比了10个癌组织样本中周围神经侵犯阳性(5例)和周围神经侵犯阴性组(5例)中差异表达的蛋白。NENF在周围神经侵犯阳性癌组织中表达升高(P<0.05)(图4A)。既往有研究表明周围神经侵犯可能与肿瘤细胞中神经营养因子、生长因子的异常升高有关[9]。NENF是一种神经营养因子样的生长因子。NENF在肝癌中异常升高,体外实验显示沉默NENF会引起抑制肝癌细胞的恶性生物学行为[10]。NENF在结肠癌组织中表达量升高(P<0.05)(图4B)。利用STRING分析与NENF相互作用的分子,结果显示,CYB5A、EM206、FOXRED2、LARP1B、PCYOX1等与NENF相关(图4C),具体相关性得分见表3。
表3 与NENF相关的基因
2.5 公共数据库分析NENF在结肠癌中的表达NENFmRNA的表达在结肠癌组织中升高(P<0.05)(图5)。在GSE39582队列中,Ⅰ~Ⅳ期NENFmRNA的表达量均高于癌旁组织(P<0.05)(图6)。进一步使用KMplot数据库中的大队列、多中心的数据分析,结果显示NENF在结肠癌转移组织中的表达高于结肠癌组织和癌旁组织(P<0.05)(图7)。结合自测的蛋白质组数据,发现结肠癌中NENF的蛋白质水平和mRNA水平均异常升高,在转移组织中表达量更高。从GSE17536队列中提取NENF的表达量和患者无病生存期信息,利用Kaplan-Meier分析NENF的表达与结肠癌患者无病生存期的相关性,发现NENF高表达与结肠癌患者较短的无病生存期相关(HR为2.41,95% CI:1.24~4.69,P<0.05)(图8)。
A、B、C、D为NENF mRNA在结肠癌组织和癌旁组织中的表达情况,数据库包括GSE20970(A)、GSE83889(B)、GSE39582(C)、TCGA(D)。
2.6 结肠癌组织芯片中NENF蛋白表达分析为了进一步分析NENF在结肠癌中的表达及其对患者预后的影响,选取138例结肠癌样本制作组织微阵列,其中癌组织75例,癌旁组织63例。癌组织及癌旁正常组织的染色结果如图9,结果显示NENF在结肠癌组织中的表达量更高。对癌组织及癌旁组织中NENF的表达进行差异分析,结果显示NENF在肿瘤组织中的表达量高于癌旁对照组织(P<0.05)(图10A)。进一步分析不同临床分期中NENF的表达量变化,结果显示,Ⅳ期患者NENF的表达量较Ⅱ期或者Ⅲ期的患者高(图10B)。结合对应的生存状态和生存时间数据,以NENF表达量的中位数分组,表达量大于中位数的为高表达组,小于中位数为低表达组。利用Kaplan-Meier分析NENF的表达对患者预后的影响,结果显示,NENF高表达患者的总生存时间更短(HR为2.19,95% CI:1.07~4.48,P<0.05)。见图11。
图6 GSE39582数据集中NENF的表达与临床分期之间的关系
图7 KMplot数据库NENF在结肠癌转移组织、癌组织和 癌旁正常组织间的表达差异
图8 GSE17536数据集中NENF的表达异常对患者 无病生存期的影响
DAB染色,100×。
A.NENF在癌组织和癌旁组织的表达差异;NENF在不同分期癌组织中的表达差异。
图11 NENF表达与患者预后的生存分析
结肠癌是一种全球范围内发病率和病死率均较高的消化道恶性肿瘤,近年来发病趋于年轻化。晚期结肠癌的生存率不足8%[11-12]。因此,深入探讨结肠癌的发生发展机制对结肠癌的诊断、预后评估及治疗具有重要意义。
本研究利用蛋白质组学分析结肠癌组织中蛋白质表达的变化,并利用生物信息学分析结肠癌组织中富集到的信号通路,对更深入理解结肠癌发生、进展中的分子变化提供了有力的证据。对比分析结肠癌组织与癌旁组织中蛋白质表达的差异,发现在癌组织中上调的蛋白质有333种,部分蛋白质在包括结肠癌在内的多种恶性肿瘤的发生发展中有重要作用。既往文献报道血小板衍生生长因子B可以促进结肠癌血管增生,并促进结肠癌细胞的增殖和肝转移的发生[13-14]。异常高表达PIK3CD可以激活AKT通路,促进结肠癌细胞的生长和侵袭[15-17]。结直肠癌中肝细胞生长因子异常上调与患者较差的预后有关[18]。在差异蛋白富集方面,本研究发现结肠癌组织中富集的通路主要有PI3K-AKT、磷脂酰肌醇、磷脂酶D、mTOR、MAPK等信号通路。既往文献报道磷酸肌醇3-激酶的活性异常会引起下游AKT的异常激活,从而影响细胞的生长、发育等表型,其异常激活在胃癌、肝癌、乳腺癌、脑癌等多种癌症中发挥重要作用[15,17,19-20]。本研究结果提示激酶表达增多、相关通路异常激活在结肠癌的发生发展中起到重要作用。针对这些分子和通路的靶点和药物的开发对结肠癌的个体化治疗具有重要意义。
NENF是一种神经营养因子,在神经元发育和脂肪细胞的分化中起作用[21-23]。近些年来逐渐有研究报道NENF参与多种实体肿瘤的发生和发展过程。Koper-Lenkiewicz等[24]报道血浆或者脑脊液中NENF的表达可以作为识别脑癌的重要标志物。Han等[25]发现NENF在乳腺癌中高表达,且其通过激活MAPK和PI3K信号通路促进乳腺癌的进展。本研究结果显示,NENF在结肠癌组织中异常高表达,且在神经侵犯阳性组的表达更高。结合公共数据库数据进一步证实了NENF在结肠癌中mRNA和蛋白质水平均异常高表达。最后利用结肠癌组织芯片分析NENF蛋白水平的表达,再次验证NENF在结肠癌组织中呈现高表达,且在较高的临床分期中表达量更高。生存分析显示,NENF高表达患者的总生存时间较短,预后较差。Stefanska等[10]通过体内外实验发现,NENF通过激活MAPK或PI3K-AKT信号通路促进肝癌细胞、胆囊癌细胞和乳腺癌的生长和侵袭等恶性生物学行为。故推测NENF可能通过激活PI3K-AKT信号通路促进结肠癌的发生、发展。
本研究利用蛋白质组学和组织芯片技术揭示了结肠癌组织中蛋白表达的变化,发现并验证了NENF在结肠癌中异常高表达,证明其高表达与患者的预后不良明显相关。NENF有望成为预测结肠癌预后的标志物和潜在的治疗靶点。