基于TCGA数据库分析MEAK7在非小细胞肺癌中的表达和临床意义

2024-03-16 10:01徐凯丽吕昕
浙江临床医学 2024年2期
关键词:线图肺癌数据库

徐凯丽 吕昕*

肺癌是世界上最常见的恶性肿瘤之一,在我国肺癌的发病人数和死亡人数均居恶性肿瘤首位[1-2]。目前肺癌预后预测主要依赖于组织病理学诊断和肿瘤分期系统,但这不足以准确评估预后[3]。TCGA 数据库已被广泛应用于科研工作。本研究利用数据库中1,149 个非小细胞癌样本的转录组测序数据构建Cox 比例风险回归模型,可用于非小细胞肺癌预后风险评估[4]。哺乳动物雷帕霉素靶蛋白(mTOR)是PI3K 相关蛋白激酶家族中的一种丝氨酸/苏氨酸蛋白激酶。mTOR 主要通过调节膜蛋白运输、蛋白质降解、蛋白激酶C 信号以及核糖体合成等途径,参与细胞生长与增殖的调控。其中,mTOR 可通过激活PI3K/AKT/mTOR 和AKT/TSC1-TSC2/mTOR 信号通路实现上述调节效应[5]。在包括非小细胞肺癌(NSCLC)在内的多种肿瘤中mTOR 呈激活状态。有实验数据显示PI3K/AKT/mTOR 通路在NSCLC样本中存在激活。通过免疫组化可见,NSCLC 切除组织中PI3K、AKT 和mTOR 的磷酸化水平较正常细胞显著升高[6]。MEAK7 是mTOR 的相关蛋白,其可模拟雷帕霉素在人类细胞中的作用机制激活mTOR 信号传导。作为mTOR 的必需互作蛋白,MEAK7 通过MTB 结构域与mTOR 结合,将信号传导至溶酶体并参与mTOR 的溶酶体靶向募集[7]。然而MEAK7 在非小细胞肺癌肿瘤中的表达及其与NSCLC 患者生存关系研究鲜有报道[8]。

1 资料与方法

1.1 数据来源 从Genomic Data Commons(GDC)数据门户网站(https://portal.gdc.cancer.gov/)下载癌症基因组图谱(TCGA)数据库肺癌基因转录组数据及临床数据,用Perl 软件(5.32.1.1 版本)将数据进行整理并将转录组数据与临床数据进行整合,最终收集肺鳞癌和肺腺癌的mRNA 表达谱和临床数据1,149 例(包括肺腺癌598 例,肺鳞癌551 例)。

1.2 基因表达差异分析 MEAK7 的表达分组比较通过R 软件包ggplot2(3.3.3 版本)进行实现,Wilcoxon 秩和检验分析结果显示,P值<0.05 被认为具有统计学意义。

1.3 生存分析 采用对数秩检验进行生存分析,临界值设定在MEAK7 的中位表达水平。单变量和多变量Cox 回归分析用于评估临床变量对患者结局的影响。将单因素Cox 回归分析中的预后变量P<0.1 输入到多变量Cox 回归分析中。R 包ggplot2 用于可视化作图。

1.4 列线图的构建和验证 为了预测总生存概率,在多变量Cox 分析中建立了基于独立预后因素的列线图。然后使用校准图来评估列线图的性能,并使用一致性指数(C 指数)来量化列线图。列线图和校准图是使用R包RMS 创建的,使用timeROC 包执行随时间变化的受试者工作特征(ROC)曲线以评估预测精度。

1.5 基因表达相关性分析 基因相关性图通过R 软件包ggplot2(3.3.3 版本)进行实现,使用Spearman 的相关分析来描述-正态分布的定量变量之间的相关性。分析数据中两两变量之间的相关性,并使用circlize 包对相关性结果进行可视化。

1.6 统计分析 所有统计分析均使用R(版本3.6.3)进行,采用Wilcoxon 秩和检验和配对样本t检验分别评估MEAK7 在非配对和配对组织中表达的统计学意义。采用Wilcoxon 秩和检验和Logistic 回归法评估临床特征与MEAK7 表达之间的相关性。所有检验均为双侧检验,P<0.05 为差异具有统计学意义。

2 结果

2.1 非小细胞肺癌患者临床资料及MEAK7 表达的单因素及多因素Cox 分析 见表1。

表1 非小细胞肺癌患者临床资料及MEAK7表达的单因素及多因素Cox分析

2.2 MEAK7 在肿瘤中表达情况 应用TIMER2 方法分析MEAK7 在TCGA 中的各种癌症类型中的表达水平。MEAK7 在膀胱尿路上皮癌(BLCA)、胆管癌(CHOL)、结肠癌(COAD)、食管癌(ESCA)、头颈鳞状细胞癌(HNSC)、肾乳头状细胞癌(KIRP)、肝细胞肝癌、肺腺癌、肺鳞癌、前列腺癌(PRAD)、直肠腺癌(READ)、胃癌(STAD)等18 个肿瘤组织中的表达水平均高于相对应的正常组织(P<0.05)(图1A)。差异表达分析结果显示,与正常癌旁组织相比,MEAK7 在肺非小细胞癌组织中明显上调(P<0.05)。配对差异分析结果表明,与相邻正常的组织相比,肺癌组织中MEAK7 处于高表达。综上,所有结果均显示MEAK7 在肿瘤中的表达水平明显高于正常组织,表明MEAK7 可能是影响肺癌预后的潜在关键基因(图1B、1C)。作者又进一步通过ROC 曲线评估预测我们实验的准确性,AUC 结果为0.815,进一步证明了实验的准确性(图1D)。

图1 在不同类型肿瘤和肺癌中的MEAK7表达水平。A. 与TCGA和GTEx数据库中的正常组织相比,MEAK7在不同类型的肿瘤中的表达;B. 在TCGA和GTEx数据库的非小细胞肺癌和正常组织中;C. 在非小细胞肺癌和TCGA数据库中的匹配正常组织;D. TCGA数据库中非小细胞肺癌与正常组织分类的ROC曲线

2.3 基于临床特征分析MEAK7 表达 通过对临床样本数据分析,在不同临床表型的分布情况可以看出,肺癌中MEAK7 的高表达与分期、分级和年龄等临床特征显著相关。结果显示,MEAK7 表达随着T、M 分期进展而升高;同时与淋巴结浸润相关;同时,MEAK7 表达与年龄正相关;吸烟患者的MEAK7 表达亦明显高于不吸烟患者;男性患者的MEAK7 表达高于女性;同时在生存状态的亚组间有显著的差异。见图2。

图2 基于临床特征分析MEAK7表达。注:*P<0.05,**P<0.01,***P<0.001

2.4 MEAK7 对肺癌患者的预后影响 利用风险模型结合临床特征肿瘤TNM 分期、年龄、性别分级构建列线图(图3A)。校准曲线显示,校正曲线接近理想曲线,表明列线图模型预测结果与实际结果有较好的一致性(图3B)。进一步通过ROC 曲线(1、3、5 年)评估预测实验的准确性(图3C)。在Kaplan-Meier 曲线分析的结果中均显示,MEAK7 的高表达与患者的低OS、DSS 相关,且结果均具有统计学意义(图3D、3E)。

图3 MEAK7对肺癌患者的预后影响。A:利用风险模型结合临床特征肿瘤TNM分期、年龄、性别分级构建列线图;B:校准曲线表明列线图模型预测结果与实际结果有较好的一致性;C:通过ROC曲线(1、3、5年)评估预测实验的准确性;D、E:在Kaplan-Meier曲线分析基于OS、DSS相关,且结果均具有统计学意义(图D、E)

2.5 MEAK7 相关结合蛋白的相互作用网络 为了进一步研究MEAK7 基因在肿瘤发生中的分子机制,筛选出了MEAK7 的靶向结合蛋白和MEAK7 表达相关基因,最终获得了20 个MEAK7 相关结合蛋白。见图4。

图4 MEAK7相关结合蛋白的相互作用网络。A:20个MEAK7相关结合蛋白的相互作用网络;B:MEAK7与这20个蛋白的共表达热图

3 讨论

MEAK7 是mTOR 信号的阳性调节因子,在人类细胞中通过S6K2/4E-BP1 轴发挥作用[9]。MEAK7 在转移性人类癌症中显著表达,并形成一种新的涉及DNAPK 的mTOR 复合物,以促进S6K2 信号传导并抑制4EBP1。研究表明,mTOR 信号异常会导致神经系统疾病如进行性肌阵挛性癫痫、癌症等多种疾病,因此更全面地了解mTOR 和MEAK7 的相互作用可能对预防或治疗这些人类疾病很重要[10]。mTOR 是磷脂酰肌醇-3 激酶相关激酶(PIKK)家族的成员。能有效调节细胞代谢、DNA 修复途径和基因组监测。mTOR 信号传导由两种多蛋白复合物定义[11]。溶酶体是mTOR 信号传导的重要细胞区室。MEAK7 锚定在溶酶体膜上,并与DNA PK形成替代mTOR 复合物,以调节mTOR 信号[12]。

本研究基于TCGA 数据库,初步探究了MEAK7 在NSCLC 患者中的预后和表达以及相关结合蛋白。初步结果表明,MEAK7 在NSCLC 中高表达;肿瘤分期越高,MEAK7 表达越高;高表达MEAK7 的NSCLC 患者总生存期低。作者也探索了与MEAK7 相关基因以及存在潜在相互作用的蛋白最终获得了20 个与MEAK7 相关结合蛋白。本研究采用了多种生物信息学方法,处理了大量数据并进行分析,但目前的研究仅限于运用数据库相关数据进行研究及验证,接下去作者将展开MEAK7 在NSCLC 中的调节作用的基础实验等方面研究。

猜你喜欢
线图肺癌数据库
个体化预测结肠癌术后发生并发症风险列线图模型的建立
中医防治肺癌术后并发症
对比增强磁敏感加权成像对肺癌脑转移瘤检出的研究
基于箱线图的出厂水和管网水水质分析
数据库
东山头遗址采集石器线图
数据库
数据库
数据库
microRNA-205在人非小细胞肺癌中的表达及临床意义