陈伟毅,胡柯,刘雨,彭靖,李小成,段绍毅,陈立军,杨骐彰
(湖南医药学院 1.医学院 2.基础医学院,湖南 怀化 418000;3.湖南医药学院第一附属医院 普通外科,湖南 怀化 418000)
方法:从TCGA和GTEx数据库下载肝癌和正常肝脏组织转录组数据进行差异表达和突变分析。采用R语言“clusterProfiler”包进行GO和KEGG富集分析。采用LASSO、单因素和多因素回归分析筛选影响肝癌患者预后的基因并构建风险因子图。使用R包“rms”构建列线图。使用UALCAN数据库分析铜死亡相关基因与肝癌临床病理特征的关系并验证。使用Spearman相关性分析铜死亡相关基因与免疫细胞浸润和免疫检查点的相关性。采用TIMER2.0数据库分析铜死亡相关基因表达与肿瘤相关成纤维细胞(CAF)浸润的相关性,采用TISDB数据库分析CDKN2A和DLAT表达与髓源抑制性细胞(MDSC)浸润丰度的相关性。
结果:与正常肝脏组织比较,9个铜死亡相关基因在肝癌中表达显著升高,CDKN2A突变频率最高。铜死亡相关基因主要参与蛋白质脂酰化、三羧酸循环、柠檬酸循环等生物过程。基于LASSO、单因素与多因素回归分析筛选出影响肝癌患者总体生存率(OS)的基因CDKN2A和DLAT,并以此构建风险因子图,时间依赖性受试者工作特征曲线显示其具有较好的预测能力。通过单因素和多因素回归分析筛选出CDKN2A、DLAT、T分期和肿瘤状态是影响肝癌患者OS的独立预后因素,基于上述因素构建了列线图,校正曲线显示该列线图预测和实际观察之间有很好的一致性。UALCAN数据库分析发现CDKN2A、DLAT与肝癌临床分期、肿瘤分级有关,且GEO数据库、HPA数据库及肝癌细胞中的验证结果与之一致。相关性分析显示,CDKN2A和DLAT表达与免疫细胞浸润和免疫检查点表达相关;TIMER2.0数据库分析显示,DLAT表达与CAF浸润明显正相关;TISDB数据库分析显示,CDKN2A和DLAT表达与MDSC浸润丰度无相关性。
结论:铜死亡相关基因CDKN2A、DLAT可能是肝癌新的预后生物标志物和免疫治疗的新靶点。
原发性肝癌又称为肝癌,是消化道恶性肿瘤之一[1]。据最新统计,肝癌发病率在全国癌症发病率中占第4位,病死率占癌症死因第2位,因此肝癌已成为严重危害人们身体健康的主要疾病之一[2]。针对肝癌的治疗,首选手术切除,然而由于肝癌发病隐匿、侵袭性强、进展迅速、早期诊断困难,大多数肝癌患者在确诊时往往已进入疾病的中晚期或发生了远处转移,失去了手术机会,而其他的治疗如局部射频消融、经导管动脉化疗栓塞、全身化疗等效果并不理想[3-4]。因此,寻找新的生物标志物和治疗靶点对提高肝癌的临床疗效至关重要。
最近,一种新的细胞死亡形式—铜死亡被发现[5]。铜死亡是由于铜离子在细胞内的过度积累导致硫辛酰化蛋白异常聚集,干扰线粒体呼吸相关的铁硫簇蛋白,引起蛋白质毒性应激反应,最终导致细胞死亡,与目前已知的其他细胞死亡形式,如细胞凋亡、铁死亡、自噬和程序性坏死等均不同[6-7]。
研究[8-9]发现铜离子水平在肝癌患者血清及肝脏中明显升高,血清铜和铜蓝蛋白水平可作为检测肝癌的标志物。有研究[10]报道肝癌患者血清铜离子水平与肝癌特异性生存期和总体生存期显著相关,表明血清铜水平可能是肝癌患者生存期的独立预测因子。同时有文献[11]表明使用铜处理肝癌细胞可增强其增殖和迁移能力。上述研究表明铜离子在肝癌的发生发展中起着重要作用,诱导铜死亡可能是治疗肝癌一个新的途径。
因此,本研究采用生物信息学方法研究铜死亡相关基因与肝癌预后和免疫浸润的关系,以期为肝癌的治疗和预后评估提供新的思路。
从TCGA数据库(https://portal.gdc.cancer.gov)中下载了来自肝癌(TCGA-LIHC)队列的424例样本转录组数据及其临床信息,其中正常肝脏组织样本53例,肝癌组织样本371例(表1),去除临床信息缺失的样本,从Genotype-Tissue Expression(GTEx)(https://commonfund.nih.gov/GTEx)数据库下载了110例正常肝脏组织的转录组数据。采用R(4.2.1)软件将转录组数据标准化为Transcripts per million(TPM)格式,并转换为log2(TPM+1)。
表1 TCGA-LIHC数据集中肝癌患者的临床信息[n(%)]Table 1 The clinical information of liver cancer patients in the TCGA-LIHC dataset [n (%)]
1.2.1 铜死亡相关基因表达差异和突变分析 10个铜死亡相关基因(LIPT1、CDKN2A、GLS、FDX1、MTF1、PDHA、DLAT、LIAS、PDHB、DLD)来源于Tsvetkov等[12]的一项报道。采用Wilcoxon rank sum test比较铜死亡相关基因在肝癌组织和正常肝脏组织中的表达差异。采用R软件中的“maftools”分析铜死亡相关基因的突变景观。
1.2.2 GO和KEGG富集分析、蛋白质互作(PPI)网络 使用R软件中的“clusterProfiler”包对铜死亡相关基因进行GO和KEGG富集分析,采用GeneMANIA网站(http://genemania.org)构建PPI互作网络。
1.2.3 风险因子图构建 首先采用LASSO回归分析来缩小基因范围,之后通过单因素和多因素回归分析筛选影响肝癌患者总体生存率(overall survival,OS)的预后基因。根据多因素回归结果,采用公式计算患者风险评分=∑(每个基因表达量×多因素回归系数),根据风险评分的中位数将患者分为高风险组和低风险组,并构建风险因子图。采用Kaplan-Meier生存曲线比较高风险组和低风险组患者OS的差异。采用R包“Survival ROC”绘制受试者工作特征(ROC)曲线分析风险因子图预测患者OS的特异度和敏感度。采用Kaplan-Meier生存曲线比较CDKN2A/DLAT/GLS高表达组与低表达组之间患者OS的差异。
1.2.4 列线图构建 采用单因素和多因素回归分析筛选影响肝癌患者OS的独立预后因素,然后基于上述因素使用R包“rms”构建列线图,绘制校正曲线评估列线图的预测准确性。
1.2.5 CDKN2A和DLAT在肝癌不同临床病理特征的表达差异 采用UALCAN数据库分析CDKN2A和DLAT在肝癌各个临床分期、肿瘤分级之间的表达差异。
1.2.6 CDKN2A和DLAT在肝癌中的表达验证 从GEO数据库(https://www.ncbi.nlm.nih.gov/geo)下载GSE144269、GSE207435两个数据集,GSE144269包含70例配对肝癌组织样本,GSE207435包含27例配对肝癌组织样本,采用独立样本t检验比较CDKN2A和DLAT在肝癌组织和正常肝脏组织中的表达差异。利用人类蛋白图谱(HPA)(https://www.proteinatlas.org)数据库中的组织化学染色验证CDKN2A和DLAT蛋白在肝癌组织和正常肝脏组织中的表达差异。
1.2.7 细胞来源及细胞培养 人肝癌HepG2、HuH-7细胞、人正常肝细胞QSG-7701购于中国科学院上海细胞库,在37 ℃、5% CO2的培养箱中用含10%胎牛血清的RPMI-1640培养基培养。
1.2.8 Western blot检测蛋白表达 使用RIPA裂解液对不同细胞冰上裂解30 min,10 000 r/min离心15 min,取上清,使用BCA法测定蛋白浓度。加入5×蛋白质上样缓冲液,95 ℃加热10 min使蛋白变性后进行聚丙烯酰胺凝胶电泳。将蛋白转移至PVDF膜,5%脱脂牛奶室温封闭1 h,一抗(1∶1 000)4 ℃过夜孵育。TBST洗膜后,与一抗相应种属的二抗(1∶10 000)室温孵育2 h。TBST洗膜后进行化学发光显影。以GAPDH为内参计算蛋白相对表达量。CDKN2A、DLAT、GAPDH抗体均购自美国Abcam公司。
1.2.9 免疫浸润相关性分析 采用R包“GSVA”中的ssGSEA法计算24种免疫细胞(aDC、B cells、CD8 T cells、cytotoxic cells、DC、eosinophils、iDC、macrophages、mast cells、neutrophils、NK CD56bright cells、NK CD56dim cells、NK cells、pDC、T cells、T helper cells、Tcm、Tem、Tfh、Tgd、Th1 cells、Th17 cells、Th2 cells、Treg)的浸润丰度,利用Spearman相关性分析CDKN2A和DLAT表达与24种免疫细胞浸润丰度的相关性。采用TIMER2.0数据库分析CDKN2A和DLAT表达与肿瘤相关成纤维细胞(cancer associated fibroblast,CAF)细胞浸润的相关性,采用TISDB数据库分析CDKN2A和DLAT表达与髓源抑制性细胞(MDSC)浸润丰度的相关性。采用Spearman相关性分析CDKN2A/DLAT表达与免疫检查点CD274、CTLA4、HAVCR2、LAG3、PDCD1、TIGIT、PDCD1LG2表达之间的相关性。
数据均以均数±标准差(±s)表示,采用R(4.2.1)软件进行统计分析,两两比较采用独立样本t检验,P<0.05为差异有统计学意义。
在10个铜死亡相关基因中,9个基因(CDKN2A、DLD、DLAT、LIAS、GLS、LIPT1、MTF1、PDHA1、PDHB)在肝癌组织中表达明显升高(均P<0.05),1个基因(FDX1)在肝癌组织和正常肝组织中表达无明显差异(P>0.05)(图1A)。相关性分析发现10个铜死亡相关基因彼此互相关联,其中DLAT与MTF1呈高度正相关(r=0.567,P<0.001)(图1B-C)。基因突变分析发现在364例肝癌样本中,有18例样本铜死亡相关基因发生了体细胞突变,占4.95%(图1D),其中错义突变是最常见的突变类型,单核苷酸多态性(single nucleotide polymorphism,SNP)是最普遍的DNA变异,C>T和C>A是最常见的单核苷酸变异类型,CDKN2A突变频率最高(图1E)。
图1 铜死亡相关基因在肝癌中的表达、相关性和突变情况 A:铜死亡相关基因在肝癌组织和正常肝组织中的表达差异;B:铜死亡相关基因的相关性分析;C:DLAT与MTF1的相关性;D-E:铜死亡相关基因的突变频率和突变类型Figure 1 Expression pattern, correlation and mutation of cuproptosis-related genes in liver cancer A: The expression of cuproptosis-related genes in liver cancer and normal tissues; B: Correlation between the expression of cuproptosis-related genes; C: Correlation between the expression of DLAT and MTF1; D-E: Mutation frequency and classification of cuproptosis-related genes in liver cancer
对10个铜死亡相关基因进行GO富集分析,结果显示,10个基因主要参与乙酰辅酶A从丙酮酸生物合成过程、蛋白质脂酰化、三羧酸循环、葡萄糖代谢过程、氧化应激反应等生物学功能(图2A)。KEGG富集分析显示,10个基因主要参与硫辛酸代谢、柠檬酸(TCA)循环、丙酮酸代谢、糖酵解/糖异生、癌症的中心碳代谢等(图2B)。利用GeneMANIA网站构建了10个基因的PPI网络,发现DLAT、PDHB、DLD、PDHA1为核心基因(图2C)。
图2 GO、KEGG富集分析和PPI网络 A:GO富集分析;B:KEGG 富集分析;C:PPI网络Figure 2 GO, KEGG pathway enrichment and PPI network analysis A: GO enrichment analysis; B: KEGG pathway enrichment analysis; C: PPI network analysis
首先对10个铜死亡相关基因进行LASSO回归以缩小基因范围,从中筛选出CDKN2A、DLAT、GLS和LIPT1等四个肝癌OS预后相关基因(图3),然后采用单因素和多因素回归分析,确定CDKN2A和DLAT是影响肝癌患者OS的预后相关基因(表2)。根据公式:风险评分=0.573×CDKN2A表达量+0.409×DLAT表达量,计算肝癌患者的风险评分。根据风险评分的中位数,将肝癌患者分为低风险组和高风险组,并构建风险因子图(图4A)。Kaplan-Meier生存分析显示低风险组患者比高风险组患者有更好的OS(图4B)。时间依赖性ROC曲线显示风险因子模型1、3、5年的曲线下面积(area under curve,AUC)值分别为0.736、0.642、0.630,表明该模型具有较好的预测能力(图4C)。Kaplan-Meier生存分析显示低表达CDKN2A、DLAT、GLS患者比高表达CDKN2A、DLAT、GLS患者有更好的OS(图4D-F)。
图3 铜死亡相关基因LASSO回归分析Figure 3 Cuproptosis-related genes screened by the Lasso cox regression analysis
图4 基于铜死亡相关基因的风险因子图构建 A:基于CDKN2A和DLAT的风险因子图;B:Kaplan-Meier生存曲线比较高风险组和低风险组患者OS;C:时间依赖ROC曲线评估风险因子图模型预测能力;D-F:CDKN2A、DLAT、GLS高表达组和低表达组患者Kaplan-Meier生存曲线比较Figure 4 Construction of the risk score model of cuproptosis-related genes in liver cancer A: The risk score model based on CDKN2A and DLAT; B: Kaplan-Meier survival analysis of the high-risk group and low-risk group; C: Time-dependent ROC curves assessing the prediction ability of the risk score model; D-F: Comparison of Meier survival curves between patients with high and low CDKN2A, DLAT and GLS expressions
表2 单因素和多因素Cox回归分析筛选OS相关因素Table 2 Univariate and multivariate Cox regression analysis of factors for OS
通过单因素和多因素Cox回归分析,确定CDKN2A、DLAT、T分期和肿瘤状态是肝癌患者OS的独立预后因素(图5A-B),基于上述因素构建了预测肝癌患者1、3、5年OS的列线图(图5C)。校正曲线显示该列线图预测和实际观察之间有很好的一致性(图5D)。
图5 基于铜死亡相关基因肝癌患者预后列线图构建 A:单因素回归分析;B:多因素回归分析;C:列线图预测肝癌患者1、3、5年OS;D:校准曲线Figure 5 Construction of nomogram for prognosis in liver cancer patients A: Univariate analysis; B: Multivariate analysis;C: Nomogram for predicting 1-, 3-, and 5-year OS in liver cancer patients; D: The calibration curves for the nomogram
采用UALCAN数据库分析CDKN2A和DLAT与肝癌临床病理特征的相关性。结果显示,CDKN2A在肝癌临床分期1、2、3期中的表达均显著高于正常组织,其中在临床2、3期的表达均明显高于临床1、4期,表明CDKN2A与肝癌临床分期相关(图6A)。其次,CDKN2A在肝癌各肿瘤分级中的表达均明显高于正常组织,并随着肿瘤分级增加而不断增高,其中在肿瘤3级的表达明显高于肿瘤1、2级,表明CDKN2A与肝癌肿瘤分级相关(图6B)。DLAT在肝癌临床分期1、2、3期表达均明显高于正常组织,但各分期之间表达无明显差异(图6C)。DLAT在肝癌各肿瘤分级中的表达均明显高于正常组织,并随着肿瘤分级增加而不断增高,其中在肿瘤2、3级的表达明显高于肿瘤1级,表明DLAT与肝癌肿瘤分级相关(图6D)。
图6 CDKN2A和DLAT在肝癌不同临床病理特征中的表达 A-B:CDKN2A在肝癌各临床分期和肿瘤分级中的表达;C-D:DLAT在肝癌各临床分期和肿瘤分级中的表达Figure 6 Expression of CDKN2A and DLAT in liver cancer with different clinicopathologic features A-B: CDKN2A expressions in different clinical stages and tumor grades; C-D: DLAT expressions in different clinical stages and tumor grades
从GEO数据库中下载数据集GSE144269和GSE207435,分析CDKN2A和DLAT在肝癌中的表达,结果发现CDKN2A和DLAT在肝癌组织中的表达均明显高于正常组织(均P<0.05)(图7A-D)。HPA数据库分析发现CDKN2A和DLAT在肝癌组织中的表达均明显高于正常组织(图7E-F)。采用Western blot检测CDKN2A、DLAT在肝癌细胞HuH-7、HepG2和肝细胞QSG-7701中的表达,结果发现,CDKN2A、DLAT在肝癌细胞HuH-7和HepG2中的表达均明显高于肝细胞QSG-7701(均P<0.05)(图7G-H)。
图7 CDKN2A和DLAT在肝癌中的表达验证 A-D:CDKN2A和DLAT在GSE144269/GSE207435中的表达分析;E-F:HPA数据库分析CDKN2A和DLAT在肝癌组织中的表达;G-H:Western blot检测CDKN2A和DLAT表达Figure 7 Validation of differential expression of CDKN2A and DLAT in liver cancer A-D: CDKN2A and DLAT expressions in GSE144269 and GSE207435; E-F: CDKN2A and DLAT expression in HPA dataset; G-H: The protein expressions of CDKN2A and DLAT measured by Western blot analysis
采用Spearman相关性分析了CDKN2A和DLAT表达与24种免疫细胞浸润丰度的相关性,结果显示:CDKN2A表达与Th2 cells、aDC等免疫细胞浸润丰度呈明显正相关,与eosinophils、CD8 T cells、NK cells、Th17 cells、mast cells、neutrophils、iDC、DC等免疫细胞浸润丰度呈明显负相关(图8A)。DLAT表达与Tcm、T helper cells、Tem、Th2 cells、macrophages等免疫细胞浸润丰度呈明显正相关,与cytotoxic cells、pDC、Th17 cells、DC、B cells、NK CD56dim cells等免疫细胞浸润丰度呈明显负相关(图8B)。采用TIMER2.0数据库分析CDKN2A和DLAT表达与Cancer associated fibroblast(CAF)细胞浸润的相关性,结果显示:CDKN2A表达与CAF浸润无相关性,DLAT表达与CAF细胞浸润明显正相关(图8C-D)。采用TISDB数据库分析CDKN2A和DLAT表达与MDSC细胞浸润丰度的相关性,结果显示,CDKN2A和DLAT表达与MDSC细胞浸润丰度无相关性(图8E-F)。
图8 CDKN2A和DLAT与免疫细胞浸润的相关性 A:CDKN2A;B:DLAT;C-D:CDKN2A和DLAT与CAF细胞浸润相关性;E-F:CDKN2A和DLAT与MDSC细胞浸润丰度相关性Figure 8 Correlation of CDKN2A and DLAT with immune cell infiltration in liver cancer A: CDKN2A; B: DLAT; C-D:The correlation of CDKN2A and DLAT with CAF infiltration; E-F: The correlation of CDKN2A and DLAT with MDSC infiltration abundance
CDKN2A、DLAT与免疫检查点相关性分析结果显示,CDKN2A表达与免疫检查点CD274、CTLA4、HAVCR2、LAG3、PDCD1、TIGIT等呈明显正相关(图9A-F),DLAT表达与免疫检查点CD274、HAVCR2、PDCD1LG2、TIGIT等呈明显正相关(图9G-J)。
肝癌是消化系统一种常见的恶性肿瘤,其发病隐匿、进展迅速、恶性程度高,临床缺乏有效的治疗手段。因此,迫切需要寻找肝癌新的预后标志物和治疗靶点[13]。铜死亡是一种铜依赖的、程序性的、新的细胞死亡方式,继发于铜过载诱发的线粒体功能受损[14-15]。铜死亡与肝癌的关系目前尚不清楚。本研究拟分析铜死亡相关基因在肝癌中的作用,并借此发掘出新的肝癌筛查、治疗及预后评估手段。
本研究发现大多数铜死亡相关基因在肝癌中表达显著升高,并且铜死亡相关基因在肝癌样本中有一定的突变率。该研究结果与Zhang等[16-18]研究结果一致。研究发现铜离子可以促使肝癌生长和转移,因此肝癌组织倾向于保持较高浓度的铜离子。但肝癌并不会发生铜死亡[19],其原因可能是由于铜死亡相关基因在肝癌中表达失衡和突变,促使肝癌能够逃避铜死亡。因此,如果能够纠正铜死亡相关基因的表达失衡和突变,诱导肝癌细胞铜死亡,可能是治疗肝癌的一种新的途径。
之后本研究从10个铜死亡相关基因中筛选出CDKN2A和DLAT,并基于这2个基因构建了风险因子模型,时间依赖曲线显示该模型具有较好的预测能力。与本研究结果相反,Chen等[20]采用了5个铜死亡相关基因构建了肝癌风险因子模型;Liu等[21]建立了9个基因的肝癌风险因子模型。上述研究结果的差异主要是由于采用筛选的铜死亡相关基因不同。本研究采用的是Tsvetkov等[12]报道的10个铜死亡相关基因,Chen等[20]选用的是在肝癌中发现的136个铜死亡相关基因,而Liu等[21]是将铜死亡相关的mRNA和lncRNA联合起来进行筛选。
列线图是肿瘤预后评估的常用工具[22-23]。相较于传统的肿瘤TNM分期系统,列线图包含更详细的临床信息,可以提供更准确的患者生存概率估计[24-25]。Chen等[26]将TNM分期、年龄和铜死亡相关lncRNA风险评分作为参数构建肝癌患者列线图预测预后,并具有较高的准确性。Liu等[27]将肿瘤分期和铜死亡相关基因风险评分作为参数构建了肝癌患者预后列线图,具有较好的预测效果。本研究首次将CDKN2A、DLAT、T分期和肿瘤状态纳入预测因素构建肝癌患者的预后列线图,校正曲线显示该列线图预测和实际观察之间有很好的一致性。因此,本研究所建立的列线图可以为临床医生评估肝癌患者预后以及制定个性化治疗方案提供一种新的、更有效的方法。
肿瘤微环境中的免疫浸润细胞在肿瘤发生、发展中发挥关键作用[28],并严重影响患者的临床预后[29-30]。本研究首先发现CDKN2A和DLAT与肝癌患者预后相关,之后发现CDKN2A和DLAT与Th2 cells、aDC、T helper cells等免疫细胞浸润,以及CD274、CTLA4、HAVCR2等免疫检查点表达相关。因此,本研究认为CDKN2A和DLAT可能通过影响免疫细胞浸润和免疫检查点表达,影响肝癌患者预后。CDKN2A和DLAT可能是肝癌免疫治疗的潜在靶点。
然而本研究也存在一些局限:第一,本研究只采用TCGA数据库构建了肝癌患者的预后模型,没有外部数据集进一步验证;第二,对于CDKN2A和DLAT在肝癌中的表达,缺乏临床样本的验证;第三,对于CDKN2A和DLAT与肝癌免疫细胞浸润的相关性,仅采用生物信息学方法分析,没有进行实验验证。
综上所述,本研究全面分析了铜死亡相关基因在肝癌中的表达特征。其中铜死亡相关基因CDKN2A和DLAT在肝癌中表达显著升高,基于CDKN2A和DLAT构建的风险因子图能够很好地预测肝癌患者预后,CDKN2A和DLAT表达与肝癌临床分期、免疫细胞浸润和免疫检查点表达等显著相关。因此,CDKN2A和DLAT有望成为肝癌新的预后生物标志物和免疫治疗的新靶点。
利益冲突:所有作者均声明不存在利益冲突。
作者贡献声明:陈伟毅负责课题设计、起草论文和修改论文;胡柯和刘雨负责起草论文和修改论文;彭靖、李小成和陈立军负责数据获取、整理和分析,段绍毅和杨骐彰负责数据分析和作图。