探索双硫死亡相关长链非编码RNA在乳腺癌中的预后价值并构建风险模型

2025-02-23 00:00:00张程李程曹一南
医学信息 2025年1期
关键词:长链非编码RNA乳腺癌

摘要:目的" 构建与双硫死亡相关长链非编码RNA(DRL)风险评分。方法" 从癌症基因组图谱TCGA数据库中下载乳腺癌的转录组数据,使用Perl脚本提取患者的lincRNA数据,通过Sperman相关性分析识别与双硫死亡相关的lincRNA,通过单因素和LASSO多因素Cox回归分析识别独立预后的DRLs并构建风险评分。结果" 单因素和LASSO多因素回归分析共筛选出了13个DRLs用于构建风险评分。卡普兰-迈耶(KM)曲线和受试者工作特征(ROC)曲线表明风险评分具有较好的预测性能。此外,不同风险组患者的临床病理特征、富集分析和药物敏感性也存在显著差异。基于风险评分构建了预测乳腺癌患者3年和5年总生存期(OS)的列线图预测模型,C指数、ROC曲线和校准曲线表明模型具有较为出色的预测性能。结论" 本研究构建了与DRLs相关的预后模型,有助于评估乳腺癌患者的预后,并为临床治疗决策提供一定的参考。

关键词:乳腺癌;双硫死亡;长链非编码RNA;预后模型

中图分类号:R737.9" " " " " " " " " " " " " " " " "文献标识码:A" " " " " " " " " " " " " " " " "DOI:10.3969/j.issn.1006-1959.2025.01.006

文章编号:1006-1959(2025)01-0037-07

Prognostic Value of Disulfidoptosis-related Long Non-coding RNA in Breast Cancer

and Construct a Risk Model

ZHANG Cheng, LI Cheng, CAO Yi′nan

(Department of Medical Technology, Nanjing Vocational Health College, Nanjing 210000, Jiangsu, China)

Abstract: Objective" To construct a risk score of disulfidoptosis-related long non-coding RNA (DRL). Methods" The transcriptome data of breast cancer were downloaded from the cancer genome atlas TCGA database, and the lincRNA data of patients were extracted by Perl script. The disulfidoptosis-related long non-coding RNA was identified by Sperman correlation analysis, and the independent prognostic DRLs were identified by univariate and LASSO multivariate Cox regression analysis, and the risk score was constructed. Results" A total of 13 DRLs were selected for risk score construction by univariate and LASSO multivariate regression analysis. Kaplan-Meier (KM) curve and receiver operating characteristic (ROC) curve showed that the risk score had good predictive performance. In addition, there were significant differences in clinicopathological features, enrichment analysis and drug sensitivity among patients in different risk groups. Based on the risk score, a nomogram prediction model was constructed to predict the 3-year and 5-year overall survival (OS) of breast cancer patients, and the C index, ROC curve and calibration curve showed that the model had excellent prediction performance. Conclusion" This study constructed a prognostic model related to DRLs, which is helpful to evaluate the prognosis of breast cancer patients and provide some reference for clinical treatment decisions.

Key words:Breast cancer; Disulfidptosis; Long non-coding RNA; Prognostic model

据国际癌症研究机构的报告显示,乳腺癌(breast cancer, BC)已经超过了肺癌,成为女性中发病率最高的恶性肿瘤[1]。仅在2020年,全球就有超过230万新增BC病例,约68万人死于BC[1]。尽管随着早期筛查以及治疗手段的发展,多数BC患者的生存情况已经有了明显的改善,但部分患者仍然由于复发或耐药性等诸多原因导致预后不佳[2]。目前临床上主要依靠TNM分期,以及分子亚型对BC患者进行预后评估以及治疗分层[3]。鉴于BC的异质性以及治疗的复杂性,临床上迫切需要开发新的生物学标志物,帮助评估BC患者的预后情况并为治疗决策提供参考。长链非编码RNA(long non-coding RNA, lncRNA)是一类并不直接编码蛋白质,且长度超过200个碱基对的特殊RNA分子[4]。越来越多的证据表明[5,6],lncRNA能够通过多种调控机制,参与BC的发生、发展,并且与患者的预后密切相关。研究发现[5],NEF在三阴性乳腺癌(triple-negative breast cancer, TNBC)患者中下调,并且与患者的不良预后相关。另有研究发现[6],NEAT1能够通过影响下游小分子RNAmiR-23a-3p的表达,介导BC患者对紫杉类药物的耐药反应。因此,深入了解lncRNA的功能和相关调控网络,有望为BC患者的治疗提供新的靶点和策略。双硫死亡(disulfidptosis)是最近新发现的一种细胞程序性死亡方式[7]。与凋亡等其他细胞死亡形式不同,双硫死亡依赖于肌动蛋白细胞骨架对二硫化物应激的敏感性,从而介导细胞死亡[7]。既往研究表明[8,9],双硫死亡参与了肿瘤的耐药性、免疫逃避和转移等重要过程。本研究旨在构建与双硫死亡相关的lncRNA(disulfidptosis-related lncRNA, DRL)预后模型,以期帮助评估BC患者的预后情况,并为临床治疗决策提供参考。

1资料与方法

1.1数据的收集和处理" 从TCGA数据库(https://www.cancer.gov/ccg/research/genome-sequencing/tcga)中下载941例BC样本以及95例正常样本的转录组表达数据。使用Perl脚本对数据进行整理,提取患者lincRNA表达数据。从最近Liu X等[7]所发表的研究中收集到了16个双硫死亡相关基因。

1.2双硫死亡相关lincRNA的鉴定" 使用Person分析对lincRNA和双硫死亡相关基因的表达水平进行相关性检验以鉴定DRLs,相关性系数gt;0.25且Plt;0.001被认为具有显著相关性。使用limma包筛选出在正常和BC样本中的差异表达的DRLs用于后续分析,筛选标准为|Log2FC|gt;1且FDRlt;0.05。

1.3预后特征的构建和评估" 使用survival包对正常样本与BC样本中差异表达的DRLs进行单因素Cox回归分析。为了减少过度拟合,使用glmnet包将单因素分析中有意义(Plt;0.05)的预后相关DRLs进行LASSO回归分析。最终筛选出13个具有独立预后价值的基因用于构建风险评分。风险评分的计算公式:Risk score=Coef(linRNA1)×EXP(linRNA1)+Coef(linRNA2)×EXP(linRNA2)+...+Coef(linRNAn)×EXP(linRNAn)。根据公式计算出TCGA-BRCA队列中所有患者的风险评分,并基于中位值分为高、低风险两组。通过卡普兰-迈耶(Kaplan-Meier, KM)曲线和受试者工作特征(receiver operating characteristic, ROC)曲线评估风险评分的预测性能。为了将风险评分与临床病理特征相关联,使用Wilcoxon秩和检验对风险评分进行临床相关性分析。

1.4富集分析" 基于limma包筛选出高、低风险组患者中的差异表达基因(|Log2FC|gt;1 amp; FDRlt;0.05)。将这些差异基因通过clusterProfiler包里的enrichGO 和enrichKEGG函数进行基因本体(Gene Ontology, GO)和京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes, KEGG)富集分析。此外,使用GSEA(Gene Set Enrichment Analysis)方法比较两组患者在50条HALLMARK基因集中的富集差异。

1.5药物敏感性预测" 为了更好的将风险评分与临床实践相关联,使用oncoPredict包分别评估了高、低风险两组患者对常见的乳腺癌化疗药物的敏感性[10]。基于oncoPredict包所预测的IC50值对药物敏感性进行评估。IC50值代表药物的50%评价抑制浓度,IC50越小表明患者对该药物越敏感。

1.6列线图的构建和评估" 将风险评分、患者年龄、TNM分期和PAM50亚型进行单因素和多因素Cox回归分析,将两者P值均lt;0.05的变量确定为BC患者的独立预后因素,使用rms包构建预测乳腺癌患者1、3、5年总生存率的列线图预测模型。使用C指数、ROC曲线、校准曲线对模型的预测性能进行评估。

1.7数据分析" 在本研究中,所有的分析均通过R语言软件(R version 4.1.0)进行。Plt;0.05被认为差异有统计学意义(双向)。

2结果

2.1 DRLs的筛选及风险评分的构建" 通过perl脚本对TCGA转录组数据整理,共得到16 200个lincRNA的表达数据。将这些lincRNA与16个双硫死亡相关基因分别进行Person相关性分析,共得到1366个DRLs。Limma包分析结果表明,336个DRLs在正常样本和肿瘤样本中差异表达,其中上调基因209个,下调基因127个(图1A)。对这336个DRLs进行单因素Cox回归分析,发现有14个基因与BC患者的预后相关(图1B)。将这14个预后相关DRLs纳入LASSO多因素Cox回归分析,最终得到13个独立预后基因并构建了风险评分(图1C、图1D)。风险评分公式:Risk score=(-0.0384×LMNTD2-AS1)+(0.2287×LINC01615)+(-0.0384×LINC01863)+(-0.019 ×LMNTD2-AS1)+(0.2057×LIVAR)+(-1.762×THRB -AS1)+(-0.3178×U73166.1)+(-0.2874×AC004816.2) +(-0.1330×MIR200CHG)+(0.5431×C9orf163)+(-0.0645 ×AP003555.2)+(-0.1673×MAPT-IT1)+(-0.3256×AC099541.2)+(0.3332×LGALS8-AS1)。

2.2风险模型的评估及临床相关性分析" 根据风险评分的中位值将TCGA-BRCA队列的患者分为高、低风险两组。KM曲线表明,两组患者的生存状况存在显著差异(Plt;0.001)(图2A)。1、3、5年的模型ROC曲线下面积分别为0.702、0.689和0.713,同样表明模型具有较高的预测性能(图2B)。在临床相关性分析中,风险评分与肿瘤的进展显著相关,分期较晚的乳腺癌患者其风险评分明显更高(图2C)。此外,不同PAM50分子亚型的BC患者其风险评分也存在显著差异,HER2型、基底样型以及LumB型BC患者的风险评分相对更高(图2D)。

2.3富集分析" GO富集分析结果显示,两组患者的640条生物过程(biological process, BP)相关通路,110条细胞组分(cellular component, CC)相关通路和23条分子功能分子功能(molecular function, MF)相关通路存在差异。图3A分别展示了前10条富集差异最明显的信号通路。BP方面主要富集于有丝分裂核分裂、细胞周期检查点信号传导、细胞周期相转换的负调控等;CC方面主要富集于核糖体和细胞-基质连接等;MF方面则主要富集于核糖体的结构成分、泛素样蛋白连接酶结合和蛋白激酶调节活性等。以上结果表明高低风险组的细胞增殖相关通路可能存在显著差异。而在KEGG的富集分析结果中,差异基因显著富集于细胞周期、PPAR信号通路和细胞凋亡等相关通路上(图3B)。接着进行了HALLMARK基因集的GSEA富集分析。如图3C所示,多条促癌通路富集于高风险组中,如E2F信号通路、MCF_V1信号通路等(NESgt;2 amp; Plt;0.001)。

2.4药物敏感性分析" 使用oncoPredict包进行了药物敏感性分析。结果表明,风险评分与多西他赛、艾瑞西布、吉西他滨和帕博西利的IC50值呈正相关,表明低风险组的患者可能对于这些药物更加敏感(图4)。

2.5列线图的构建" 在单因素和多因素分析结果表明,风险评分均与BC患者的预后显著相关(图5A、图5B)。基于多因素分析的结果,使用rms包构建了预测BC患者1、3和5年OS的列线图模型(图5C)。经1000次重抽后模型的C指数为0.707。1、3和5年ROC曲线下面积分别为0.747,0.685和0.747,同样表明模型具有较好的区分度(图5D)。此外,校准曲线表明,模型所预测的患者生存情况与其实际生存情况较为吻合,表明模型具有较高的预测精度(图5E)。

3讨论

BC是女性最常见的恶性肿瘤类型,其发病率逐年上升[11]。BC存在高度异质性,不同BC患者的病情及预后可能存在很大差异[12,13]。尽管有手术治疗、放化疗、内分泌治疗和靶向治疗等多种治疗手段,但仍有部分患者面临复发转移和药物抵抗等诸多问题,导致预后不佳[14,15]。因此,寻找多样化的生物学标志物,对BC患者进行风险分层以评估预后,并寻找新的治疗靶点,是当前BC研究的热点。

双硫死亡是最近发现的一种新型细胞程序性死亡类型,通过氧化还原反应和形成二硫键来触发[16]。与其他程序性死亡类型相比,双硫死亡具有独特的特征和调控机制[17]。其中,SLC7A11是双硫死亡的关键介质。当SLC7A11过表达时,细胞内会发生二硫键堆积,导致肌动蛋白细胞骨架塌陷,最终导致细胞死亡[16]。最近的研究表明[18-20],二硫死亡与肝癌、肾癌、结肠癌等多种恶性肿瘤的预后有关。因此,开发新的相关靶点,诱导癌细胞发生二硫死亡,已成为新的肿瘤治疗策略。然而,目前对BC的相关研究还相对较少。

本研究利用TCGA数据库中的二代测序数据进行分析,识别与二硫死亡相关的lncRNA,并进行了单因素和LASSO多因素Cox回归分析,最终确定了具有独立预后价值的BC二硫死亡相关lncRNA预后基因,并构建了相应的风险评分系统。多种统计学方法的结果一致表明,该风险评分模型能够较准确地预测BC患者的预后。临床相关性分析结果显示,风险评分与BC的TNM分期以及PAM50分子亚型密切相关,表明所构建的风险评分系统在预测患者的临床病理特征方面具有一定价值。此外,本研究还发现风险评分与常见BC化疗药物的敏感性之间存在关联。

综上所述,本研究构建的风险评分系统能够较准确地预测BC患者的预后,并为BC的临床治疗决策提供参考。为了更准确和直观地预测患者的预后情况,将风险评分系统与BC患者的临床病理特征相结合,构建了预测患者1、3和5年生存率的列线图预后模型。使用C指数、ROC曲线和校准曲线等多种方法对列线图的预测性能进行评估,结果显示该模型具有出色的预测性能。

本研究还存在一些局限性。首先,基于公共数据库中的二代测序数据进行的回顾性分析,缺乏前瞻性和大样本量的数据集来对所构建的风险评分系统进行外部验证。其次,TCGA数据库中缺少一些与BC患者预后密切相关的重要参数,如Ki67指数、化疗和内分泌治疗信息等,这些重要变量的缺失可能会影响所构建的列线图模型的预测精度。最后,由于实验条件的限制,暂时无法对风险评分中的核心基因的生物学功能进行相应的体内和体外实验验证。这些局限性需要在下一步的研究中进一步完善。

参考文献:

[1]Sung H,Ferlay J,Siegel RL,et al.Global Cancer Statistics 2020:GLOBOCAN Estimates of Incidence and Mortality Worldwide for 36 Cancers in 185 Countries[J].CA Cancer J Clin,2021,71(3):209-249.

[2]Nagaraj G,Ma CX.Clinical Challenges in the Management of Hormone Receptor-Positive,Human Epidermal Growth Factor Receptor 2-Negative Metastatic Breast Cancer:A Literature Review[J].Adv Ther,2021,38(1):109-136.

[3]Cardoso F,Kyriakides S,Ohno S,et al.Early breast cancer:ESMO Clinical Practice Guidelines for diagnosis,treatment and follow-up[J].Ann Oncol,2019,30(10):1674.

[4]Chen Y,Li Z,Chen X,et al.Long non-coding RNAs:From disease code to drug role[J].Acta Pharm Sin B,2021,11(2):340-354.

[5]Song X,Liu Z,Yu Z.LncRNA NEF is downregulated in triple negative breast cancer and correlated with poor prognosis[J].Acta Biochim Biophys Sin(Shanghai),2019,51(4):386-392.

[6]Zhu L,Wang F,Fan W,et al.lncRNA NEAT1 promotes the Taxol resistance of breast cancer via sponging the miR-23a-3p-FOXA1 axis[J].Acta Biochim Biophys Sin(Shanghai),2021,53(9):1198-1206.

[7]Liu X,Nie L,Zhang Y,et al.Actin cytoskeleton vulnerability to disulfide stress mediates disulfidptosis[J].Nat Cell Biol,2023,25(3):404-414.

[8]Zhao D,Meng Y,Dian Y,et al.Molecular landmarks of tumor disulfidptosis across cancer types to promote disulfidptosis-target therapy[J].Redox Biol,2023,68:102966.

[9]Wang X,Lin J,Li Z,et al.In what area of biology has a “new” type of cell death been discovered[J].Biochim Biophys Acta Rev Cancer,2023,1878(5):188955.

[10]Maeser D,Gruener RF,Huang RS.oncoPredict:an R package for predicting in vivo or cancer patient drug response and biomarkers from cell line screening data[J].Brief Bioinform,2021,22(6):bbab260.

[11]张思维,郑荣寿,孙可欣,等.2016年中国恶性肿瘤分地区发病和死亡估计:基于人群的肿瘤登记数据分析[J].中国肿瘤,2023,32(5):321-332.

[12]Rakha EA,Ellis IO.Modern classification of breast cancer: should we stick with morphology or convert to molecular profile characteristics[J].Adv Anat Pathol,2011,18(4):255-267.

[13]Diaz LK,Cryns VL,Symmans WF,et al.Triple negative breast carcinoma and the basal phenotype:from expression profiling to clinical practice[J].Adv Anat Pathol,2007,14(6):419-430.

[14]Early Breast Cancer Trialists' Collaborative Group(EBCTCG).Radiotherapy to regional nodes in early breast cancer: an individual patient data meta-analysis of 14 324 women in 16 trials[J].Lancet,2023,402(10416):1991-2003.

[15]Chang CA,Jen J,Jiang S,et al.Ontogeny and Vulnerabilities of Drug-Tolerant Persisters in HER2+ Breast Cancer[J].Cancer Discov,2022,12(4):1022-1045.

[16]Zheng P,Zhou C,Ding Y,et al.Disulfidptosis:a new target for metabolic cancer therapy[J].J Exp Clin Cancer Res,2023,42(1):103.

[17]Hadian K,Stockwell BR.The therapeutic potential of targeting regulated non-apoptotic cell death[J].Nat Rev Drug Discov,2023,22(9):723-742.

[18]Wang Z,Chen X,Zhang J,et al.Based on disulfidptosis-related glycolytic genes to construct a signature for predicting prognosis and immune infiltration analysis of hepatocellular carcinoma[J].Front Immunol,2023,14:1204338.

[19]Chi H,Huang J,Yan Y,et al.Unraveling the role of disulfidptosis-related LncRNAs in colon cancer:a prognostic indicator for immunotherapy response,chemotherapy sensitivity,and insights into cell death mechanisms[J].Front Mol Biosci,2023,10:1254232.

[20]Liu T,Ren Y,Wang Q,et al.Exploring the role of the disulfidptosis-related gene SLC7A11 in adrenocortical carcinoma:implications for prognosis,immune infiltration,and therapeutic strategies[J].Cancer Cell Int,2023,23(1):259.

收稿日期:2023-11-07;修回日期:2023-12-25

编辑/肖婷婷

作者简介:张程(1986.10-),女,江苏南京人,硕士,讲师,主要从事医学基础教育、临床普外方向研究

猜你喜欢
长链非编码RNA乳腺癌
绝经了,是否就离乳腺癌越来越远呢?
中老年保健(2022年6期)2022-08-19 01:41:48
中医治疗乳腺癌的研究进展
乳腺癌是吃出来的吗
胸大更容易得乳腺癌吗
别逗了,乳腺癌可不分男女老少!
祝您健康(2018年5期)2018-05-16 17:10:16
MicroRNA及lncRNA在心肌纤维化中的研究进展
长链非编码RNA在胃癌中作用机制的研究进展
LncRNAs作为miRNA的靶模拟物调节miRNA
长链非编码RNA与肝癌的关系及其研究进展
鼻咽癌肿瘤干细胞miRNAs和 lncRNAs及mRNAs表达谱分析