基于TCGA数据库口腔鳞状细胞癌相关microRNA预后风险模型的建立

2022-10-14 03:47李晶晶黄月娇冯焯明余浩华李炳锟粟小平
大众科技 2022年9期
关键词:生存率靶向口腔

李晶晶 黄月娇 冯焯明 余浩华 李炳锟 罗 莹 粟小平

基于TCGA数据库口腔鳞状细胞癌相关microRNA预后风险模型的建立

李晶晶 黄月娇 冯焯明 余浩华 李炳锟 罗 莹 粟小平

(广西医科大学口腔医学院,广西 南宁 530021)

目的:研究旨在通过检测microRNA(miRNA)的表达特征来预测口腔鳞状细胞癌(OSCC)患者的存活率。方法:从TCGA数据库下载397名OSCC患者的表达谱数据及相应的临床信息。通过生物信息学的方法分析OSCC与正常组织间的差异表达的miRNA,使用Cox回归分析和其他生物信息学方法筛选预后相关的miRNA。并应用采用Kaplan-Meier分析和、受试者工作特征(ROC)曲线分析评估所筛选的miRNA作为预后评估指标的可信度。结果:通过生物信息学的方法分析获得差异表达的miRNA363个,其中上调的miRNA197个,下调的miRNA166个(PDR<0.05)。通过单变量COX回归分析发现84个miRNA的表达与患者预后显著相关,将其中<0.001的11个miRNA进一步进行多变量COX回归分析,其中4个miRNA(has-miR-30e、has-miR-337、has-miR-6507、has-miR-1251)纳入了风险评估模型。根据多因素COX分析的回归系数,构建由4个miRNA组成的预后风险评估模型,根据风险评分将OSCC患者分为高风险组和低风险组。Kaplan-Meier生存曲线表明高风险组生存率显著低于低风险组生存率(=1.026e-05),构建的ROC曲线下面积AUC为0.669,C-index为0.63。结论:4个miRNA,has-miR-30e、has-miR-337、has-miR-6507及has-miR-1251的组合可以作为预测OSCC患者预后的潜在标志物。

TCGA;OSCC;microRNA;预后;风险

引言

头颈肿瘤是世界第六大高发肿瘤,包括鼻窦、鼻腔、咽部、喉部及口腔等部位的上皮恶性肿瘤,约占所有病例6%,全球每年约有65万例新发病例以及35万例与头颈肿瘤相关的死亡病例[1]。而口腔癌是头颈部最常见的肿瘤之一,在60岁以上的男性患者中发病率为75%,约95%的病例为鳞状细胞癌[2]。然而,尽管在过去的几十年里外科手术和化疗取得了显著的进展[3],但口腔癌的5年生存率及预后依然没有得到很好的改善,没有可用的早期诊断的标志物。微小RNA(miRNA)是生物体中一种非编码的短小RNA,其在机体的发育中具有重要的作用,其表达异常与肿瘤的发生发展具有密切关系,其在口腔肿瘤中的研究也得到了广泛的发展[4]。本研究以TCGA数据库为基础,筛选OSCC与正常口腔组织差异表达的miRNA,并结合相应的病例样本临床信息,通过单因素和多因素COX回归分析,建立基于miRNA表达的预后风险评估模型,为OSCC的诊疗提供一定的参考。

1 材料与方法

1.1 数据处理

OSCC患者样本的miRNA表达数据及相应的临床信息于2020年4月从TCGA下载。一共包括430个样本,包括32个正常样本和398个OSCC样本。OSCC组织和正常组织的差异表达miRNA应用R语言的edgeR包进行分析。以<0.05和|Log2FC|≥1作为差异miRNA的筛选标准。

1.2 差异表达miRNA的生存分析

应用perl脚本将差异表达的miRNA的表达数据和患者的生存状态和生存信息进行处理形成矩阵,再通过R语言的survival包分析每个差异表达基因与患者生存率之间的关系。

1.3 差异表达miRNA的单因素及多因素COX回归分析

将上一步得到的miRNA与患者生存状态及生存时间的矩阵,通过R语言的coxph函数进行单因素回归分析。将显著性<0.001的基因,通过R语言的coxph函数,用于多因素COX回归分析。根据风险系数及miRNA的表达量对每位患者进行风险评估打分,并根据风险评估打分的中位值将患者分为高风险组和低风险组,再利用R语言的survival包,构建风险生存曲线。

1.4 miRNA风险评估模型的可信度评价

ROC曲线是用来评价连续变量反应敏感性与特异性的综合指标。使用R语言的survivalROC包分析包括风险评分和其他指标预测患者的能力。同时利用survcomp包计算C-index指数,并建立风险分布图、生存状态图以及风险热图。

2 结果

2.1 口腔鳞状细胞癌与正常口腔组织的差异miRNA分析

从TCGA数据库下载2020年4月的OSCC的表达谱数据,包括肿瘤组织398份,正常组织32份。共获得差异表达的miRNA363个,其中上调的miRNA197个,下调的miRNA166个(PDR<0.05)(表1,图1)。

表1 OSCC和正常口腔组织的差异miRNA分析(前20)

miRNAlogFClogCPMPValueFDR hsa-miR-381-3.6950702717.2782040684.04E-886.45E-85 hsa-miR-101-2-2.13189724712.183137262.68E-652.14E-62 hsa-miR-101-1-2.1277466512.170679598.63E-654.59E-62 hsa-miR-299-2.8362481273.514671991.49E-565.92E-54 hsa-miR-411-2.841516674.0662013012.40E-547.64E-52 hsa-miR-378c-2.6135387163.871188793.34E-538.87E-51 hsa-miR-30e-1.33578958513.30831491.56E-503.55E-48 hsa-miR-135a-2-4.688685417-0.1213615568.41E-481.68E-45 hsa-miR-195-2.0550794554.9959671762.56E-464.53E-44 hsa-miR-378a-2.2876874110.711337527.86E-461.25E-43 hsa-miR-30a-2.29612496813.529842062.65E-453.85E-43 hsa-miR-375-3.87772179711.14670586.20E-458.23E-43 hsa-miR-139-1.8469886586.0642711748.71E-411.07E-38 hsa-miR-376c-2.3240974363.2578064341.63E-401.86E-38 hsa-miR-29c-2.21667873611.080778021.28E-381.36E-36 hsa-miR-885-3.7770857731.2882918256.49E-386.46E-36 hsa-miR-29a-1.49116854112.87639611.37E-361.29E-34 hsa-miR-26a-1-1.4131069910.090893711.46E-361.30E-34 hsa-miR-26a-2-1.40984363810.099642881.63E-361.36E-34 hsa-miR-379-2.16028499110.395346161.41E-351.03E-33

图1 差异表达的miRNA

2.2 差异表达的miRNA的生存分析

结合样本病例的生存时间及生存状态信息,分析差异表达miRNA与患者生存率的关系。研究结果表明,一共有27个基因与患者的生存率显著相关(<0.05)(如图2)。

图2 与OSCC患者生存率显著相关的部分miRNA(前10)

2.3 差异miRNA的COX回归分析及预后风险模型的构建

通过R程序,利用coxph函数,进行单因素COX回归分析,分析结果表明,差异显著的miRNA共有84个(<0.05),<0.001的miRNA有11个(表2),此11个基因进一步用于多因素COX回归分析。多因素COX回归分析显示,其中4个miRNA,即hsa-miR-30e、hsa-miR-337、hsa-miR-1251和hsa-miR-6507可以作为评估OSCC预后的独立因子,其AIC值为1735.77(表3,图3)。hsa-miR-30e的HR值小于1,所以其可以作为独立保护因子,而hsa-mir-337、hsa-miR-1251和hsa-miR-6507的HR>1,认为这些miRNA可以作为OSCC患者的风险因子。

表2 单因素COX分析

miRNAHRzp hsa-miR-3371.2761736964.0163492475.91E-05 hsa-miR-65071.8107365733.9616896327.44E-05 hsa-miR-3691.2921013723.5310323640.000413941 hsa-miR-4931.2657022733.5051814180.000456296 hsa-miR-376c1.2580884253.5019418590.00046188 hsa-miR-376a-21.2539026923.4803779720.000500707 hsa-miR-6541.2147677373.3839216340.000714584 hsa-miR-30e0.6101686253.3330051140.000859134 hsa-miR-487b1.2595115983.3018696360.000960427 hsa-miR-12511.6337001953.2990937640.000969975 hsa-miR-3771.2432676283.2948616280.000984702

表3 多因素COX回归分析

idcoefexp(coef)se(coef)zp hsa-miR-30e-0.437030.645950.15597-2.802040.005078 hsa-miR-3370.1924041.212160.0625593.0755780.002101 hsa-miR-12510.4698461.5997470.1591822.951630.003161 hsa-miR-65070.4588051.5821830.1530912.9969410.002727

图3 多因素COX森林图

2.4 风险评估模型的可信度检测

以各基因的表达量为自变量,生存时间为因变量,得到风险得分公式为:Risk score=-0.43703377×(hsa-mir-30e)+0.192404036×(hsa-mir-337)+0.469845758×(hsa-mir-1251)+0.458805225×(hsa-mir-6507),计算每位患者的风险得分,根据风险得分的中位置,将患者分为高风险组和低风险组。建立风险生存曲线,结果显示,高风险组的生存率显著低于低风险组(=1.026e-05)(图4A)。构建的ROC曲线显示,AUC=0.699(图4B),计算获得C-index=0.63,这表明所构建的风险模型具有一定的可信度。通过构建风险曲线、生存状态分布发现,随着风险值的增加患者死亡率增加(图4C,D)。分析风险热图发现,hsa-mir-337、hsa-miR-1251和hsa-miR-6507随着表达量的增加,患者风险增加;而hsa-miR-30e随着表达量的增加,患者风险降低(图4E)。

2.5 4个关键miRNA与患者生存率的关系

利用R语言的survival包分析显示,hsa-mir-337高表达的患者的生存率显著低于低表达的患者,hsa-miR-30e高表达的患者的生存率显著高于低表达的患者(图5)。hsa-miR-1251和hsa-miR-6507的高表达和低表达对患者生存率没有显著影响(图5)。

图5 4个关键miRNA与患者生存率之间的关系

3 讨论

在本研究中,从TCGA数据库下载了OSCC的表达谱及相应患者的生存信息,通过生物信息学的方法,进行了处理与提取,最终获得了4个可以作为评估OSCC患者预后的miRNA,这对于临床口腔癌患者的治疗的早期评估具有一定的意义。

miRNA作为广泛存在于机体的非编码小片段RNA,对肿瘤的早期诊断以及治疗具有重要的意义。已有相关的研究证明miRNA可以作为肿瘤诊疗的生物标志物。HUI等[5]研究表明,miR-149、miR-3189、miR-3677、miR-3917、miR-4999及miR-6854等6个miRNA可以作为结肠癌的预后标志物。Sujaya Srinivasan的研究表明,hsa-miR-20a等10个miRNA可以用于预测胶质母细胞瘤细胞患者的生存率[6]。在口腔癌中,miR211通过靶向抑制TCF12以及增强抗氧化活性促进致癌物引起的口腔癌[7],miR146a通过靶向irak1,TRAF6及NUMB基因增强口腔癌的致瘤性[8]。

在本研究中,从TCGA下载了OSCC的miRNA表达谱数据,通过生物信息学的方法分析获得了OSCC与正常口腔组织的差异表达miRNA,并通过单因素COX回归分析以及多因素回归分析,获得了4个miRNA(hsa-mir-337、hsa-miR-1251、hsa-miR-6507和hsa-miR-30e)用于构建OSCC预后风险模型,并通过ROC曲线、风险曲线等验证了所构建模型具有一定的可信度。从高、低风险组的生存曲线可看出,多个miRNA表达水平构建的预测风险模型,比单一miRNA表达水平的生存分析差异更显著,这说明多基因表达构建的预测模型比单一miRNA构建的模型预测精度更高。

在用于构建风险评估模型的4个miRNA中,hsa-miR-6507目前未见到有相关的报导,而其他三个miRNA,在多种肿瘤中都有相关的研究,并呈现不同的功能。hsa-mir-337对肿瘤的发生发展具有重要作用,在黑色素瘤中,hsa-miR-337的表达低于癌旁组织,hsa-miR-337低表达的患者的预后更差[9]。Wang等[10]的研究表明,hsa-miR-337-3p能够通过靶向ARHGAP10基因抑制胃癌细胞的转移。Du等[12]发现,在乳腺癌中hsa-miR-337-3p的下调能够激活STAT3信号,从而促进EMT介导的迁移[11]。在肝癌细胞中,上调hsa-miR-337-3p的表达抑制细胞的增殖、迁移和侵袭。hsa-miR-337-3p也能够通过环状RNA的调节,促进胃癌细胞的增殖和迁移[13]。在本研究中,hsa-miR-337的高表达增加了患者的风险,且高表达的hsa-miR-337的病例的生存率更低。这与hsa-miR-337在其他肿瘤的研究结论相反,这可能是肿瘤的差异性所导致。

在胰腺癌中,沉默circRNA circ_0001666可通过上调hsa-miR-1251和下调SOX4抑制EMT[14]。hsa-miR-1251-5p通过靶向肿瘤抑制因子TBCC促进卵巢癌细胞的癌变和自噬[15]。hsa-miR-1251-5p过表达通过靶向NPTX2抑制透明细胞肾细胞癌的增殖、迁移和免疫逃逸[16]。hsa-miR-1251-5p通过靶向AKAP12促进肝细胞癌的生长和转移[17]。

在乳腺癌中,hsa-miR-30e通过靶向IRS1抑制肿瘤的生长以及化疗的耐药性[18]。在前列腺癌,miR-30e可以通过下调CHRM3抑制MAPK信号通路的激活,从而抑制前列腺癌细胞的黏附、迁移、侵袭和细胞周期进程[19]。miRNA-30e可通过靶向RPS6KB1抑制食道癌细胞的增殖、侵袭和肿瘤生长[20]。在头颈部鳞状细胞癌中,miR-30e-5p直接靶向AEG-1抑制血管生成和转移[21]。口腔鳞状细胞癌属于头颈肿瘤,这与本研究的结果一致,has-miR-30e高表达的患者风险降低,且生存率增加。

4 结束语

综上所述,本研究通过综合生物信息学分析建立了4-miRNA(hsa-mir-337、hsa-miR-1251、hsa-miR-6507、hsa-miR-30e)组合的风险评估模型,以作为预测OSCC患者预后的潜在生物标志物。但本研究没有使用临床样本进行验证,因此需要进一步进行研究探索。

[1] Sung H, Ferlay J, Siegel R L, et al. Global cancer statistics 2020: GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries[J]. CA: A Cancer Journal for Clinicians, 2021, 71(3): 209-249.

[2] Akram S, Mirza T, Aamir M M, et al. Emerging patterns in clinico-pathological spectrum of oral cancers[J]. Pakistan Journal of Medical Sciences, 2013, 29(3): 783-787.

[3] Xi S, Grandis J R. Gene therapy for the treatment of oral squamous cell carcinoma[J]. Journal of Dental Research, 2003, 82(1): 11-16.

[4] Momen-Heravi F, Bala S. Emerging role of non-coding RNA in oral cancer[J]. Cellular Signalling, 2018(42): 134-143.

[5] Zhang H, Wang Z, Ma R, et al. MicroRNAs as biomarkers for the progression and prognosis of colon carcinoma[J]. International Journal of Molecular Medicine, 2018, 42(4): 2080-2088.

[6] Srinivasan S, Patric I R, Somasundaram K. A ten-microRNA expression signature predicts survival in glioblastoma[J]. PLoS One, 2011, 6(3): e17438.

[7] Chen Y F, Yang C C, Kao S Y, et al. MicroRNA-211 enhances the oncogenicity of carcinogen-induced oral carcinoma by repressing TCF12 and increasing antioxidant activity[J]. Cancer Research, 2016, 76(16): 4872-4886.

[8] Hung P, Liu C, Chou C, et al. miR-146a enhances the oncogenicity of oral carcinoma by concomitant targeting of the IRAK1, TRAF6 and NUMB genes[J]. PloS one, 2013, 8(11): e79926.

[9] Xiao W, Yao E, Zheng W, et al. miR-337 can be a key negative regulator in melanoma[J]. Cancer Biology and Therapy, 2017, 18(6): 392-399.

[10] Wang Z, Yao L, Li Y, et al. miR3373p inhibits gastric tumor metastasis by targeting ARHGAP10[J]. Molecular Medicine Reports, 2020, 21(2): 705-719.

[11] Du P, Zeng H, Xiao Y, et al. Chronic stress promotes EMT-mediated metastasis through activation of STAT3 signaling pathway by miR-337-3p in breast cancer[J]. Cell Death and Disease, 2020, 11(9): 761.

[12] Zuo X L, Chen Z Q, Wang J F, et al. miR-337-3p suppresses the proliferation and invasion of hepatocellular carcinoma cells through targeting JAK2[J]. American Journal of Cancer Research, 2018, 8(4): 662-674.

[13] Gao Q, Liu Q, Chen H. Circular RNA hsa_circ_0000117 accelerates the proliferation and invasion of gastric cancer cells by regulating the microRNA-337-3p/signal transducer and activator of transcription 3 axis[J]. Bioengineered, 2021, 12(1): 1381-1390.

[14] Zhang R, Zhu W, Ma C, et al. Silencing of circRNA circ_0001666 Represses EMT in Pancreatic Cancer Through Upregulating miR-1251 and Downregulating SOX4[J]. Frontiers in Molecular Biosciences, 2021, 8: 684866.

[15] Shao Y, Liu X, Meng J, et al. MicroRNA-1251-5p Promotes Carcinogenesis and Autophagy via Targeting the Tumor Suppressor TBCC in Ovarian Cancer Cells[J]. Molecular Therapy, 2019, 27(9): 1653-1664.

[16] Yue L, Lin H, Yuan S, et al. miR-1251-5p Overexpression Inhibits Proliferation, Migration, and Immune Escape in Clear Cell Renal Cell Carcinoma by Targeting NPTX2[J]. Journal of Oncology, 2022, 2022: 3058588.

[17] Han S, Wang L, Sun L, et al. MicroRNA-1251-5p promotes tumor growth and metastasis of hepatocellular carcinoma by targeting AKAP12[J]. Biomedicine and Pharmacotherapy, 2020, 122: 109754.

[18] Liu M M, Li Z, Han X D, et al. MiR-30e inhibits tumor growth and chemoresistance via targeting IRS1 in Breast Cancer[J]. Scientific Reports, 2017, 7(1): 15929.

[19] Zheng X M, Zhang P, Liu M H, et al. MicroRNA-30e inhibits adhesion, migration, invasion and cell cycle progression of prostate cancer cells via inhibition of the activation of the MAPK signaling pathway by downregulating CHRM3[J]. International Journal of Oncology, 2019, 54(2): 443-454.

[20] Wang L, Ji X B, Wang L H, et al. MiRNA-30e downregulation increases cancer cell proliferation, invasion and tumor growth through targeting RPS6KB1 [J]. Aging, 2021, 13(21): 24037-24049.

[21] Zhang S, Li G, Liu C, et al. miR-30e-5p represses angiogenesis and metastasis by directly targeting AEG-1 in squamous cell carcinoma of the head and neck[J]. Cancer Science, 2020, 111(2): 356-368.

Establishment of Prognostic Risk Model of Oral Squamous Cell Carcinoma Associated microRNA Based on TCGA Database

Objective: This study aims to predict the survival rate of patients with oral squamous cell carcinoma (OSCC) by detecting the expression of microRNA. Methods: The expression profile data and corresponding clinical information of 397 OSCC patients were downloaded from TCGA database. The differentially expressed miRNAs between OSCC and normal tissues were analyzed by bioinformatics methods, and the prognosis related miRNAs were screened by Cox regression analysis and other bioinformatics methods. Kaplan-Meier analysis and receiver operating characteristic (ROC) curve analysis were used to evaluate the reliability of the selected miRNAs as prognostic indicators. Results: 363 miRNA were differentially expressed by bioinformatics analysis, including 197 up-regulated miRNAs and 166 down-regulated miRNAs (FDR<0.05). Through univariate Cox regression analysis, it was found that the expression of 84 miRNAs was significantly correlated with the prognosis of patients. Among them, 11 miRNAs with< 0.001 were further analyzed by multivariable Cox regression analysis, of which 4 miRNAs (has-miR-30e, has-miR-337, has-miR-6507 and has-miR-1251) were included in the risk assessment model. According to the regression coefficient of multivariate COX analysis, a prognostic risk assessment model composed of 4 miRNAs was constructed, and OSCC patients were divided into high risk group and low risk group according to the risk score. Kaplan-Meier survival curve indicates that the survival rate of the high-risk group was significantly lower than that of the low-risk group (=1.026E-05). The AUC and C-index under the constructed ROC curve were 0.669 and 0.63 respectively. Conclusion: The combination of 4 miRNAs, has-miR-30e, has-miR-337, has-miR-6507 and has-miR-1251, can be used as potential markers to predict the prognosis of OSCC patients.

TCGA; OSCC; miRNA; prognosis; risk

R739.81

A

1008-1151(2022)09-0107-05

2022-06-27

广西高校大学生创新创业计划项目(201910598058)。

李晶晶(2000-),女,广西医科大学口腔医学院学生,研究方向为口腔疾病。

粟小平(1987-),男,广西医科大学口腔医学院助理研究员,博士,从事口腔肿瘤发生机制研究工作。

猜你喜欢
生存率靶向口腔
新型抗肿瘤药物:靶向药物
国家生物靶向诊治国际联合研究中心
“六步四环”单元教学靶向课堂提质
靶向免疫联合三维适形放疗治疗晚期原发性肝癌患者的疗效观察
口腔CT支架的设计与分析
『5年生存率』啥意思
“五年生存率”不等于只能活五年
“三减三健”之健康口腔篇
日本首次公布本国居民癌症三年生存率
自动看牙镜