CXCL8和MSMO1基因在宫颈鳞癌预后评价中的临床价值

2021-04-15 08:23郭思慧向雪萍匡婷康佳文陈晓艳符晓华张勇李乐赛
肿瘤 2021年6期
关键词:鳞癌宫颈癌宫颈

郭思慧,向雪萍,匡婷,康佳文,陈晓艳,符晓华,张勇,李乐赛

根据2020年全球癌症统计,估计有60.4万宫颈癌新发病例和34.2万死亡病例,宫颈癌是导致女性死亡的第4大恶性肿瘤,尤其在发展中国家,宫颈癌是女性癌症相关死亡的主要原因[1]。在主要的组织学类型中,宫颈鳞癌占宫颈癌75%~80%,临床上宫颈鳞癌患者通过治疗取得一定疗效[2],但仍有35%患者在初次治疗后发生复发/转移/未控而导致预后差[3]。尽管可通过国际妇产科联盟(International Federation of Gynecology and Obstetrics,FIGO)分期和肿瘤病理特征反映患者严重程度并判断患者预后,但准确率不高[4],研究人员积极探索评估宫颈鳞癌预后的生物标志物,如血管内皮生长因子(vascular endothelial growth factor,VEGF)和p53等。但目前临床尚无公认的用于评估预后的分子标志物。

本研究通过生物信息学方法发现C-X-C基因序趋化因子配体8(C-X-C motif chemokine ligand 8,CXCL8)和和甲基固醇单加氧酶 1(methylsterol monooxygenase 1,MSMO1)与宫颈鳞癌预后相关,并通过实时荧光定量PCR法验证CXCL8和MSMO1基因在宫颈鳞癌细胞中高表达以及CCK-8法检测MSMO1基因对宫颈鳞癌细胞的增殖影响,为寻找宫颈鳞癌患者预后相关的生物标志物提供进一步的研究思路和线索。

1 材料和方法

1.1 细胞和试剂

宫颈鳞癌细胞系Siha以及人脐静脉内皮细胞(human umbilical vein endothelial cells,HUVECs)HUVE-12购自中国典型培养物保藏中心。DMEM高糖培养液、胎牛血清和胰蛋白酶购自以色列Bioind公司,Lipo6000™转染试剂购自中国碧云天生物技术有限公司;TRIzol试剂、反转录试剂盒和实时荧光定量PCR试剂盒购自南京诺唯赞生物科技有限公司;CXCL8基因、MSMO1基因、内参照GAPDH基因引物和携带特异性针对MSMO1基因的siRNA以及阴性对照(negative control,NC)由生工生物工程(上海)股份有限公司合成。

细胞培养箱(3110型)为美国Thermo Electron公司产品,倒置光学显微镜(CX41型)为日本Olympus公司产品,电泳仪、PCR仪(CFX96 Touch型)和免疫酶标检测仪(Synergy型)均为美国Bio-Rad公司产品,凝胶成像仪(TANON-5000型)为上海天能科技公司产品。

1.2 微阵列数据

在美国国家生物技术信息中心(National Center of Biotechnology Information,NCBI)GEO数据库检索宫颈鳞癌相关基因芯片。检索词为“(cervical)or(cervix)”和“(cancer)or(tumor)”,限制研究类型为Expression profiling by array,限制种属为Homo sapiens。纳入标准:数据集包含正常对照(normal)和宫颈鳞癌(cancer);Affymetrix基因表达谱芯片,平台为GPL96。

最终纳入2个数据集GSE7803和GSE9750。GSE7803包含10个正常样本和21个宫颈鳞癌样本[5]。GSE9750包含24个正常样本和33个宫颈鳞癌样本[6]。使用R软件ggpubr和ggthemes包对2个数据集进行主成分分析(principal component analysis,PCA)以及ggplot2包绘制火山图展示差异表达基因分析结果。在癌症基因组图谱(The Cancer Genome Atlas,TCGA)数据库下载304例宫颈鳞癌样本和3例正常样本相应的临床资料。本研究流程图如图1所示。

1.3 差异表达基因筛选及分析

利用GEO2R筛选差异表达基因(http://www.ncbi.nlm.nih.gov/geo/geo2r/)。差异表达基因的筛选标准为P<0.05且|Log2FC|≥1(fold change,FC)。通过venn图筛选2组数据集重叠的差异表达基因。利用DAVID(The Database for Annotation,Visualization and Integrated Discovery)对差异表达基因进行基因本体论(gene ontology,GO)分析和京都基因与基因组百科全书(kyoto encyclopedia of genes and genomes,KEGG)通路分析,其中GO分析包括生物过程、细胞组成和分子功能3个部分,以P<0.05为差异具有统计学意义。通过STRING揭示差异基因编码蛋白之间的相互作用网络。利用cytoscape软件的cytohubba插件筛选关键基因。采用Cytohubba计算网络节点的11种拓扑分析方法,选取每种方法分数排名前10的基因,组成Hub基因集。

1.4 Hub基因分析

利用基因表达谱数据动态分析(Gene Expression Profiling Interactive Analysis,GEPIA)数据库分析Hub基因在正常组织和宫颈鳞癌中的表达水平以及预后关系。利用人蛋白质数据库(human protein atlas,HPA)分析Hub基因在正常宫颈组织和宫颈癌中的蛋白表达水平。使用R语言软件分析TCGA宫颈鳞癌临床数据中Hub基因对患者的预后价值。对Hub基因进行基因集富集分析(Gene Set Enrichment Analysis,GSEA),进一步探索基因调控网络之间的关系及基因功能和意义。

1.5 单因素和多因素COX风险回归模型分析

从TCGA数据库下载304例宫颈鳞癌基因表达谱数据和临床资料,分别取CXCL8和MSMO1表达量的截断值分为高表达组和低表达组。用χ2检验分析CXCL8和MSMO1表达与宫颈鳞癌患者临床病理参数之间的相关性,单因素和多因素COX风险回归模型检验预后相关因素。

1.6 随机森林模型构建及验证

通过构建随机森林模型来预测患者预后。采用R软件读取CXCL8和MSMO1基因表达数据集及TCGA临床样本数据304例。使用随机函数,将基因表达数据集按1∶1随机分为训练组和验证组,用于随机森林模型的构建和验证。调用randomForest包构建随机森林模型,计算CXCL8和MSMO1基因的重要程度,其中参数ntree=500表示使用500棵决策树模型用于随机森林的分类。应用predict和ggboxplot函数将训练组和验证组的数据纳入构建的随机森林模型中,计算预测值并绘制箱型图。应用受试者工作特征曲线(receiver operating characteristic curve,ROC)和曲线下面积(area under curve,AUC)评估预测模型的准确性。

1.7 实时荧光定量PCR法检测Siha细胞中CXCL8和MSMO1 mRNA的表达水平

收集细胞,用TRIzol试剂提取细胞总RNA,用反转录试剂盒将RNA反转录为cDNA。按照实时荧光定量PCR试剂盒说明书配制反应体系,加入引物以及适量cDNA,以GAPDH基因作为内参照,进行PCR扩增。反应条件为预变性95 ℃ 30 s、95 ℃变性10 s、63 ℃退火30 s、返回95 ℃ 10 s,共39个循环;65~95 ℃,每0.5 ℃5 s梯度递增;终止反应。以2-△△Ct值表示目的基因mRNA的表达量。实验独立重复3次。实验组为宫颈鳞癌Siha细胞,对照组为HUVE-12细胞。

CXCL8基因上游引物序列为5’-AACTGAG AGTGATTGAGAGTGG-3’,下游引物序列为5’-ATGAATTCTCAGCCCTCTTCAA-3’;MSMO1基因上游引物序列为5’-GTTCATCA TGAGTTTCAGGCTC-3',下游引物序列为5’-TACATGATCACACAAAAGCACG-3’;GAPDH基因上游引物序列为5’-CTGCCAAC GTGTCAGTGGTG-3’,下游引物序列为5’-TC AGTGTAGCCCAGGATGCC-3’。

1.8 细胞转染

采用脂质体转染法将特异性针对MSMO1基因的siRNA(siMSMO1)瞬时转入人宫颈鳞癌Siha细胞,转染流程参阅试剂盒来源公司提供的操作流程。实验分为对照组(siNC)、siMSMO1-1组、siMSMO1-2组和siMSMO1-3组。转入siMSMO148h后,采用实时荧光定量PCR法检测转染效率,实验流程同1.7节。siMSMO1-1正义链序列为5’-GCAUAGACUCUUACACCACAATT-3’,反义序列链为5’-UUGUGGUGUAAGAGUCUA UGCTT-3’;siMSMO1-2正义链序列为5’-CU CUCAGUAUAAUGCCUAUAATT-3’,反义链序列为5’-UUAUAGGCAUUAUACUGAGAGTT;siMSMO1-3正义链序列为5’-AUGGGUGACC AUUCGUUUAUUTT-3’,正义链序列为5’-AAUAAACGAAUGGUCACCCAUTT-3’;siNC正义链序列为5’-UUCUCCGAACGUGUC ACGUTT-3’,反义链序列为5’-ACGUGACA CGUUCGGAGAATT-3’。

1.9 CCK-8法检测

分别于siNC、siMSMO1-1、siMSMO1-2和siMSMO1-3转入Siha细胞24、48和72 h时,加入含10% CCK-8溶液的细胞培养液继续培养3 h后,在酶联免疫检测仪波长450 nm处检测各孔的D值。

1.10 统计学方法

所有统计分析采用R(4.0)和GraghPad Prism 8进行。利用R软件获得各基因的最佳截断值和生存曲线。用χ2检验分析Hub基因表达与宫颈鳞癌临床因素的相关性。进行单因素和多因素COX风险回归分析模型选择独立预后因素。以P<0.05为差异有统计学意义。

2 结果

2.1 差异表达基因筛选

对GSE7803(图2A)和GSE9750(图2B)数据集进行PCA分析,结果显示2组数据集的样品组间差异明显,表明数据质量好,可进行下一步差异分析。

GSE7803数据集中共有878个差异表达的基因,其中有488个为表达上调的基因,390个为表达下调的基因(图2C);GSE9750数据集共有2 470个差异基因,其中有548个为表达上调的基因,1 922个为表达下调的基因(图2D)。利用venn图分别将2组数据集的上、下调差异基因取交集,获得上调差异基因集和下调差异基因集,筛选出表达上调的基因245个,表达下调的基因334个,结果如图2E和图2F所示。

2.2 GO和KEGG通路富集分析

GO分析结果(图3)显示,差异表达基因主要参与RNA聚合酶Ⅱ启动子的转录正调控、细胞复制、细胞分裂和细胞增殖等生物过程。差异表达基因的细胞组成包括外泌体、细胞质、细胞核、核浆和细胞膜等。在分子功能方面,差异表达基因主要富集于蛋白结合、染色体结合、染色体二聚体化和同蛋白结合等。KEGG分析结果(表1)显示,差异表达基因主要富集在肿瘤、细胞周期、人类嗜T细胞病毒类型Ⅰ(human T-cell leukemia virus type-Ⅰ,HTLV-Ⅰ)感染和肿瘤中的微RNA(microRNA,miRNA)等10条通路中。GO和KEGG分析结果表明,细胞增殖和分裂的变化在宫颈癌的发生和发展进程中扮演重要角色。

表1 前10差异基因KEGG富集通路Table 1 Top 10 differential gene kyoto encyclopedia of genes and genomes (KEGG) enrichment pathway

Fig.2 Principal component analysis (PCA) analysis graph of GSE7803 and GSE9750 data sets (A-B),the volcano diagram (B-C) and venn diagram (E-F) with up-regulated differential genes and the volcano diagram and venn diagram with down-regulated differentially expressed genes.图2 GSE7803和GSE9750数据集的PCA分析图(A和B)、上调和下调差异基因的火山图(C和D)以及venn图(E和F)

Fig.3 Gene ontology (GO) analysis of Hub genes:biological process (A),cell composition (B) and molecular function (C).图3 差异表达基因GO分析结果生物过程(A)、细胞组成(B)和分子功能(C)

2.3 蛋白-蛋白网络(protein-protein interaction network,PPI)分析和关键基因筛选

通过Cytohubba插件的11种计算方法,筛选出58个关键基因。关键基因蛋白互作网络如图4所示。GEPIA在线工具分析结果显示,其中10个关键基因在宫颈鳞癌中的表达与患者的预后显著相关;其中CXCL8(P=3.4×10-5)、MSMO1(P=4.6×10-3)、拓扑异构酶Ⅱα(topoisomeraseⅡα,TOP2A)(P=0.031)、微小染色体维持蛋白2(minichromosome maintenance protein,MCM2)(P=0.01)、细胞分裂周期45(cell division cycle 45,CDC45)(P=0.038)、载脂蛋白C1(apolipoprotein C1,APOC1)(P=0.049)、GINS复合物亚基2(GINS complex subunit 2,GINS2)(P=0.037)和增殖细胞核抗原(proliferating cell nuclear antigen,PCNA)(P=0.023)等8个基因在宫颈鳞癌中表达上调,胰岛素样生长因子1(insulin like growth factor 1,IGF1)(P=0.029)和Jun原癌基因(Jun protooncogene,JUN)(P=0.029)这2个基因在宫颈鳞癌中表达下调。

Fig.4 Protein-protein interaction network (PPI) of hub genes.图4 Hub基因的PPI

生存分析结果(图5A)显示,CXCL8和MSMO1基因高表达宫颈鳞癌患者的总生存期(overall survival,OS)较低表达者明显缩短(P=1.5×10-5和P=0.037),提示CXCL8和MSMO1基因高表达可能与宫颈鳞癌患者的不良预后相关。基于TCGA的数据分析结果(图5B)显示,与正常组织比较,CXCL8和MSMO1基因在宫颈鳞癌组织中的表达明显升高。通过HPA数据库检索免疫组织化学检测标本,获得宫颈正常组织标本3例,宫颈鳞癌标本11例;免疫组织化学检测结果(图5C)显示,宫颈正常组织标本中均未检测到MSMO1蛋白的表达,宫颈鳞癌组织中2例MSMO1蛋白表达呈阳性(https://www.proteinatlas.org/ENSG00000052802-MSMO1/pathology/cervical+cancer#ihc)(所有结果均已获得原出版单位授权)。

Fig.5 Correlation between C-X-C motif chemokine ligand 8 (CXCL8) and methylsterol monooxygenase 1 (MSMO1) gene expression levels and prognosis of patients with cervical squamous carcinoma (A),CXCL8 and MSMO1 gene expression levels in normal and cervical cancer tissues (B) and MSMO1 protein expression in normal and cervical cancer tissue was detected by immunohistochemistry (DAB staining).图5 CXCL8和MSMO1基因表达水平与宫颈鳞癌患者预后的相关性(A),CXCL8和MSMO1基因在正常组织和宫颈癌组织中的表达水平(B)以及MSMO1蛋白在正常组织和宫颈癌组织中的表达水平

2.4 CXCL8和MSMO1 mRNA表达与宫颈鳞癌临床相关因素分析及GSEA富集分析

对304例宫颈鳞癌患者的临床病理特征分析结果(表2)显示,CXCL8和MSMO1表达水平与患者的年龄(P=0.045和P=0.013)以及OS期(P=0.015和P<0.001)均有明显的相关性。

表2 CXCL8和MSMO1 mRNA表达与宫颈鳞癌患者临床病理特征的关系Table 2 Correlations between the chemokine C-X-C motif ligand 8 (CXCL8) and methylsterol monooxygenase 1(MSMO1) mRNA expression and clinicopathological factors of patients with cervical squamous cancern (%)

TCGA-CESC临床数据的单变量和多变量COX回归分析结果(表3)显示,肿瘤患者是否淋巴结转移、CXCL8和MSMO1基因的表达水平与宫颈鳞癌患者的OS相关(P均<0.05)。GSEA富集分析结果(图6)显示,CXCL8基因主要富集于23条通路(P<0.05),其中小细胞肺癌、肾细胞癌和NOD样受体信号等通路与癌症相关;MSMO1基因主要富集于29条通路(P<0.05),其中,抗原处理和呈递、细胞黏附分子、移植物抗宿主和原发性免疫缺陷等通路明显与宫颈癌的发生和发展相关。

表3 影响宫颈癌OS期的单因素和多因素分析结果Table 3 The results of univariate and multifactorial analyses affecting overall survival (OS) of cervical cancer

Fig.6 Gene Set Enrichment Analysis (GSEA) enrichment analysis of chemokine(C-X-C motif) ligand 8(CXCL8) (A) and methylsterol monooxygenase 1 (MSMO1) gene (B).图6 CXCL8(A)和MSMO1基因(B)的GSEA富集分析图

2.5 随机森林模型构建结果

对CXCL8和MSMO1进行森林模型构建,计算临床数据中每个基因的重要程度,并利用varImpPlot函数进行可视化(图7)。将训练组数据纳入构建好的森林模型中,结果(图8A)显示在生存组和死亡组中,患者的预测评分存在明显差异(P<0.05)。同样的,将验证组的临床信息纳入模型,结果同样显示该模型可以预测宫颈鳞癌患者的生存和死亡状态(P<0.05)。本模型中,训练组预测结果的ROC曲线下面积(area under the curve,AUC)=1.00,验证组的AUC=0.71,说明模型预测能力较好(图8B)。

Fig.7 The importance of chemokine C-X-C motif chemokine ligand 8 (CXCL8) (A) and methylsterol monooxygenase 1 (MSMO1) gene in the random forest model.The horizontal axis refers to increase in node purity,the higher the value,the greater the importance of the gene,the vertical axis were the genes.图7 随机森林模型中CXCL8和MSMO1基因的重要性

Fig.8 Box diagram and receiver operating characteristic (ROC) curve of model verification results.A:Box plot of the prediction results of the training group and the validation group;B:ROC curve of the model in the training group and the validation group.图8 训练组和验证组的模型验证结果[箱型图(A)及ROC曲线(B)]

2.6 Siha细胞中CXCL8和MSMO1 mRNA高表达

实时荧光定量PCR检测结果(图9)显示,CXCL8 mRNA在Siha细胞中的相对表达量为9.15±2.58,明显高于HUVE-12细胞中的1.00±0.00,差异有统计学意义(P<0.05)。MSMO1 mRNA在Siha细胞中的相对表达量为2.53±0.61,明显高于HUVE-12细胞中的1.00±0.00,差异有统计学意义(P<0.05)。

Fig.9 The expression levels of C-X-C motif chemokine ligand 8 (CXCL8) and methylsterol monooxygenase 1 (MSMO1) mRNA in cervical squamous cell carcinoma Siha cells and human umbilical vein endothelial HUVE-12 cells were detected by real-time fluorescent quantitative PCR (n=3).图9 实时荧光定量PCR法检测MSMO1和CXCL8 mRNA在宫颈鳞癌Siha和人脐静脉内皮HUVE-12细胞中的表达水平

2.5 敲低MSMO1基因表达对Siha细胞增殖的影响

为了探讨MSMO1基因对人宫颈鳞癌Siha细胞增殖的影响,分别转入siMSMO1-1、siMSMO1-2和siMSMO1-3沉默Siha细胞中MSMO1基因的表达水平。实时荧光定量PCR法检测结果(图10A)显示,转入siMSMO1 48 h后,siMSMO1-1、siMSMO1-2和siMSMO1-3均能明显下调MSMO1 mRNA的表达水平(P均<0.000 1)。CCK-8法检测结果(图10B)显示,采用siMSMO1-1、siMSMO1-2和siMSMO1-3沉默MSMO1基因表达后,Siha细胞的增殖能力被明显抑制(P<0.05)。

Fig.10 The expression level of methylsterol monooxygenase 1 (MSMO1) mRNA in Siha cells transfected with siMSMO1-1,siMSMO1-2 and siMSMO1-3 were detected by real-time fluorescent quantitative PCR(A).The proliferation of Siha cells were detected by CCK-8 method (B).Siha cells were transfected with siNC as the control group.**P < 0.01,****P < 0.000 1,vs siNC group (n=3).图10 实时荧光定量PCR检测转入siMSMO1对Siha细胞中MSMO1 mRNA表达水平的影响(A)并采用CCK-8法检测沉默MSMO1基因表达对Siha细胞增殖能力的影响(B)

3 讨论

宫颈癌是发展中国家最常见的妇科肿瘤。尽管应用宫颈癌筛查和多种临床治疗手段,其临床治疗效果及预后得到改善,但仍存在一些难治或复发患者,复发或远处转移患者五年生存率仅为30%[7]。本研究通过生物信息学分析发现,CXCL8和MSMO1基因对宫颈鳞癌患者预后判断具有重要价值。

CXCL8是一种促炎症趋化因子,在胃癌[8]、结直肠癌[9]、头颈部鳞状细胞癌[10]和其他肿瘤中高表达,能够刺激中性粒细胞和淋巴细胞发生颗粒释放和氧化。本研究发现,CXCL8在宫颈鳞癌细胞和组织中过表达,且过表达CXCL8的患者预后更差。有研究报道,CXCL8过表达促进宫颈癌的生长与转移,是宫颈癌患者预后差的独立危险因素[11-12],本研究结果与之相同。CXCL8与肿瘤的炎症、免疫反应和血管新生生成密切相关[13]。这也与本文在KEGG分析方面的结果相似,即CXCL8富集于肿瘤和趋化因子信号通路。ZHANG等[14]在体内外研究中均发现,CXCL8过表达诱导肿瘤细胞的生长、克隆形成和血管生成。以上结果提示,CXCL8在宫颈癌中发挥促癌基因作用,其过表达是宫颈癌患者预后不良因子。目前关于CXCL8在宫颈癌中的机制研究相对全面,本文未进行后续分析,需要未来深入探讨。

MSMO1编码甲基甾醇单加氧酶1催化胆固醇合成途径中C4-甲基固醇的去甲基化。本研究通过GSEA富集分析发现MSMO1主要富集于类固醇合成、萜类生物合成和不饱和脂肪酸合成等通路。KEGG分析发现,MSMO1基因涉及细胞增殖、抗原处理和呈递、细胞黏附分子和原发性免疫缺陷等通路。既往也有研究发现,MSMO1在高密度脂蛋白胆固醇生物合成、能量代谢和胰岛素水平异常中发挥作用[15]。在肝癌细胞中,miR-23a和miR-23b下调MSMO1导致肝癌糖异生、固醇和胆固醇代谢发生异常[16]。目前,仅有少量研究发现宫颈癌组织中胆固醇含量高于正常宫颈组织,且癌症患者总生存率随着血清中胆固醇浓度增高而降低[17]。为了进一步证实MSMO1在宫颈癌中的作用,本研究通过分析TCGA临床数据发现MSMO1高表达与宫颈癌患者预后差密切相关,免疫组织化学和实时荧光定量PCR证实MSMO1在宫颈癌组织和鳞癌细胞中高表达,敲低MSMO1表达可以抑制Siha细胞的增殖能力。综上所述,MSMO1基因在宫颈鳞癌组织和细胞中过表达可能与患者不良的临床结局相关,MSMO1基因具有促进宫颈鳞癌Siha细胞增殖能力的作用,可能是评估宫颈鳞癌患者预后的一个新的分子标志物。对于MSMO1基因在宫颈鳞癌中的作用和功能通路未见相关报道,因此MSMO1在宫颈鳞癌中影响及作用机制有待进一步探索。

本研究存在一定的局限性。生物信息学计算方法和数据集整合方式不同,可能导致本结果与其他研究存在差异。另外,生物信息学分析的结果需要经过基础和临床研究验证才更可靠。因此,在未来的研究中将在细胞和动物实验中进一步探索CXCL8和MSMO1基因在宫颈发生和发展的机制,同时结合临床样本验证CXCL8和MSMO1基因对肿瘤患者预后的判断作用。

猜你喜欢
鳞癌宫颈癌宫颈
中老年女性的宫颈癌预防
恶性胸膜间皮瘤、肺鳞癌重复癌一例
预防宫颈癌,筛查怎么做
基于深度学习的宫颈鳞癌和腺鳞癌的识别分类
怀孕后宫颈管短怎么办
这几种“宫颈糜烂”需要治疗
HPV感染——“宫颈的感冒”
Hepsin及HMGB-1在宫颈癌组织中的表达与侵袭性相关性分析
E-cadherin、Ezrin在宫颈癌组织中的表达及临床意义
整合素αvβ6和JunB在口腔鳞癌组织中的表达及其临床意义