王力业, 高莺, , 田淳
1.山西医科大学口腔医学院·口腔医院,山西 太原(030001); 2.山西医科大学第一医院口腔科,山西 太原(030001)
口腔鳞状细胞癌(oral squamous cell carcinoma,OSCC)是常见癌症类型,约占所有口腔恶性肿瘤的90%[1-2]。在OSCC 治疗中的关键是探索新的可靠的分子标志物提高癌症患者的早期诊断,并识别和定位耐药机制。生物信息学的发展使基因表达谱被广泛应用于识别生物标志物。通过访问不同类型的数据库,包括大规模的临床信息、基因测序和表达水平,可进行各种类型癌症的标准化分析[3]。筛选肿瘤组织和正常组织中差异表达基因(differentially expressed genes,DEGs)将有助于进一步阐明OSCC 的发病机制,并可能为早期诊断和治疗提供有希望的生物标志物或靶点。影响OSCC预后的中枢基因尚未完全确定,大多数研究只针对数据库中的单个基因,关于联合遗传模型预测预后的研究较少。因此,本研究尝试利用联合遗传模型寻找OSCC 预后的关键基因,为在临床预测OSCC 患者预后提供理论依据。
从美国国家生物技术信息中心创建并维护的基因表达数据库(Gene Expression Omnibus,GEO)数据库中获取OSCC 相关的三个芯片数据GSE23558、GSE37991、GSE30784,其中包括73 例OSCC 和50 例癌旁样本。数据集中均使用人类口腔组织样本,均包括健康组和对照组。利用GEO 数据库提供的GEO2R 在线工具和维恩在线软件对芯片数据进行差异表达分析,显著差异表达基因的判定标准为|log(差异倍数)|≥1、P<0.05,并进行可视化。
为了对DEGs 进行全面的注释,采用R/bioconductor 的“clusterProfiler”程序包进行基因本体论(gene ontology,GO)富集分析和京都基因与基因组百科全书(the kyoto encyclopedia of genes and genomes,KEGG)富集分析。筛选标准是落在单个term 上差异基因,按照富集程度的值进行排列。
DEGs 相互作用使用STRING(http://string-db.org/)在线数据库进行分析。将数据导入Cytoscape软件并绘制网络图,用MCODE 插件对蛋白互作网络中的模块进行检测,找出蛋白互作网络中的集群即高度互连的区域,找出核心基因。
使用Kaplan Meier-plotter 网站工具评估核心差异基因在头颈部鳞状细胞癌中的总生存率,随后利用GEPIA(http://gepia.cancer-pku.cn/)网站对与预后相关的核心基因进行进一步验证,P<0.05 为差异有统计学意义。
通过对三个数据集的分析,共筛选出212 差异性基因,与正常组织相比,OSCC 中包括74 个上调和138 个下调差异性基因(表1)。
GO 功能注释显示DEGs 主要参与了信号转导、细胞粘附细胞增殖的正调控、炎症反应等生物学过程。DEGs 主要分布于细胞外来体、胞外区、蛋白质的细胞外基质等,参与到钙离子结合、肝素结合、受体结合、细胞因子活性等(图1)。DEGs 进行KEGG 通路分析,结果显示主要富集在癌症通路、细胞因子-细胞因子受体相互作用通路、细胞外基质受体相互作用、精氨酸和脯氨酸代谢、组氨酸 代谢、PPAR 信号通路(图2)。
表1 口腔鳞状细胞癌的差异表达基因Table 1 Venn diagrams of differentially expressed genes of OSCC
Figure 1 Gene ontology enrichment analysis results of differentially expressed genes in OSCC图1 口腔鳞状细胞癌的差异表达基因的基因本体论分析结果
Figure 2 Differentially expressed genes in OSCC are involved in metabolic pathways图2 口腔鳞状细胞癌的差异表达基因参与的代谢途径
使用STRING 在线软件进行分析,得到蛋白质-蛋白质相互作用网络,将数据输入Cytoscape 软并获得蛋白互作网络图,随后使用MCODE 插件进行模块化分析(degree cutoff = 2,node score cutoff =0.2,k-core = 2,max= 100)最终获得16 个核心基因(图3)。
Figure 3 Constructed protein-protein interaction network of differentially expressed genes in OSCC图3 口腔鳞状细胞癌的差异基因蛋白质互作网络图
利用Kaplan-Meier 在线工具分析差异基因的预后信息,显示16 个核心基因中有6 个基因高表达,与不良生存率显著相关(P<0.05),这6 个基因分别是:极光激酶A(aurora kinase A,AURKA)、极光激酶B(aurora kinase B,AURKB)、细胞凋亡抑制因子5(baculoviral IAP repeat containing 5,BIRC5)、细胞分裂周期蛋白6(cell division cycle 6,CDC6)、E2F 转录因子7(E2F transcription factor 7,E2F7)、泛素样含PHD 和环指域蛋白1(ubiquitin-like with PHD and ring finger domains 1,UHRF1)(图4)。随后,利用GEPIA 挖掘癌症组织和正常组织之间6 个基因表达水平。结果显示,与正常组织相比,AURKA、AURKB、BIRC5、CDC6、E2F7、UHRF1 等6 个核心基因在癌症组中均表达较高(P<0.05)(图5)。
随着生物信息学发展,人们逐渐加深了对OSCC 的认知,Zheng 等[4]通过生物信息学分析OSCC肿瘤组织和相邻正常组织临床样本的微阵列,得到与OSCC 相关的15 个核心差异基因,并通过定量逆转录聚合酶链反应进一步检测OSCC 肿瘤与非肿瘤之间的关系。Zhang 等[5]通过生物信息学分析识别OSCC 中异常甲基化的差异基因,结果显示这些基因在调节免疫应答过程中被富集,主要参与PI3K-AKT 和EMT 通路。本研究整合了来自多个数据集芯片数据以识别OSCC 中生物标志物,与单一数据集分析进行比较结果相对准确可靠。
Figure 4 The prognostic information of the core genes in OSCC图4 口腔鳞状细胞癌核心基因的预后信息
Figure 5 Validation of the expression levels of critical genes in OSCC图5 验证口腔鳞状细胞癌核心基因表达水平
本研究使用GEO 数据库下载了三个基因芯片用于OSCC 的生物信息学分析与整合最终获取16个核心基因,其中与口腔癌患者生存率密切相关的候选基因有6个:AURKA、AURKB、BIRC5、CDC6、E2F7、UHRF1。对以上基因进行文献检索,证实上述基因与OSCC 的发生、转移及预后密切相关。BIRC5、UHRF1 主要参与细胞凋亡的抑制。BIRC5被认为是迄今发现最强的凋亡抑制因子[6]。BIRC5 编码的蛋白Survivin 可以直接抑制末端效应酶caspase-3 和caspase-7 的活性,抵抗特定刺激引起的细胞凋亡,还可以与细胞周期蛋白依赖性激酶CDK-4 和CDK-2 相互作用抑制凋亡信号通路[7]。Troiano 等[8]对OSCC 和正常口腔黏膜进行生物信息学和组织学的综合分析,发现Survivin 蛋白在肿瘤组织中呈高表达,与肿瘤细胞较高的增殖率以及较差的预后密切相关。UHRF1 是泛素样含PHD 和环指域蛋白家族的主要成员之一,能够调节DNA 甲基化和组蛋白修饰之间的相互连接,是重要的表观遗传学调控因子。Polepalli 等[9]研究认为UHRF1 通过抑癌基因启动子高甲基化,沉默抑癌基因的转录,从而抑制其凋亡,参与肿瘤的侵袭及转移。UHRF1 基因的敲除可降低坏死受体相互作用激酶-3 的关键调节因子启动子的甲基化水平,导致坏死受体相互作用激酶-3 表达增加,从而导致肿瘤生长下降,其潜在的分子机制有助于开发肿瘤治疗药物[10]。Baroudi 等[11]发现头颈部鳞状细胞癌中UHRF1 的过表达与肿瘤侵袭性相关,不仅有助于评估患者预后,还具有对患者进行临床分期的诊断价值。
AURKA、AURKB、CDC6、E2F7 与细胞有丝分裂密切相关。Guo 等[12]采用RNA 干扰技术靶向抑制E2F7 在肿瘤中的表达进而发挥抑癌作用,该实验同时还发现在TF-target 调控网络中,E2F7 可以调控CDC6 基因表达。E2F7 过表达不仅与癌症预后相关,还会引起头颈部鳞状细胞癌治疗中蒽环类药物的耐药性。Hazar-Rethinam 等[13]证明E2F7定位错误引起RacGAPI 和Sphk1/S1P 表达下调,该网络与耐药性直接相关,并且观察到E2F7 可能是通过AURKB 作用于RacGAPI 从而激发耐药。Saen-Ponce 等[14]进一步研究发现,E2F7 从细胞核输出后错误定位于细胞质中是通过病理激活XPO1 途径所致,并且在头颈部鳞状细胞癌异种移植模型中使用XPO1 抑制剂实现了对蒽环类药物耐药性的逆转,逆转E2F7 核输出可能为头颈部鳞状细胞癌的治疗及提高生存率提供机会。CDC6 是DNA 复制必不可少的蛋白,其与其他调节蛋白结合形成“复制前复合体”,与肿瘤发生发展密切相关,同样可以促进细胞的恶性转化[15]。Feng 等[16]使用RTPCR 及免疫组化检测发现CDC6 的mRNA 和蛋白在正常口腔黏膜中低表达,在癌前病变和OSCC 中呈高表达。研究发现OSCC 淋巴结转移患者中CDC6表达明显高于非转移性癌,为了进一步证实与舌鳞癌细胞的关系,该研究者敲除CDC6 的基因后发现舌鳞癌Tca8113 细胞的增殖、迁移受到了明显的抑制[17]。AURKA、AURKB 均属于有丝分裂丝氨酸/苏氨酸激酶家族,AURKA 参与维持细胞中心粒和染色体的精确分离过程,AURKB 主要参与细胞从G2期到M 期的分裂,二者的过度表达均与肿瘤不良预后相关。Huang 等[18]发现AURKA 基因多态性表达水平和吸烟联合检测可以作为OSCC 诊断和预后的重要分子标志物,吸烟伴AURKA 基因高表达者患口腔癌风险显著增加,对筛选口腔癌高危人群有一定参考价值。Yang 等[19]证明AURKA的抑制剂MLN8237 一方面可以通过抑制AURKA在Thr288 的自磷酸化,导致细胞不能正常分裂,另一方面诱导细胞周期在G2/M 期停止细胞出现衰老,从而抑制肿瘤细胞的生长。已有学者观察到在头颈部肿瘤中AURKB 的高表达与细胞增殖和淋 巴 结 转 移 相 关[20]。Bertran-Alamillo 等[21]使 用AURKB 抑制剂处理可降低pH3 水平,从而触发G1/S 阻滞和多倍体化,在生长停滞和多倍体化之后,抑制AURKB 会引发不同类型肿瘤细胞的衰老或死亡。Togar 等[22]对OSCC 细胞的基因进行了筛选并评级,最后识别出AURKB 对OSCC 细胞增殖至关重要,进一步实验中对AURKB 进行药理抑制发现抑制癌症细胞增殖。Boeckx 等[23]比较西妥昔单抗敏感细胞和耐药头颈部鳞状细胞癌细胞系的全基因组mRNA 表达,发现高表达的AURKB 通过RAS-MARK 信号通路作用导致耐药性的发生,因此使用AURKB 抑制剂阻断该通路可能是在治疗中克服西妥昔单抗耐药性的新策略。AURKA、AURKB是癌症治疗中另一重要靶点。
综上所述,本研究利用生物信息学工具分析了OSCC 组织和相邻正常组织的基因表达差异,找出与肿瘤相关的核心基因,并对这些关键基因参与癌症的发生、发展和预后的关系进行挖掘。但一些基因在OSCC 中的功能及其分子机制有待进一步研究,同样需要用大量独立样本集对这些标志物进行验证。