黄俊杰,梁彬
(中国医科大学生命科学学院生物信息学教研室,沈阳 110122)
2018年全球癌症统计学研究[1]显示,世界范围内口腔癌发病率占所有癌症的2%,死亡率占1.9%。其中口腔鳞状细胞癌(oral squamous cell carcinoma,OSCC)最常见,约占口腔恶性肿瘤的90%以上。尽管放疗、化疗以及靶向治疗技术等医疗手段在OSCC的治疗上取得很大进展,但是OSCC的5年生存率仍然仅为40%~50%,严重影响了患者的生活质量[2]。目前,OSCC的发展、侵袭和转移机制尚不完全明确,阐明OSCC的发病机制,寻找高效的治疗靶点,对OSCC的预防及治疗具有重要的指导意义。FOXD1属于叉头框(forkhead box,FOX)蛋白转录因子家族,研究[3]证明FOXD1参与多种肿瘤的发生发展过程。目前,FOXD1在OSCC发生发展中扮演的角色知之甚少,本研究基于癌症基因组图谱(the cancer genome atlas,TCGA)数据库和Gene Expression Omnibus(GEO)数据库的信息,通过分析FOXD1在OSCC中的表达特点,探讨FOXD1在OSCC预后中的价值,同时分析FOXD1与肿瘤微环境(tumor microenvironment,TME)的关系,为进一步明确OSCC的发病机制和治疗策略提供依据。
从TCGA数据库(https://portal.gdc.cancer.gov/)下载头颈部鳞状细胞癌的基因表达谱三级数据,并进行标准化处理,提取FOXD1基因表达信息。从cBioportal数据库(https://www.cbioportal.org/)下载患者的临床信息,包括年龄、性别、TNM分期、病理分期以及预后情况。剔除临床信息和生存资料不完整的样本,共314例OSCC样本和44例癌旁组织样本纳入研究,见表1。
表1 TCGA 数据集中OSCC患者的临床特征Tab.1 Clinical characteristics of OSCC patients in the TCGA dataset
通过关键词“head and neck” “oral”和“carcinoma” “cancer” “tumor” “neoplasma”在GEO数据库(https://www.ncbi.nlm.nih.gov/geo/)中搜索相应的GEO数据集,下载芯片表达数据,提取FOXD1基因表达信息。共4个数据集纳入研究,见表2。
表2 OSCC 的GEO 数据集基本特征Tab.2 Currently available datasets curated by GEO
比较TCGA数据集中FOXD1在癌组织和癌旁组织/正常组织中的表达差异。GEO数据集作为外部验证数据集,分别分析4个GEO数据集中FOXD1在癌组织和癌旁组织/正常组织中的表达差异。分析FOXD1表达与临床参数的关系。根据FOXD1表达的中位数划分,将OSCC样本分为FOXD1高表达组和低表达组。
采用Estimation of Stromal and Immune Cells in Malignant Tumor Tissues Using Expression Data(ESTIMATE)算法对下载的RNA表达数据进行基质评分和免疫评分,并依据FOXD1的中位数将样本分成FOXD1高表达组和低表达组,比较2组基质评分和免疫评分的差异。Cell-type Identification by Estimating Relative Subsets of known RNA Transcripts(CIBERSORT)是一种采用标准化基因表达数据来评估免疫细胞组成的生物信息学方法。采用CIBERSORT算法比较FOXD1高表达组和低表达组22种免疫细胞构成比。22种免疫细胞包括巨噬细胞(M0、M1、M2),7种T细胞亚型、B细胞(初始B细胞、记忆性B细胞)、肥大细胞(未活化、活化)、自然杀伤细胞(未活化、活化)、树突细胞(未活化、活化)、浆细胞、单核细胞、嗜酸性粒细胞和中性粒细胞。
采用GSEA工具,利用MSigDB数据库中参考数据集“c2.cp.kegg.v7.2.symbols.gmt gene sets”和“C5.go.bp.v7.2.symbols.gmt gene set”进行FOXD1基因相关生物学功能和信号通路富集分析。以错误发现率(false discovery rate,FDR)<0.25和P< 0.05的基因集为显著富集基因集。
采用SPSS 22.0软件进行统计学分析。计量资料2组比较采用t检验,多组比较采用单因素方差分析。采用Kapalan-Meier曲线和Log-rank检验方法比较FOXD1高表达组和低表达组的生存差异。采用单因素和多因素Cox回归分析方法评估FOXD1的预后价值。P< 0.05为差异有统计学意义。
TCGA 数据集中,OSCC样本FOXD1表达显著高于癌旁组织(P< 0.001,图1A)。4个GEO数据集,GSE25099(P< 0.001),GSE31056(P< 0.001),GSE74530(P< 0.001)分析结果表明FOXD1在癌组织中的表达量均显著高于正常组织(图1B~1D);GSE30784数据集中FOXD1表达显著高于良性增生组织(P< 0.001,图1E)。
图1 TCGA和GEO数据集中FOXD1在OSCC组织和正常组织中的表达Fig.1 FOXD1 expression in OSCC and normal control group in TCGA and GEO datasets
TCGA数据集中,FOXD1表达与临床分期(P=0.107)、病理分期(P=0.496)、N分期(P=0.150)和T分期(P=0.102)不相关(图2)。但FOXD1在临床分期Ⅱ期(P=0.050)和Ⅲ期(P=0.027)中的表达显著高于分期Ⅰ期。在N分期和T分期中,FOXD1表达随着N分期升级有逐渐增高的趋势。
图2 FOXD1表达与临床特征的关系Fig.2 Correlation between FOXD1 expression and clinical parameters
Kaplan-Meier生存曲线显示FOXD1表达状态对OSCC患者总体生存率和无病生存率的影响。结果显示,FOXD1高表达组的总体生存率(P=0.039)和无病生存率(P=0.041)显著低于FOXD1低表达组(图3)。进一步分析FOXD1表达和OSCC的临床参数与预后的关系,如表3所示,单因素Cox回归分析中,FOXD1表达与总体生存率(HR=1.408,95%CI:1.017~1.949,P=0.039)和无病生存率(HR=1.360,95%CI:1.011~1.830,P=0.042)相关。多因素Cox回归分析结果显示FOXD1表达仅与无病生存率(HR=1.401,95%CI:1.038~1.891,P=0.027)相关,可作为无病生存的独立预后指标。
表3 OSCC预后影响因素的单因素和多因素的Cox回归分析Tab.3 Univariate and multivariate Cox regression analyses influencing factors on prognosis
ESTIMATE分析结果显示,FOXD1高表达组的基质评分(P=0.014)和免疫评分(P=0.028)显著低于FOXD1低表达组(图4A)。CIBERSORT分析结果显示FOXD1高表达组的M1型巨噬细胞(P=0.037)和活化肥大细胞(P=0.010)含量显著高于低表达组;而FOXD1高表达组未活化的树突状细胞(P=0.040)和滤泡辅助性T细胞(P=0.043)含量显著低于低表达组(图4B)。
图4 FOXD1表达与TME的关系Fig.4 Relationship between FOXD1 expression and tumor microenvironment
GSEA分析结果显示,与FOXD1高表达表型相关的信号通路包括:花生四烯酸代谢、细胞色素P450代谢、甾类激素生物合成、细胞黏附分子和PPAR 信号通路(图5A);另外,FOXD1高表达表型与角质细胞分化、上皮细胞分化、补体活化、B细胞调控免疫和吞噬作用等信号通路相关(图5B)。
图5 高表达FOXD1和低表达FOXD1的GESA分析Fig.5 GSEA analysis of high and low FOXD1 expression phenotypes
FOX家族成员可通过FOX结构域结合DNA来调控胚胎发育,调节免疫、调节糖类和脂类代谢,以及调控细胞增殖、凋亡、迁徙和转移等多种生物学过程[4]。FOX家族成员主要包括FOXA、FOXC、FOXM、FOXO和FOXP[5]。FOXD1作为FOX转录因子家族的新成员,位于染色体5q13.2。目前,研究[6-11]显示FOXD1参与多种肿瘤(肺癌、大肠癌、卵巢癌、乳腺癌,鼻咽癌、胃癌和前列腺癌)的发生发展过程。TCGA大数据分析显示,FOXD1在乳腺癌、胆管癌、结肠癌、食管癌、头颈部鳞状细胞癌、肝细胞癌、肺癌、直肠癌和胃癌中上调,而在肾透明细胞癌、甲状腺癌、子宫内膜癌中下调。一项有关卵巢癌的研究[8]显示卵巢癌细胞系中上调FOXD1可诱导卵巢癌细胞阻滞在G1期,从而抑制细胞增殖,且高表达的FOXD1与良好的预后相关。因此,FOXD1可能在肿瘤发展过程中呈现促癌和抑癌的两面性。
本研究基于TCGA和GEO数据库,发现FOXD1在OSCC组织中的表达显著上调。预后分析结果显示FOXD1高表达与不良预后相关,可作为评估预后的独立因素。CHEN等[12]研究结果显示在口腔癌的发展过程中,FOXD1可通过上调lncRNA CYTOR促进上皮间质转化和化疗抗性。LIN等[13]发现抑制FOXD1可显著增强OSCC患者放疗的有效性,且促进肿瘤免疫监视。通过对TCGA数据进行分析发现,FOXD1mRNA水平可作为OSCC诊断和预后的潜在标志物[5]。本研究结果与这些研究结果一致,推测FOXD1可作为新的癌基因参与OSCC发生发展过程。
TME是肿瘤细胞生长的内环境,主要由血管生成细胞、免疫浸润细胞及癌相关的成纤维细胞三大基质细胞组成[14]。研究[15]发现,OSCC发生发展与TME的变化紧密相连。在 OSCC的TME中,免疫细胞微环境、免疫抑制细胞微环境、间质微环境是一个相互联系、相互调节的整体,协同作用决定OSCC的发展及转归。本研究基于OSCC转录组学数据,采用ESTIMATE算法,预测肿瘤组织中浸润的基质细胞和免疫细胞的比例。结果显示OSCC样本中,FOXD1高表达组的基质评分和免疫评分均显著低于FOXD1低表达组(P< 0.05)。为了进一步探讨TME中免疫浸润细胞的变化趋势,本研究采用CIBERSORT算法对TME中22种免疫细胞亚型的组成进行评估。结果显示,M1型巨噬细胞、未活化树突状细胞、活化肥大细胞和滤泡辅助性T细胞在FOXD1高表达组和低表达组存在显著差异。因此推测FOXD1与TME的变化密切相关,且影响TME中免疫浸润细胞的组成。
本研究采用生物信息学方法对FOXD1影响的生物学过程和信号通路进行预测,结果显示,FOXD1主要富集在细胞黏附途径、花生四烯酸、类固醇激素生物合成以及PPAR信号通路。高FOXD1表达表型主要与上皮细胞、角化细胞分化以及免疫细胞调控相关。
综上所述,本研究通过对生物信息数据库的挖掘,发现FOXD1表达在OSCC组织中呈现上调的趋势,且与OSCC患者的不良预后相关。FOXD1表达影响TME中基质细胞和免疫浸润细胞的变化。FOXD1可能作为潜在的癌基因参与OSCC的发生发展过程,通过调控物质代谢和免疫反应调控OSCC的进展。