综合分析TCGA与GEO甲基化数据鉴定胆管癌预后相关基因SOX9和FZD10

2021-01-28 07:53
肝胆胰外科杂志 2021年1期
关键词:胆管癌甲基化标志物

(青岛大学附属医院 肝病中心,山东 青岛 266000)

胆管癌(cholangiocarcinoma,CCA)是一种起源于胆道上皮细胞的恶性肿瘤,根据其解剖起源位置可分为肝内CCA、肝门部CCA和远端CCA[1]。手术切除仍然是CCA唯一可能治愈的方法。由于缺乏早期诊断的生物标志物,只有1/3的患者有机会手术,大多数患者通常被诊断时已接近晚期[2],且术后2年内CCA患者复发和远处转移的几率仍较高[3]。此外,据文献统计CCA的发病率和病死率正逐年上升[4-5]。

DNA甲基化是一种核心的表观遗传修饰,在细胞过程中起着关键作用,如基因组调控、机体发育和疾病发生[6]。近年来DNA甲基化模式的失调越来越被认为是肿瘤发生的起始和晚期的一个重要基因事件[7]。大量的研究已经证明抑癌基因的高甲基化和癌基因的全局低甲基化在癌症的发生和进展中,包括在CCA中起着至关重要的作用[8]。Chen等[9]发现,O6-甲基鸟嘌呤-DNA甲基转移酶(MGMT)启动子高度甲基化,MGMT表达水平与CCA总生存率和组织学分级呈正相关。此外,GATA-5、ANGPTL4和DLEC1的异常甲基化已被证实参与CCA的发生和发展[10-12]。尽管在CCA中发现了几个具有特异性的低甲基化或高甲基化基因,但是基于这些基因的甲基化谱和相关通路的综合网络研究还不够深入。基因图谱和下一代测序技术已经成为癌症研究不可或缺的工具,其可以检测癌症相关的遗传和表观遗传变化,如突变、拷贝数变化以及更广泛的基因组区域DNA甲基化变化[13-14]。这些数据的生物信息学分析可以为CCA的研究提供有价值的信息。Kong等[15]基于CCA的下一代测序数据识别出三种差异表达基因(DEGs),分别是UCA1、miR-122和CLIC1,对这些失调基因的分析表明,它们可以通过调控miR-122/CLIC1和激活ERK/MAPK信号通路来促进CCA的进展。因此,差异甲基化有助于评估胆管癌的发生和预后,并可能作为CCA生物标志物。本研究旨在通过对TCGA数据库CCA甲基化数据进行分析,挖掘与CCA生存相关的甲基化基因,寻找潜在的CCA治疗靶点。现报道如下。

1 方法

1.1 数据检索与分析

在TCGA数据库下载CCA全基因组甲基化level3数据、转录组数据及相应的临床信息。33例CCA样本和8例正常样本甲基化数据和转录组数据被纳入研究。CCA样本临床信息主要包括生存信息、年龄、性别和TNM分期等。同时,在GEO数据库下载32例CCA甲基化数据(GSE32879),作为生物标志物的外部验证数据集。

1.2 构建甲基化基因生物标志物

在CCA样本和正常样本中进行差异甲基化基因(differential methylation genes,DMGs)筛选,甲基化值(Beta value)>0.1、差异倍数在2倍以上(|Fold Change|≥2)并且校正后的P值(FDR)≤0.05认定为DMGs。此外,|Fold Change|≥2、FDR<0.05,并且FPKM(每千个碱基的转录每百万映射读取的fragments)>1,则认定为差异表达基因(differential expression genes,DEGs)。从这些数据集中鉴定出多个DMGs和DEGs后,筛选DMGs和DEGs的共有基因。通过Cox比例风险回归分析筛选出与生存相关的DMGs作为CCA预后标志物,建立模型,该模型能够根据如下表达评估预后风险:

其中,N为判断预后的DNA甲基化基因数量;Meth代表DNA甲基化值;Coef为单因素Cox回归系数。

1.3 统计学分析

在甲基化数据中,风险分数平均值作为临界值将CCA患者分为高风险组与低风险组,采用Kaplan-Meier法绘制生存曲线来预测总生存率,并使用Logrank检验分析高、低风险组生存曲线是否存在差异,FDR≤0.05为存在差异,值越小差异越显著。然后使用时间依赖性ROC曲线来评估该模型的预测能力。本研究将鉴定的生物标志物与其他临床参数共同纳入多因素Cox回归分析来评估其独立预后价值。

1.4 DNA甲基化生物标志物基因功能注释

通过基因本体 (gene ontology,GO)功能注释分析所选标志物基因的功能,以进一步了解标志物基因的预测能力,设定阈值P<0.05。

2 结果

2.1 样本情况

33例CCA样本包括男性患者14例,女性患者19例。I、II、III、IV期患者分别有18例、9例、1例、5例。具体临床资料见表1。

表1 CCA样本(n=33)的患者资料统计

2.2 鉴定CCA预后相关甲基化基因

通过差异基因筛选,共筛选到DMGs 600个,筛选DEGs 6 876个。DMGs与DEGs的交集基因一共94个(图1A~C)。通过单因素与多因素Cox比例风险回归分析鉴定出FZD10和SOX92个与患者总生存时间有显著相关性的甲基化基因(图1D)。

2.3 甲基化基因预测能力验证

每例CCA患者的风险评分如下:

每例患者得到一个风险评分,以中位风险评分作为临界值,将患者分为低风险组(n=17)和高风险组(n=16)。Kaplan-Meier生存分析显示,低风险组患者总生存期明显高于高风险组(2.07年vs0.92年,图2A)。由2个甲基化基因构建的FZD10和SOX9组合生物标志物其AUC值为0.90,预测能力较高,且其预测效果比TNM分期或年龄更好(图2B)。经GEO数据验证,此组合甲基化生物标志物同样有较高的预测能力,可以明显观察到低风险组比高风险组有较高的生存期(图2C),AUC值为0.79(图2D)。

将FZD10和SOX9组合甲基化基因生物标志物和其他临床特征(性别、年龄、TNM分期等)进行多因素Cox回归分析,结果表明,组合甲基化基因生物标志物是独立的CCA预后因子(高风险组vs低风险组,HR3.53,95%CI1.74~13.40,P=0.01),见表2。

2.4 甲基化生物标志物基因功能分析

GO功能注释显示,与CCA预后相关的FZD10和SOX9基因显著富集在转录因子和转录调控、肿瘤蛋白多糖调节、干细胞的调控等方面,见图3。

3 讨论

胆管癌(CCA)是由胆管细胞引起的一种致命的恶性肿瘤。大多数CCA患者在诊断时由于缺乏典型症状和检测指标而进展为晚期CCA或其他转移性疾病,患者往往预后较差[16-17]。因此,鉴定新的CCA分子生物标志物并研究其潜在机制非常必要。DNA甲基化是一种核心的表观遗传修饰,在细胞过程中起关键作用,通常发生在鸟嘌呤核苷酸之前的胞嘧啶上[18]。由于许多转录因子的结合位点富含CpG岛,因此可能会增强对转录起始位点的结合[19]。越来越多的证据表明,异常的DNA甲基化与肿瘤的发生和发展有关。Gao等[20]通过建立肺腺癌患者预后风险模型,研究表明关键基因位点异常甲基化与预后较差有关。此外,Fan等[21]通过研究GEO数据库发现了可作为肝癌生物标志物的异常甲基化基因。更多的证据表明,表观遗传修饰尤其是DNA甲基化在CCA中具有重要的生物学功能,如CCA患者血清中OPCML和HOXD9的甲基化水平存在显著差异,这两个基因可用于胆管癌与其他胆道疾病的鉴别诊断[22]。Wang等[16]发现,DANCR可以与EZH2结合,调节FBP1启动子的组蛋白甲基化,从而调节CCA细胞的增殖和迁移。但是,以往的研究主要集中在DNA甲基化异常的特定基因或单个基因的分析。在CCA中同时涉及基因表达和甲基化的联合分析可能会产生更准确可靠的结果。因此,我们基于基因表达和基因甲基化数据进行了综合生物信息学分析,以筛选CCA新的组合生物标志物,为今后的研究提供依据。

图1 CCA预后相关的差异基因筛选

图2 FZD10和SOX9组合甲基化基因生物标志物预测CCA预后

本研究通过差异基因分析,共鉴定出600个差异甲基化基因与6 876个差异表达基因,进而得到了94个交集基因。然后通过单因素与多因素Cox回归分析,发现FZD10和SOX9这两个与CCA生存相关的差异甲基化基因,并构建组合生物标志物预测模型。此组合生物标志物可以将CCA患者分为生存时间显著不同的高风险组和低风险组,表明具有较强的预测能力。通过多因素Cox回归分析,证实甲基化基因标志物的风险得分与总生存期保持独立相关,不受其他临床因素的影响。ROC曲线的AUC值是0.90,进一步证明了FZD10和SOX9组合甲基化基因标志物是一个具有较高精度的新预后标志物。

本研究通过GO功能注释分析了作为生物标志物的甲基化基因,其功能主要集中在转录因子和转录调控、肿瘤蛋白多糖调节、干细胞调控等方面。SOX9属于SOX转录因子家族[23],在胚胎发育过程中,它广泛表达于多个器官。SOX9的表达是肝细胞最特异、最早的标志物,决定了肝内胆管形态发生的时间。在正常成人肝脏中,SOX9表达于门脉周围小的肝内管道和大胆管内的胆道周围腺体[24]。有研究发现,SOX9通过抑制miR-130a来增加宫颈癌细胞的化疗耐药[25]。FZD10是卷曲蛋白基因家族成员之一,编码Wnt通路分子的细胞表面受体[26]。FZD10在滑膜肉瘤[27]、原发性结肠癌[28]、宫颈癌[29]中高度上调。有研究发现FZD10能促进WNT-β-catenin-TCF信号通路和Rac1-JNK通路的激活[30]。FZD10甲基化可能是胆管癌发生的早期事件,这值得进一步研究。

综上所述,本研究利用生物信息学数据分析并鉴定出甲基化调控的差异表达基因,构建了一个包含SOX9和FZD10的组合生物标志物模型,对CCA预后有较好的预测价值。本研究可能为CCA的治疗提供了新的靶点。

表2 FZD10和SOX9组合生物标志物与CCA患者生存关系的单因素分析和多因素Cox回归分析

图3 甲基化基因生物标志物GO功能分析

猜你喜欢
胆管癌甲基化标志物
炎性及心肌纤维化相关标志物在心力衰竭中的研究进展
肝吸虫感染致胆管损伤及胆管癌的相关研究进展
一种肿瘤甲基化谱纯化的统计方法朱宜静
肝脏里的胆管癌
5-氮杂胞苷调节植物基因表达研究进展与应用展望
多项肿瘤标志物联合检测在健康体检中的应用价值
甲基苯丙胺改变成瘾小鼠突触可塑性基因的甲基化修饰
植物DNA甲基化研究进展
巨噬细胞移动抑制因子在肝门部胆管癌中的表达及其临床意义
B7-H4在肝内胆管癌的表达及临床意义