肺腺癌预后甲基化基因生物标志物鉴定

2019-12-23 02:54:08青,王
转化医学杂志 2019年6期
关键词:甲基化腺癌标志物

李 青,王 莉

癌症是严重威胁人类健康的重大疾病。研究发现,2018年全球范围内约有1 810万癌症新发病例和960万癌症死亡病例,接近一半的癌症新发病例和超过一半的癌症死亡病例发生在亚洲地区。尤其在中国,肿瘤发病形势十分严峻,中国的癌症发病人数约占全球的22%,发病人数全球最多[1]。近年来,肺癌仍然是人类最常见的恶性肿瘤之一,而且肺癌发病率和病死率正在呈现逐年上升趋势[2-3]。肺癌有2种主要类型,分别是小细胞肺癌(small cell lung cancer,SCLC)和非小细胞肺癌(non-small cell lung cancer,NSCLC)[4-5]。而肺腺癌是NSCLC的主要亚型,发病率越来越高,在许多国家始终是对人类威胁最大的几种癌症之一[6]。以前的研究表明,肺腺癌患者与其他NSCLC患者相比生存时间较短[7]。作为一种常见的NSCLC的组织学亚型,肺腺癌的临床治疗以手术切除为主,但是治疗后患者预后较差,患者术后复发率高达35%~50%[8]。因此,迫切需要建立一个敏感性高、预测能力强的生物标志物模型来阐明肺腺癌的预后。

虽然癌症的发生和发展主要依赖于肿瘤相关基因的改变,但肿瘤相关基因的DNA甲基化等表观遗传变化在肿瘤发生发展中发挥着重要作用[9-10]。DNA甲基化常被认为是基因沉默的一种机制,在胚胎发育、转录、基因组印记和X染色体失活等许多细胞过程中发挥重要作用[11-14]。DNA甲基化生物标志物已被用于癌症的早期诊断和预后。已有研究发现肺腺癌中一些基因甲基化变化进而影响基因表达,最后影响肺腺癌患者的预后[15-16]。本研究在癌症基因组图谱(The Cancer Genome Atlas,TCGA)数据库中肺腺癌甲基化数据进行挖掘,全基因组范围探寻与肺腺癌预后相关的甲基化基因,为开发新的肺腺癌预后标志物和治疗靶点奠定基础。

1 材料与方法

1.1 DNA甲基化数据检索 在TCGA数据库中下载美国Illumina公司Methylation 450K芯片检测的肺腺癌全基因DNA甲基化level 3数据,为了保证数据的准确性,对数据进行了预处理。

1.2 样本资料 数据处理后,获得了219例肺腺癌DNA甲基化样本数据及相关的临床信息和29例正常肺组织样本数据,肺腺癌临床样本信息包括生存信息、性别、年龄和TNM分期等。将219例肺腺癌样本随机分为验证组(73例)和训练组(146例)。本研究中,男性患者113例,女性患者106例。Ⅰ、Ⅱ、Ⅲ、Ⅳ期患者分别为111例、54例、37例、12例,患者平均年龄为64岁。

1.3 在训练组数据中构建DNA甲基化生物标志物在肺腺癌样本和正常肺组织样本中进行差异甲基化基因筛选,我们认定甲基化值(Beta value)>0.1、差异倍数在2倍以上(|Fold Change|≥2)并且校正后的P值(FDR)<0.05为差异甲基化基因。通过单因素Cox比例风险回归分析评估训练组中患者总生存期(overall survival,OS)和DNA甲基化之间的关系。进一步通过多因素比例风险回归分析筛选出预测肺腺癌患者预后的甲基化生物标志物。为筛选出预测肺腺癌预后最强大、最准确的DNA甲基化基因,采用多因素Cox回归分析建立模型,该模型能够评估预后风险,表达如下:

(1)

式(1)中,N为判断预后的DNA甲基化基因数量;Meth代表基因DNA甲基化值;Coef为单因素Cox回归系数。当Coi系数<0时,将其定义为预后较好的部位,而当Coi系数>0时被认为是预后较差的部位。风险评分(RS)是风险得分的多节点加权和。

1.4 生存分析与预后模型评估 采用风险平均值作为训练组中临界值将训练组中肺腺癌患者分为高风险组与低风险组,采用Kaplan-Meier法绘制生存曲线来预测总生存率,使用时序检验来检验高、低风险组生存曲线是否存在差异,应用时间依赖性受试者工作特征(receiver operating characteristic,ROC)曲线来评估该预后模型的预测能力。为评估甲基化预后生物标志物的独立预后价值,本研究将其与其他临床信息共同纳入多因素Cox回归分析。为鉴定预后生物标志物的准确性,使用时间依赖性ROC曲线和Kaplan-Meier生存分析在验证组中验证了DNA甲基化基因生物标志物的预测能力。

1.5 DNA甲基化生物标志物基因功能注释 为进一步研究生存相关DNA甲基化生物标志物基因的功能,使用基因本体论(Gene Ontology,GO)功能注释来研究所选择基因的功能,设定阈值P<0.05。

2 结果

2.1 肺腺癌预后相关DNA甲基化基因鉴定情况 通过对219例肺腺癌患者肿瘤组织与29例正常肺组织的差异甲基化基因筛选,一共筛选到差异甲基化基因160个,其中甲基化显著增高的基因156个,甲基化显著降低的基因4个。通过单因素Cox比例风险回归分析基因甲基化水平与生存时间的关系,以生存时间和生存状态为因变量,共鉴定7个甲基化基因,它们与患者的OS均有显著的相关性(P<0.05;图1A)。为了选择具有最大预测能力的标志物,进行了多因素Cox回归分析,共鉴定出4个预后相关甲基化基因,分别是AF131215.8、AL021918.1、RP11.386G11.3和ZNF382(图1B),并建立了肺腺癌预后标志物模型。

图1 单因素Cox(A)和多因素Cox(B)回归分析训练组肺腺癌患者甲基化基因与生存的关系

每个肺腺癌患者的风险评分如下:

RS=(-0.31×methAF131215.8)+(-0.31×methAL021918,1)+ (0.31×methRP11.386G11.3)+(0.28×methZNF382)

(2)

每个患者从所选择的甲基化基因生物标志物中得到一个风险评分,以中位风险评分作为临界点,将训练组患者分为低风险组(n=73)和高风险组(n=73)。Kaplan-Meier生存分析显示,患者OS比较低风险组(1.97年)明显高于高风险组(0.54年),差异比较具有统计学意义(P<0.001;图2A)。为了验证DNA甲基化标志物的预测能力,在验证组中使用相同的预后风险评分模型进行验证,患者OS比较高风险组(1.57年)明显低于低风险组(2.06年),差异比较具有统计学意义(P=0.03;图2B)。

2.2 DNA甲基化基因生物标志物预测能力验证结果 为了检验DNA甲基化基因生物标志物的预测能力,进行了单独的ROC分析,通常认为ROC曲线下面积(area under curve,AUC)越大,预测模型越好。在训练组中,4个DNA甲基化基因生物标志物的预测能力较高(AUCSignature=0.793;图2C),进一步证明了研究中甲基化基因生物标志物是一种新颖且高度准确的预后标志物。在验证组中也发现了类似的结果(AUCSignature=0.738;图2D)。

图2 甲基化基因生物标志物预测肺腺癌患者预后

通过将鉴定的甲基化基因生物标志物和其他临床信息(性别、年龄、TNM分期等)结合进行多因素Cox回归分析,结果表明,用于预测预后的甲基化基因生物标志物预测能力与其他临床信息无关,是独立的预后因子[高风险组与低风险组,风险比(hazard ratio,HR)=2.76,95%可信区间(confidence intervals,CI)(1.67~4.57),P=0,n=146]。同样的结果也在验证组中出现[高风险组与低风险组,HR=1.97,95%CI(1.17~1.91),P=0.03,n=73]。表1。

表1 4个甲基化基因与肺腺癌患者生存的单因素和多因素Cox回归分析

2.3 DNA甲基化基因生物标志物GO功能注释结果 GO功能注释显示,预后相关的DNA甲基化生物标志物基因显著富集在转录激活活性、RNA聚合酶Ⅱ启动子转录、蛋白质异源二聚体活性和RNA聚合酶Ⅱ启动子转录的正调控等方面(P<0.05,图3)。表明这些预后相关基因可能从调控转录和蛋白质活性等方面来调控肺腺癌的预后。

图3 肺腺癌患者生存相关基因GO功能注释

3 讨论

在NSCLC中,肺腺癌是一种常见的组织学亚型,不论男性和女性、吸烟者和非吸烟者死亡率都较高,预后较差[17]。目前对肺腺癌患者的治疗仍以手术为主。然而,手术治疗后近半数患者出现复发甚至死亡,导致5年生存率较低[18]。因此,需要一个有效的评估生存结果或预测术后复发风险的预后标志物。

大量研究报道,许多肿瘤抑制基因通过调控作用在肿瘤预防上发挥了关键作用,如DNA修复、细胞粘附、细胞周期控制和细胞凋亡调控等可以调控肿瘤发生发展[19]。许多肿瘤发生是由于基因启动子的甲基化导致基因沉默引起的。因此,某些基因的DNA甲基化状态作为一个有用的生物标志物预测肿瘤的行为是合理的假设。此外,DNA甲基化生物标志物与基因和血清标志物比较是有许多优势,如DNA甲基化谱具有比RNA或大多数蛋白质更具化学和生物学稳定性的分子诊断信息来源[20]。异常的DNA甲基化导致细胞过程的失调(如增殖、转化和抗凋亡作用),都促进癌症的进展。DNA甲基化为了解肺腺癌的恶性行为提供了有价值的信息。以往对肺腺癌的研究大多集中在一些已知癌症相关基因上并且目前对肺腺癌生物标志物的研究大多集中在mRNA、lncRNA和miRNA等转录层面,例如通过TCGA数据库分析鉴定出hsa_circ_0000792为潜在的肺腺癌生物标志物[21],可能应用于肺腺癌的高危人群早期筛查和诊断。而miR-30a-3p的研究为肺腺癌的诊断和预后提供了新的潜在的生物标志物[22]。肺腺癌中lncRNA相关的ceRNA网络研究,发现了潜在的诊断和预后RNA相关生物标志物[23]。但是,肺腺癌仍缺乏表观遗传方面的生物标志物。本研究以TCGA数据库中肺腺癌患者的甲基化数据为基础,利用生物信息学方法寻找新的生物标志物,建立了一个由4个DNA甲基化基因组成的新型DNA甲基化生物标志物模型;通过多因素Cox回归分析,确定了所鉴定的DNA甲基化生物标志物在预后预测中的独立性,预测能力不依赖于其他临床信息;ROC曲线进一步证明了所鉴定的DNA甲基化基因生物标志物是一个新的高精度预后标志物,具有重要的临床价值。

此外,本研究分析了作为生物标志物的DNA甲基化基因的功能。GO富集主要集中在转录激活活性、RNA聚合酶Ⅱ启动子转录、RNA聚合酶Ⅱ启动子转录的正调控和蛋白质异源二聚体活性等方面,表明这些甲基化基因可能通过影响基因转录表达进而影响肿瘤的预后。在这些甲基化基因生物标志物中,ZNF382编码转录因子KZNF,KZNFs在细胞分化、增殖和凋亡等多种过程的调控中发挥着重要作用,并且能抑制活化蛋白1和NF-κB信号通路,在多种肿瘤中起抑癌作用。在食管鳞状细胞癌中,经常会发生ZNF382甲基化并且抑制Wnt/β-catenin信号通路[24]。在胃癌中,ZNF382基因启动子发生甲基化而沉默,而ZNF382的异位表达能诱导细胞凋亡,显著抑制胃肿瘤细胞克隆性、增殖、迁移和上皮间质转化[25]。肝癌中,启动子甲基化经常使ZNF382表达下调,而ZNF382的表达降低与早期原发性肝癌患者生存不良密切相关。功能研究表明,ZNF382通过抑制裸鼠细胞增殖、集落形成、迁移、侵袭和致瘤潜能,诱导细胞凋亡,是肝癌细胞的有效抑癌因子[26]。并且还发现,与本研究一致的是,ZNF382能显著抑制多种癌基因的RNA水平,这些癌基因参与肿瘤转化、凋亡、细胞周期和增殖,包括MYC,STAT3,ID1,IKBKE,STAT5B,MITF,HMGA2,CDK6。

AF131215.8、AL021918.1和RP11.386G11.3目前还没有对其在肿瘤中作用的研究,但是在本研究中,这些基因表现出很高的预后预测能力,可能是新的肿瘤相关基因,具有潜在价值,可为以后的肿瘤研究提供更多思路,需要进一步研究。

本研究还存在一些局限性。首先,研究样本是完全回顾性的,数据的限制可能会影响结果;其次,还没有进一步研究这些DNA甲基化基因在肺腺癌中的作用机制,尤其是新发现的基因;最后,虽然确定了所选择的DNA甲基化基因作为一个强有力的预测特征,但将其应用于临床需要更多的研究。尽管存在局限性,但我们已经识别并成功验证了肺腺癌患者的DNA甲基化特征,并且这些甲基化基因生物标志物具有很高的预后预测准确率,具有临床意义。

猜你喜欢
甲基化腺癌标志物
益肺解毒方联合顺铂对人肺腺癌A549细胞的影响
中成药(2018年7期)2018-08-04 06:04:18
脓毒症早期诊断标志物的回顾及研究进展
HIF-1a和VEGF-A在宫颈腺癌中的表达及临床意义
西南军医(2016年3期)2016-01-23 02:17:47
冠状动脉疾病的生物学标志物
GSNO对人肺腺癌A549细胞的作用
鼻咽癌组织中SYK基因启动子区的甲基化分析
肿瘤标志物在消化系统肿瘤早期诊断中的应用
MR-proANP:一种新型心力衰竭诊断标志物
胃癌DNA甲基化研究进展
老年胃腺癌中FOXO3a、PTEN和E-cadherin表达的关系
西南军医(2014年5期)2014-04-25 07:42:32