阮红莲,叶芷璇,杨磊,王书强,施昌宏
511436 广州,广州医科大学公共卫生学院 应用统计系(阮红莲、叶芷璇、施昌宏),预防医学系(杨磊);518055广东 深圳,中国科学院深圳先进研究院 高性能计算技术研究中心(王书强)
肺癌是目前全球范围内死亡率最高的恶性肿瘤,5年生存率仅为16%左右[1]。 近年来,我国肺癌的发病率呈现逐年增长的趋势[2],对人民的生命和健康造成严重危害。非小细胞肺癌(non-small cell lung cancer, NSCLC)占肺癌的80%,分为鳞癌(squamous cell lung carcinoma,SCLC)、腺癌、大细胞癌和神经内分泌癌,其中SCLC占NSCLC的20%~30%。由于对肺鳞癌发病的分子机制缺乏了解,因此肺鳞癌的治疗方案比较局限。
微小RNA(microRNA,miRNA)是一种内源性的非编码RNA,是由17~25个碱基组成的单链RNA分子,广泛存在于各种生物体中,在转录和转录后水平调控细胞生命活动。近年的研究发现,miRNA在很多肿瘤中异常表达,与肿瘤形成、侵袭转移、分期预后及治疗反应等均有密切关联[3]。目前,人们已在淋巴癌、前列腺癌、小细胞肺癌和结肠癌等多种肿瘤组织中检测到与肿瘤发生发展相关的miRNA[4]。miR-139位于染色体11q13.4,参与调节多种肿瘤的增殖、凋亡和化疗敏感性[5],然而,关于miR-139在肺鳞癌预后中的作用国内外尚未见相关报道。本研究通过从癌症基因组图谱(the cancer genome atlas,TCGA)公共数据库中下载肺鳞癌相关表达谱与临床预后信息,研究miR-139在肺鳞癌组织中的表达及其临床意义,为进一步探讨miR-139在肺鳞癌患者预后中的作用提供依据。
在TCGA数据库中 (https://genome-cancer.ucsc.edu/)筛选SCLC患者数据集,下载level 3 IlluminaHiSeq_miRNASeq、RNASEqV2和clinical data的数据(数据截止时间为2017年3月)。纳入本研究的患者均具有总生存期(overal survival,OS)和miRNAseq资料;患者临床特征包括患者肿瘤复发时间、性别、诊断年龄、肿瘤T分期、肿瘤N分期和TNM分期。
对TCGA数据库下载的资料进行整理,得到45例癌与癌旁组织匹配的数据。纳入总生存期大于等于30日的I/II期肺鳞癌患者,得到266例miR-139表达与临床资料匹配数据,379例靶基因表达与临床资料匹配数据。266例具有miR-139表达数据的患者中具有肿瘤复发数据,379例具有靶基因表达数据的患者中377例具有肿瘤复发数据。患者的OS定义为从诊断日期开始到患者死亡或失访日期截止,患者无病生存期(disease-free survival,DFS)定义为从诊断日期开始到患者复发或失访日期截止。 miR-139表达量以中位数分为2组(低表达=0,高表达=1)。患者以年龄65岁分为两个亚组(<65岁=0,≥65岁=1)。
使用R软件及其扩展包“survival”对数据进行分析。计量资料采用Wilcoxon秩和检验,计数资料采用卡方检验,单因素生存分析采用Kaplan-Meier(K-M法)和Log-rank检验,多因素生存分析采用Cox比例风险模型。应用在线生物信息学分析工具miRecords(http://c1.accurascience.com/miRecords/)预测miR-139的靶基因,miRecords整合了11种常用的microRNA靶基因预测算法。应用在线生物信息学分析工具Gene Trail2(https://genetrail2.bioinf.uni-sb.de/start.html) 对靶基因进行KEGG分析和GO分析。利用单变量Cox比例风险模型分析靶基因表达与预后的关系。
在TCGA数据集中,整理得到癌与癌旁组织匹配的患者45名。肺鳞癌组织的miR-139表达中位数为28.91,低于癌旁正常组织(中位数为156.01),且差异具有统计学意义(P<0.001)(见图1)。整理得到临床数据与癌组织miR-139 表达数据匹配的I/II期肺鳞癌患者266名。以癌组织miR-139表达量的中位数将患者分为高表达组和低表达组,发现不同临床特征肺鳞癌患者的miR-139表达差异无统计学意义,见表1。
图1癌旁组织与癌组织中miR-139的表达;
Figure 1. Comparison of miR-139 expression in tumor tissue and paired nontumorous tissue
采用K-M法对266例I/II期肺鳞癌患者进行生存分析,miR-139相对高表达组总生存比miR-139相对低表达组差,其中位生存期分别为1 713天和3 253日,差异具有统计学意义(P<0.001)(见图2A)。根据患者年龄是否大于65岁,将所有患者分成两个亚组。在每个亚组中采用K-M法进行生存分析,发现年龄<65岁患者,miR-139相对高表达组(中位生存期:1 912日)和相对低表达组(中位生存期:3 600日)总生存的差异无统计学意义(P=0.479)(见图2B);而年龄≥65岁的患者,miR-139相对高表达组(中位生存期:1 640日)和相对低表达组(中位生存期:3 253日)的总生存差异有统计学意义(P<0.001)(见图2C)。对年龄≥65岁的患者的DFS进行生存分析,发现miR-139相对高表达组DSF(中位数:1 448日)和相对低表达组之间的DFS(中位数:4 471日)差异具有统计学意义(P=0.045)(见图2D)。上述结果表明miR-139相对高表达患者无病生存时间相对较短,推测患者将发生复发或者转移,进而导致总生存也相对较短。进一步将miR-139表达、年龄、性别、和TNM分期等变量纳入到多因素Cox比例风险模型分析,结果显示校正相关临床信息后,miR-139表达与预后的关联仍然具有统计学意义,高表达患者死亡的风险是低表达患者的2.768倍,提示miR-139为肺鳞癌预后的独立影响因素,见表2。
表1 miR-139表达与肺癌临床特征的相关性分析
Table 1. Relationship between miR-139 expression and clinic characteristics in SCLC
VariableNo.miR-139 expressionlowhighχ2P-valueSex0.6740.411 Male6826 (38.2)42 (61.8) Female19887 (43.9)111 (56.1)Age(year)0.0460.830 <658738 (43.7)49 (56.3) ≥6517574 (42.3)101 (57.7)T stage3.8130.149 T17324 (32.9)49 (67.1) T215973 (45.9)86 (54.1) T33416 (47.1)18 (52.9)N stage2.8090.422 N019681 (41.3)115 (58.7) N16431 (48.4)33 (51.6)TNM stage2.7000.100 I14555 (37.9)90 (62.1) II12158 (47.9)63 (52.1)
miR-139-5p和miR-139-3p是两条分别从miR-139前体的5’端臂和3’端臂加工而来的成熟microRNA,其中miR-139-5p参与调节多种肿瘤的增殖、凋亡和化疗敏感性。我们利用在线分析工具miRecords预测miR-139-5p的靶基因,共得到431个靶基因被至少4种不同的软件预测。我们利用在线分析工具Gene Trail2对这些基因进行KEGG分析和GO分析,结果显示这些基因富集在43条KEGG通路上(P<0.05), 其中一些通路在癌症的发展过程中发挥重要作用,如黏着斑、PI3K-Akt 信号通路、Hippo信号通路等。进一步在I/II期肺鳞癌患者对这些靶基因的表达数据进行生存分析,得到与肺鳞癌预后相关的13个基因(P<0.05)(见表3),包括PDE4A,MBNL2,ZEB2等基因。
图2 miR-139的表达与肺鳞癌预后的关系。(A)miR-139的OS生存曲线(B)年龄<65岁组的OS生存曲线;(C)年龄≥65岁组的OS生存曲线;(D)年龄≥65岁组的DFS生存曲线
Figure 2. Relationship between miR-139 expression and prognosis of SCLC (A) OS of miR-139; (B) OS in subgroup age<65;(C) OS in subgroup age≥65;(D) DFS in subgroup age≥65.
表2影响肺鳞癌患者总生存的多因素Cox回归分析
Table 2. Multivariate Cox proportional hazards analysis of impact factors of OS in patients with SCLC
Variable HR(95%CI)P-valueGender(male/female)1.575(0.408~1.252)0.136Age(<65/≥65)1.574(0.866~2.863)0.136TNM stage (I / II)0.995(0.596~1.664)0.986miR-139 expression(high/low)2.768(1.576~4.861)<0.001
我们根据靶基因ZEB2的表达高低分组构建K-M生存曲线(见图3),包括总体生存期OS和无病生存期DFS ,并采用Log-rank检验比较ZEB2相对高表达组和相对低表达组之间DFS和OS的中位数,发现ZEB2相对高表达和相对低表达组之间的DFS(P=0.011)和OS(P=0.011)差异均具有统计学意义,且ZEB2相对高表达组的无病生存与总生存均较差。ZEB2即E盒结合锌指蛋白,是重要的细胞核转录因子,其异常表达与多种肿瘤预后密切相关。已有研究报道在肝癌细胞[6]和胶质母细胞瘤中[7],miR-139通过调控ZEB2抑制癌细胞的转移和侵袭。因此我们推测miR-139可能通过调控ZEB2影响肺鳞癌患者的无病生存期和总生存期。
图3 ZEB2的表达与肺鳞癌预后的关系。(A)DFS生存曲线; (B)OS生存曲线
Figure 3. Relationship between ZEB2 expression and prognosis of SCLC, (A) DFS curve; (B) OS curve
表3肺鳞癌患者预后相关的miR-139-5p靶基因
Table 3. Target genes of miR-139-5p related to prognosis of SCLC
Target genesHR (95%CI)P valuePDE4A1.965 (1.327~2.908 )0.001MBNL21.732 (1.174~2.555)0.006CBX10.593 (0.404~0.872)0.008THBS11.664 (1.127~2.457)0.010SOX50.608 (0.413~0.896)0.012FHL51.645 (1.113~2.432)0.012ZEB21.638 (1.111~2.415)0.013PSME40.613 (0.416~0.903)0.013FMR10.624 (0.424~0.920)0.017ZNF1070.633 (0.429~0.935)0.021ASH1L0.653 (0.443~0.960)0.030APLP21.514 (1.027~2.231)0.036KTN10.671 (0.456~0.987)0.043
基因调控网络的平衡决定着细胞的命运,而miRNAs参与基因转录后调控。生物信息学分析发现,人类1/3的基因表达受miRNA的精细调控。miRNAs表达异常与肿瘤的发生发展密切相关[2]。miR-139位于染色体11q13.4,其异常表达与多种疾病密切相关。最早被报道的是其与神经退行性病变的关联,在该病发生发展过程中miR-139表达下调。随后的研究发现, miR-139在肿瘤的发生、发展以及肿瘤的治疗中发挥着重要作用。miR-139与多种人类恶性肿瘤的关联均有报道,例如:头颈癌、乳腺癌、胃癌、子宫内膜癌、结直肠癌、膀胱癌、肝癌、卵巢癌、食管鳞癌、甲状腺癌、恶性胶质瘤、基底细胞癌、肾细胞癌、喉癌、胰腺癌、非小细胞肺癌等[4]。
本研究发现,miR-139在肺鳞状细胞癌组织中低表达(中位数为28.91),相对于癌旁组织(中位数:156.01)的表达差异具有统计学意义(P<0.001)。这一结果与miR-139在肝癌[8]、结直肠癌[9]、甲状旁腺癌[10]、头颈癌[11-12]、胃癌[13]、乳腺癌[14]、基底细胞癌[15]、卵巢癌[16]等癌组织中呈现低表达的结果一致。然而,在肺鳞癌的癌组织中,miR-139相对高表达患者死亡的风险高于miR-139相对低表达组。校正性别、年龄,和TNM分期之后,miR-139高表达患者死亡的风险为低表达患者的2.768倍(P值<0.001)。以上结果提示,miR-139在预后中的作用与miR-139在癌症发生中的作用不一致。可能的解释是,miR-139在肺鳞癌发生的早期充当抑癌因子,但是随着肿瘤的进一步发展,miR-139的作用变为促进肿瘤的复发与转移。本研究的数据提示,miR-139相对高表达组的无病生存期更短,复发率相对更高。
为进一步明确miR-139对肺鳞癌预后的潜在机制,本课题组借助生物信息学工具分析获得431个miR-139-5P的潜在靶基因及其作用通路43条,其中的部分通路如PI3K-Akt 信号通路、Hippo信号通路、Wnt信号通路等与癌症的关联早有报道[17-20]。对潜在靶基因与肺鳞癌总生存的关联研究发现,PDE4A、MBNL2和ZEB2等13个靶基因与肺鳞癌总生存的关联具有统计学意义。其中,ZEB2与肺鳞癌的总生存期和无病生存的相关均具有统计学意义,且ZEB2相对高表达组的生存比相对低表达组差。
尽管目前研究提示miR-139与多种人类肿瘤的发生发展相关,是肿瘤重要的诊断、预后与治疗信号分子,但是其调控机制尚不完全清楚。本研究为深入探讨miR-139的作用机制提供了新的线索,但不足之处在于对这些发现的靶基因及通路缺少独立验证,后续经验证的靶基因与通路有望为肺鳞癌的预后提供新的思路。
作者声明:本文第一作者对于研究和撰写的论文出现的不端行为承担相应责任;
利益冲突:本文全部作者均认同文章无相关利益冲突;
学术不端:本文在初审、返修及出版前均通过中国知网(CNKI)科技期刊学术不端文献检测系统学术不端检测;
同行评议:经同行专家双盲外审,达到刊发要求。