严宇青 陈豪燕 洪 洁 王震华
上海交通大学医学院附属仁济医院消化内科 上海市消化疾病研究所(200001)
背景:LncRNA与结直肠癌的发生、发展密切相关,其在肿瘤中表达和调控异常具有较高的特异性。目的:利用Cancer LncRNome数据库筛选结直肠癌中差异表达的lncRNA,并探讨LINC02363在结直肠癌中的表达及其临床意义。方法:提取Cancer LncRNome数据库和TCGA数据库中结直肠癌患者芯片数据,筛选结直肠癌差异表达的lncRNA。以实时荧光定量PCR法检测结直肠癌细胞株和上海交通大学医学院附属仁济医院53例结直肠癌组织中LINC02363表达。分析基于TCGA数据库的LINC02363表达与结直肠癌患者生存期和临床病理特征的相关性。结果:共筛选出与结直肠癌预后相关的2条表达上调的lncRNA和12条表达下调的lncRNA。与正常肠上皮细胞相比,LINC02363在结直肠癌细胞中表达下调。LINC02363在结直肠癌组织中表达显著降低。LINC02363低表达组生存期显著短于LINC02363高表达组,LINC02363低表达与结直肠癌远处转移呈正相关。结论:LINC02363在结直肠癌组织中表达下调,低表达LINC02363的结直肠癌患者预后差、转移可能性大。提示LINC02363有可能作为评估结直肠癌发生、发展以及远处转移的新型肿瘤标志物。
结直肠癌是常见的消化系统恶性肿瘤之一,其发病率居恶性肿瘤第三位,病死率居第四位,是癌症相关死亡的第二大原因[1-2]。由于饮食习惯和生活方式发生改变,近年我国结直肠癌的发病率逐年上升。结直肠癌远处转移和治疗后复发是影响结直肠癌患者预后的重要因素[3-5]。为了早期诊断结直肠癌、遏制其发展进程、改善患者的预后,亟待寻找新的肿瘤标志物。结直肠癌是涉及基因组学的多步骤改变的遗传疾病,与蛋白编码基因(PCG)相比,长链非编码RNA(long noncoding RNA,lncRNA)的表达和调控异常具有更高的肿瘤特异性[6]。LncRNA可作为支架来调节蛋白-蛋白或蛋白-DNA之间的相互作用;可作为诱饵结合蛋白或microRNA;可作为增强子影响基因转录;还可通过染色质修饰,在生理和病理条件下调控表观遗传[7-11]。
Cancer LncRNome数据库(The Cancer LncRNome Atlas)是基于对癌症基因组图谱(The Cancer Genome Atlas,TCGA)数据库中转录、基因组和表观遗传水平的lncRNA改变进行多平台整合分析而得到的数据库,涵盖13种癌症、5 037例人类肿瘤标本[12]。本研究通过提取Cancer LncRNome数据库中结直肠癌差异表达的lncRNA,将其与TCGA数据库中的芯片数据进行比对,旨在筛选结直肠癌中差异表达的lncRNA,并探讨LINC02363在结直肠癌中的表达及其意义,进一步分析其与结直肠癌诊断、肿瘤转移之间的相关性。
1.Cancer LncRNome数据库:提取该数据库中含有结直肠癌组织与正常结直肠组织芯片的数据,在RNA水平比较差异表达的lncRNA。
2.TCGA数据库:提取TCGA数据库中含有结直肠癌组织芯片和正常结直肠组织芯片的数据以及患者的临床资料和预后信息。临床资料包括患者的性别、初次病理诊断年龄、疾病AJCC临床分期、淋巴结转移、远处转移、脉管侵及、结肠息肉病史、治疗后复发情况。
选择2016年1月—2017年12月上海交通大学医学院附属仁济医院53例结直肠癌手术患者,从癌组织中央非坏死区域取材,经两位高年资消化病理科医师诊断为结直肠癌。本研究方案已获得上海交通大学医学院附属仁济医院伦理委员会批准。
人正常结直肠黏膜FHC细胞、人结直肠癌细胞株均购于美国菌种保藏中心(ATCC)。RPMI-1640培养基、McCoy’s 5A培养基和胎牛血清购自美国Gibco公司。Trizol试剂、PrimeScriptTMRT Reagent Kit、SYBR Premix Ex Taq均购自日本Takara公司。ENSG00000180712、ENSG00000229649、ENSG00000 246089特异性引物和内参GAPDH引物均由生工生物工程(上海)股份有限公司合成。
1.细胞培养:人结直肠癌细胞株SW1116、SW480、DLD-1、RKO和LoVo用含10%胎牛血清的RPMI-1640培养基进行培养,人结直肠癌细胞株HT29和HCT116用含10%胎牛血清的McCoy’s 5A培养基进行培养,人结直肠癌细胞株Caco-2用含20%胎牛血清的DMEM培养基进行培养,以上细胞均置于37 ℃、5% CO2培养箱中。
2.实时荧光定量PCR法检测结直肠癌细胞和组织中LINC02363表达:结直肠癌细胞经PBS洗涤两次,取60 mg结直肠癌组织研磨成粉末,加入1 mL Trizol试剂提取RNA。取1 μg RNA,反转录成cDNA,行实时荧光定量PCR。PCR反应条件:95 ℃ 30 s;95 ℃ 5 s,60 ℃ 30 s,共40个循环。以2-△△Ct法评估基因的相对表达量。每组实验设置3个复孔,以GAPDH为内参。GAPDH引物上游:5’-ACA ACT TTG GTA TCG TGG AAG G-3’,下游:5’-GCC ATC ACG CCA CAG TTT C-3’;ENSG00000180712引物上游:5’-CCC AAA CCT GCC TTG ACT C-3’,下游:5’-CCA GAA CTT CGC CAC TAC CTA-3’;ENSG00000229649引物上游:5’-ATT TAG CGG GGA AAC AGT TCA C-3’,下游:5’-ACC ACA GGG CAG TTG ACA GA-3’;ENSG00000246089引物上游:5’-GGG AAT GAA AGA GAC TTC GGA T-3’,下游:5’-GGG ATT GCC TGA ATG TGA G-3’。
从Cancer LncRNome数据库提取含有结直肠癌组织与正常结直肠组织芯片的数据,筛选差异表达的lncRNA。将得到的lncRNA与TCGA数据库中lncRNA信息重合,筛选出在两个数据库中ID一致的lncRNA,共得到512条扩增的lncRNA和1 901条降低的lncRNA。剔除PCG后,进一步筛选出至少在30%的样本里均表达的lncRNA,结果共纳入52条扩增的lncRNA和209条降低的lncRNA。以TCGA中lncRNA表达的中位数作为截断值,将患者分为高表达组和低表达组,筛选出与结直肠癌预后相关的lncRNA,包括2条扩增的lncRNA和12条降低的lncRNA(图1A),其中2条扩增的lncRNA和6条降低的lncRNA与预后呈正相关(图1B-1C),并挑选ENSG00000180712、ENSG00000229649、ENSG0 0000246089和ENSG0000 0230850作为候选分子标志物。
A:lncRNA的筛选过程;B-C:TCGA数据库中lncRNA高表达和低表达患者的生存分析图1 结直肠癌组织和正常结直肠组织中差异表达的lncRNA
经LNCipedia(https://lncipedia.org/)数据库验证候选lncRNA的非编码特性,发现仅LINC02363(ENSG00000180712)、lnc-LBX1-1∶1(ENSG00000 229649)和lnc-ANGPT2-2 (ENSG00000246089)为非编码RNA。而ENSG00000230850暂不能证实其非编码特性,故排除。
在正常肠上皮细胞和8种结直肠癌细胞株中验证候选lncRNA的表达情况,结果发现LINC02363和lnc-LBX1-1∶1在3种及以上结直肠癌细胞中表达显著低于正常肠上皮FHC细胞,而lnc-ANGPT2-2在3种结直肠癌细胞中的表达高于正常肠上皮细胞(图2A-2C)。故本研究重点关注LINC02363和lnc-LBX1-1∶1。
与FHC细胞相比,*P<0.05;**P<0.01;***P<0.001;****P<0.000 1图2 lncRNA在结直肠癌细胞中的表达(荧光定量PCR法)
进一步行分析发现,53例结直肠癌组织中LINC02363表达显著低于癌旁组织(P<0.000 1)(图3A),而两组lnc-LBX1-1∶1表达相比无明显差异(图3C)。TCGA数据库结果显示,结直肠癌组织中LINC02363表达显著低于正常肠黏膜组织(P=0.027 1;图3B),而两组lnc-LBX1-1∶1表达无明显差异(图3D)。故本研究选择LINC02363作为潜在的结直肠癌分子标志物行下一步研究。
****P<0.0001A:53例患者中LINC02363表达;B:TCGA数据库中LINC02363表达;C:53例患者中lnc-LBX1-1∶1表达;D:TCGA数据库中lnc-LBX1-1∶1表达图3 LINC02363在结直肠癌组织中表达降低
将TCGA数据库中634例结直肠癌患者根据LINC02363表达分为高表达组和低表达组。Kaplan-Meier生存分析显示LINC02363低表达组的生存期显著短于LINC02363高表达组(P=0.025;图1C)。LINC02363低表达与女性患者(P=0.017)、结直肠癌远处转移(P=0.015)相关,而与患者的初诊年龄、临床分期、结肠息肉病史等无关(表1)。说明低表达LINC02363的结直肠癌患者多为女性,后期预后较差且易发生癌组织远处转移。
表1 结直肠癌患者LINC02363表达与临床病理特征的关系(n)
发现非编码RNA之前,癌症驱动因素的研究主要聚焦于PCG;但仅2%的人类基因组为PGC[13]。非编码RNA曾被认为是“转录噪声”,近年发现其在癌症的发生、发展中起重要作用[14]。LncRNA是转录本长度超过200个核苷酸的非编码RNA[15]。lncRNA表达具有较高的肿瘤特异性,差异表达的lncRNA可作为新型肿瘤标志物[16-17]。在胃癌组织中高表达的lncRNA GClnc1通过调控组蛋白修饰促进胃癌发生[18];MALAT1是一种预测肺癌转移的生物学标志物,可诱导转移相关基因的表达[19]。由于lncRNA定量检测方法敏感、快速、成本低,且lncRNA往往形成相对稳定的二级结构,易在尿液和血液中检测到[12],因此,在癌症预警、早期诊断、治疗和分级方面,lncRNA可能是较为理想的、具有潜在应用价值的生物学标志物。
结直肠癌发病率高,易复发,病死率高,同时致病机制仍未完全阐明。近年研究结果表明,lncRNA表达异常与结直肠癌的发生、发展密切相关[20-22]。CCAT1和CCAT2在结直肠癌组织中表达升高,高表达CCAT1和CCAT2者的无复发生存率和总生存率均较低[23];HOTAIR在Ⅳ期结直肠癌患者癌组织中的表达显著高于癌旁正常组织,且HOTAIR表达与肝转移相关[24];HULC在结直肠癌肝转移结节中表达升高,而在原发灶中的表达与正常组织无明显差异[25];TUSC7在结直肠癌组织中表达降低,通过竞争性结合miR-211,抑制结直肠癌细胞的增殖[26]。Yan等[12]对TCGA数据库中13种肿瘤的lncRNA表达改变进行多平台整合分析后,构建了Cancer LncRNome数据库,为癌症分子标志物的筛选提供了一个相对较短的候选lncRNA名单。本研究提取了Cancer LncRNome数据库中与正常肠黏膜、结直肠癌组织相关的芯片数据,筛选出在结直肠癌组织中表达上调或下调的lncRNA。随后将筛选出的lncRNA与TCGA数据库中有关的lncRNA重合,同时验证这些lncRNA对结直肠癌患者预后的影响,筛选出在结直肠癌组织中表达与预后呈正相关的lncRNA。进一步通过文献筛选和细胞实验,发现在结直肠癌组织中表达降低的LINC02363具有非编码特性;且LINC02363在多种结直肠癌细胞株中较正常肠上皮细胞表达减少。同时,在纳入的53例结直肠癌患者队列和TCGA数据库中结直肠癌患者队列中,LINC02363表达显著降低。提示LINC02363表达下调可能参与了结直肠癌的发生、发展。
进一步分析TCGA数据库中的634例结直肠癌患者后发现,低表达LINC02363的患者多为女性,Kaplan-Meier生存分析显示LINC02363低表达组的生存期显著短于高表达组,且LINC02363低表达与结直肠癌远处转移呈正相关。提示LINC02363可预测结直肠癌患者的预后和肿瘤转移情况,低表达LINC02363的结直肠癌患者预后差、转移可能性大,应在早期给予积极治疗,同时切除病灶后进行密切随访。
综上所述,LINC02363在结直肠癌组织中表达下调,且与结直肠癌的远处转移和患者预后相关,提示LINC02363有可能作为临床评估结直肠癌发生、发展以及远处转移的候选基因。