路会玲,林 盪
(苏州市立医院呼吸与危重症科,江苏 苏州 215001)
肺癌是全球范围内高发的癌症,而我国的肺癌发病率现以每年26.9%的速度增长,肺癌死亡率在过去30年间上升了465%[1]。它在我国已成为发病率和死亡率增长最快,对人群健康和生命威胁最大的恶性肿瘤。非小细胞肺癌(non-small cell lung cancer, NSCLC)是肺癌中最常见的组织类型,包括鳞状细胞癌、腺癌、大细胞癌,大部分NSCLC患者被发现时已处于中晚期,5 年生存率很低,因此对NSCLC的早诊断、早治疗,是目前肺癌检测研究的主要方向之一[2]。
外泌体是一类几乎所有细胞都能够分泌的,存在于几乎所有体液中的囊泡类物质。外泌体能够包裹其内部的物质,进行物质的传输和信号的传递[3-4]。miRNA是一类长约20 bp的单链RNA,能够与靶基因的3'非翻译区结合,通过阻碍翻译或者促进靶基因mRNA降解的方式,进行转录后水平的调控,影响人的生长发育,疾病发生等多项生理功能[5-7]。研究表明,外泌体能够包裹miRNA并将其传递至远处,作用于靶细胞中的靶基因,影响下游信号通路[8]。在肿瘤中,外泌体miRNA能够影响肿瘤生长,肿瘤血管、肿瘤转移龛的形成和癌症耐药等方面[9-10]。与此同时,外泌体miRNA也能够作为新型分子标志物,用于癌症的诊断和监控[11-12]。
本研究通过分析芯片数据,找到在早期NSCLC中表达异常的一系列外泌体miRNA,从中挑选出差异表达最明显的miR-141,使用TCGA数据库对miR-141在NSCLC中的作用进行初步分析,证明miR-141不利于NSCLC患者生存。接下来对miR-141的靶基因进行预测,并对这些预测的靶基因进行功能分析,从而预估外泌体miR-141可能的功能和作用机制。
1.1 一般材料与资料 芯片数据筛选:通过GEO数据库(https://www.ncbi.nlm.nih.gov/geo/),下载GSE114711芯片结果的原始数据,使用R语言对结果进行初步处理,去除本研究中并不涉及的晚期NSCLC的数据和其他不必要的数据,一共有7 例吸烟对照组和11 例早期NSCLC,计算出每个miRNA的变化倍数(Fold of change)和P值,使用R语言中的ggplot2包,将处理过的数据以火山图的形式表现出来。将阈值设为变化倍数>1或<-1,P值<0.05,筛选出差异表达miRNA。
1.2 方法
1.2.1 生存分析:肺腺癌和肺鳞状细胞癌的生存分析数据来源于TCGA数据库(https://cancergenome.nih.gov/),下载数据后,使用R语言中的survival包,绘制miR-141高表达和低表达时生存情况,使用Log-rank检验比较生存差异。
1.2.2 靶基因预测:通过在线软件mirPath v.3(http://snf-515788.vm.okeanos.grnet.gr/)[13],在TargetScan,microT-CDS v5.0[14]和Tarbase v7.0[15]三个数据库中进行靶基因预测,其中TargetScan基于靶mRNA序列的进化保守等特征来搜寻动物的microRNA靶基因,TarBase v7.0是已有实验验证的miRNA-靶基因结果数据库,microT-CDS v5.0使用其特有算法搜索带注释的miRNA靶标。对三个数据库得到的靶基因进行分析,绘制韦恩图,取三个数据结果的交集,能够有效提高预测的准确性。
1.3.3 靶基因功能预测:将筛选出的靶基因,使用Metascape(http://metascape.org/)在线软件[16]进行功能预测,并绘制功能网络图。
1.3 统计学处理 根据变化倍数>1或<-1,P<0.05的标准,在芯片数据中筛选出差异表达miRNA,这些miRNA在对照组和早期NSCLC中的表达水平以Graphpad Prism v6.01绘制,以min to max形式表示,两组数据的比较采用配对t检验。使用Log-rank检验比较生存差异。P<0.05为差异有统计学意义。
NCBI网站的GEO数据库包含了大量研究人员所做的芯片等数据,二次利用这些数据能够大大降低研究者的实验成本,从GEO数据库下载GSE114711芯片结果,其中包括了7 例吸烟对照组,11 例早期NSCLC和8 例晚期NSCLC样本的血浆外泌体miRNA检测结果。由于目前包括影像学技术等在内的检测技术的进步,晚期NSCLC患者更容易被发现和诊断,而早期NSCLC患者则可能被漏诊或难以确诊,因此对于早期NSCLC患者的诊断研究可能更具有意义。对芯片结果中吸烟对照组和早期NSCLC的数据进行统计和分析后发现,在检测的3 762 个血浆外泌体miRNA中,没有在早期NSCLC中表达上调的且差异有统计学意义的血浆外泌体miRNA(图1);有7 个表达下调且差异具有统计学意义的血浆外泌体miRNA。
图1 对照组和早期NSCLC血浆外泌体miRNA芯片结果统计
从这7个miRNA中,根据平均表达水平和变化趋势,进一步筛选出miR-141,miR-141在对照组和早期NSCLC中平均表达水平都较高,且表达水平下降趋势最为明显(对照组血浆外泌体中miR-141平均水平为早期NSCLC的74.7倍,P=0.015)(图2)。
图2 7 个miRNA在对照组和早期NSCLC血浆外泌体中的表达情况
TCGA数据库是美国国家癌症研究所和美国人类基因组研究所建立的一个汇聚了大量癌症患者基因组数据的数据库,其中肺腺癌共2 932 例,肺鳞状细胞癌共902 例。通过检索TCGA数据库,分析miR-141对NSCLC患者生存周期的影响,发现具有高miR-141水平的肺腺癌和肺鳞状细胞癌患者,都具有较短的生存周期(P=0.0211和P=0.0419,图3),说明在NSCLC中,miR-141可能作为癌基因发挥作用,促进癌症发生发展,对患者生存不利。
图3 TCGA数据库中,miR-141的生存分析结果:肺腺癌(A);肺鳞状细胞癌(B)
使用TarBase,TargetScan和microT-CDS三个数据库预测miR-141的靶基因。Tarbase预测到的靶基因有893 个,microT-CDS预测到的靶基因有934 个,TargetScan预测到的靶基因有221 个,三个数据库取交集,得到共同预测到的靶基因有59个(图4)。
图4 miR-141的靶基因预测
对这59 个靶基因进行功能预测分析,发现它们参与多项通路的调节,其中细胞形态发生的调节、细胞黏附的调节、细胞基质连接、激动蛋白细胞骨架等可能会影响肿瘤细胞的迁移和侵袭;有丝分裂细胞周期的调节、细胞周期、上皮细胞增殖等可能影响肿瘤细胞的增殖和凋亡;Rho GTP酶信号和JNK级联的调节能够影响细胞内多条信号转导通路;这些基因间也存在相互作用,形成一个调控网络,影响生理生化功能(图5)。
图5 miR-141靶基因功能预测
在本研究中,使用GEO数据库中的GSE114711芯片数据,一共筛选出了7 个miRNA在对照组和早期NSCLC中表达差异显著,并进一步挑选出miR-141这个平均拷贝数最高,且变化倍数最高的miRNA进行进一步研究,该miRNA不利于患者生存,可能起到癌基因的作用。使用多个miRNA靶基因预测数据库,取交集得到59 个miR-141的靶基因,对59 个靶基因的功能进行分析发现,它们参与脊索动物的胚胎发育、糖酵解和调节细胞黏附等多项功能,并形成调控网络,影响整体的生理生化状态。
miR-141是miR-200家族的一员,除了miR-141外,miR-200家族还包括miR-200a、miR-200b、miR-200c和miR-429,该家族在恶性肿瘤的发生发展、后期侵袭和转移中发挥重要作用。研究表明,在NSCLC中,miR-141能够通过靶向PHLPP1和PHLPP2影响细胞的增殖[17],通过调节EIF4、ZEBE和PDCD4的表达影响化疗耐药性[18-20],肿瘤组织中的miR-141也能够用于预测早期NSCLC的总体生存期[21]。
外泌体是所有活细胞都能够分泌的、存在于所有体液中的囊泡类物质,细胞将其分泌到细胞外、组织液,乃至血液中,这些被包裹在外泌体中的miRNA,能够有效避免内环境中的各种酶以及pH、渗透压等理化性质对miRNA的影响,使得外泌体包裹的miRNA,相对于游离miRNA更加稳定。包裹在外泌体中的miRNA,通过血液等载体达到靶细胞后,进入细胞并作用于靶基因。肿瘤细胞也能够通过外泌体传递miRNA,有研究表明,肿瘤细胞分泌的外泌体miRNA能够作用于远端靶细胞,为肿瘤的转移提供合适的环境,或作用于周围细胞,抑制免疫[22-23]。前列腺癌细胞来源的外泌体miR-141能够通过影响成骨活性来促进前列腺癌的骨转移[24]。血液中外泌体miRNA也可作为诊断标志物,血浆或血清来源的外泌体miR-141可以用于前列腺癌[25]和卵巢癌[26]的诊断。但外泌体miR-141在NSCLC中的研究还没有相关文章发表。
本研究利用生物信息学手段,探讨了血浆外泌体miR-141在早期NSCLC诊断的潜在作用和可能机制。二次利用GEO数据库内的已发表文章的芯片数据,筛选出差异表达的miR-141,并使用TCGA数据库对miR-141对肺腺癌和肺鳞状细胞癌患者进行了生存分析,说明外泌体miR-141具有作为诊断标志物的潜力。同时使用多个miRNA靶基因数据库筛选出可信度较高的miR-141靶基因,并对其进行功能注释。后续需要在更多的样本上验证外泌体miR-141作为早期NSCLC的标志物的可能性,同时对其作用机制也要进行进一步的探索。
与对照组相比,早期NSCLC患者血液外泌体中存在大量表达降低的miRNA,其中差异最明显的是miR-141。血液中的外泌体miR-141,能够通过体液循环到达靶细胞,在转录或转录后水平调控靶基因的表达,该调节可能会影响肿瘤转移、肿瘤微环境调节和免疫等功能,从而对NSCLC的发展、转移和治疗等产生影响。综上所述,外泌体miR-141具有作为早期NSCLC诊断标志物的潜力。