陈雪萍,刘 航,张阳丽,彭 健,吴 江,张玉洪,府伟灵
1.重庆医科大学附属第一医院临床分子医学检测中心,重庆 400042;2.重庆医科大学生命科学院,重庆 400042;3.陆军军医大学第一附属医院检验科,重庆 400038
胰腺癌被称为癌中之王,放眼全球,胰腺癌都是最致命的癌症之一[1-2]。 然而大多数胰腺癌患者在早期并没有任何特殊的临床症状,因此大多数胰腺癌患者都错过了最佳的治疗时期。在过去的40年中并没有发现可以显著提升胰腺癌患者生存率的方法。胰腺癌患者的5年生存率为5%~15%,总体生存率约为6%,且仅有20%患者可以进行手术切除[3]。因而早期诊断在胰腺癌防治过程中扮演着重要的角色。
目前胰腺癌的主要筛查诊断方法有超声检查、CT以及核磁共振,各自有优缺点。超声检查很难区分出恶性组织和非恶性组织;CT 和核磁共振也是诊断胰腺癌的辅助手段,目前也无法满足胰腺癌早期筛查的临床需求。除此之外,许多的肿瘤抗原也被用作胰腺癌诊断的相关指标。其中最有效和临床应用最广的生物标志物是CA19-9。然而CA19-9在机体具有其他炎症的状态下水平也会升高,特异性较低,这也限制了其作为胰腺癌术后检测指标的应用发展[4-5]。目前还没有有效且准确的生物标志物用于胰腺癌早期筛查和诊断。
miRNA是一类大小约为22 bp的非编码单链RNA分子,它们在细胞增殖、蛋白质代谢和肿瘤形成等生理、病理过程中扮演着重要的功能。有研究报道miRNA参与实体瘤的发生、发展。在胰腺癌中,miRNA的上调或下调均与胰腺癌的进展过程密切相关[6]。
既往有研究表明,miR-21及其下游靶标在胰腺癌的细胞增殖、凋亡和细胞周期中起关键作用,miR-21可能是诊断胰腺癌的有潜力的生物标志物[7]。研究表明miR-25对早期胰腺癌的诊断灵敏度和特异度分别达到76%和93%[8]。miR-25有助于鉴别慢性胰腺炎与胰腺癌,这也大大增加miRNA在胰腺癌中的应用潜力,目前关于miR-25的临床诊断效能评估也还在进行中。这些报告表明,miRNA有作为胰腺癌早期筛查指标的应用前景。然而,迄今为止,这些基于miRNA的研究均未进入临床实践,还需要更多的研究验证。因此,筛选胰腺癌的血浆肿瘤标志物,对进一步分析其作用的靶基因与胰腺癌发生、发展的关系具有重要的临床意义。
1.1一般资料 以“胰腺癌、miRNA、血浆”为关键词检索文献,然后在NCBI数据库GEO中进行检索,按包含胰腺癌标本、其他肿瘤标本、良性胰腺疾病、胆道疾病标本及相应正常胰腺标本的基因芯片为标准,经过筛选,最终研究团队使用了编号为GSE124158和GSE59856的基因芯片数据。
1.2方法
1.2.1显著差异miRNA的筛选 首先,采用GEO数据库所提供的基于R语言的在线分析软件GEO2R,将编号为GSE59856的基因芯片数据分为胰腺癌与健康对照组、胰腺癌与良性疾病对照组、胰腺癌与其他癌症对照组3个对照组进行初步筛选。然后,筛选标准|log2FC|≥1,经过初步的分析筛选,分别得出3个对照组胰腺癌组织差异表达的miRNA。接着,通过同样的处理步骤将编号为GSE124158中的数据也分为同样的3个对照组进行处理,设置相同的参数进行筛选,分别得到相应的胰腺癌组织差异表达的miRNA。进一步使用Venn diagram webtool分析,分别得到每个对照组中初步分析所得到的差异表达的miRNA的重叠部分,取每个重叠部分的交集,最后得到的重叠部分为显著差异表达的miRNA。
1.2.2靶基因预测 将上一步分析所得到的显著差异miRNA运用在线分析软件DIANA tools进行靶基因的预测[9]。
1.2.3关键基因的GO功能及KEGG通路富集分析 采用DAVID和KOBAS3.0对预测获得的靶基因开展GO/KEGG通路富集分析,以进一步分析靶基因对胰腺癌患者的作用部位及途径。
1.2.4靶基因的蛋白质相互作用网络的构建 通过STRING数据库对上述预测得到的靶基因进行关键蛋白之间的相互作用关系分析,得到PPI相互作用图,然后通过查询相关的文献,最后筛选出关键基因[10]。
1.2.5关键基因的TCGA验证分析 将上述筛选分析得出的关键基因导入在线分析网站GEPIA、cBioPortal进行TCGA表达谱的分析,再通过查找相关的文献验证所筛选的关键基因与胰腺癌患者预后的相关性,进一步分析其在胰腺癌发生、进展及预后中的作用。
2.1差异表达miRNA筛选 本次研究筛选了两个基因芯片(GSE59856、GSE124158)(表1)进行差异分析。在GSE59856中,得到胰腺癌与健康对照组内差异表达miRNA 21个,胰腺癌与其他癌症对照组内差异表达miRNA 91个,胰腺癌与良性疾病对照组内差异表达miRNA 60个。在GSE124158中,胰腺癌与健康对照组中差异表达miRNA 1 877个,胰腺癌与其他癌症对照组中差异表达miRNA 43个,胰腺癌与良性疾病对照组中差异表达miRNA 47个。再用GSE124158 的数据分别对GSE59856每个对照组的数据进行验证,作VEEN图,每个对照组分别得到13、9、6个差异表达miRNA(图 1),最后取3个对照组数据的交集,最终得到miR-122-5p为显著差异表达的miRNA。
表1 GEO数据库胰腺癌基因芯片样本(n)
图1 VEEN分析
2.2差异表达miRNA的靶基因预测 为了阐明差异表达miRNA的生物学功能及其具体的作用机制及通路,将上一步分析所得到的差异表达miRNA运用在线数据库DIANA tools和ENCORI预测miR-122-5p的靶基因,最终得到517个预测靶基因。
2.3差异表达miRNA的靶基因的GO富集和KEGG途径分析 使用DAVID在线数据库对517个靶基因的功能和通路进行富集分析。GO功能富集分析结果表明,靶基因在生物过程中主要参与胶原蛋白分解代谢、GTP酶活性的调节、细胞间黏附、RNA聚合酶Ⅱ启动子转录的正调控、转录的正调控。细胞成分主要是聚集在细胞薄膜、细胞内区、细胞间黏附连接、细胞顶端质膜、细胞质膜、细胞表面。而分子功能主要与RNA聚合酶Ⅱ核心启动子近端区序列特异性DNA结合、泛素连接酶E3结合域、金属肽酶活性、锌离子结合、金属内肽酶活性、GTP酶活性有关。见表2。
表2 GO功能富集分析
KEGG的结果(图 2)显示,靶基因富集于抗原处理和呈递、囊泡转运中的相互作用、黏蛋白型O-聚糖生物合成、甲状腺激素合成、自然杀伤细胞介导的细胞毒性、移植物抗宿主病、多巴胺能突触、胰岛素分泌、胆碱能突触、糖基磷脂酰肌醇(GPI)-锚定物、心肌细胞肾上腺素能信号传导、幽门螺杆菌的上皮细胞信号转导、1型糖尿病的介导、AMPK信号通路、MAPK信号通路、黏着连接、心肌收缩、HIF-1信号通路、内吞作用等。
续表2 GO功能富集分析
图2 KEGG通路富集分析
2.4从PPI网络中筛选关键基因 通过将所预测的靶基因利用在线数据库STRING进行数据挖掘及绘制,得到了蛋白质之间的互相作用关系图。进一步通过相关文献的查询与筛查,筛选得出UBA52、ADAM10、CBL、VAMP3 这4个关键基因。然后将得到的结果导入到Cytoscape中,作出4个关键基因的互作图 (图3)。
图3 关键基因互作图
2.5TCGA验证分析 将筛选所得的4个关键基因使用在线分析网站GEPIA、cBioPortal分析发现,与健康对照相比,胰腺癌患者体内UBA52、CBL、VAMP3、ADAM10的表达均远远高于健康人。然后在GEPIA、cBioPortal网站中分析得出胰腺癌患者的生存曲线(图 4),发现与高表达VAMP3和ADAM10的胰腺癌患者相比,这2个基因低表达的患者总生存率更高(P<0.05)。UBA52和CBL的调节对胰腺癌患者的生存没有影响(P>0.05)。
注:A和B分别为UBA52和CBL基因,两基因与胰腺癌患者的总生存率无相关性;C和D分别为 VAMP3和ADAM10基因,两基因与胰腺癌患者总生存率有关。
胰腺癌的临床表现隐蔽,大多数胰腺癌患者在确诊时已经处于晚期,因为癌细胞已经扩散并无法通过手术切除治疗,晚期胰腺癌患者5年生存率低于5%,因此胰腺癌是恶性肿瘤中病死率最高的肿瘤之一。然而胰腺癌的早期诊断仍面临巨大的挑战。在本次研究中,笔者团队通过NCBI的在线分析软件GEO2R及VEEN对GSE59856的数据按照胰腺癌与健康对照组、胰腺癌与其他癌症对照组、胰腺癌与良性疾病对照组进行在线分析,然后再用GSE124158的数据进行验证,最后得出miR-122-5p这一明显差异表达的miRNA,miR-122-5p在胰腺癌患者体内表达下降。此前有研究将健康人群、慢性胰腺炎患者与胰腺癌患者相比较,发现miR-122-5p在胰腺癌患者体内表达下降。这与既往的研究结果相符[11]。另外miR-122-5p可作为评估胰腺癌预后的标志物,即miR-122-5p血浆水平升高与胰腺癌患者预后较差之间具有一定的关联性[12]。另有研究报道miR-122-5p通过直接靶向细胞周期蛋白1抑制了胰腺癌细胞的生长、侵袭和转移[13]。因此,miR-122-5p可能是胰腺导管腺癌的治疗靶标。
为继续探索miR-122-5p在调节人胰腺癌进展过程中的作用机制,使用DIANA tools对miR-122-5p进行靶基因预测,得到517个靶基因。对关键基因的功能富集分析显示,它们主要参与胶原蛋白分解代谢、GTP酶活性的调节、转录的调控等过程。以往有研究和证据表明,本文筛选出的靶基因的GO、KEGG富集通路在胰腺癌的进展过程中可能具有重要的功能。再运用结合 DAVID、STRING等生物信息数据库以及查询文献进行筛选,最后得到UBA52、ADAM10、CBL、VAMP3这4个关键基因。这些关键基因在癌组织中的表达水平与正常胰腺组织相比显著上调或下降。
对筛选到的这4个关键基因进行TCGA验证分析,胰腺癌患者体内UBA52、ADAM10、CBL、VAMP3的表达均远远高于健康人。再验证4个基因的预后价值,与高表达VAMP3、ADAM10的胰腺癌患者相比,这2个基因低表达的患者总体生存率更高(P<0.05)。而UBA52、CBL上调对胰腺癌患者生存无明显影响(P>0.05)。有研究表明,VAMP3在胰腺癌细胞的外泌体分泌中发挥积极作用,其中VAMP3对于PVT1介导的外泌体分泌至关重要[14]。而胰腺癌组织中ADAM10表达比正常组织中更高。ADAM10沉默会显著降低癌细胞的迁徙与转移能力,但对正常细胞却没有影响[15]。然而目前这些关键基因在胰腺癌患者中的具体作用机制还不清楚,还需进一步研究。
综上所述,本研究是基于生物信息学方法对胰腺癌患者血浆差异miRNA进行分析,由此筛选出miR-122-5p,并发现其具有作为胰腺癌诊断标志物的潜力。通过数据库验证,miR-122-5p作用的关键靶基因VAMP3、ADAM10在胰腺癌组织中差异表达,可能与胰腺癌的侵袭与转移相关。但上述miRNA及其靶基因与胰腺癌的相关性还需要进一步的大量临床样本和随访数据验证。