赵恒宇,郑浩青,黄河儒,李维嘉,吴振兴
(杭州医学院,浙江 杭州 310053)
肝癌已成为人类第四大死因,目前我国肝癌发患者数约占世界肝癌发患者数的50%[1,2]。肝癌病例中有75%-85%为肝细胞肝癌(hepatocellular carcinoma,LIHC)[3]。乙肝病毒、丙肝病毒、酗酒和马兜铃酸是LIHC的危险因素,这些因素将导致肝细胞损伤、炎症反应激活、细胞死亡以及肿瘤进展[4,5]。目前,LIHC缺乏早期诊断标志物和特异性治疗药物[6]。
肺癌死亡率最高的癌症,约85%的肺癌病例为非小细胞肺癌(non-small-cell lung cancer,NSCLC),而肺腺癌(lung adenocarcinoma,LUAD)是NSCLC中最常见的类型[7,8]。吸烟是肺癌的主要危险因素[9,10]。由于目前医疗技术的局限,大量肺癌患者确诊时已为晚期[11]。
结构特异性核酸内切酶I(flap endonuclease 1,FEN1)基因定位于染色体11q12,在DNA复制、损伤修复、重组中起到重要作用[12,13]。有研究报道,FEN1过表达存在于多种肿瘤,提示FEN1过表达与肿瘤预后不良相关[14]。已有META分析证明FEN1与LIHC及LUAD相关[15-17]。
本研究使用ONCOMINE、DriverDBv3、人类蛋白质图谱(The Human Protein Atlas,HPA)、GEPIA、Kaplan-Meier Plotter和UALCAN等数据库和挖掘工具,探究FEN1表达在LIHC与LUAD中的预后价值。本研究也使用了STRING、Metascape、cBioPortal数据库等网络工具对FEN1进行蛋白互作分析、富集分析、突变分析。研究结果表明,FEN1是LIHC和LUAD的潜在诊疗与预后的生物标志物。
ONCOMINE(https://www.oncomine.org)是一个癌基因和癌基因组数据库[18]。为获取FEN1在肝癌和肺癌中及正常组织中的表达数据,我们设定数据将筛选条件如下:①Gene:FEN1;② Analysis Type:Cancer vs.Normal Analysis;③ Data Type: mRNA;④临界值设定条件:P<0.01,Fold Change>1.5,Gene Rank:10%。
DriverDBv3(http://driverdb.tms.cmu.edu.tw)是一个癌症组学数据库[19]。本研究使用DriverDBv3分析FEN1基因在原发性LIHC和LUAD中表达与在正常样本中表达的差异。
UALCA(http://ualcan.path.uab.edu)是一个交互式的癌症组学数据库,收录了癌症基因组图谱(The Cancer Genome Atlas,TCGA)等多数据库资源[20]。本研究使用UALCAN分析FEN1在正常样品与肿瘤样品中差异表达。
HPA数据库(http://www.proteinatlas.org)是一个旨在构建细胞、组织、器官中蛋白质图谱的数据库[21-23]。本研究从HPA中下载肝癌、肺癌组织,以及正常肝组织、肺组织中免疫组化图片并对其进行分析。
GEPIA(http://gepia.cancer-pku.cn/index.htmL)是一个聚合了肿瘤样本和正常样本的RNA测序表达的数据库[24]。本研究利用GEPIA分析FEN1高表达与低表达对LIHC、LUAD患者生存的影响。
The Kaplan-Meier Plotter(https://kmplot.com/analysis)是一个评估基因表达或突变对患者生存的影响的在线工具[25-27]。本研究使用该数据库验证了FEN1表达水平高低对肝癌和肺癌患者生存的影响。
STRING(https://string-db.org)是一个分析蛋白质-蛋白质相互作用(protein-protein interactions,PPI)的数据库[28,29]。本研究使用STRING分析FEN1的20个相关蛋白的相互作用。
Metascape(https://metascape.org)是一个提供富集分析、PPI分析、基因注释等功能的在线工具[30]。本研究将STRNG中获取的20个FEN1相关蛋白进行功能富集分析。
癌症基因组学的生物门户(cBioPortal for Cancer Genomics,cBioPortal)是一个多组学数据库[31]。本研究使用cBioPortal评估FEN1突变对于患者生存时间的影响。研究中将筛选数据的条件设定如下:①Genomic Profiles:Mutation,copynumber alterations from GISTIC,mRNA Expression z-Scores(RNASeq V2 RSEM);② z-score threshold:±1.8。
对ONCOMINE数据库中肝癌和肺癌的芯片进行分析。与正常组织相比,FEN1在肝癌与肺癌组织中呈现高表达(图1A)。通过DriverDBv3分析,FEN1在原发性LIHC和LUAD中表达显著高于正常组织(图1B)。通过UALCAN数据库对TCGA中样本进行定量分析(图1C),FEN1在LIHC样品中表达显著高于正常组织(P<0.05),FEN1在LUAD样品中表达也显著高于正常组织(P<0.05)。通过分析HPA数据库中免疫组化图片,FEN1在肝癌与肺癌组织中均为高表达,在正常肝组织与肺组织中均为中表达(图1D)[21-23]。因此,FEN1在LIHC与LUAD中均存在高表达情况。
图1 FEN1在肝癌、肺癌、正常组织中表达差异分析
GEPIA数据库结果显示,FEN1表达水平与LIHC和LUAD患者预后相关(图2)。LIHC中FEN1高表达与患者总生存期(Overall Survival,OS)和无病生存期(Disease-Free Survival,DFS) 相 关(OS log-rankP=0.022,HR=1.5;DFS log-rankP=0.0075,HR=1.5)(图2A、B)。LUAD 患者FEN1高表达与OS相关,但FEN1表达高低对DFS造成的差异无统 计 学 意 义(OS log-rankP=0.027,HR=1.4;DFS log-rankP=0.63,HR=1.1)(图2C、D)。
我们使用Kaplan-Meier Plotter验证GEPIA结果,LIHC中FEN1高表达与OS和DFS相关(OS log-rankP=3.4e−06,HR=2.28;DFS log-rankP=0.0095,HR=1.54)(图2E、F);LUAD患者FEN1高表达与OS和DFS也相关(OS log-rankP=0.00093,HR=1.66;DFS log-rankP=0.041,HR=1.75)(图2G、H)。
图2 FEN1表达差异的生存分析
综合两个数据库的分析结果,FEN1表达水平可作为预测LIHC和LUAD患者生存状况的标志物。
通过STRING构建了FEN1及20个相关蛋白的PPI网络(图3A),在Metascape中进行了基因本体(Gene Ontology,GO)和京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes pathways,KEGG)分 析(图3B、C、D),FEN1及相关蛋白主要功能为DNA修复(GO:0006281)、DNA 链延伸(R-HSA-69190)、DNA 重组(GO:0006310)等功能。通过cBioPortal分析发现,FEN1突变情况对LIHC患者的DFS长短造成的差异有统计学意义(P<0.05)。
图3 FEN1的PPI分析和富集分析
目前,肝癌和肺癌分别已成为中国人位居第三大、第五大的死因[32]。由于缺乏早期诊断标志物、预后标志物和靶向药物,肝癌和肺癌患者生存期较短[6,11]。因而寻找肝癌和肺癌的标志物及靶向药物,是肿瘤研究领域亟待解决的问题。
FEN1是5’核酸酶超家族成员,它参与了冈崎片段成熟、长碱基切除修复RNA引物在后随链复制中的移动、维持端粒长度等功能[33]。因此,FEN1为细胞正常运行提供必要的支持。
本研究分析了FEN1在LIHC和LUAD中的功能、表达及预后价值。其中运用了多组学对FEN1表达进行分析,发现FEN1在LUAD与LIHC中确实存在高表达。本研究还分析了FEN1表达高低对于患者生存期的影响。GEPIA数据库表明,FEN1高表达与LIHC预后不良相关;Kaplan-Meier Plotter数据库表明,FEN1高表达与上述两种癌症预后不良都有相关性。综上所述,FEN1表达水平也可作诊断与治疗的潜在标志物,可为医生制定治疗策略提供参考。研究也发现FEN1突变与LIHC患者无病生存期相关,提示FEN1突变情况可作为预测LIHC的潜在标志物。
尽管本研究通过多个数据库进行多组学分析,但仍存在着局限性。一是,FEN1的mRNA 表达差异样本量较小;二是没有使用META分析对FEN1在LIHC和LUAD中诊断价值进行评估。我们在近期聚焦于体外实验,以完善数据库分析所存在的不足,期待更好地说明FEN1表达与两种类型恶性肿瘤的相关性。但总的来说,FEN1可成为肝细胞肝癌和肺腺癌潜在的预后和诊疗生物标志物。