ESCC基因表达谱分析与KRT家族基因的鉴定

2021-10-09 00:37王登奎杨瑞娜袁小志刘志伟王新帅
食管疾病 2021年3期
关键词:差异基因食管可视化

任 婧,王登奎,杨瑞娜,袁小志,刘志伟,王新帅

食管癌是全球第七大常见癌症和第六大癌症死亡原因[1]。食管鳞状细胞癌(esophageal squamous cell carcinoma, ESCC)作为食管癌的主要亚型,在亚洲部分地区所有食管癌病例中占90%以上[2]。ESCC是一种恶性疾病,由于缺乏与诊断、治疗及预后相关的生物标志物,ESCC患者的总体预后差,5 a总生存率低至15%~25%[3]。因此,揭示ESCC发生和发展的分子机制,鉴定更敏感和特异的分子标志物势在必行,以期改善ESCC的早期诊断和预后。针对此现状,本研究基于TCGA数据库对ESCC和正常食管上皮组织的基因表达谱进行差异分析,发现KRT(Keratin,角蛋白)家族基因在ESCC的发生、发展及预后中的作用,这将为 ESCC 患者提供潜在的生物标志物。

1 材料方法

1.1 数据来源及处理食管鳞状细胞癌(ESCC)基因表达数据及临床信息来自THE UCSC XENA (http://xena.ucsc.edu/)在线数据库下载获得的TCGA数据库中的食管癌信息,包括82个ESCC组织和11个正常食管上皮组织。基于Rstudio软件(4.0.4版本)将得到的样本数据进行标准化、去除缺失值、探针与基因转化等处理,将处理获得的食管样本表达数据进行后续分析。

1.2 差异基因鉴定基于R语言软件包Limma包对ESCC和正常组织表达矩阵数据进行差异分析,以“FDR<0.05及|logFC|≥1”为差异基因筛选条件,得到显著差异表达基因矩阵,并用ggplot2绘制可视化火山图。

1.3 GO和KEGG富集分析DAVID是一个功能注释、可视化和集成发现的数据库。本研究使用DAVID(http://david-d.ncifcrf.gov/)数据库对显著差异表达基因进行GO(gene ontology)和KEGG(Kyoto encyclopedia of genes and genomes)功能注释,并通过R语言将富集分析结果可视化。GO包括生物学过程(biological process,BP)、细胞成分(cellular component,CC)和分子功能(molecular function,MF)。

1.4 PPI网络构建及关键基因鉴定STRING (https://string-db.org/)数据库用于评估基因之间的量化关系。Cytoscape软件是一款强大的可视化和分析软件,用于绘制蛋白-蛋白相互作用(protein protein interaction,PPI)网络。采用Cytohubba中MCC拓扑分析方法分析基因之间的量化关系,基于Rank排序鉴定出关键基因。

1.5 关键基因生存预后及表达量分析为探究关键基因与ESCC患者生存预后的关系及其在ESCC患者中的表达量变化,本研究应用在线数据库THE KAPLAN-MEIER PLOTTRT(http://kmplot.com/analysis/index.php p=background)及UALCAN (http://ualcan.path.uab.edu/)数据库分别进行生存预后分析和表达量验证分析。

1.6 关键基因PPI网络预测GENEMANIA(http://genemania.org/)是一个预测基因的蛋白相互作用和基因功能的数据库[4]。该数据库使用生物信息学方法显示出基因的基因共表达、物理相互作用、基因共定位、基因富集分析,同时有位点预测的功能。本研究通过GENEMANIA预测了关键基因的相互作用网络,并可视化分析。

1.7 统计方法以P<0.05为有显著统计学差异,本研究统计及分析采用R语言下Rstudio及相关软件包。

2 结果

2.1 数据准备及差异表达基因鉴定通过在线网站及R语言处理,将下载得到的93个样本数据(82个ESCC组织及11个正常组织)进行标准化、探针与基因转化等,得到19 560个基因表达矩阵,接着对基因表达矩阵进行差异分析,以“FDR<0.05及|logFC|≥1”为差异基因筛选条件,共得到708个显著差异基因(335个上调差异基因和373个下调差异基因,图1),其中红点代表上调差异基因,绿点代表下调差异基因。

图1 差异表达基因火山图

2.2 差异表达基因富集分析基于DAVID数据库对708个显著差异基因进行GO和KEGG富集分析。如图2,GO富集分析揭示差异基因在生物学过程、细胞成分和分子功能方面主要参与蛋白酶解、角化细胞分化、角化作用、角蛋白丝、消化作用、质膜组成部分、表皮结构成分、丝氨酸型内肽酶抑制剂活化、丝氨酸肽链内切酶活化等;KEGG富集分析显示,差异基因主要与蛋白质消化吸收、细胞色素P450相关生物代谢、神经活性配体-受体的相互作用等通路相关。

图2 差异表达基因富集分析

2.3 关键基因鉴定将708个显著差异基因上传至STRING数据库得到基因之间的量化关系,并通过Cytoscape进行可视化分析,采用Cytoscape中的MCC算法获得前30显著差异基因网络图,根据Rank=1的节点基因确定为关键基因(图3)。本研究所确定的关键基因KRT9、KRT84、KRT82、KRT81、KRT79、KRT6B、KRT5、KRT3、KRT16等,均为KRT家族基因。

图3 关键基因PPI网络

2.4 关键基因预后及表达量分析将上文鉴定的关键基因通过KAPLAN-MEIER PLOTTER数据库进行生存预后分析,发现KRT5、KRT6B、KRT16、KRT79基因高表达与ESCC患者预后差显著相关(图4)。本研究进一步通过UALCAN数据库分析了KRT5、KRT6B、KRT16、KRT79基因在ESCC中的表达量分析,结果如图5所示,对比食管腺癌和正常食管组织,KRT5、KRT6B、KRT16、KRT79基因在食管鳞癌中高表达。

图4 KRT基因OS评估

图5 KRT基因在食管鳞癌、食管腺癌和正常组织中差异表达

2.5 关键基因PPI网络预测GENEMANIA数据库预测的关键基因PPI网络揭示出KRT5、KRT6B、KRT16、KRT79基因主要参与角质化、皮肤发育、角化细胞分化和表皮细胞分化(图6),支持KRT5、KRT6B、KRT16、KRT79的功能涉及角化细胞分化。

图6 KRT基因PPI网络预测

3 讨论

ESCC是中国癌症相关死亡的第四大原因[4]。ESCC的发生原因和潜在机制仍是一个世界性难题[5]。用于预测不同肿瘤的潜在生物标志物的基因分析或微阵列技术是癌症研究的新方式。本研究通过差异分析对比从TCGA数据库获得ESCC和正常食管组织基因表达谱,鉴定出708个显著差异表达基因。发现差异基因主要参与角化细胞分化、角蛋白丝、表皮结构成分等生物学通路,且差异基因中的KRT家族基因在调控ESCC中发挥着重要作用。生存预后结果提示KRT家族基因中KRT5、KRT6B、KRT16、KRT79(上调关键基因)高表达与ESCC患者预后差显著相关,并通过对比食管正常组织及食管腺癌,再次证实KRT5、KRT6B、KRT16及KRT79在ESCC中起着上调作用。

KRT基因编码一组不同的中间丝蛋白,其编码蛋白构成上皮细胞的细胞骨架,恶性肿瘤细胞常起源于这些上皮细胞[6-7]。既往研究报道KRT可能在细胞凋亡、细胞生长、上皮极性、伤口愈合和组织重塑中发挥作用[8]。最新研究表明,KRT基因是上皮细胞中最常见和特异表达的基因,其在不同癌症中的表达异常影响细胞增殖、侵袭和迁移[9]。在尿路上皮细胞、乳腺和肺癌方面,KRT 经常被用来确定癌细胞的起源,为诊断提供一定的指导[10]。KRT还参与细胞信号转导调节、蛋白质合成和极化细胞结构的维持等[11]。

KRT5已被用作单独的标记物或与KRT6组合(KRT5/6)作为鳞癌抗原特异性免疫组化诊断的一部分[12-14]。膀胱癌中,KRT5/6 和 KRT20作为一种组合标志物用于免疫组化分析,可帮助临床评估患者化疗受益情况[15]。SK-OV-3细胞中KRT5基因缺陷可阻止细胞迁移[16]。具有鳞状分化小鼠的肌细胞中KRT5的表达与Trp53突变会导致浸润性膀胱癌发生率更高[17]。肝癌细胞中,KRT6B过表达可促进癌细胞增殖并表现出抗凋亡作用,且KRT6B是Notch信号传导的关键介质可能参与肾细胞癌的发生、进展和预后[18-19]。KRT6/16/17角蛋白的上调会改变角质形成细胞的增殖、细胞黏附、迁移和炎症特征,导致角质形成细胞过度增殖和先天免疫激活以响应表皮屏障破坏[20]。KRT16参与遗传性皮肤病、银屑病和癌症相关的上皮炎症发生,沉默KRT16通过抑制ERK信号通路来抑制银屑病中角质形成细胞的增殖和血管内皮生长因子的分泌[21-22]。肺癌中KRT16过表达可促进肿瘤发生,并且 KRT16 表达可以作为独立的预后标志物[23]。 研究证实KRT79参与角化、发育生物学和启动了毛管形态发生和再生[24],其在癌症中的生物学功能尚不清楚,进一步研究显得尤为必要。

综上所述,本研究通过分析TCGA数据库中的ESCC样本,发现KRT家族在ESCC发生、发展中发挥重要作用,且KRT5、KRT6B、KRT16及KRT79与ESCC预后显著相关。由于KRT家族基因在ESCC中的研究较少,本研究可为ESCC研究提供一定的理论依据。

猜你喜欢
差异基因食管可视化
自然资源可视化决策系统
思维可视化
基于知识图谱的我国短道速滑研究可视化分析
复变函数级数展开的可视化实验教学
复变函数级数展开的可视化实验教学
有种胃病,用药治不好
基于高通量测序的药用植物“凤丹”根皮的转录组分析
基于高通量测序的药用植物“凤丹”根皮的转录组分析
紫檀芪处理对酿酒酵母基因组表达变化的影响
巴雷特食管该怎样治疗