肖琪,严树丽,詹珊珊
广东江门中医药职业学院医学技术学院,广东江门 529000
肝细胞癌的治疗一直是难点,对于早期肝细胞癌患者,手术、局部破坏性治疗和肝移植是非常有效的治疗手段,但手术治疗后的复发是个主要问题,肝细胞癌5 年复发率超过70%。在很多情况下,肝细胞癌经常在晚期才被诊断出来,许多晚期患者不适合手术根治性治疗,传统的全身化疗也收效甚微[1-3]。目前,晚期患者可以口服多激酶抑制剂索拉菲尼进行治疗,但只对不到1/3 的患者有很好的疗效,并且在治疗后的6 个月内会出现明显的耐药性。随着长期使用索拉菲尼还会出现额外的问题,如药物毒性问题等。近年来,许多科研工作者发现免疫系统对于肿瘤的发生发展具有重要影响[4-6],各种针对癌症的免疫治疗手段层出不穷,如PD-1抗体治疗、CAR-T 技术的应用等,但目前这些方法均有其局限性和不良反应,因此迫切需要研发新型药物来与传统药物配合使用,才能更好地解决这些问题,因此本文选取2019 年6 月、2019 年8 月、2013年4 月上传到GEO 数据库中的测序数据,利用生物信息学技术分析肝细胞癌的免疫学机制,为药物研发提供理论基础。现报道如下。
在基因表达综合(Gene Expression Omnibus,GEO)数据库中获得肝细胞癌数据表达芯片GSE101685、 GSE101728、 GSE46408, 其 中GSE101685 包含正常组织10 例,肝癌组织24 例;GSE101728 包含正常组织7 例,肝癌组织7 例;GSE46408 包含正常组织6 例,肝癌组织6 例。
GEO2R 在线分析工具依托R 语言limma 程序包对基因芯片进行分析,利用GEO2R (https://www.ncbi.nlm.nih.gov/geo/geo2r/)对3 个基因组表达谱芯片进行分析,以|LogFC>1|、矫正P<0.05 为筛选标准,得到每组芯片的差异基因(differentially expressed genes, DEGs)。为了筛选掉假阳性结果,利用网络分析平台(https://www.omicstudio.cn/tool)将3 组芯片的差异基因取交集,获得共差异基因(co-DEGs)。
利用DAVID(https://david.ncifcrf.gov/)在线分析共差异基因,将共差异基因进行基因本体论(gene ontology, GO)和京都基因与基因组百科全书(kyoto encyclopedia of genes and genomes, KEGG)通路分析。
利用STRING 数据库对共差异基因所编码蛋白之间的相互作用关系进行分析。将得到的co-DEGs 上传到STRING(https://cn.string-db.org/)数据库,以可信度>0.9 为筛选条件,构建蛋白互作网络,导出结果后,利用Cytoscape 软件对蛋白互作网络进行可视化处理,采用Cyto Hubba 插件计算蛋白节点并进行评分,取评分前20 位的基因再次进行互作分析,将排名前10 位的基因定义为关键基因(hub基因)。
利用GEPIA 网站对筛选后的6 个hub 基因进行生存分析。打开GEPIA 后,选择“Expression Analysis”模块,点击“Survival Analysis”,输入基因名称,选择进行总生存率分析或无病生存率分析,选择肝癌,即得到基因表达对肝癌患者生存率的影响。
利用TIMER2.0 数据库对6 个hub 基因进行免疫评估。TIMER2.0(http://timer.comp-genomics.org/)数据库提供免疫相关(immune association)、癌症探索(cancer exploration)和免疫评估(immune estimation)分析。利用TIMER2.0 的免疫相关评价模块分别对6 个hub 基因与肝癌组织免疫浸润情况进行相关性分析。
通过GEO2R 的分析筛选,获得3 组肝细胞癌表达谱芯片差异表达火山图,其中横坐标负值代表下调基因,正值代表上调基因。通过GEO2R 的分析筛选,根据|LogFC>1|、矫正P<0.05 为筛选标准,得到GSE101685 数据集DEGs 2 600 个,GSE101728 数据集DEGs 4 359 个,GSE46408 DEGs 4 604 个,以韦恩图取交集获得共差异基因(co-DEGs)798 个,见图1。
图1 差异基因的筛选
通过DAVID 数据库对798 个共差异基因进行GO 分析,结果显示,这些基因主要参与芳香族氨基酸代谢过程,胞内氨基酸代谢过程,细胞对异物的刺激反应等生物过程。同时差异基因主要富集于稠密染色体、着丝粒区域以及有丝分裂纺锤体等区域,参与的分子功能主要有花生四烯酸环氧合酶活性、氨基转移酶活性的调节等。KEGG 富集分析显示,共差异基因主要参与的代谢通路包括细胞周期循环、补体和凝血级联反应、丁酸代谢等通路,见图2。
图2 差异表达基因的GO 富集分析和KEGG 通路分析
通过STRING 数据库构建蛋白质相互作用网络及Cytoscape 软件Cytocubba 插件计算关键节点蛋白,得到degree 前20 的基因,将20 个基因再次构建相互作用网络,将排名前10 位的基因定义为影响肝细胞癌发生发展的关键基因,按照排序分别为CDK1、CCNA2、CCNB1、CDC20、TOP2A、BUB1、KIF11、CCNB2、MAD2L1、ASPM,见图3,经TCGA 数据库及HPA 数据库验证后,筛选得到CDK1、CCNA2、CCNB1、CDC20、TOP2A 和KIF11 这6 个关键基因,见图4。
图3 差异基因的PPI 互作网络分析及核心基因筛选
图4 核心基因在肝癌组织与正常组织中蛋白水平表达量
利用GEPIA 网站进行肝细胞癌的预后分析,结果显示,6 个hub 基因高表达均会降低患者的总生存率及无病生存率,其中CDC20 在总生存率中的风险比(hazard ratio, HR)值最大,为2.3,而CCNB1 在无病生存率中的HR 值最大,为2,见图5。
图5 核心基因的生存分析曲线
为了研究6 个hub 基因高表达导致肝癌患者预后不良的原因,利用TIMER2.0 数据库分析hub 基因与不同免疫细胞数量的相关性,结果显示,hub 基因与大部分T 淋巴细胞呈负相关,但与CD4+Th2 细胞呈明显正相关(P<0.001)。hub 基因与中性粒细胞、树突状细胞及M1 型巨噬细胞相关性较低,与原始巨噬细胞、NK 细胞呈负相关,但与肿瘤相关成纤维细胞呈明显正相关(P<0.001),见图6。
图6 核心基因与免疫细胞浸润相关性分析
对于肝癌的治疗,早期肝癌可以选择的方法有很多,如手术、破坏性治疗等,但由于肝细胞癌的特点,其被早期诊断的可能性并不高,而对于晚期肝癌,主要的治疗手段是让患者服用索拉菲尼[7-9],索拉菲尼作为抗肝癌的一线药物,治疗效果显著,但目前已经发现许多患者对索拉菲尼有耐药现象[10],其耐药机制也逐渐被发现。所以急需开发治疗晚期肝癌的新型药物,对索拉菲尼进行补充,甚至取代索拉菲尼对肝细胞癌患者进行治疗,近些年肿瘤免疫药物研发产业蓬勃发展,产生了许多针对肝细胞癌的免疫治疗药物,但依然存在治疗效果不确切、治疗范围有限、具有明显不良反应等缺点,因此本文也通过分析肝细胞癌相关免疫机制来进一步为免疫药物的研发提供理论基础。
本研究利用GO 分析、KEGG 分析、STRING 数据库分析以以及核心基因计算等手段发现CDK1、CCNA2、CCNB1、CDC20、TOP2A 和KIF11 这6 个基因对于肝细胞癌的发生发展可能具有明显促进作用。肿瘤微环境是指肿瘤的发生发展过程影响其生长、转移等性状的环境因素,包括代谢、分泌、免疫、结构的改变,其中肿瘤周围的免疫环境至关重要,肿瘤可以通过免疫逃逸来躲避免疫细胞的杀伤[11-13],找到肿瘤免疫逃逸的机制及重要靶点蛋白对于研发抗肿瘤药物至关重要。本研究发现6 个核心基因会导致患者预后不良,通过对核心基因及不同免疫细胞的相关性分析发现,核心基因与大部分T 淋巴细胞、NK 细胞呈负相关,已有研究表明,CD8+T 细胞、NK 细胞对肿瘤起到杀伤作用,是主要抑制肿瘤的免疫效应细胞[14],这可能是肝细胞癌免疫逃逸的原因之一。本研究结果显示,所有的核心基因与CD4+的Th2 细胞呈现出明显的强烈的正相关,有文献表明,当Th2 在肿瘤免疫微环境中占主要部分时,会促进肿瘤的进展、转移和一定的耐药性[15]。另外,有文章报道,肿瘤细胞可以通过刺激胸腺基质淋巴细胞生成素表达促进原始辅助T 细胞分化为Th2 细胞,进而促进肿瘤细胞的增殖[16]。白细胞介素-4 是Th2 分化的必要细胞因子,同时Th2 也会再次分泌白细胞介素-4 进行正反馈,但免疫细胞上的白细胞介素-4 和白细胞介素-4 受体结合会导致Th2 细胞内STAT6 磷酸化、核易位核GATA3 转录因子的表达,导致Th2 细胞因子的分泌,最终可以促进肿瘤细胞的生长和转移[17]。以上文献均说明,Th2 可能会促进肿瘤细胞的发生和发展。本研究发现,CDK1 等6 个蛋白与Th2 肿瘤浸润呈强相关性,这6 个核心基因导致肝细胞癌患者预后不良的原因可能是通过介导肿瘤细胞周围免疫微环境的变化,促进肿瘤细胞的免疫逃逸,导致患者生存率降低。目前,报道6 种核心基因与Th2 细胞相关的研究较少,已有研究者证明CCNA2 在肿瘤中与Th2 呈正相关[18];CCNB1 没有报道过在肿瘤患者中与Th2 细胞之间的关系,但可能在COVID-19 感染过程中与Th2 细胞关系比较密切[18];TOP2A在肝癌中与Th2 细胞呈正相关关系[19],然而,并没有确切的研究表明CCNA2、TOP2A 是如何调节Th2细胞的,同时对于CDK1、CCNB1、CDC20、KIF11 这4个基因与Th2 细胞的关系的研究本研究尚属首次,但基因发挥作用的具体机制还不明确,需要进行后续的生物学实验研究验证。
综上所述,本研究基于GEO 及TCGA 等网络数据库筛选肝细胞癌发生发展的关键蛋白,分析其促癌机制,为后续肝细胞癌的机制研究及药物研发奠定理论基础。