肝细胞癌相关差异表达基因和药物预测的生物信息学分析

2021-03-19 04:36:58张玉峰牛文辉戚亚婷赵永华樊亚芳
医学研究杂志 2021年2期
关键词:基因芯片细胞周期生存率

张 依 张玉峰 牛文辉 戚亚婷 赵永华 樊亚芳

肝细胞癌(hepatocellular carcinoma,HCC)是原发性肝癌最常见的组织学亚型,每年全球约有84万例新增HCC患者,因HCC死亡人数高达78万[1]。并且HCC患者的5年生存率仍不尽如人意(约为12.1%),发病机制尚不明确[2]。研究显示,中医药治疗肝癌时,能够降低肝癌复发和转移,提高患者生存质量,并能够减少肝癌细胞增殖和新生血管形成,促进其凋亡[3]。因此,研究HCC的分子机制和具有潜在治疗作用的中药或有效成分显得尤为重要。

近年来,生物信息学方法广泛应用于医学领域,是探索和预测疾病发病机制的重要手段。因此,本研究选取了HCC相关基因芯片进行生物信息学分析,筛选HCC相关DEGs,并挖掘DEGs的生物学功能和通路,探讨HCC潜在的分子机制。并筛选核心基因和具有潜在治疗作用的中药有效成分,旨在为诊断、治疗和机制研究提供基础。

材料与方法

1.材料:在GEO数据库(https:∥www.ncbi.nil.nih.gov/geo/)中根据以下条件进行筛选基因芯片:①样本组织为HCC和癌旁或正常肝组织;②数据类型为mRNA表达谱;③物种为智人(Homo sapiens);④平台为GPL570[(HG-U133_Plus_2)Affymetrix人基因组U133加2.0阵列]。基于上述条件,选择并下载4组基因芯片:GSE45436(来源于93个HCC组织和41个癌旁肝组织)、GSE84402(来源于14个HCC组织和14个癌旁肝组织)、GSE62232(来源于81个HCC组织和10个正常肝组织)、GSE101685(来源于24个HCC组织和8个正常肝组织)。

2.筛选DEGs:使用R 3.5.1软件的Affy和Limma包对4组基因芯片进行分析,得到DEGs,其中Limma包的Benjamini-Hochberg算法对P值进行校正,得到校正后的P值[4]。若校正后的P<0.05、|log2(fold change,FC)|(|log2FC|)>1(FC为差异倍数),则为DEGs。再分别利用“Volcano plot”和“Venn diagram”包构建火山图和韦恩图,选取同时在4组基因芯片中的上调或下调基因为DEGs。

3.GO和KEGG分析:将DEGs输入DAVID 6.8(https:∥david.ncifcrf.gov/),选择物种为智人,进行KEGG和GO分析,两者均以P<0.01为截断标准。其中GO分析包括生物过程(biological process,BP)、细胞组分(cellular components,CC)及分子功能(molecular functions,MF)分析。

4.构建PPI网络和筛选核心基因:在STRING 11.0数据库(https:∥string-db.org/)中输入DEGs,选择最低相互作用评分为中等置信度(0.400),得到蛋白质-蛋白质互作(protein-protein interaction,PPI)数据。并使用Cytoscape 3.7.2软件对PPI数据进行可视化展示,根据“CytoHubba”插件中MCC算法,选择前10位DEGs作为核心基因。

5.验证核心基因的表达和生存分析:在UALCAN(http:∥ualcan.path.uab.edu/analysis.html)中设置检索条件为:①gene symbol:核心基因;②TCGA dataset:liver hepatocellular carcinoma;③expression;④survival。分析核心基因表达,并绘制核心基因的Kaplan-Meier生存曲线,两者均以P<0.05为截断标准。

6.筛选潜在治疗药物:在比较毒物遗传学数据库(CTD,http:∥ctdbase.org/)中输入疾病为hepatocellular carcinoma,从化合物-基因相互作用(chemical-genes interactions)数据中筛选能够负调节核心基因表达的中药有效成分,作为潜在治疗HCC的低分子化合物。

结 果

1.筛选DEGs:通过R 3.5.1的Affy和Limma包分析得到DEGs,使用火山图进行展示,详见图1。并对4组基因芯片中DEGs取交集和绘制韦恩图,得到173个上调基因和323个下调基因,详见图2。

图1 4组微阵列数据的火山图

图2 上调基因(A)和下调基因(B)的韦恩图

2.GO和KEGG分析:GO和KEGG分析发现,DEGs主要参与75个BP,主要分布于29 个CC,主要具有28种MF,主要富集在20条KEGG通路,详见表1。

表1 GO和KEGG分析

3.构建PPI网络和筛选核心基因:通过STRING和Cytoscape分析,得到由430个节点(节点表示DEGs,其中66个DEGs在本研究中孤立存在,未参与PPI网络构建)和5047个边(边表示DEGs间相互作用关系)组成的PPI网络图,详见图3A。使用cytoHubba的MCC算法,筛选得到10个明显上调的核心基因,包括有丝分裂阻滞缺陷蛋白2样蛋白1(mitotic arrest deficient 2 like protein 1,MAD2L1)、有丝分裂检查点丝氨酸/苏氨酸蛋白激酶B(mitotic checkpoint serine/threonine kinase BUB1 beta,BUB1B)、非染色体结构维护凝缩蛋白I复合体G亚基(non-SMC condensin I complex subunit G,NCAPG)、细胞周期蛋白A2(cyclin A2,CCNA2)、细胞周期蛋白B2(cyclin B2,CCNB2)、驱动蛋白超家族11(kinesin family member 11,KIF11)、细胞周期蛋白依赖性激酶1(cyclin dependent kinase1,CDK1)、酪氨酸和苏氨酸蛋白激酶(tyrosine and threonine protein kinase,TTK)、苯并咪唑出芽抑制解除同源物1(budding uninhibited by benzimidazoles 1,BUB1)、细胞周期蛋白B1(cyclin B1,CCNB1),详见图3B。

4.验证核心基因的表达和生存分析:通过UALCAN数据库发现,核心基因在HCC组织中均显著高表达且差异有统计学意义(P<0.05),详见图4。生存分析结果显示,核心基因高表达组生存率均低于低表达组生存率且差异有统计学意义(P<0.05),详见图5。

图4 UALCAN数据库中核心基因的表达情况

图5 核心基因的Kaplan-Meier生存曲线

5.筛选潜在治疗药物:核心基因均为上调基因且与低生存率密切相关,因此,从CTD中筛选可降低核心基因表达的中药有效成分。根据中药有效成分对应的核心基因的数目进行排序,前5个中药有效成分为槲皮苷、白藜芦醇、姜黄素、雷公藤甲素、相思子碱,详见表2。

表2 CTD数据库筛选的潜在治疗药物

讨 论

本研究使用生物信息学方法对基因芯片进行分析,探讨HCC的分子机制,为实验和临床提供潜在治疗靶点和治疗药物。

本研究共得到496个DEGs。GO和KEGG分析表明,DEGs主要调控细胞分裂、有丝分裂等生物学过程,主要参与代谢和细胞周期等通路。上述生物学过程和通路可能在HCC发生、发展过程中起着至关重要的作用,为探究HCC的发病机制提供基础。

通过PPI分析发现了10个高表达且与生存率密切相关的核心基因,包括MAD2L1、BUB1B、NCAPG、CCNA2、CCNB2、KIF11、CDK1、TTK、BUB1、CCNB1。其中MAD2L1是纺锤体组装的检查蛋白的重要组成部分,其异常表达时,可影响纺锤丝检查点的活性,导致染色体不稳定,促进肿瘤的产生,但在HCC中研究较少,可能为新的治疗靶点[4,5]。BUB1B又称为BUBR1,是连接纺锤体微管和染色体的有丝分裂功能蛋白,在HCC组织中高表达,与乙肝表面抗原(HBsAg)阳性率、较大肿瘤体积、低生存率密切相关[6]。NCAPG可负责染色体的稳定和凝聚,在HCC中,高表达NCAPG与较低的生存率密切相关,其表达降低时可导致肝癌细胞在体内形成的异体移植瘤减小[7]。

CCNA2为DNA复制的调控因子,在HCC中精氨酸琥珀酸裂解酶(ASL)与CCNA2相互作用,并通过非酶途径促进HCC的发生[8]。CCNB2与细胞分裂周期蛋白20(Cdc20)结合能够引起细胞从G2期转换至M期,在HCC中显著高表达,下调CCNB2可引起细胞增殖和迁移的减少、凋亡增加和S期阻滞[9]。KIF11为调控依赖性运动蛋白,在有丝分裂纺锤体形成和维持纺锤体动力中发挥重要作用,其在口腔鳞状细胞癌和非小细胞肺癌中显著高表达,但在HCC中研究较少,可能为新的靶点基因[10,11]。CDK1与CCNB1结合后具有激酶功能,在HCC细胞中,CDK1能够通过调节凋亡素的肿瘤特异性杀伤功能和分布在细胞核、细胞质中比例,调控凋亡素引起的细胞凋亡[12]。

TTK是纺锤体检测点的一部分,在HCC组织中高表达,并与肿瘤直径、门静脉癌栓(PVTT)的形成密切相关,也可促进细胞增殖和迁移[13]。BUB1是编码染色体分离调控的蛋白激酶,在HCC中高表达,下调BUB1的表达可导致细胞增殖减少,凋亡增多和S期阻滞[14]。CCNB1为有丝分裂的关键启动因子,在HCC中高表达的CCNB1与血管侵犯、病理分期和较低的无病生存率、总生存率密切相关[15]。结合上述分析发现,核心基因与细胞周期密切相关,可能为HCC的致癌基因和治疗靶点。

本研究在CTD数据库中筛选出槲皮素、白藜芦醇、姜黄素、雷公藤甲素、相思子碱5个中药有效成分,其中槲皮素是广泛存在于三七、绞股蓝等中药的天然黄酮类化合物,白藜芦醇是来源于虎杖等中药的非黄酮类多酚化合物,两者均能降低肝癌细胞增殖活性并促进凋亡,引起细胞周期阻滞[16,17]。姜黄素是姜黄中的天然酚类化合物,雷公藤甲素是从雷公藤中提取的环氧化二萜内酯化合物,两者均可抑制肝癌细胞增殖,而雷公藤甲素也能降低肝癌细胞侵袭和转移能力[18~20]。相思子碱是从相思子或鸡骨草中提取的生物碱,从鸡骨草中提取的相思子碱能够减少四氧化碳(CCl4)和异硫氰酸萘酯引起的肝损伤小鼠模型中总胆红素和丙氨酸氨基转移酶的含量,具有降酶退黄护肝的药理作用[21]。但相思子碱对HCC细胞的研究较少,可能为新的治疗HCC药物。上述5种中药有效成分能够影响肝癌细胞的增殖和凋亡,具有抗肝癌的作用。

综上所述,本研究使用生物信息学方法对HCC相关DEGs和潜在治疗药物进行分析,发现DEGs主要调控DNA复制和氧化还原过程,参与细胞周期和代谢信号通路。筛选得到10个显著上调且与低生存率密切相关的核心基因,可能为HCC的致癌基因和潜在治疗靶点。并且发现槲皮素、白藜芦醇、姜黄素、雷公藤甲素、相思子碱具有潜在的治疗作用。因此本研究有助于分析HCC的潜在分子机制和发现具有治疗作用的中药有效成分,为后续临床和实验研究提供潜在的靶标和治疗药物。

猜你喜欢
基因芯片细胞周期生存率
出生时即可预判发育潜力 基因芯片精准筛选肉牛良种
今日农业(2021年4期)2021-06-09 06:59:56
“五年生存率”不等于只能活五年
人工智能助力卵巢癌生存率预测
红霉素联合顺铂对A549细胞的细胞周期和凋亡的影响
“五年生存率”≠只能活五年
双管单色荧光PCR法与基因芯片法检测CYP2C19基因多态性的比较研究
NSCLC survivin表达特点及其与细胞周期的关系研究
HER2 表达强度对三阴性乳腺癌无病生存率的影响
癌症进展(2016年12期)2016-03-20 13:16:14
X线照射剂量率对A549肺癌细胞周期的影响
癌症进展(2016年10期)2016-03-20 13:15:43
应用基因芯片技术检测四种结核药物敏感试验的研究
哈尔滨医药(2015年3期)2015-12-01 03:57:44