黄 容,张 键,车 旭
(1.中国科学院深圳先进技术研究院 生物医学与生物技术研究所 能量代谢与生殖研究中心,广东 深圳 518055;2.国家癌症中心 国家肿瘤临床医学研究中心 中国医学科学院 北京协和医学院 肿瘤医院深圳医院 肝胆外科,广东 深圳 518116)
肝细胞癌(hepatocellular carcinoma, HCC)是最常见的肝癌形式,是世界第三大致死性肿瘤,发病率持续上升[1],肝切除术后肿瘤复发率和远处转移率高是影响其预后的主要危险因素[2]。SLC4A10(solute carrier family 4 member 10),又名NCBE,属于SLC4家族成员,是从小鼠胰岛素瘤细胞系MIN6的cDNA文库中首次克隆得到的一个基因,该基因在垂体、睾丸、肾脏和回肠组织中低表达,在脑组织中高表达[3],在外周神经系统和非神经组织,如脉络丛、硬脑膜和一些上皮细胞中也有表达[4]。SLC4A10在神经系统中的表达分布、生理学及病理学重要性已经得到比较广泛的研究与认识,但在肝癌中的表达及生理学作用尚不清楚。
本研究利用在线数据库分析SLC4A10在肝癌与癌旁组织中的表达并进行生物学实验验证,通过单因素和多因素Cox回归,分析SLC4A10与肝癌患者生存预后的相关性,并构建SLC4A10的蛋白相互作用网络(protein-protein interaction network, PPI),进行功能富集分析,阐明SLC4A10的潜在作用机制,为肝癌的早期诊断、治疗和判断预后提供新的依据和思路。
1.1.1 SLC4A10在肝癌中表达分析:从TCGA数据库下载SLC4A10在374例肝癌和50例癌旁组织中的mRNA表达数据(fragments per kilobase per million, FKPM),分析SLC4A10在肝癌组织与癌旁组织中的mRNA表达。
1.1.2SLC4A10在肝癌中的基因突变分析:通过cBioPortal数据库分析SLC4A10在肝癌中的基因突变情况。
1.1.3 Kaplan-Meier(K-M)生存曲线分析:生存分析使用R-survival包,从TCGA(The Cancer Genome Atlas)数据库中下载SLC4A10在374例肝癌中的mRNA 表达数据(FKPM)以及相应的临床数据,首先计算SLC4A10表达量最优分界点,根据表达量分界点将样本分为SLC4A10高表达组和低表达组,作K-M生存曲线图。
1.1.4 单因素和多因素Cox回归分析:从TCGA数据库中下载SLC4A10在374例肝癌中的mRNA表达数据与临床数据,采用R-survival包建立mRNA表达量以及临床病理特征与肝癌患者总生存期和无病生存期的单因素回归模型,筛选出有显著影响(P<0.05)的因素,进行肝癌患者总生存期和无病生存期的多因素回归分析。
1.1.5 构建蛋白互作网络(protein-protein interaction, PPI):利用STRING数据库(search tool for the retrival of interacting genes/protein, STRING, https://www.string-db.org/)预测与SLC4A10共调节关键基因的蛋白互作关系,综合得分大于0.4的相互作用被认为具有统计学意义。利用cytoscape进行蛋白互作网络的可视化。
1.1.6 功能分析:下载STRING数据库预测到的与SLC4A10共调节的关键基因,利用Metascape数据库(http://metascape.org)对关键基因(hub gene)进行基因本体论(gene ontology, GO)分类注释。
1.2.1 细胞系:人肝癌细胞系Huh7/HepG2(中国医学科学院基础医学研究所细胞资源中心);人肝癌细胞系HLE/SMMC7721、人正常肝细胞系LO2(ATCC公司)。
1.2.2 实验材料:DMEM高糖培养基、MEM培养基(Hyclone公司);0.25%胰蛋白酶、胎牛血清(Gibco公司);青霉素-链霉素、Trizol、Revert Aid First Strand cDNA Synthesis Kit(Thermo Fisher Scientific公司);PowerUpTMSYBRTM Green Master Mix(2×)(Applied Biosystems公司);引物(北京擎科生物科技有限公司合成)。
1.2.3 检测方法:HLE/SMMC7721/Huh7/LO2细胞使用DMEM高糖培养基(10%胎牛血清、1%青霉素-链霉素),HepG2细胞使用MEM培养基(10%胎牛血清、1%青霉素-链霉素)。所有细胞于5% CO2,37 ℃恒温培养。将肝癌细胞系和正常肝细胞分别接种6孔板,当细胞汇合度接近80%时,用Trizol裂解细胞,提取RNA,用反转录试剂盒反转成cDNA,使用Bio-rad荧光定量PCR仪进行荧光定量PCR检测,PCR扩增步骤:95 ℃预变性10 min;95 ℃变性15 s,60 ℃退火、延伸1 min,共40个循环。本实验所用引物序列为:SLC4A10正向序列:5′-GTACGC CATAGGGTCCATGAG-3′,SLC4A10反向序列:5′-G GAACGAACAATGGGAATCCT-3′;ACTB正向序列:5′-CATGTACGTTGCTATCCAGGC-3′,ACTB反向序列:5′-CTCCTTAATGTCACGCACGAT-3′。反应结束后,以ACTB为内参,利用公式2-△△Ct计算各基因表达量。
TCGA数据库中374例肝癌组织与50例癌旁组织mRNA表达分析显示,SLC4A10在肝癌中的表达显著低于癌旁组织(P<0.01)(图1A),在50例配对肝癌与癌旁组织中,SLC4A10在癌组织的mRNA表达显著低于癌旁组织(P<0.05)(图1B)。实时荧光定量PCR实验结果显示,SLC4A10在正常肝细胞系(LO2)中的表达显著高于肝癌细胞系(SMMC7721、HepG2、HLE、Huh7)(图1C)。基因突变分析发现,SLC4A10在肝癌中的突变率为7%,主要包括错义突变、扩增突变和深度缺失(图1D)。
A.transcriptional level of SLC4A10 expression in 374 HCC tissues and 50 normal tissues in TCGA cohort;B.change of SLC4A10 mRNA expression between paired tumor samples and adjacent normal tissues from TCGA LIHC(liver hepatocellular carcinoma)studies;C.mRNA expression of SLC4A10 in normal liver cell line and hepatocellular carcinoma cell line;D.alteration analysis of SLC4A10;*P<0.05, **P<0.01 compared with normal group;#P<0.001 compared with LO2 cells group
针对TCGA数据库中371例具有总体生存数据的肝癌患者,Kaplan-Meier(K-M)生存曲线分析发现,SLC4A10高表达患者(n=133)的总体生存时间较SLC4A10低表达患者(n=238)更长。在320例具有无病生存数据的肝癌患者中,相对于SLC4A10低表达患者(n=221),SLC4A10高表达患者(n=99)的无病生存时间更长(图2)。
A.Kaplan-Meier survival curve comparing the overall survival(OS)time for different SLC4A10 expression subtypes in HCC patients from TCGA database;B.Kaplan-Meier survival curve comparing the disease free survival(DFS)time for different SLC4A10 expression subtypes in HCC patients from TCGA database
将374例肝癌患者临床信息汇总(表1),对患者临床信息进行Cox单因素回归分析发现,肿瘤M分期(P<0.05),肿瘤T分期(P<0.001),病理分级(P<0.001)和SLC4A10表达高低(P<0.01)显著影响肝癌患者的总生存期,肿瘤M分期(P<0.01),肿瘤T分期(P<0.001),病理分级(P<0.001)和SLC4A10表达高低(P<0.01)显著影响肝癌患者的无病生存期(表2)。用多因素Cox回归模型计算肿瘤M分期,肿瘤T分期,病理分级和SLC4A10表达量的危险度,发现SLC4A10低表达是肝癌患者不良预后的一个独立危险因素(P<0.05)(表3)。
表1 肝癌患者临床信息
表2 肝癌患者总生存期和无病生存期单因素Cox回归分析
表3 肝癌患者总生存期和无病生存期多因素Cox回归分析
SLC4A10的蛋白相互作用网络预测发现,与SLC4A10共表达的基因包括以下10个:OSGEP,SLC12A2,SLC9A1,SLC9A5,AQP1,KCNH7,AHCYL1,SLC12A5,TMPRSS15,PDDC1(图3A),将以上11个具有相互作用的蛋白进行功能富集分析,结果显示,这些基因在钾离子跨膜转运蛋白活性、单价无机阳离子稳态、顶端质膜、细胞体积内环境稳态、溶质-正离子联合体和离子跨膜转运调节等生物过程显著富集(图3B)。ClueGO功能注释表明SLC4A10调控的生物过程包括跨上皮细胞转运、细胞体积内环境稳态、钠离子跨膜导入等生物过程(图3C)。
A.the PPI network of SLC4A10 was constructed, a network of SLC4A10 and its co-expression genes was set up visually;B.functional enrichment analysis of a total of 11 involved genes were performed and visualized in barplot;C.functional annotation using ClueGO
肝细胞癌是最常见的肝癌形式,是常见的恶性肿瘤之一,需要有对肝癌更为有效的诊断及预后判断指标。本研究通过数据库分析发现,SLC4A10是一个肝癌低表达基因,SLC4A10表达是肝癌患者的总生存期和无病生存期的独立预后因子,SLC4A10高表达患者对应的生存预后更好,提示该指标可作为一个潜在因子用于肝癌的诊断及预后的预测。
蛋白相互作用网络预测发现,与SLC4A10相互作用的蛋白主要富集于离子跨膜转运、维持细胞体积内环境稳态等生物过程。SLC4A10是SLC4家族中的一员,该家族蛋白介导了HCO3-、CO32-、Cl-、Na+、H+的跨细胞膜转运,参与pH调节、跨上皮H+/碱转运和离子稳态等多种重要的生理过程[5]。SLC4家族包括10个成员,其中至少8个成员参与HCO3-转运。根据功能的不同,这8个成员可分为2大类,3个Cl-/HCO3-交换体(SLC4A1,SLC4A2,SLC4A3),5个Na+/HCO3-共转运体(SLC4A4,SLC4A5,SLC4A7,SLC4A8,SLC4A10),SLC4A4,SLC4A5属于生电性,其余6个属于电中性[6]。SLC4A11编码一个钠离子依赖的硼酸根转运体BTR1,SLC4A9的功能仍未确定[7]。这些SLC4家族成员都是整合膜蛋白,它们所编码的膜蛋白都有着很相似的亲水特征,但是转运活性存在显著的差异,例如,Na+/HCO3-共转运体能够从膜的一侧向其另一侧运输Na+和HCO3-或其相关的物质。SLC4A10属于Na+/HCO3-电中性共转运体,在维持细胞内环境稳态尤其维持酸碱平衡,以及HCO3-跨上皮细胞转运过程中发挥重要作用。由于机体新陈代谢不断产生酸性物质,再加上HCO3-等弱酸或弱碱离子或者H+的转运,导致细胞内外pH一直处于不断的变化之中,因此维持机体内外的pH稳态对于生物体各种功能的发挥至关重要,如中枢神经元和心肌细胞的兴奋性、心率产生、肌肉的伸缩、消化、受精[8]、细胞连接[9]、细胞构型的改变[10]以及代谢酶的活性如磷酸果糖激酶[11]等。本研究发现肝癌中SLC4A10表达降低,可能引起体内酸碱环境失衡,引起代谢酶的活性改变,从而引起肝脏疾病的发生,最终导致恶性肿瘤的形成。
本研究分析发现SLC4A10是肝癌患者生存预后的潜在因子,可能通过改变体内酸碱平衡引起肿瘤进展,为进一步研究SLC4A10在肝癌发生发展中的作用机制提供了新的线索。