左静芝,刘江锡,王 敏,张 磊1,,韩 东,燕宪亮△
1.徐州医科大学附属医院急诊医学科,江苏徐州 221002;2.徐州医科大学研究生院急救与救援医学系,江苏徐州 221004;3.徐州医科大学附属医院徐州市急诊医学重点实验室,江苏徐州 221002;4.徐州医科大学麻醉学院,江苏徐州 221002
肝细胞癌(HCC)是一种恶性程度极高、易转移、易复发的恶性肿瘤,是全世界因癌症死亡的第二大常见原因[1- 2]。全球每年新增原发性肝癌患者超过62万例,我国患者所占比例超过一半,极大地威胁着我国国民健康[3]。目前HCC的发病机制不清楚,已知的危险因素包括病毒感染、有毒物质、代谢改变、肝硬化和吸烟等[3]。在受到这些危险因素中的一种或多种影响后,会出现遗传和表观遗传的改变,可能会打破原癌基因与抑癌基因的平衡,从而导致HCC的发生[4]。手术切除、移植、靶向治疗药物是目前治疗HCC的主要手段,但仅适用于30%~40%的HCC患者,而剩余60%~70%的患者仅适用于姑息和对症治疗[2]。总体来说,HCC患者的5年生存率仍然很低,尤其是晚期肝癌。因此,若能阐明HCC发生和发展的分子机制,就能在HCC病变早期发现疾病,可以增加有效治疗的机会,从而提高存活率。
脂蛋白(a)[Lp(a)]是一种主要由肝脏合成的蛋白-脂质复合物,有研究表明肝脏疾病患者组的血清Lp(a)水平显著低于健康组[5-6],提示Lp(a)水平可能在一定程度上可以用于监测肝脏疾病。其中血清中Lp(a)的水平70%~90%受Lp(a)基因(LPA)遗传变异决定[7]。Lp(a)水平在HCC患者血清中明显增高,且随临床分期/级越大,增幅越高,可作为临床HCC诊断及分期依据[8]。此外,HCC患者血清载脂蛋白AⅠ和载脂蛋白AⅡ水平显著降低, 但在HCC患者中发现前载脂蛋白AⅠ比率增高[9]。在慢性肝炎和HCC中, 血清载脂蛋白AⅠ和Lp(a)水平可以作为诊断肝脏损伤的指标[10]。目前,关于LPA在肝癌中的表达和预后价值研究很少,因此本研究通过生物信息学[7]的方法,评估LPA在HCC中的表达情况,分析LPA对HCC发生和预后的影响,为HCC发生、发展机制研究提供新的理论依据,为临床治疗提供参考。
1.1基因芯片数据来源 本次分析的数据来源于肿瘤基因组图谱计划(TCGA)[11]和基因型组织表达(GTEx)正常组织数据库。TCGA计划是由美国国家癌症研究所联合国家人类基因组研究所开展的,目的是对20 000多个原发癌症标本和33种癌症类型的匹配正常标本进行分子特征分析,其中包含肝癌组织标本和癌旁正常组织对照标本,包括每一个标本的RNA-seq数据、分期、生存时间和状态[11]。依据平台中的注释信息,剔除部分缺失生存相关信息或者无法准确进行癌症分期的标本,共纳入HCC标本369例、癌旁正常组织标本159例。
1.2方法
1.2.1LPA在肿瘤组织及癌旁正常组织的表达情况 笔者使用基因表达谱交互分析(GEPIA)平台[12]分析LPA在33种肿瘤类型及匹配的癌旁正常组织中的表达。这些肿瘤包括肾上腺皮质癌(ACC)、膀胱尿路上皮癌(BUCA)、乳腺浸润癌(BRCA)、宫颈鳞癌和腺癌(CESC)、胆管癌(CHOL)、结肠癌(COAD)、肝细胞肝癌(LIHC)、肺腺癌(LUAD)、肺鳞癌(LUSC)、间皮瘤(MESO)等[11]。对于参数选项,笔者使用ANOVA统计方法进行差异基因表达分析,选择log2(TPM+1)转换后的表达数据用于绘图, |log2FC|截止值为1,Q值截止值为0.01。
1.2.2LPA对HCC患者肿瘤分级和HCC患者总生存期(OS)的影响 GEPIA平台利用TCGA和GTEx数据库,探讨LPA对HCC患者肿瘤分级和HCC患者OS的影响,绘制其与分期相关的小提琴图和Kaplan-Merier生存曲线,关于生存曲线的假设检验,GEPIA考虑的是对数秩检验。为此,本研究选择了一个基于Cox PH模型的风险比(HR)和95%可信区间信息(CI)来表示,95%CI为虚线。根据mRNA表达的中位数将癌症患者分为高表达组和低表达组,并用K-M生存曲线进行验证。因此,LPA表达水平高于和低于50%的标本分别被用作高表达组和低表达组。当P<0.05时为差异有统计学意义。
1.2.3LPA和DNA甲基转移酶(DNMT)、错配修复基因的相关分析 本研究使用TCGA数据库,下载了HCC中LPA mRNA(LPA-001)的数据,利用Perl软件,采用Pearson相关系数法,对HCC中LPA-001与DNMT、错配修复基因进行成对基因表达相关分析,其结果通过circos图和热图[13](使用pheatmap包生成)显示。通过TCGA数据,我们确定了LPA mRNA 水平,并将其分别与33种癌症DNA甲基转移酶[14]进行相关性分析。利用TCGA的表达谱数据评估5个MMR基因,即 MLH1、MSH2、MSH6、PMS2和EPCAM突变,分别与33种癌症组织中LPA表达水平之间的关系,其中相关性水平是使用Pearson 相关系数计算的,相关级别用r表示。
1.2.4GO功能注释及KEGG通路富集分析 使用TCGA R软件,基于 Wallenius non-central hyper-geometric distribution数学模型,对交集的差异基因进行GO功能注释和KEGG通路富集分析。GO分为生物过程(BP)、细胞组成(CC)和分子功能(MF)3个部分。在GO和KEGG中搜索生物学过程,寻找显著性水平集(P<0.05,浓缩分数>1.5)的途径。选择了基于P值的前10个BP、CC和MF进行绘图。为了进一步明确LPA影响HCC发生、发展及预后可能通过哪些通路,将TCGA数据库里面HCC组织与正常组织中的差异基因1,HCC组织中LPA高表达与低表达所得的差异基因2进行比较,得出交集差异基因,对交集差异基因进行GO功能注释和KEGG通路富集分析。
2.1LPA在肿瘤及癌旁正常组织的表达情况 33种肿瘤组织与癌旁正常组织的LPA mRNA水平表达如图1所示。结果显示,在LIHC、ACC、BUCA及BRCA等癌症中,癌组织LPA mRNA表达水平均明显低于癌旁正常组织,差异均有统计学意义(P<0.05)。HCC组织中LPA存在3个转录本(图2),其中ENST00000316300.9(LPA-001)表达丰度较高,因此选择LPA-001作为比较。在HCC组织中LPA-001表达水平明显低于癌旁正常组织(P<0.05)。
注:使用GEPIA网络服务器,将TCGA 33种肿瘤类型中癌组织LPA mRNA水平与癌旁正常组织进行比较。每种肿瘤的癌组织或癌旁正常组织的LPA mRNA以圆点表示,对于每个TCGA肿瘤(浅灰色),给出其匹配的正常和GTEx数据(深灰色);T为肿瘤;N为正常。Y轴为log2(TPM+1)。X轴为癌组织和癌旁正常组织标本的数量。
2.2LPA在不同HCC肿瘤分级中的表达 如图3A所示,LPA的表达与HCC患者肿瘤分级呈负相关(r=-0.18,P=0.01),LPA在HCC患者Ⅰ级、Ⅱ级、Ⅲ级的表达均高于Ⅳ级,表明在HCC早期阶段,LPA表达水平比较高,但是到了HCC晚期,其表达水平较低。推测LPA可作为调节HCC进展并影响患者预后的潜在标志物。
2.3总体生存分析 为进一步阐明LPA表达水平是否可以影响HCC患者OS,通过GEPIA平台依据LPA mRNA高低分组进行生存分析。如图3B所示,在HCC数据中LPA 高表达组(n=182)比LPA低表达组(n=182)预后更好,log-ranking检验P=0.014,HR=0.64,LPA 高表达组与HCC患者的总体生存时间较长呈正相关(r=0.20,P=0.005,log-ranking检验,P<0.05),结果表明LPA是反映HCC良好预后的标志物。
注:LPA基因表达时存在3个转录本,包括ENST00000614786.1(LPA-202)、ENST00000447678.2(LPA-201)及ENST00000316300.9(LPA-001)。A表示ENST00000614786.1(LPA-202)的表达与癌旁正常组织标本的比较;B表示ENST00000447678.2(LPA-201)的表达与癌旁正常组织标本的比较;C表示3种转录本表达水平的比较。与癌旁正常组织标本相比,肝癌患者癌组织标本中LPA基因转录本ENST00000614786.1(LPA-202)与ENST00000447678.2(LPA-201)表达无明显差异,而ENST00000316300.9(LPA-001)有明显变化,说明ENST00000316300.9(LPA-001)是肝癌患者LPA基因的主要转录本,其主要构造可通过GEPIA2.0进一步可视化出ENST00000316300.9 (LPA-001)的结构。
注:A表示TCGA数据库中HCC中LPA mRNA的小提琴图谱,Y轴代表每个标本相应基因的表达值;B表示LPA基因在HCC中高表达组与低表达组的Kaplan-Meier生存曲线,浅黑线表示LPA高表达组,深黑线表示LPA低表达组,在Kaplan-Meier生存曲线中,LPA高表达组与良好预后相关。
2.4LPA和DNA甲基转移酶相关分析 通过TCGA数据确定了LPA mRNA 水平,并将其分别与33种DNNT进行相关性分析,结果表明HCC组织中LPA mRNA 水平与3种DNMT水平呈负相关,即DNMT2 (r=-0.15,P=0.012)、DNMT3A (r=-0.22,P=5.5E-5)、DNMT3B(r=-0.13,P=0.027),提示LPA表达可能与HCC中DNA甲基化水平呈负相关。
2.5LPA基因和错配修复基因相关分析 结果表明,在HCC组织中,LPA mRNA水平与MLH1、MSH2、PMS2、EPCAM等MMR基因表达水平呈负相关(r<0,P<0.05)。
2.6GO功能注释与KEGG通路富集分析 GO功能注释分析中,如图4所示,BP基因富集功能数包括翻译起始(translational initiation)、mRNA分解代谢(mRNA catabolic process)、病毒基因表达(viral gene expression)、病毒转录(viral transcription)等。CC富集功能数包括焦点粘连(focal adhesion)、细胞底物黏着连接(cell-substrate adherens junction)、细胞底物连接(cell-substrate junction)、核糖体亚基(ribosomal subunit)、胞浆核糖体(cytosolic ribosome)、核糖体(ribosome)等。MF富集功能包括核糖体结构成分(structural constituent of ribosome)、钙黏着蛋白结合(cadherin binding)、细胞附着分子结合(cell adhesion molecule binding)、辅酶结合(coenzyme binding)、电子转移活性(electron transfer activity)、核糖核蛋白复合物(ribonucleoprotein complex binding)、未折叠蛋白结合(unfolded protein binding)、泛素蛋白连接酶结合(ubiquitin protein ligase binding)、泛素样蛋白连接酶结合物(ubiquitin-like protein ligase binding)等。
通过KEGG分析,笔者发现在HCC与LPA表达相关的基因,主要富集于以下通路:核糖体(ribosome)、氧化磷酸化(oxidative phosphorylation)、脂肪酸降解(fatty acid degradation)、PPAR信号通路(PPAR signaling pathway)、化学致癌作用(chemical carcinogenesis)、铁死亡(ferroptosis)等30条途径,见图5。
注:显示了HCC中LPA表达相关基因的KEGG通路分析。
肝癌是我国常见的恶性肿瘤之一,患者5年生存率不高[15]。尽管近些年靶向药物的出现为原发性肝癌的治疗带来了曙光,但是它的应用仍然有限。原发性肝癌发生的分子机制尚需进一步确认,生物信息学可以帮助分析原发性肝癌基因层面的变化,探索原发性肝癌发生的分子机制,为治疗提供理论参考。
在本研究中,笔者分析了LPA在HCC中差异表达特征,评估其表达水平对HCC患者预后的影响。与癌旁正常组织相比,HCC组织中LPA mRNA水平较低。而将HCC患者按肿瘤分级后,发现随肿瘤分级增加,LPA mRNA水平逐渐下降,且生存分析中显示LPA mRNA水平较高与良好预后之间一致关联。
临床研究发现LPA基因的产物Lp(a)水平与肝脏疾病密切相关,与健康对照组相比,肝炎、肝硬化[5]、慢性迁徙性肝炎、HCC患者Lp(a)水平均较低。同样在肝脏移植患者中的研究也有类似结果,肝移植患者术前Lp(a)水平较低,手术后逐渐恢复至稳定水平[6]。本研究借助TCGA和GTEx数据库信息,通过GEPIA平台研究LPA mRNA水平与HCC发生、发展、预后的关系,研究证实了HCC组织中LPA的表达谱,并显示3种LPA mRNA中,LPA基因转录本ENST0000031 6300.9(LPA-001)在HCC组织中的表达近似丰度最大,较癌旁正常组织下调。HCC组织中LPA基因转录本ENST00000614786.1(LPA-202)、ENST00000447678.2(LPA-201)表达与癌旁正常组织相比没有明显差异。在HCC患者中,癌组织LPA mRNA水平明显低于正常组织,且差异有统计学意义(P<0.05)。此项结果正好与上述临床研究中观察到原发性肝癌患者中血清Lp(a)水平较低相符。
在LPA mRNA水平对HCC患者预后影响的研究中,笔者将HCC患者按肿瘤分级分类,结果显示在肝癌早期LPA高表达,随着肿瘤分级进展,LPA的表达水平逐渐下降,且差异有统计学意义(P<0.05)。尽管Ⅳ级肝癌中LPA水平有所回升,但差异并不显著,这可能是由于Ⅳ级肝癌样品数不足所导致。这表明LPA上调可能与HCC的进展呈负相关,表明该基因的功能可能是抑制HCC的进展。生存分析结果表明,数据库中的LPA mRNA水平与HCC的预后有相关性,LPA mRNA水平较高的患者总体生存时间较长,这间接表明LPA与HCC进展相关,可作为HCC患者治疗、诊断的预测因子。
表观遗传改变在决定基因及其产物何时何地表达的分化程序的建立和调控中起着至关重要的作用。MLH1、MSH4和RTF2参与了DNA修复,MLH1、MSH4、RPL22L1和RTF2主要影响细胞周期,NHLRC1、HENMT1、LYG1和SMAP1参与代谢过程,NHLRC1和HENMT1与基因表达调控有关[16]。虽然这些改变不会引起DNA序列的变化,但它们通过改变基因的DNA甲基化模式、microRNA的表达谱、组蛋白的翻译后修饰和核小体位置,从而调节基因的表达[17-18]。在所有生物过程中,表观遗传调控都起着核心作用,还与许多疾病有关,包括HCC[19]、乳腺癌等[17]。到目前为止,已鉴定出4种DNMT (DNMT1、DNMT2、DNMT3A和DNMT3B)和1种DNMT相关蛋白(DNMT3L)[17-18],它们催化S-腺苷基甲硫氨酸(SAM)上的甲基转移到胞嘧啶碱基上。除了在体内可能作为RNA甲基转移酶的DNMT2外,所有的DNMT2对于胚胎的存活都是必不可少的,基因组甲基化模式的维持主要由DNMT1介导,它通过细胞世代传递表观遗传信息,DNMT1的蛋白质表达增加与人类HCC的恶性潜能和预后不良密切相关[14]。DNMT3A和DNMT3L一起母体印记基因甲基化,DNMT3B定位于微小的卫星重复序列,而且还协同作用使基因组甲基化。乙型肝炎病毒X蛋白上调DNMT1、DNMT3A1和DNMT3A2来增加总DNMT活性,可选择性地促进特定肿瘤抑制基因的区域甲基化,下调DNMT3B则诱导了卫星2重复序列的整体甲基化不足,最终在表观遗传方面导致肝癌发生[4]。因此,笔者将LPA基因表达与4种DNMT进行相关性分析,结果表明HCC组织中LPA mRNA水平与DNMT2、DNMT3A、DNMT3B呈负相关,提示在HCC组织中LPA可能通过影响上述3种DNMT,从而进一步影响HCC的发生。
错配修复基因在启动DNA复制过程中涉及错配核苷酸的切除修复,因此在维持人类基因组DNA的保真度方面起着至关重要的作用[20-22]。这一系统的缺陷导致微卫星的帧移位突变,这可能是原癌基因和抑癌基因突变积累的原因,最终导致恶性转化DNA修复缺陷,进而导致许多遗传癌综合征和散发性癌症。机体内参与DNA修复的途径有5种,包括碱基切除修复、修复非同源末端连接、同源重组修复、错配修复和核苷酸切除修复。MMR基因是一组遗传易感基因,MMR的关键位点缺失会导致DNA复制错误且无法被修复,从而导致基因组中突变的积累,从而增加肿瘤恶变的概率[15]。相关研究表明,MMR基因表达减少与HCC的较高等级之间存在显著关联[23],所有类型HCC中都存在MLH1、MSH2、PMS2的启动子甲基化[24]。因此,本研究选择5个MMR基因(MLH1、MSH2、MSH6、PMS2和EPCAM)进行分析,结果显示LPA mRNA水平与MLH1、MSH2、PMS2、EPCAM等MMR基因表达水平呈负相关(r<0,P<0.05)。这表明LPA与MLH1、MSH2、PMS2、EPCAM等MMR基因相关,在LPA高表达的HCC组织中,应用铂类化疗药物可能抑制HCC组织中肿瘤细胞的DNA修复过程,进而抑制肿瘤的进展。
一些研究表明酒精所致的HCC中,乙醛对肝脏有毒,会改变脂质体内平衡,减少PPAR并增加固醇调节元件结合蛋白的活性,在乙醛和ROS的作用下,形成易于诱变的DNA复合物,干扰甲基化,从而导致与酒精相关的HCC的发生[21]。同样,铁死亡与肝癌发生,促进靶向药物索菲替尼耐药方面密切相关[22]。本研究通过GO富集分析发现,这些差异表达基因主要集中在翻译起始、mRNA分解代谢、病毒基因表达、病毒转录、焦点粘连、细胞底物黏着连接、细胞底物连接、核糖体结构成分、钙黏着蛋白结合、细胞附着分子结合、辅酶结合、电子转移活性等。KEGG分析也提示差异表达基因主要参与核糖体、氧化磷酸化、脂肪酸降解、PPAR信号通路、化学致癌作用、铁死亡等途径。由此推测,LPA有可能通过上述基因、通路,从而影响HCC的发生、发展及预后。
综上所述,LPA在HCC组织中表达水平低,并且其与HCC的发生、发展、预后密切相关,可能通过PPAR信号通路、化学致癌作用、铁死亡等途径发生作用,但是这些还需要后续的真实实验验证。