向丽娟, 汪圣毅, 包楚阳, 张 焱, 韩 坤, 刘 虎,4
胃癌(gastric cancer,GC)是世界第五大恶性肿瘤和第三大常见癌症死亡原因[1]。GC作为消化道肿瘤与营养代谢密切相关。随着脂质组学分析在癌症研究中取得的重要进展,脂代谢(lipid metabolism,LM)异常与癌症关系的研究日益受到关注[2-5]。转录组是连接基因组遗传信息与生物功能的纽带,是揭示疾病基因突变规律、疾病发生发展重要机制以及发现致病基因调控关键靶点等领域的最佳研究手段。该研究利用高通量测序对GC及癌旁组织的差异表达谱进行京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes, KEGG)富集分析,以期探索GC中LM相关通路的关键基因(key genes,KGS),为GC诊断与治疗从转录组学和代谢组学上寻找新的线索。
1.1病例资料收集安徽医科大学第一附属医院2017年4月7日~19日住院GC患者术后GC组织标本8例及相应癌旁正常组织标本4例,均经病理学诊断证实。其中男3例,女5例,年龄25~77(60.1±15.3)岁。病理显示均为中-低分化腺癌,其中6例有淋巴结转移,但无远处脏器转移。TNM ⅠB~ⅡB期4例,ⅢA~ⅢC期4例。患者术前均未接受过化疗、放疗或生物治疗等干预措施,无其他肿瘤病史,无糖尿病、高血压、肾病、免疫系统疾病及上呼吸道感染等合并症。癌及癌旁两组性别、年龄差异均无统计学意义。标本于术后0.5 h内放入RNAlater(美国Invitrogen公司)保存液中,-20 ℃保存,正常对照来自手术边界5 cm以上。所有患者签署知情同意书。该实验经安徽医科大学伦理委员会批准(伦理批准号:20140141)。
1.2主要仪器与试剂琼脂糖凝胶电泳系统购自美国Nanodrop公司;NanoPhotometer®分光光度计购自德国Implen公司;安捷伦2100生物分析仪购自美国Agilent公司;HiSeq Xten、TruSeq PE簇生成试剂盒v3-cBot-HS购自美国Illumina公司; NEBNext®UltraTMRNA文库制备试剂盒及Oligo d(T) 25磁珠购自美国NEB公司;Qubit®2.0荧光计、Superscript II逆转录试剂盒及TRIzol试剂购自美国 Invitrogen公司; 核酸纯化试剂盒AMPure XP购自美国Beckman Coulter公司。
1.3cDNA文库构建及质检① 按TRIzol试剂说明书进行总RNA提取,随后质控(样品无污染时,RNA质量≥1 μg,RNA完整性(RNA integrity number,RIN) ≥6.8;样品有轻微污染时,RNA质量≥2 μg,RIN≥6.8);② 通过Oligo(dT)磁珠富集mRNA,在NEBNext碎片缓冲区用二价阳离子将mRNA随机打断;③ 将片段化mRNA为模板合成cDNA第一条链,随后用核糖核酸酶H降解RNA链,以dNTPs为原料合成cDNA第二条链;④ 末端修复、加A尾并连接测序接头,用AMPure XP筛选150~200 bp的cDNA片段,进行PCR扩增并再次使用AMPure XP进行纯化,最终获得cDNA文库;⑤ 使用Qubit 2.0荧光计对文库进行初步定量,安捷伦2100生物分析仪对文库的插入片段大小进行检测,随后qRT-PCR对文库有效浓度进行准确定量(文库有效浓度高于2 ×10-9mol/L ),以保证文库质量。从而得到最终的cDNA文库。
1.4上机测序根据制造商的说明,利用TruSeq PE簇生成试剂盒v3-cBot-HS 生成簇,然后在HiSeq Xten平台上对文库进行双端150 bp测序。
1.5统计学处理经过测序错误率检查、GC含量分布检查及原始数据(raw read)过滤,获得后续待分析数据(clean reads),采用STAR(v2.5.1b)软件对获得的clean reads进行比对分析,使用HTSeq(v0.6.0)进行基因水平定量分析,RSEM(v1.2.28)进行转录本水平的定量分析。采用edgeR(v3.12.1)软件进行表达差异显著性分析,将q (多重假设检验校正的P值)<0.05为差异有统计学意义。采用clusterProfiler(v3.0.5)软件对差异基因集进行KEGG通路富集分析,将q<0.05为富集有统计学意义,筛选出与胃癌相关的脂代谢通路。
2.1mRNA转录组文库的构建采用TRIzol法提取的GC和癌旁正常组织的总RNA的各项质量指标都基本达标,然后用Oligo磁珠分离出mRNA,合成双链cDNA文库,文库质检合格后,上机测序。
2.2RNA-seq数据处理将构建文库用HiSeq Xten进行转录组的双端测序,为了保证信息分析数据质量,将12个样本的测序数据进行过滤和比对分析。clean reads均占相应raw reads的90%以上, Q20≥94%, Q30≥88%(Q为20和30分别代表碱基测序错误率为0.01和0.001,Q20和Q30分别表示质量值大于20和30的碱基占总碱基的百分比)。质量控制合格,后续分析都基于高质量的clean reads。然后对RNA-seq测序数据进行比对分析、基因水平定量及标准化处理。有91%~95%的reads可以比对到人类参考基因组上,两组的唯一比对率66%~93%。
2.3差异表达分析根据以上判断标准,利用edgeR软件筛选差异基因。将q<0.05作为GC和癌旁正常组织差异表达基因筛选标准。一共检测出差异表达基因3 198个。与正常胃黏膜相比,GC中表达上调基因共1 776个,下调基因共1 422个。火山图表明了GC癌组织和正常组织间差异有统计学意义的表达基因分布情况,见图1,上调基因用红点表示,下调基因用绿点表示, PC表示癌旁组,DEG表示差异表达基因。差异倍数(fold change)表示基因在癌组织与正常组织间表达倍数变化,根据差异分析软件中的收缩模型计算得到。
图1 胃癌与正常胃黏膜差异表达基因火山图
2.4差异表达KEGG分析进一步行KEGG 富集分析,评估差异表达基因涉及的生物途径。结果表明,共映射到215种不同的代谢通路上。其中显著富集的途径是蛋白质的消化与吸收,细胞外基质受体相互作用,精氨酸和脯氨酸代谢,粘着斑,脂肪的消化与吸收,胃酸分泌,见表1。
2.5脂肪消化与吸收代谢通路的关键基因脂肪的消化与吸收代谢通路中有18个基因显著差异表达,其中14个上调和4个下调,见表2。代谢通路图见图2。将基因差异倍数|fold change|>2作为进一步筛选标准,得到9个上调基因和2个下调基因,可能为脂代谢相关通路的潜在KGS。
表1 GC和正常组织差异表达基因的KEGG显著富集通路(q <0.05)
表2 脂肪消化与吸收代谢通路显著上调或下调基因
自从癌症被提出是一种代谢异常性疾病以来,已有诸多研究[6-8]探索对肿瘤发生发展起关键作用的特定生化代谢途径。脂质具有多种重要的生物学功能,脂质谱系变化及LM异常在癌症的发生发展过程中扮演着十分重要的作用[4, 9]。
KEGG是一个用于从基因组和分子水平了解生物系统高级功能和效用的数据库资源,它能通过图形来表示细胞内代谢、膜运输、信号传导和细胞生长周期等生物学过程。该研究对GC差异表达基因行KEGG富集分析,发现LM通路中脂肪的消化与吸收代谢通路显著富集。
脂质的消化吸收分为胆汁酸盐协助脂质消化酶消化脂质和吸收的脂质经再合成进入血液循环两部分。脂质消化产生的长链脂肪酸、2-甘油一酯、胆固醇和溶血磷脂等,在小肠进入肠黏膜细胞后需要单酰甘油-O-酰基转移酶3(monoacylglycerol O-acyltransferase 3,MOGAT3)、脂肪酸结合蛋白2(fatty acid binding protein 2,FABP2)、载脂蛋白A4(apolipoprotein A4,APOA4)、NPC1样细胞内胆固醇转运蛋白1(NPC1 like intracellular cholesterol transporter 1,NPC1L1)等协助合成乳糜微粒,进而被肠黏膜细胞分泌,经淋巴系统进入血液循环。而该研究中合成这些蛋白的基因高表达,提示吸收的脂质再合成途径未影响GC患者脂质的消化与吸收,而主要是脂质消化酶的低表达起了主导作用。
图2 脂肪消化与吸收的代谢通路图红色表示基因上调,绿色表示基因下调;其中Lipase中包括PLA2G1B、PLA2G2A、PLA2G12B、PLA2G12A、LIPF
脂肪酶F,胃型 (lipase F,gastric type,LIPF)是最显著下调的基因,它编码的胃脂肪酶参与胃肠道中膳食甘油三酯的消化;其表达下调可严重影响机体对脂肪的存储。而脂肪存储障碍是引起癌症恶病质的重要因素之一。因此,LIPF可能与癌症恶病质的发生紧密相关。
由磷脂酶A2组IIA(phospholipase A2 group IIA,PLA2G2A)编码的蛋白质是磷脂酶a2家族的成员,它催化磷酸甘油酯的sn-2脂肪酸酰基酯键的水解,并且被认为参与调节生物膜中的磷脂代谢。有研究[10]显示PLA2G2A在GC细胞质中显著表达,其表达程度与肿瘤大小、分化程度及分期相关,是GC患者生存的独立预测因子。体外实验显示它的敲除能增加GC对5-氟尿嘧啶的敏感性[11]。该研究显示PLA2G2A在GC中上调,这与以前的研究结果一致,提示PLA2G2A可能成为GC诊断、治疗及预后的分子靶点。另外,PLA2G2A的过表达与直肠癌、肺癌的预后也相关[4, 12],并且可能参与前列腺癌的进展[13]。
PLA2G4A为花生四烯酸生成途径的限速酶,而花生四烯酸代谢途径与胃肠癌炎症相关肿瘤的发生相关。这提示PLA2G4A在胃肠癌的产生中发挥关键作用。Zhang et al[14]发现与非癌组织相比,GC中PLA2G4A的表达显著降低, 它的降低与GC患者的不利生存相关。而该研究却显示PLA2G4A在GC组高表达。有研究[5]显示PLA2G4A在乳腺癌中也高表达,与其不良预后相关。此外,PLA2G4A过表达可以促进癌细胞迁移和侵袭[2]。各种癌症中都报道了FABP1的过表达,并能促进肿瘤血管生成和迁移[9]。ATP结合转运蛋白G超家族成员5(ATP binding cassette subfamily G member 5,ABCG5)编码的蛋白质作为半转运体可以限制肠吸收并促进胆固醇的胆汁排泄,其高表达可能与GC患者的吸收功能缺陷有关,尚需进一步研究。
综上所述,对脂肪的消化与吸收代谢通路的分析显示LIPF、PLA2G2A、PLA2G4A、FABP1及ABCG5可作为GC诊断与治疗的候选生物标志物。本研究为探明GC脂质代谢改变机制提供了线索,有利于监控代谢异常和及早干预恶病质的发生,延长患者生存期和提高生活质量。