PLOD3:一种潜在的直肠癌预后生物标志物①

2023-11-30 02:08杨年钊戴大飞杨小龙马佳慧皖南医学院第一附属医院胃肠外科芜湖241001
中国免疫学杂志 2023年11期
关键词:甲基化直肠癌数据库

杨年钊 戴大飞 杨小龙 姚 军 马佳慧 赵 军(皖南医学院第一附属医院胃肠外科,芜湖 241001)

结直肠癌是全球第三大常见癌症,约占所有实体瘤的10%,直肠肿瘤约占所有结直肠癌病例的40%,其中约50%表现为局部晚期疾病[1-2]。尽管现代医疗诊治水平(手术、化学疗法、放射疗法、分子靶向疗法和免疫疗法等)有了很大提高,但结直肠癌仍然是全球癌症相关死亡的主要原因[3]。根据中国国家癌症中心统计,中国大肠癌的发病率和死亡率均逐年上升[4]。目前直肠癌形成和进展的分子机制仍不清楚,妨碍了该疾病的有效治疗。因此,识别新的诊断和预后生物标志物并探索治疗直肠癌的潜在靶点有重要的意义。近年来,越来越多的研究结果表明,胶原蛋白的沉积增加及其交联可影响癌细胞功能,促进细胞增殖、迁移和侵袭,进而加速肿瘤进展[5-6]。胶原沉积和交联取决于赖氨酸残基的羟基化,这主要由前胶原赖氨酸-2-酮戊二酸-5-双加氧酶(procollagen-lysine,2-oxoglutarate 5-dioxygenase,PLOD)催化。目前发现三种赖氨酸羟基化酶,包括PLOD1、PLOD2、PLOD3[7]。PLOD 家族基因的表达水平受多种细胞因子、转录因子和miRNA 种类控制[8]。PLOD3(也称LH3)基因是PLOD 家族成员,它是一种具有赖氨酰羟化酶、胶原半乳糖基转移酶和葡萄糖基转移酶(GGT)活性的多功能酶[9]。细胞外基质中PLOD3 的GGT 酶活性对细胞的生长和活力至关重要[10]。越来越多的证据表明PLOD3 的异常表达与肿瘤的发生发展密切相关,如在肺癌中PLOD3 通过调控STAT3 信号通路,激活RAS-MAP激酶促进肺癌的转移[11]。在脑胶质瘤中,沉默PLOD3 表达通过p53 非依赖性调节p21 途径抑制细胞增殖并诱导G1期阻滞;抑制PLOD3 表达,通过下调包括Snail 和Twist 在内的间充质标志物,降低VEGF 的表达和抑制细胞的迁移和侵袭[12]。PLOD3是早期肝癌诊断的标志物,在体内和体外实验均表明PLOD3 失活可抑制肝癌细胞的生长[13]。DENG等[14]研究通过12 例结肠癌和癌旁样本的PCR 及Western blot 检测结果发现,PLOD3 在结肠癌中呈高表达,并通过TCGA 数据分析发现其与结肠癌不良预后有关,PLOD3 的高表达与免疫调节剂的表达减少和两种促肿瘤途径的活性增强有关,包括上皮间质转化(epithelial-mesenchymaltransition,EMT)中的糖异生和TGF-β 信号传导。WANG 等[15]研究发现PLOD3 在胃癌中上调,促进胃癌细胞增殖,影响胃癌患者预后。因此,推测PLOD3 有可能参与直肠癌的发生发展,也可能是直肠癌治疗的潜在靶点。然而,关于PLOD3 在直肠癌中的表达、生物功能及对预后的影响尚不清楚,本研究旨在探究PLOD3 在直肠癌中的生物学功能及预后价值。

1 材料与方法

1.1 PLOD3 mRNA 在肿瘤组织中差异表达分析采用GEPIA2(TCGA 和GTEx)和TIMER(TCGA)对PLOD3 在肿瘤中与正常对照组织中mRNA 差异表达进行分析。采用GENT2(GEO)对PLOD3 在直肠癌中的表达情况进行验证。GEPIA2 涵盖来自TCGA 和GTEx 数据库的9 736 个肿瘤和8 587 个正常样本的RNA 测序表达数据[16]。本研究通过泛癌分析获得PLOD3 在不同种类癌症中的表达图谱,使用Logrank 和Mantel-Cox 比较来自TCGA 及GTEx 的410 个直肠癌与正常组织中PLOD3 的表达水平,参数设置:P为0.01,fold change 为2。GENT2 包含来自GEO数据库超过68 000个样本,现在提供72种不同组织的基因表达数据[17]。本研究通过泛癌分析模块验证PLOD3 在直肠癌中的表达情况。数据平台选择AffymetrixU133Plus2 和AffymetrixU133A,P为0.01。TIMER 主要用于系统评估不同肿瘤中免疫细胞浸润情况及临床影响,还可以探索肿瘤和正常组织之间的差异基因表达以及基因之间的相关性等[18]。使用DiffExp 模块,使用Wilcoxon 检验评估差异表达的统计学意义。

1.2 PLOD3 在直肠癌中蛋白表达分析 HPA 可以获得来自TCGA 数据库的常见肿瘤的免疫组化图谱[19]。本研究使用HPA 评估正常组织与直肠癌组织中PLOD3的蛋白表达水平。对来自TCGA数据库的599 例肿瘤和正常直肠组织进行分析,抗体选择HPA001236,根据染色强度和数量,将蛋白表达水平分为4个级别:无、<25%、25%~75%和>75%。

1.3 PLOD3 基因表达与直肠癌患者预后的关系使用GEPIA(TCGA 和GTEx)进行PLOD3 在直肠癌中的生存分析,并使用Kaplan-Meier 验证。GEPIA数据库Kaplan-Meier 曲线评估有风险患者的OS 和无病生存期(disease free survival,DFS)。按照中位数分为高、低表达两组,计算风险比(HR)、95%置信区间(CI)和P值。Kaplan-Meier 数据来自TCGA、GEO 和EGA[20]。主要用于发现和验证癌症患者的生物标志物、存活率和预后。本研究使用K-M plotter 数据库确定直肠癌中PLOD3 与OS、DFS 之间的关联。采取单因素分析,按照中位数分为高、低表达两组,显示有风险的病例数、HR、95%CI和P值。P<0.05表示差异具有统计学意义。

1.4 肿瘤免疫细胞浸润分析 使用TIMER 评估PLOD3 在直肠癌中与免疫细胞浸润(B 细胞、CD4+T细胞、CD8+T 细胞、中性粒细胞、巨噬细胞和树突状细胞)的相关性。采用log2 TMP 表示基因表达量,Spearman相关系数和P值自动计算。

1.5 基因组学突变分析 cBioPortal 是一种可以可视化和分析癌症基因组数据的网络数据库[21]。本研究根据cBioPortal数据评估在直肠癌中基因类型、突变和拷贝数变异(CNV),P<0.05 表明差异具有统计学意义。K-M Plot 用于分析在肿瘤突变负荷(TMB)高低组中PLOD3 表达量与预后相关性,参数采取默认设置。

1.6 DNA 启动子甲基化分析 采用UALCAN 分析PLOD3 在直肠癌中的甲基化水平(来自TCGA 数据库的105 个组织样本),通过SurvivalMeth 数据库验证。UALCAN 提供多种来源癌症组学数据(TCGA、MET500、CPTAC 和CBTTC),可以用于评估表观遗传调控基因启动子甲基化表达等[22]。本研究基于TCGA 数据对直肠癌与正常对照组间进行甲基化分析。Beta 值表示甲基化水平,P值自动计算。SurvivalMeth 是一个分析DNA 甲基化与预后关系的工具,其数据来自TCGA、CCLE 和GEO 数据库,包括36 种癌症的13 371 个样本中的81 个DNA 甲基化谱[23]。本研究采用SurvivalMeth 分析评估直肠癌中PLOD3 启动子甲基化情况及其与预后的关系。采用t检验,阈值为0.01。

1.7 PLOD3 基因共表达及基因功能富集分析 本研究使用GeneMANIA(GEO 数据)构建了PLOD3 和共表达基因的基因-基因网络。NetworkAnalyst 构建了PLOD3 和共表达基因的蛋白-蛋白互作网络(PPI)。NetworkAnalyst 是一个集成了组织、细胞特异性PPI网络、基因共表达网络和基因调控网络[24]。GeneMANIA(来源GEO 数据库)是一个用于分析目标基因的遗传和蛋白质相互作用、共表达、途径、共定位和域-蛋白质相似性在线数据库分析工具[25]。参数采取默认设置,Pearson 相关系数和P值自动计算,根据相关系数进行排序,提取前20 最相关共表达基因。该研究使用Metascape 对PLOD3 及其共表达基因进行功能富集分析。Metascape 是一款用于基因注释和基因集富集分析的工具[26]。在本研究中,该工具用于评估PLOD3 及其共表达基因的功能。PPI网络使用mCODE分析,富集系数>1.5,P值设为0.01,P<0.01表示差异具有统计学意义。然后使用DAVID再次进行功能富集分析,DAVID包含一套全面的功能注释工具,用于更好地阐明目标基因的生物学功能[27]。本研究使用DAVID 对PLOD3 及其密切相关的共表达基因进行了GO 和KEGG 通路富集分析。

2 结果

2.1 PLOD3 在直肠癌中异常表达 分别从GEPIA2、UALCAN、GENT2、TIMER 数据库获取PLOD3基因的相关信息。根据数据库信息比较多种肿瘤类型与正常组织中PLOD3 的表达情况。不同数据库结果均显示,与正常组织相比,肿瘤中的PLOD3呈高表达,与正常直肠组织相比,直肠癌中PLOD3表达量显著升高(P<0.05,图1A~C)。GEPIA 结果显示在直肠癌不同病理分期中PLOD3 表达量差异无统计学意义(图1D)。确定PLOD3 在直肠癌中转录水平变化后,本研究使用HPA分析PLOD3在直肠癌与正常组织中蛋白表达情况。结果显示在直肠癌样本中的PLOD3 蛋白呈高表达(图2A、B),在正常直肠组织中PLOD3 蛋白不表达(图2C、D)。以上结果表明,直肠癌中PLOD3 在mRNA 及蛋白水平上均过表达。

图1 PLOD3 mRNA在肿瘤中差异表达Fig.1 Differential expression of PLOD3 mRNA in tumors

图2 人类蛋白质图谱显示PLOD3的免疫组化图像Fig.2 Human Protein Atlas showing immunohistochemical images of PLOD3

2.2 PLOD3对直肠癌预后的评估价值 使用GEPIA和K-M Plot 进行生存分析,评估PLOD3 与直肠癌预后的关系。PLOD3 的OS 曲线显示PLOD3 的高转录水平与直肠癌患者的较短OS 显著相关(P<0.05,图3A、C)。DFS 曲线显示PLOD3 的高转录水平与直肠癌患者的DFS差异无统计学意义(图3B、D)。

图3 PLOD3在直肠癌中的生存分析Fig.3 Survival analysis of PLOD3 in rectal cancer

2.3 直肠癌患者PLOD3 基因的免疫细胞浸润 免疫细胞浸润可以影响直肠癌的预后,本研究使用TIMER 数据库评估了PLOD3 基因与免疫细胞浸润之间的相关性。结果显示PLOD3 与CD8+T 细胞负相关(Cor=-0.261,P=1.92e-3),与CD4+T 细胞正相关(Cor=0.196,P=2.07e-2),而 与B 细 胞(Cor=-0.119,P=1.62e-1)、巨噬细胞(Cor=0.101,P=2.39e-1)、中性粒细胞(Cor=-0.093,P=2.78e-1)及树突状细胞(Cor=-0.125,P=1.41e-1)的相关性差异无统计学意义。结果显示PLOD3 在直肠癌中免疫微环境中有调节肿瘤免疫活性的作用(图4A)。

图4 PLOD3 表达与直肠癌中免疫浸润水平的相关性及PLOD3基因突变分析Fig.4 Correlation between PLOD3 expression and immune infiltration level in rectal cancer and analysis of PLOD3 gene mutation

2.4 直肠癌患者PLOD3 基因频率的改变 使用cBioPortal 数据库分析直肠癌患者中PLOD3 基因突变情况。结果显示直肠癌患者显著性的PLOD3 基因改变(10%),包括扩增、深度缺失、截断突变、错义突变和转录上调(图4B、C)。K-M Plot 生存数据库分析结果显示在肿瘤突变负荷(TMB)高危组中,PLOD3 mRNA 高表达与直肠癌患者较短的OS 显著相关(P<0.05,图4D)。

2.5 PLOD3 在直肠癌中共表达及功能富集分析使用GeneMANIA、NetworkAnalyst 构建PLOD3 及其功能相关共表达基因的网络,探索PLOD3 在直肠癌中的可能机制。结果显示:PLOD1、COLGALT1、PLOD2、COLGALT2、P4HB、POR、FBXO6、TECPR1、GBE1、COL4A2、AL445524.2、HADHA、OGFOD3、EEF1G、TGM2、CPT1A、EGLN2、P4HA1、EGLN3、FAM153A 等基因与PLOD3 的调节功能相关(图5)。使用DAVID、Metascape 评估PLOD3 与其功能相关的前20 个基因的生物学功能,结果显示,前5 个富集项目分别为蛋白质羟基化、胶原蛋白生物合成和修饰酶、赖氨酸降解、细胞修饰氨基酸代谢过程、脂肪酸氧化(图6A、B);构建了由ID 着色的功能富集网络(图6C)。为了进一步研究PLOD3 与直肠癌的关系,课题组构建了PPI 网络并进行了分子复合物检测(mCODE)分析,结果显示PLOD3 功能主要与胶原蛋白生物合成和修饰酶、胶原蛋白的形成、细胞外基质的组成有关(图6D~F)。

图6 直肠癌中PLOD3及其20个共表达基因的富集分析Fig.6 Enrichment analysis of PLOD3 and its co-expressed 20 genes in rectal cancer

2.6 在直肠癌中PLOD3 启动子甲基化分析 使用UALCAN和SurvivalMeth进行数据分析,结果显示在直肠癌患者中PLOD3 启动子甲基化水平较对照组显著降低(P<0.05,图7A、B)。为了进一步分析PLOD3 启动子甲基化对直肠癌患者生存的影响,本研究使用SurvivalMeth 生存分析功能,根据直肠癌患者甲基化中位风险评分分为高危组和低危组,结果显示高危组患者甲基化水平显著降低(P<0.05,图7C),且高危组与较短的OS 显著相关(P<0.05,图7D)。

图7 直肠癌中PLOD3基因的甲基化分析Fig.7 Methylation analysis of PLOD3 gene in rectal cancer

3 讨论

前胶原赖氨酸-2-酮戊二酸-5-双加氧酶(PLODs)是调节赖氨酸羟基化和稳定胶原蛋白的酶家族,PLOD3 基因是PLODs 家族中的一员,除具有与PLOD1、PLOD2 一样的赖氨酰羟化酶、胶原半乳糖基转移酶活性外,还具有葡萄糖基转移酶(GGT)活性[9]。近年来,越来越多的研究表明PLOD3 的异常表达与肿瘤的发生发展密切相关,如肺癌、脑胶质瘤、肝癌、结肠癌、胃癌等。然而,关于PLOD3 在直肠癌中的功能尚不清楚[11-15]。在本研究发现PLOD3 在直肠癌中mRNA 及蛋白表达水平均显著高表达,且PLOD3 表达较高的患者OS 较差。本研究在直肠癌中的这些发现与已报道的PLOD 家族基因在其他肿瘤中的表达趋势相一致。因此,PLOD3基因可能是直肠癌患者的潜在预后生物标志物。

免疫细胞在调节肿瘤细胞行为中发挥重要作用,越来越多的证据支持它们在预测许多癌症类型的结果和治疗效果方面的重要性[28]。HARADA等[29]发现在使用放化疗之前具有更多CD8+T细胞浸润的直肠癌对放化疗更敏感,有更长的DFS 和OS。SCHOLLBACH 等[30]发现在局部晚期直肠癌中,具有较多的CD8+T 淋巴细胞浸润可带来良好的OS。因此,本研究分析了在直肠癌中PLOD3 基因表达水平与各种肿瘤免疫浸润细胞(B 细胞、CD8+T 细胞、CD4+T 细胞、巨噬细胞、中性粒细胞和树突状细胞)的相关性。本研究结果发现,在直肠癌中PLOD3 与CD8+T 免疫浸润细胞呈负相关,提示PLOD3 在调节肿瘤免疫学中起负面作用,因此PLOD3 可能通过调节肿瘤免疫进而影响患者的OS。

从基因组学角度分析,肿瘤是一种由DNA 变异累积而引起的遗传疾病,基因组的改变导致细胞功能致病性变化[31]。肿瘤突变负荷(TMB)指每百万碱基中被检测出的体细胞基因编码错误、碱基替换、基因插入或缺失错误的总数,高度突变的肿瘤被认为含有增加的新抗原负荷,使其具有免疫原性,并对免疫治疗有反应[32]。为了探究PLOD3 在直肠癌发生发展中基因组变化,本研究使用cBioPortal对来自TCGA 的数据进行分析。结果发现直肠癌患者中PLOD3 基因突变率为10%,K-M Plot 结果显示在TMB 高危组中PLOD3 的mRNA 高表达与直肠癌患者较短的OS 显著相关。因此,PLOD3 有可能成为这些高频突变基因组(H-TMB)直肠癌患者的协同治疗靶点。

近年来,很多证据表明表观遗传与肿瘤密切相关,包括:DNA 甲基化、组蛋白修饰、非编码RNA 调控[33]。DNA 甲基化是在基因组CpG 二核苷酸的胞嘧啶5 号碳位共价键上结合一个甲基基团,在基因稳定和基因表达中起重要作用,甲基化能够“关闭”基因的表达,与癌症、衰老等疾病密切相关[34]。在结直肠肿瘤中,甲基化修饰是致癌过程中重要的分子机制[35]。本研究发现PLOD3 在直肠癌患者组织中启动子甲基化水平比正常直肠组织显著降低。高危组患者PLOD3 甲基化水平显著降低,高危组与较短的OS 显著相关。因此,在直肠癌中PLOD3 可能是通过DNA甲基化发挥功能。

以往的研究表明,PLOD 家族成员在其他疾病中的作用机制主要是通过对众多信号通路的调节[36]。在本研究中,为了进一步了解PLOD3 在直肠癌中的生物学功能,我们探索了可能与PLOD3 功能相关的重要基因并进行了GO 和KEGG 功能富集分析。结果显示这些基因主要参与蛋白质羟基化、胶原蛋白生物合成和修饰酶、赖氨酸降解、细胞修饰氨基酸代谢过程、脂肪酸氧化、细胞外基质的组成。胶原蛋白是细胞外基质的重要的成分,为肿瘤细胞提供多种生化信号,与肿瘤的发展、侵袭和转移有关[37]。异常的赖氨酸降解与胶原相关疾病的进展有关,包括癌症和纤维化[38]。PLOD 基因家族通过调节胶原蛋白生物合成与肿瘤转移有关[39]。因此,PLOD3在直肠癌的确切机制仍有待进一步研究。

本研究发现了PLOD3 对直肠癌患者的预后价值。尽管本研究揭示了PLOD3 在直肠癌中的表达模式和潜在的临床和科学意义,但仍存在一定的局限性。第一:本课题组使用的数据来自多个不同的数据库,很难保证不同数据库之间的统一性,课题组无法核实这些数据库中的数据。第二:PLOD3 表达与启动子甲基化的具体机制需要进一步研究。第三:应通过基础实验从细胞和动物水平进一步验证直肠癌中PLOD3 的功能及可能机制,也需要大量的临床数据验证。

综上所述,本研究说明了PLOD3 在直肠癌中具有重要作用,提供了关于PLOD3 在直肠癌中的功能及预后的证据,为直肠癌的诊断、寻找潜在治疗靶点、个体化治疗及预后评估提供参考。

猜你喜欢
甲基化直肠癌数据库
腹腔镜下直肠癌前侧切除术治疗直肠癌的效果观察
数据库
数据库
数据库
数据库
直肠癌术前放疗的研究进展
COXⅠ和COX Ⅲ在结直肠癌组织中的表达及其临床意义
GRP及GRPR在结直肠癌中的表达及意义
鼻咽癌组织中SYK基因启动子区的甲基化分析
胃癌DNA甲基化研究进展