李书珍, 曹雅杰, 耿海营, 蔡曾晓瑞,代春美, 温有锋, 李 宁,
(1.锦州医科大学基础医学院生物化学与分子生物学教研室,辽宁 锦州 121000;2.锦州医科大学药学院,辽宁 锦州 121000;3.锦州医科大学基础医学院人体解剖学教研室,辽宁 锦州 121000;4.辽宁省人类表型组学重点研究实验室,辽宁 锦州 121000)
肺腺癌(lung adenocarcinoma,LUAD)是非小细胞肺癌最常见的组织学亚型,具有高度恶性和侵袭性,死亡率高,预后很差,缺乏有效的预后标志物[1-2]。透明质酸介导的细胞游走受体(hyaluronan-mediated motility receptor,HMMR)是一种进化上保守的有丝分裂和减数分裂调节因子[3]。研究[4-5]显示:HMMR参与调节细胞迁移、肿瘤发生、伤口愈合和炎症等多种表型,特别是HMMR 与肺癌的发生发展有密切关联。HCG18/miR-34a-5p/HMMR 调控轴加速了LUAD 疾病的进展,沉默HMMR 能够抑制肺癌A549 细胞的G2/M期转换、增殖和上皮间质转化[6-7]。HMMR 表达是大细胞肺癌患者生存有价值的预测指标[8]。然而,HMMR 表达对LUAD 患者预后的影响以及其与患者各临床病理参数的相关性报道较少,其在LUAD 中的临床价值和意义尚未完全阐明。本研究采用生物信息学方法,整合多个数据库,探讨HMMR 在LUAD组织中的表达,并阐明HMMR mRNA 表达水平与LUAD 患者临床病理参数和预后的关系。初步探讨HMMR 高表达在LUAD组织中可能影响的通路及其表达与TP53 基因突变状态的关系,为HMMR 在LUAD组织中功能和机制研究提供依据。
1.1 基因表达汇编(Gene Expression Ommibus,GEO)数据库分析GEO是高通量微阵列和二代测序数据集的国际公共储存数据库,收录了大量肿瘤和非肿瘤样本基因表达数据集[9]。本文作者从GEO 数据库(https://www.ncbi.nlm.nih.gov/geo/)下 载GSE6044 和GSE118370 基因芯片的Raw数据。采用R包affyPLM 对芯片数据进行回归计算并绘制相对对数表达(relative log expression,RLE)箱线图。GSE6044 包含5个正常肺组织和10个LUAD组织;GSE118370包含6个癌旁肺组织和6个LUAD组织。采用RMA 法校正Raw 数据并输出到表格,多个探针对应1个基因时取平均值,采用k-Nearest Neighbor 法寻找和填充缺失值,最终整理为基因表达矩阵。采用t检验评估HMMR在LUAD组织和正常肺组织中的表达差异。
1.2 肿瘤基因组图谱(The Cancer Genome Atlas,TCGA)数据库分析TCGA数据库是迄今为止世界上最大的癌症基因组学数据库,包含了基因组序列、表达、甲基化和拷贝数变异等多种类型数 据[10]。本文作者从TCGA数据库(http://cancergenome.nih.gov/)下载LUAD mRNA表达数据(HTSeq-FPKM)和相应的临床数据,共59个正常肺组织样本和535个LUAD组织样本。采用Perl 语言将表达数据整理为基因表达矩阵并采用limma R 包标准化,然后提取患者的生存状态、年龄、性别、TNM分期、T分期、N分期和M分期等临床信息。删除临床信息不完整的样本,其余337个LUAD组织样本用于后续分析。采用Wilcoxon signed rank检验分析HMMR 在LUAD组织和癌旁组织中的表达差异。Wilcoxon 检验分析HMMR 在不同临床病理参数患者中的表达差异。通过逻辑回归的方法探讨HMMR mRNA 表达水平与患者临床病理参数的相关性。采用survivalR包进行单因素和多因素Cox分析,评估患者年龄、性别、TNM分期、T分期、N分期、M分期与LUAD 患者预后的关系[11-13]。将单因素分析中结果有统计学意义的变量纳入多因素Cox 回归分析。为探讨HMMR 异常表达所涉及的通路,本研究进行了GSEA 富集分析。根据HMMR 表达量的中位值将癌症样本分为高表达显型和低表达显型。基因表达矩阵和表型文件作为输入文件,c2cp.kegg.v7.2.symbols.gmt 作为参考基因集,采用gsea-3.0.jar 软件进行GSEA 富集分析。
1.3 人类蛋白图谱(Human Protein Atlas,HPA)数据库和GEPIA2 数据库采用HPA(http://v13.proteinatlas.org/)数据库探讨HMMR 蛋白在LUAD组织和正常肺组织中的表达水平。在HPA 数据库中,以“HMMR” 为检索词,选择 “lung”,选择抗体(HPA043926),分析HMMR 蛋白在正常肺组织(患者ID: 2417)和LUAD组织(患者ID:1847)中的表达水平。通过GEPIA2(http://gepia2.cancer-pku.cn/)数据库分析HMMR 表达对LUAD 患者总生存期(overall survival,OS)和无病生存期(diseasefree survival,DFS)的影响[14]。在GEPIA2 主 界面搜索框内输入基因“HMMR”,选择 “Survival Analysis”模块,肿瘤类型设置为“LUAD”,Group Cutoff设置为“Median”,下载“Overall survival”和“Disease Free Survival”结果。
1.4 UALCAN和STRNG数据库采 用UALCAN[15](http://ualcan.path.uab.edu/)数据库探讨LUAD组织中HMMR mRNA表达与TP53基因突变的关系。为了进一步探讨HMMR与p53 通路中蛋白的可能作用关系,从PathCards(https://pathcards.genecards.org/)数据库下载p53通路中126个基因。打开STRING数据库(https://string-db.org/)主页,选择“Multiple proteins” 和“Homo sapiens”,在“list of Names”输入框输入HMMR和上述126个基因,然后预测并可视化相应蛋白间的相互作用。
1.5 统计学分析本研究中GEO 和TCGA数据库的原始数据采用GraphPad Prism软件(version 8.0.1)和R 软件(version 3.6.1)分析。GSE6044和GSE118370 芯片中HMMR 的表达水平符合正态分布,组间比较采用t检验;TCGA 数据库中,LUAD组织样本中HMMR 表达水平分布不符合正态分布,采用Wilcoxon Signed Rank 检验(两组间比较)或Kruskal-Wallis 检 验(多组间比较)。HMMR 表达与患者临床病理参数之间的关系采用逻辑回归分析。采用单因素和多因素Cox分析评估HMMR 是否可以作为LUAD 的独立预后因子。以P<0.05 为差异有统计学意义。
2.1 LUAD组织和正常肺组织中HMMR mRNA和蛋白表达水平箱线图结果显示:每个样本的RLE 中位值处于同一基线并位于 “0” 附近,说明芯片质量合格,可以用于后续分析,见图1。GEO数据库结果分析结果显示:LUAD组织中HMMR mRNA 表达水平高于正常组织(GSE6044,P<0.01;GSE118370,P<0.05),见图2。在TCGA数据库LUAD组织中HMMR mRNA 表达水平高于癌旁组织(P<0.01)。免疫组织化学染色结果显示:在LUAD组织中HMMR 表达呈阳性,染色程度为 “低”,正常肺组织中未检测到HMMR,呈阴性,见图3。表明HMMR 在LUAD组织中的表达水平高于正常肺组织。
图1 基因芯片GSE6044(A)和GSE118370(B)的相对对数表达箱线图Fig.1 Box diagrams of relative log expression of GSE6044(A) and GSE118370(B)
图2 正常组织和LUAD组织中HMMR mRNA 表达水平Fig.2 Expression levels of HMMR mRNA in normal tissue and LUAD tissue
图3 免疫组织化学法检测正常肺组织和LUAD组织中HMMR 蛋白表达(Bar=100 μm)Fig.3 Expressions of HMMR protein in normal lung tissue and LUAD tissue detected by immunohistochemistry(Bar=100 μm)
2.2 HMMR 的生存分析和临床病理参数相关性分析GEPIA2 数据库分析结果表明: HMMR mRNA 表达水平高的LUAD 患者OS(P<0.01,见 图4A)和DFS 较 短(P<0.01,见 图4B)。Wilcoxon 检验和Kruskal-Wallis 检验分析结果表明:HMMR mRNA 表达分别在不同的T分期(T1、T2、T3 和T4)、N分 期(YesvsNo)、M分 期(M0vsM1)、TNM分 期(stage Ⅰ、stage Ⅱ、stage Ⅲ和stageⅣ)和性别(FemalevsMale)患者中比较差异均有统计学意义(P<0.05),见图5。逻辑回归分析结果显示: HMMR mRNA 表达与T分期、N分期和TNM分期有关(P<0.05),见表1。
图5 TCGA 数据库中HMMR 表达与LUAD 患者临床病理参数的相关性Fig.5 Correlations between expression of HMMR and clinicopathological parameters of LUAD patients in TCGA database
表1 HMMR 表达与患者临床病理参数的相关性Tab.1 Correlations between expression of HMMR and clinicopathological parameters of patients
图4 GEPIA2 数据库中HMMR 表达与LUAD 患者生存时间的关系Fig.4 Relationship between expression of HMMR and survival time of LUAD patients in GEPIA2 database
2.3 独立预后分析单因素Cox分析结果表明:T分期、N分期、TNM分期和HMMR mRNA表达均与LUAD 患者预后有关联(P<0.05)。多因素Cox分析结果表明: TNM分期和HMMR mRNA 的表达与LUAD 患者的预后有关联(P<0.05)。见表2。
表2 TCGA 数据库中LUAD 患者的OS 与临床病理参数的关系Tab.2 Associations between OS and clinicopathologic parameters of LUAD patients in TCGA datatbase
2.4 HMMR 高表达富集的通路GSEA 富集分析结果显示:在LUAD组织中高表达的HMMR 显著富集在细胞周期、DNA 复制、同源重组、p53 信号通路、膀胱癌、小细胞肺癌和泛素化介导的蛋白水解等通路[NominalP<0.05,且错误发现率(false discovery rate,FDR)<0.05]。见图6。
图6 HMMR 的基因集富集分析Fig.6 Gene set enrichment analysis on HMMR
2.5 HMMR 与p53 通路GSEA 富集分析结果显示: 在LUAD 中p53 通路显著富集在HMMRmRNA 高表达显型。采用UALCAN 数据库分析HMMR mRNA 表达与TP53 基因的突变相关性结果显示:在肺腺癌组织中,HMMR mRNA 表达与TP53 突变相关(P<0.01),见图7A。STRING数据库分析结果显示:这些蛋白质之间可能存在密切的调控作用,见图7B。
图7 HMMR 和p53信号通路的关系Fig.7 Relationship of HMMR and p53 signaling pathways
HMMR最初是作为透明质酸受体被发现的,后来其对细胞周期的调控功能逐渐被发现,HMMR可增强Polo样激酶1(Polo-like kinase 1,PLK1)和Aurora-A 激酶(Auroka kinase A)等激酶活性,调节纺锤体的组装和定位[3,16-17]。HMMR 蛋白可分布于细胞膜、细胞质和细胞核,细胞膜上的HMMR 蛋白与其受体CD44 结合,激活下游的ERK1/2,并与之结合形成复合体,促进乳腺癌细胞的侵袭和运动[17-18]。在细胞胞质中,其N 端结构域可以直接与微管结合,调控纺锤体的正确定位,磷酸化后出现核定位,并可能有助于TPX2蛋白的核运输[19]。研究[4,16,20]显示:HMMR 在伤口愈合和神经发育中起重要作用,可以维持胶质母细胞瘤干细胞的干细胞样特性和致瘤性。HMMR 在多种癌症患者中表达上调,如乳腺癌[21]、急慢性髓系白血病[22]、胃癌、胰腺癌[24]、肝癌[25]和非小细胞肺癌[26]等,并与疾病进展和不良预后有关联。研究[27]显示:在新生儿细支气管上皮细胞中,HMMR 表达与肺空气含量呈负相关关系。Hyaluronan-CD44-HMMR 信号轴在肺癌中表达显著上调,并促进肺癌细胞的增殖和生存[6,28]。
本研究采用生物信息学的方法,探讨了HMMR 在LUAD组织中的表达及其临床意义。本研究结果表明:在LUAD组织中HMMR mRNA 和蛋白表达水平明显高于正常肺组织和癌旁组织,并且mRNA 表达水平高的LUAD患者OS和DFS 较短,说明HMMR 在LUAD的发生发展中起重要作用。回归分析结果表明:HMMR mRNA 表达与LUAD 患者的TNM分期、T分期和N分期有关联。单因素分析结果表明:TNM分期、T分期、N分期和HMMR mRNA 表达水平与LUAD 患者的预后有关联;多因素分析结果表明:具有较高HMMR mRNA表达的患者预后更差,且可以作为独立的预后指标评估LUAD 患者的预后。有研究[29]显示:HMMR 是乳头肌浸润性膀胱癌的独立预后指标并与预后不良有关,这与本研究结论一致。为了探讨LUAD组织中HMMR 高表达可能影响的通路,本文作者进行GSEA 富集分析的结果显示:细胞周期、DNA 复制、同源重组、p53信号通路、膀胱癌、胰腺癌、小细胞肺癌和泛素化介导的蛋白水解等通路显著富集在HMMR 高表达显型。这说明异常表达的HMMR 或许通过上述通路影响LUAD 的进展。本文作者采用UALCAN 数据库探讨了HMMR mRNA 表达和TP53基因突变的关系[15]。本研究结果显示:HMMR 的表达与TP53突变状态有关联。与非突变的肺腺癌患者比较,TP53 突变的患者HMMR mRNA 表达水平更高。本文作者采用STRING数据库预测了HMMR 和p53 信号通路中蛋白的可能相互关系,结果表明:HMMR 与BRCA1、CHEK1、MAPK1、CSNK1 D、TP53、CSNK1A1 和TNFRSF10B 之间可能有复杂的调控关系。这些相互作用影响LUAD 发展的机制值得进一步研究。
本研究采用生物信息学的方法,整合多个数据库,证明了HMMR 在LUAD组织中呈高表达,阐明了HMMR 表达与LUAD患者临床病理参数的关系,HMMR mRNA 高表达是LUAD 患者的独立预后指标,本研究结果为HMMR 在LUAD中的机制研究提供了理论基础。