赵冉,冯圣鋆,宣成昊,兰蓓
天津医科大学基础医学院生物化学与分子生物学系,天津300070
肺癌是全球最常见的恶性肿瘤之一,在我国肺癌发病率和死亡率位居首位[1]。根据组织学特征,肺癌可以分为非小细胞肺癌(NSCLC)和小细胞肺癌(SCLC)两大类,前者约占所有病例的85%。NSCLC可以进一步细分为肺腺癌、鳞状细胞癌和大细胞癌三种亚型,其中肺腺癌是最常见的组织学亚型。肺腺癌的发病率近年来显著升高,并在全球范围内继续上升[2]。尽管已经在新的筛查技术、手术方法、新的化疗和放疗方面取得了重大进展,但肺腺癌患者的预后仍然不容乐观[3],因此发掘肺腺癌有效的药物靶点以提高患者的生存率具有十分重要的临床意义。扩展突触标记蛋白(extended synaptotagmins,E-SYTS)是一类与突触标记素相似的具有SMP 和C2 结构域的膜蛋白,ESYT 家族有3 名成员,ESYT1 有5个C2 结构域,ESYT2 和ESYT3 有3个C2结构域[4]。C2 结构域的主要功能是形成内质网—质膜连接,参与两个细胞器之间的磷脂交换[5]。有文献报道,小鼠胚胎成纤维细胞中ESYT3 基因的缺失会抑制细胞的迁移能力[6]。但关于ESYT3 在肺腺癌中的作用未见报道,本研究利用TCGA 数据库数据分析ESYT3 基因在肺腺癌组织与正常组织中的表达差异及其临床意义,并探讨其分子作用机制,为其作为肺腺癌的诊断和治疗靶点奠定理论基础。
1.1 数据来源 肺腺癌患者RNA FPKM 数据集及临床资料数据均来自于TCGA 数据库LUAD 项目,相同患者如有多个肿瘤样本,则保留原位癌数据,最后513 例肺腺癌患者数据列入本次分析,其中包括57例肺腺癌患者的正常肺组织。
1.2 肺腺癌组织和正常肺组织中ESYT3 RNA 的表达量、ESYT3 DNA 甲基化水平观察 收集并比较TCGA 数据库LUAD 项目中肺腺癌组织和正常肺组织中ESYT3 RNA 的表达量、ESYT3 DNA 甲基化水平,其中ESYT3 DNA甲基化数据来自UALCAN 数据库(http://ualcan. path. uab. edu/index. html),数据共有505 例,包括32 例正常肺组织样本、473 例肺腺癌组织样本。
1.3 肺腺癌患者ESYT3 RNA 高、低表达分组及其与临床病理特征的关系分析 以肺腺癌组织中ESYT3 RNA 表达量中位值为界,将肺腺癌患者分为低表达组和高表达组,以ESYT3 RNA 高、低表达为因变量,以肺腺癌患者性别、年龄、临床分期和TMN分期为自变量,利用R 语言的“glm”函数进行单因素Logistic 回归,分析ESYT3 RNA 高、低表达与肺腺癌患者临床病理特征的关系(年龄、临床分期和T分期、M分期、N分期资料中,各有19、8、3、144、12名患者信息缺失,未纳入分析)。
1.4 ESYT3 RNA 高、低表达组患者中位生存期分析 根据患者的生存时间,通过R 语言“survival”包进行Kaplan-Meier 生存分析,计算并比较两组患者的中位生存期。
1.5 ESYT3 RNA 高、低表达组患者的差异表达基因筛选、GO 生物过程(Gene Ontology:Biological Process)和KEGG(Kyoto Encyclopedia of Genes and Genomes)信号通路富集分析 通过R 语言“limma”包,设定差异倍数为1.5 倍、q<0.05,筛选ESYT3 RNA高、低表达组患者的差异表达基因。将低表达组中的差异表达基因提交https://metascape. org/gp/index.html网站,对差异基因进行GO生物过程富集分析和KEGG信号通路富集分析。
1.6 ESYT3 基因与KEGG 细胞周期信号通路基因的相关性分析 提取参与KEGG 细胞周期信号通路相关的126个基因,分析126个基因在ESYT3 RNA高、低表达组患者的差异表达情况。通过“ggstatsplot”R 包中的“ggscatterstats”函数(参数type=“pearson”),利用Pearson 相关性分析ESYT3 与上述差异表达基因的相关性,其中|r|≥0.8 时表示目的基因与潜在靶基因具有高度以上相关性,0.5≤|r|<0.8 时为中度相关,0.3≤|r|<0.5时为低度相关。
1.7 统计学方法 利用R 语言R-4.0.3 对数据整理和统计学分析,计量资料数据呈非正态分布,以中位数[M(P25,P75)]表示,比较用Wilcoxon 秩和检验。相关性分析用Pearson 相关分析法。P<0.05 为差异有统计学意义。
2.1 肺腺癌组织和正常肺组织中ESYT3 RNA 的表达量、ESYT3 DNA 甲基化水平比较 肺腺癌组织中ESYT3 RNA 的表达量为1.335(0.704,2.546),正常肺组织中ESYT3 RNA 的表达量为3.953(2.986,4.737),两者相比,P<0.001。肺腺癌组织中ESYT3 DNA 甲基化水平为0.246(0.186,0.309),正常肺组织 中ESYT3 DNA 甲 基 化 水 平 为0.219(0.177,0.282),两者相比,P<0.01。
2.2 ESYT3 RNA 高、低表达与肺腺癌患者临床病理特征的关系 以肺腺癌组织中ESYT3 RNA 表达量中位值(MEDIA=1.33)为界进行分组,其中低表达组257 例、高表达组256 例。低表达组257 例患者中,男134 例、女123 例,年龄>65 岁124 例、≤65 岁124例,临床分期Stage Ⅰ期120例、Stage Ⅱ期67例、Stage Ⅲ期50例、Stage Ⅳ期17例,T分期T1期67例、T2 期146 例、T3 期29 例、T4 期13 例,M 分期M0 期179例、M1期16例,N 分期N0期154例、N1期56例、N2 期42 例、N3 期2 例;高表达组256 例患者中,男103 例、女153 例,年龄>65 岁132 例、≤65 岁114 例,临床分期Stage Ⅰ期154 例、Stage Ⅱ期54 例、StageⅢ期34例、Stage Ⅳ期9例,T 分期T1期101例、T2期130 例、T3 期18 例、T4 期6 例,M 分期M0 期165 例、M1 期9 例,N 分期N0 期176 例、N1 期39 例、N2 期32例、N3 期0 例。单因素Logistic 回归分析结果显示,ESYT3 RNA 高、低表达与肺腺癌患者性别、临床分期和T 分期有关(P均<0.05),而与年龄、M 分期和N分期无关(P均>0.05)。
2.3 ESYT3 RNA 高、低表达组患者中位生存期比较 低表达组肺腺癌患者中位生存期为2.86 年,高表达组肺腺癌患者中位生存期为4.47 年,两组相比,P<0.01。
2.4 ESYT3 RNA 高、低表达组患者的差异表达基因筛选、GO 生物过程和KEGG 信号通路富集分析结果 共筛选出ESYT3 RNA 高、低表达组患者的差异表达基因1 396个,其中656个基因在ESYT3低表达组中表达上调,740个基因在ESYT3 低表达组中表达下调。GO生物学过程富集分析结果显示,表达上调的基因主要富集在有丝分裂细胞周期、细胞分裂、有丝分裂细胞周期检查点、DNA 复制等代谢通路,表达下调的基因主要富集在MHCⅡ类蛋白复合物组装、白细胞介导免疫和B 细胞介导免疫等通路。KEGG 信号通路富集分析结果显示,表达上调的基因主要富集在细胞周期、细胞衰老、P53 信号通路等,表达下调的基因主要富集在哮喘、类风湿关节炎等信号通路。
2.5 ESYT3 基因与KEGG 细胞周期信号通路基因的相关性 KEGG细胞周期信号通路基因共126个,其 中BUB1、BUB1B、CCNA2、CCNB1、CCNB2、CCNE1、CDC20、CDC25A、CDC25C、CDC45、CDC6、CDK1、CDK6、CDKN2A、CHEK1、DBF4、ESPL1、MAD2L1、MCM2、MCM4、ORC1、ORC6、PKMYT1、PLK1、PTTG1、TTK 共26个基因在ESYT3 高低表达组中差异表达。Pearson 相关性分析结果显示,ESYT3 与CCNA2、MAD2L1、PLK13个基因表达呈中度负相关关系,与BUB1、BUB1B、CCNB1、CCNB2、CCNE1、CDC20、CDC25A、CDC25C、CDC45、CDC6、CDK1、CDK6、CHEK1、DBF4、ESPL1、MCM2、MCM4、ORC1、ORC6、PKMYT1、PPTG1 和TTK 共22个基因表达具有低度的负相关关系,与CDKN2A 基因表达无相关性。
ESYT3蛋白是E-Syt蛋白亚家族中的一员,含有多个C2结构域,在脂质稳态和细胞内信号传导中起着重要作用[7]。另有研究[8]表明,敲除小鼠下丘脑POMC 神经元中的ESYT3可抑制小鼠食欲并促进产热,说明ESYT3 在营养性肥胖的形成中也发挥着重要作用。然而,关于ESYT3 在肺腺癌中的作用未见报道。
本研究通过对TCGA 数据库分析发现,肺腺癌组织中ESYT3 RNA 表达量低于正常组织。DNA甲基化是一种化学修饰,在表观遗传基因表达[9]、X 染色体失活[10]和基因组稳定性[11]的调控中起着重要作用,异常DNA 甲基化模式的形成是癌细胞的标志[12]。我们通过对ESYT3 DNA 甲基化水平分析发现,肺腺癌组织中ESYT3 DNA 甲基化水平增加,提示我们肺腺癌中ESYT3 DNA 甲基化水平增加有可能是ESYT3 基因表达水平减少的原因之一。进一步分析ESYT3 的表达与临床病理参数的关系,单因素Logistic 结果显示ESYT3 表达与患者性别、临床分期和T 分期有关,而与年龄、M 分期和N 分期无关;分析ESYT3 表达水平对患者预后生存的影响,发现ESYT3 低表达患者预后较差,提示ESYT3 可能发挥了抑制肺腺癌发生发展的作用。
深入分析ESYT3 潜在的分子作用机制,我们筛选出ESYT3 高、低表达组的差异表达基因,并对这些差异表达基因进行GO 生物过程和KEGG 信号通路富集分析,结果显示在ESYT3 低表达组中表达上调基因主要富集在细胞周期等癌症相关通路。细胞周期进展异常是肿瘤发生的基本机制之一,细胞纺锤体检查点的丢失、严重的染色体分离缺陷[13]、细胞周期相关的基因的缺失、点突变以及基因表达水平的变化均与肿瘤发生有关[14]。细胞周期抑制剂的药物也已经开始应用于相关癌症的治疗[15]。GO 和KEGG 富集分析结果都显示,ESYT3 差异表达基因集中在细胞周期信号通路。为了进一步分析ESYT3通过细胞周期信号通路调控肺腺癌进展可能的机制,寻找ESYT3 潜在的靶基因,我们提取细胞周期信号通路相关的126个基因,分析后发现其中有26个基因在ESYT3 高表达组和低表达组中差异表达。对以上26个基因表达与ESYT3 基因表达进行Pearson 相关性分析,发现CCNA2、MAD2L1、PLK1 等基因的表达与ESYT3 呈负相关,提示ESYT3 有可能通过调控以上基因表达,进而对肺腺癌细胞周期的发挥调控作用。
综上所述,ESYT3基因在肺腺癌组织中低表达,ESYT3 表达水平与患者性别、临床分期、T 分期、生存期有关。ESYT3 低表达影响细胞周期等信号通路,并与CCNA2、MAD2L1、PLK1 等基因的表达呈负相关关系,ESYT3 有可能通过调节CCNA2、MAD2L1和PLK1 等基因的表达来参与肺腺癌细胞周期的调控,有望成为肺腺癌患者早期诊断和治疗的新靶点和生物学标志物。