田莉,胡月明
唐山中心医院病理科,河北唐山063000
胰腺癌是消化道常见恶性肿瘤,具有侵袭性强、易早期转移、病死率高等特点,患者5年存活率<5%。2018年全球新发胰腺癌病例和死亡病例分别为45.89万人、43.22万人[1];中国癌症中心发布的相关数据显示2015年我国胰腺癌发病率为6.92/10万、死亡率为6.16/10万[2]。目前胰腺癌的干预手段包括手术、化疗、放疗等,但临床疗效欠佳[3]。超过90%的胰腺癌患者会发生KRAS突变,70%的患者会发生TP53错义突变。研究显示,突变型KRAS与p53蛋白之间存在依赖于GTP酶激活蛋白(GAP)的异常剪接和膜定位的通路;TP53通过RNA剪接蛋白hnRNPK介导的通路对GAP异常剪接发挥调节作用,从而促使TP53与KRAS突变协同促癌[4]。近年来,基因组学、蛋白组学及生物信息学的发展极大地促进了恶性肿瘤的分子诊断及分型的进步,亦有利于探索胰腺癌的分子机制和寻找潜在生物学标志。本研究利用公共数据库中的数据和资料,寻找胰腺癌的差异表达基因(DEG),并对DEG进行功能分析和通路富集分析,以期寻找胰腺癌核心基因和潜在药物作用靶点。
1.1 基因芯片数据的来源 通过美国国家生物技术信息中心公共基因芯片(GEO)数据库进行基因芯片筛选。以“pancreatic cancer”为关键词在GEO数据库中检索胰腺癌患者临床标本,检索时间:2000年1月—2021年4月,获得GSE15471[5]、GSE62165[6]两个数据集,剔除重复标本,两个数据集均有胰腺癌组织样本和正常胰腺组织样本,共纳入157例胰腺癌组织样本和52例正常胰腺组织样本。
1.2 DEG的筛选 利用GEO数据库的GEO2R在线工具分析GSE15471、GSE62165,筛选符合条件的DEG。筛选条件:校正后P<0.05;|log FC|>1.5,FC为差异倍数。同时满足以上2个条件的基因为DEG。通过Venny2.1在线工具(https://bioinfogp.cnb.csic.es/tools/venny)对筛选出来的DEG进行映射,找出共同数据,以提高数据的准确性。
1.3 DEG的功能和信号通路富集分析 用在线工具 DAVID(version 6.7,http://david.ncifcrf.gov)进行基因本体(GO)功能分析、京都基因与基因组百科全书(KEGG)通路富集分析,明确DEG在胰腺癌发生中的作用。GO功能分析将DEG功能注释分生物过程、细胞组分和分子功能;KEGG通路富集分析对DEG作用机制和信号通路进行总结。
1.4 蛋白互作网络(PPI)的构建和基因模块分析在 STRING(http://string-db.org)和 Cytoscape(version 3.6.0)软件中绘制关于DEG的PPI网络图,并处理为可视化网络图。用Cytoscape3.6.0生物信息学软件平台的插件MCODE工具对构建的生物学网络进行关联度分析,筛选出核心蛋白质簇和关键节点蛋白。MCODE选择标准:MCODE scores>10,degree cut-off=2,node score cut-off=0.2,Max depth=100,k-score=2。将筛选的核心基因利用cBioPortal网站绘制Kaplan-Meier法生存曲线,以明确核心基因与患者预后的相关性。
2.1 DEG筛选结果 GSE15471数据集纳入78例组织样本,分析得到708个DEG,其中表达上调基因625个、表达下调基因83个;GSE62165数据集纳入131例组织样本,分析得到1 943个DEG,其中表达上调基因1 386个、表达下调基因557个。对两组DEG进行映射,明确548个为共表达基因,其中表达上调基因476个、表达下调基因72个。
2.2 GO功能分析结果 对548个DEG进行GO功能分析,相关数据可分为生物过程、细胞组分、分子功能等三类,筛选P<0.05的结果有38条。生物过程:胶原蛋白分解代谢过程、细胞黏附、胶原纤维组织、细胞外基质分解、内肽酶活性负调节、内胚层细胞分化、骨骼系统开发、免疫应答、白细胞迁移、炎症反应;细胞组分:细胞外间隙、胞外区、蛋白质类细胞外基质、胞外体、内质网腔、基底膜、血小板α颗粒管腔、质膜;分子功能:包括与肝素结合、与胶原结合、丝氨酸型内肽酶活性、与钙离子结合、与整合素绑定、与血小板衍生生长因子结合、与蛋白多糖结合等。
2.3 KEGG通路富集分析结果P<0.05筛选得到的结果有18条。包括ECM受体作用、蛋白质消化吸收、PI3K-Akt信号通路、吞噬体、血小板活化、白细胞经内膜迁移、癌症相关通路、细胞因子-受体相互作用、癌症中的转录失调、胰腺分泌物等。
2.4 PPI的构建和核心基因生存分析结果 构建548个DEG的PPI,有67个属于核心基因,分别属于2个子簇(得分≥10)。子簇A包含30个节点、241条边;子簇B包含37个节点、272条边。其中节点度排名前6的核心基因:FN1(节点度=138)、MMP2(节点度=97)、PTPRC(节点度=80)、ITGAM(节点度=77)、COL1A2(节点度=76)、COL3A1(节点度=71)。见图1。对6个核心基因进行Kaplan-Meier生存分析,根据基因相对表达量中位数将胰腺癌患者划分为高表达组和低表达组。FN1高表达组中位生存时间(19.77个月)短于低表达组(22.80个月),比较差异有统计学意义(P=0.029);MMP2高表达组中位生存时间(11.13个月)短于低表达组(13.13个月),比较差异有统计学意义(P=0.011)。PTPRC、ITGAM、COL1A2、COL3A1高表达组中位生存时间分别为19.87、19.87、19.73、19.77个月,低表达组中位生存时间分别为24.6、22.8、22.0、35.3个月,比较差异均无统计学意义(P均>0.05)。
图1 核心基因的PPI图
近年来,随着DNA、RNA测序技术的发展,对于胰腺癌的分子分型展开了较多的探索,以期开展胰腺癌的精准治疗。COLLISSON等[7]根据临床胰腺癌组织标本和基础实验基因组学分析的结果,将胰腺癌区分为经典型、类间充质型和外分泌样型,对临床和预后具有一定的指导意义。其中经典型的GATA6、KRAS等黏附基因及上皮细胞相关基因多处于高表达状态;类间充质型的TWIST1、CAV1存在异常表达的状态;而外分泌样型的消化酶基因高表达。有研究将胰腺癌患者区分为基底样A型、基底样B型、混合型、典型性A型、典型性B型等5个类型[8]。但可应用于的胰腺癌分子分型及发生、发展的分子机制尚未明确,需要进一步进行探索。
本研究共纳入157例胰腺癌组织和52例正常胰腺组织,进行相关分析后明确了548个DEG,其中大部分呈高表达状态(476个),低表达基因较少(72个)。在548个DEG中有PTPRC、ITGAM、COL1A2、COL3A1、FN1、MMP2共6个核心基因。PTPRC具有编码蛋白质酪氨酸磷酸酶的作用,被公认是T细胞和B细胞抗原受体信号转导的重要调节剂,在多种恶性肿瘤中呈异常表达状态,但其在胰腺癌中的研究较少[9]。ITGAM位于染色体16p11.2,编码白细胞黏附分子β2,具有介导体内细胞向炎症局部迁移和聚集的作用,亦与肿瘤细胞的早期侵袭和转移具有相关性。研究表明,处于异常表达状态的ITGAM对于调控髓源性免疫细胞迁移到肿瘤微环境具有重要作用,影响肿瘤患者的整体生存期和预后[10-12]。COL1A2、COL3A1属于胶原蛋白基因家族,其家族构成了细胞外基质的主要成分,在细胞黏附、固定、迁移中具有重要作用,在胰腺癌的转移和侵袭中亦具有重要作用[13]。Ⅰ型胶原蛋白是细胞外基质中最丰富的胶原蛋白,根据α1(Ⅰ)链和α2(Ⅰ)链构成的不同可分为两个亚型。COL1A2编码Ⅰ型胶原的α2(Ⅰ)链,在乳腺癌、头颈部癌、结直肠癌、胰腺癌等恶性肿瘤中异常表达[14]。研究发现,COL1A2通过与microRNA相互作用,可直接在胰腺癌细胞增殖、迁移、侵袭和体内异种移植进程中发挥作用[15]。一项临床试验比较了胰腺癌患者、胰腺良性病变患者和健康人群血清COL6A3水平,结果发现胰腺癌患者的COL6A3蛋白水平显著升高,高COL6A3血清水平与神经周浸润、吸烟等因素相关,并证明循环COL6A3在胰腺癌诊断中有潜在临床价值[16]。以上研究均显示PTPRC、ITGAM、COL1A2、COL3A1参与各种肿瘤的发生发展;但本研究显示PTPRC、ITGAM、COL1A2、COL3A1与生存时间无关。考虑以下原因:上述基因与胰腺癌的发生发展具有相关性,但胰腺癌发生发展由多因素引起,上述基因与生存时间无必然的因果关系;进行Kaplan-Meier生存分析,上述基因高表达组和低表达组之间的生存时间亦存在不同,仅表现在统计学上无差异,可考虑进一步对肿瘤分期、性别、年龄等因素进行分层分析,但因局限于数据来源于公共数据库,难以在本文中开展探索;上述相关研究多从细胞和动物实验层面开展,具体在临床病例中亦存在差异。
本研究对筛选出来的6个核心基因进行生存相关的Kaplan-Meier分析,结果显示FN1和MMP2的高表达与胰腺癌患者的预后不良相关。FN1是一种以二聚体或者多聚体的形式存在于细胞表明或细胞外基质中的糖蛋白,介导细胞与细胞外基质的相互作用,在细胞黏附、迁移、生长和分化中起重要作用[17-18]。FN1可通过与整合素受体 α5β1结合激活PI3K/Akt信号通路,在食管癌、鼻咽癌、卵巢癌等多种肿瘤中具有促进细胞增殖和迁移的作用[19]。研究发现,65.7%的胰腺癌患者间质细胞中FN1蛋白表达升高,FN1阳性的患者存活率明显降低[20]。研究表明,FN1高表达与吉西他滨干预胰腺癌的耐药性相关,肿瘤相关性巨噬细胞能够分泌携带FN1蛋白的囊泡,FN1通过ERK信号通路引起胰腺癌对吉西他滨的耐药,采用FN1抑制剂可显著逆转吉西他滨的耐药[21]。FN1在胰腺癌中处于异常表达状态[22],本研究亦发现FN1高表达与患者预后不良具有相关性。此外,MMP是一类具有裂解细胞外基质底物能力的内源性蛋白水解酶,具有调节细胞黏附性及促进微血管新生的作用,参与癌细胞的迁移、侵袭等病理过程,可分为MMP1、MMP2、MMP9、MMP11等20多个亚型[23-24]。MMP-2在胰腺癌组织中高表达,与胰腺癌患者术前血清CA19-9水平升高、组织学分级差淋巴结转移神经周浸润及远处转移有关[25]。本研究亦发现,MMP2高表达组的中位生存时间短于低表达组。
综上所述,PTPRC、ITGAM、COL1A2、COL3A1、FN1、MMP2参与胰腺癌的发生、侵袭和转移的过程,有望成为胰腺癌治疗的潜在靶点。本研究为胰腺癌的精准治疗提供了一定的思路和方向,但上述结果尚需通过临床和基础实验进行验证。