高志壕
四川省巴中市中医院检验科 636600
胰岛素瘤是最常见的功能性胰腺神经内分泌肿瘤(pancreatic neuroendocrine neoplasia,pNEN),起源于胰岛β细胞,表现为大量胰岛素阵发性分泌导致低血糖反复发作,根据典型whipple三联征(反复发作的低血糖症状、发作时血糖<2.8mmol/L、供糖后症状迅速缓解)联合激素水平测定诊断并不难。但胰岛素瘤患者常伴发精神失常、癫痫发作、意识障碍等中枢神经精神症状甚至以此为首发、主要表现,此种患者不仅极易误诊为癫痫、癔症、脑血管病等其他疾病[1],长期的高胰岛素、低血糖状态还会导致智力低下甚至不可逆痴呆[2],严重影响生活质量。目前胰岛素瘤的主流治疗手段是外科手术,大部分胰岛素瘤都是良性肿瘤,但其几乎都有恶变潜能,故而早期发现、治疗是非常重要的。胰岛素瘤的病因及发病机制仍不清楚,推测可能是一个复杂多基因疾病。近年来随着基因芯片及高通量测序等现代生物技术的蓬勃发展,利用生物信息学分析大数据可以从理论上初步揭示许多肿瘤发生发展分子机制。本研究选择GEO数据库中的胰岛素瘤相关基因表达谱芯片数据集,依托生物信息学探讨胰岛素瘤分子机制。
1.1 资料来源 以“insulinoma”为关键词,物种限定为“homo sapiens”,研究类型选择“expression profiling by array”,在基因表达综合数据库(Gene Expression Omnibus,GEO, https://www.ncbi.nlm.nih.gov/geo/)数据库检索,得到由Anguraj Sadanandam等在2016年1月更新的数据集GSE73338。该数据集来源于英国伦敦癌症研究所,采用18.5K human oligo microarrays obtained from the Ohio State University Cancer Center平台,内含97个数据样本,其中17个胰岛素瘤组织、4个正常胰岛组织、63个非功能性神经内分泌肿瘤组织、5个正常胰腺组织、7个已转移的胰腺神经内分泌肿瘤组织、1个未明确分类的功能性胰腺神经内分泌肿瘤组织,剔除非功能性胰腺神经内分泌肿瘤等组别资料,仅分析17例胰岛素瘤及4例正常胰岛对照组织数据。该数据集共包含15 961个基因的表达数据。
1.2 差异表达基因的筛选 利用GEO数据库自带数据分析工具GEO2R(https://www.ncbi.nlm.nih.gov/geo/geo2r/)比较胰岛素瘤患者组与正常胰岛组织基因表达,下载原始数据后按照adj.P.value<0.01 且差异倍数(Fold change,FC)≥4的标准筛选差异表达基因(Differentially expressed genes,DEGs),并绘制火山图分析差异基因分布。
1.3 基因本体论与信号通路分析 利用DAVID(https://david.ncifcrf.gov/)数据库对DEGs进行基因本体(Gene Ontology,GO)功能分析和京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路富集分析(FDR<0.05,P值<0.05认为有统计学意义)。
1.4 蛋白互作网络分析、Hub基因筛选 利用基因、蛋白质相互作用关系String(https://string-db.org/)数据库在线分析DEGs的蛋白质—蛋白质相互作用(Protein-protein interaction,PPI)。借助Cytoscape 3.7.2软件可视化PPI网络图,通过CytoHubba插件的MNC算法获取得分最高的前10个基因(Hub基因)。
2.1 DEGs的筛选结果 本研究选择基因转录谱芯片GSE73338,以校正后Padj<0.01,|log2FC|≥2为筛选标准筛选出胰岛素瘤相关DEGs共319个,其中包括140个上调基因和179个下调基因。然后以logFC为横坐标,以校正后P值的负对数-log10(adj.P.Val)为纵坐标,对DEGs进行可视化,得到火山图(图1)。
图1 胰岛素瘤DEGs的火山图
2.2 GO、KEGG分析 GO分析结果显示,DEGs在生物过程中主要涉及炎症反应、细胞对TNF/IL1反应、细胞增殖负调控、中性粒细胞趋化正调控、细胞迁移的正调控,分子功能主要涉及蛋白质结合,细胞组成主要在细胞表面和细胞外隙。KEGG通路富集分析结果显示,DEGs主要涉及TNF信号通路、细胞因子受体相互作用、NOD样受体信号通路、类风湿关节炎、非洲锥虫病和疟疾。见表1。
2.3 PPI分析、Hub基因结果 DEGs编码蛋白的PPI网络图中(已排除其中孤立的蛋白质,“可信度”为0.4),共包含节点蛋白 314个,边 741条(图2)。
图2 DEGs的PPI网络图
表1 胰岛素瘤中DEGs的GO分析和KEGG分析
依据MNC算法得分前10位基因为白介素-6(Interleukin 6,IL6)、CXC趋化因子配体8(Cysteine X chemokine ligand 8,CXCL8)、白介素-1β(Interleukin 1 beta,IL1β)、β-淀粉样蛋白(Amyloid beta A4 protein, APP)、单核细胞趋化蛋白-1(Monocyte chemotactic protein-1,MCP-1/CCL2)、CD44(Cluster of differentiation 44)、巨噬细胞炎性蛋白-3α[chemokine (C-C motif )ligand 20,CCL20]、CXC趋化因子配体2(Cysteine X chemokine ligand 2,CXCL2)、细胞间黏附分子-1(Intercellular adhesion molecule-1,ICAM1)、血管内皮细胞黏附分子-1(Vascular cell adhesion molecule-1,VCAM1),见图3。
图3 MNC算法中排名前10名的基因
pNEN是源于胰腺多能神经内分泌干细胞的一类肿瘤,依据激素分泌及相关临床症状出现与否,pNEN可分为功能性和无功能性胰腺神经内分泌肿瘤(Functional pNEN,F-pNEN;Non-functional pNEN,NF-pNEN),其中大部分pNEN是NF-pNEN。目前关于pENE的发病机制研究多集中于NF-pNEN,而F-pNEN有着其独特的遗传机制。一项对胰岛素瘤患者进行全外显子测序的研究发现胰岛素瘤常出现正常拷贝数变异(Copy number variation, CNV)和扩增CNV,而CNV正常的胰岛素瘤表现出较高的转录因子YY1(Yin-Yang1,YY1)基因突变率[3]。目前胰岛素瘤的病因目前仍不清楚,本研究通过挖掘胰岛素瘤患者胰岛组织基因芯片数据,有助于胰岛素瘤发病机制研究。
本研究通过GEO2R对GSE73338数据集进行数据挖掘,筛选出319个DEGs,包括140个上调基因和179下调基因。GO分析提示DEGs主要分布在细胞表面、外隙中,在蛋白质结合、炎症反应、细胞对TNF/IL1反应等生物过程中显著富集。KEGG分析显示DEGs主要参与TNF信号通路、细胞因子受体相互作用、NOD样受体信号通路等相关信号通路。接着构建了DEGs编码蛋白间的PPI网络图并利用Cytoscape软件cytohubba插件筛选出10个Hub基因,包括IL6、CXCL8、IL1β、APP、CCL2、CD44、CCL20、CXCL2、ICAM1、VCAM1,但这些基因在胰岛素瘤的发生发展机制中的作用尚未研究。
慢性炎症与许多肿瘤发生、发展密切相关,这主要是因为肿瘤微环境的形成。肿瘤微环境由单核细胞等炎症细胞、多种细胞因子(趋化因子、黏附因子、炎症因子等)和细胞外基质等元素组成,其在瘤细胞形成、肿瘤浸润与转移、耐药性诱导等诸方面发挥重要作用[4]。作为介导炎症反应的重要成员,细胞因子(Cytokine,CK)在免疫调节、炎症应答、细胞增殖生长、肿瘤演进等生理或病理进程中发挥着举重若轻的作用。CK是由多种细胞(主要是单核、巨噬细胞、T细胞等免疫细胞)经丝裂原等刺激后分泌的小分子蛋白物质的统称,从其发挥的生物学功能角度,CK可分为白细胞介素、干扰素、肿瘤坏死因子、集落刺激因子、趋化因子等等。其中的趋化因子根据结构的不同又可以分为C、CC、CXC和CX3C四个亚族。白细胞介素-1β/6/8 (IL1β/6/8)在其中是比较重要的促炎细胞因子。IL1β是白介素-1家族中的一员,主要是由单核细胞产生,在大多数肿瘤(乳腺癌、结肠癌、黑色素瘤、肺癌等)中表达上调,通过激活MAPK和NF-KB信号转导通路发挥促炎、促肿瘤生长和转移等功能[5]。IL6可由IL1β和肿瘤坏死因子激活,它不仅是TNF信号通路的参与者,同时也在JAK/STAT和MAPK通路活化中起到关键作用,而IL6/STAT3通路对胰腺疾病进展具有调控作用[6]。CXCL8是肿瘤微环境内的显著调节因子,常常被称为IL8,不仅可以直接作用肿瘤细胞使其增生,同时还参与肿瘤血管生成、阻滞细胞凋亡、促细胞间及细胞和基质间黏附等促进肿瘤发生发展甚至转移[7]。研究发现CXCL8在结直肠癌、黑色素瘤、甲状腺癌等肿瘤中高表达,同时还能预示胰腺癌患者预后[8]。简而言之,IL1β、IL6/8在肿瘤组织中的表达水平明显高于正常组织,这与肿瘤的分期和浸润转移程度相关。而CCL2和CCL20都是趋化因子CC亚族中的成员,其中CCL2通过结合CC类趋化因子受体2募集单核细胞、巨噬细胞和T淋巴细胞,从而参与炎症和肿瘤的发生发展。已有研究表明CCL2在乳腺癌、结肠癌、前列腺癌、胰腺癌等肿瘤中高表达,且与肿瘤分级、转移及浸润程度密切相关[9]。CCL20,它是通过结合细胞表面的CCR6发挥信号传导作用。Rubie C等检测慢性胰腺炎、胰腺囊腺瘤、胰腺癌组织中CCL20的表达情况,结果发现CCL20在胰腺癌中显著高表达[10]。本研究中发现在胰岛素瘤组织中IL1β、IL6/8、CCL2和CCL20表达水平显著下调,这可能是因为纳入的标本几乎都是良性胰岛素瘤组织。
APP是一种具有多种生物学功能的跨膜蛋白,除了因酶活性障碍导致β-淀粉样蛋白在大脑中过度沉积促使阿尔兹海默症的发生,研究证明它也能介导细胞间或细胞与基质间的粘连作用。已有研究发现APP在胰腺癌细胞及其细胞上清中高表达[11]。ICAM1和VCAM1都是比较重要的细胞黏附因子,隶属于免疫球蛋白超家族的成员,可以通过介导肿瘤细胞与细胞外基质的黏附促进肿瘤细胞侵袭和转移。正常情况下在血管内皮表达量很低,而在肿瘤细胞中呈现高表达[12-13]。CD44有标准型CD44s和变异型CD44v两种形式,前者主要在造血细胞、基质细胞中表达,后者在上皮和肿瘤细胞中表达。CD44通过与透明质酸结合促进细胞间及细胞与基质黏附,研究表明CD44与肿瘤发生、侵袭及转移密切相关[14]。CD44、APP、ICAM1和VCAM1基因均参与细胞间或细胞与基质间的黏附过程,但其可能在胰岛素瘤发生发展甚至恶变进程中发挥重要的作用,具体作用机制还需进一步验证。
查阅PubMed等相关数据库,截至2021年1月12日,对GSE73338基因芯片进行数据挖掘的文献有2篇,1篇来自中山大学第一附属医院团队[15],他们分别对WHO不同分级的pNEN、良恶性的pNEN、转移与否的pNEN和伴随MEN1基因突变与否的pNEN进行了生物信息学分析,主要是探讨pNEN的分期分级、侵袭和转移背后的分子机制。另一篇则来自湖北省十堰市太和医院[16],他们对GSE7338中17个胰岛素瘤和8个胰腺组织进行了差异基因筛选、GO、KEGG分析、Hub基因筛选,共获得了1 632个DEGs(1 117个上调、514个下调),分析发现上调DEGs与胰岛素分泌密切相关,下调差异基因富集于胰腺分泌,同时发现7个Hub基因,分别是:GCG、GCGR、PLCB1、 CaSR、 F2R 、GRM1和GRM5。该研究所得差异基因数量众多,富集分析,Hub基因筛选和本研究结果不一致,主要是因为它纳入的8个胰腺组织包含本研究的3个正常胰岛对照,对照不同,研究结果自然有差异。本研究可与之互为补充,从而更好地理解胰岛素瘤的发生机制。
综上,本研究通过生物信息学对GEO数据库中胰岛素瘤相关基因数据集进行挖掘,筛选出319个DEGs并对它们进行GO、KEGG和PPI分析,最终筛选出10个核心基因,但要想明确它们在胰岛素瘤发病机制中的作用还需要临床资料结合免疫组化等实验的进一步验证。