基于GEO数据库探索成釉细胞瘤与牙源性角化囊肿间差异基因

2020-11-27 02:37兰天俊陈之锋
口腔医学 2020年11期
关键词:角化胞外基质差异基因

兰天俊,刘 鑫,陈之锋

成釉细胞瘤(ameloblastoma, AM)是一种口腔颌面部常见的牙源性良性颌骨肿瘤,来源于釉质器或者牙板上皮,常常表现为初期无自觉感觉的缓慢生长,逐渐向周围膨胀,导致颌骨膨大,造成颌面部畸形[1-3]。临床发现成釉细胞瘤具有局部侵袭性、术后高复发率以及偶见远处转移等特点,故又被称为“临界瘤”。牙源性角化囊肿(odontogenic keratocyst, OKC)是一种口腔颌面部常见的牙源性囊肿,来源于原始的牙胚或牙板残余,也是在发病初期无明显症状的缓慢生长,逐渐增大,最终导致一系列症状[3-4]。因其组织表现为不全角化的复层鳞状上皮,并具有浸润性生长和局部复发的生物学行为,曾一度被国内外学者认为是牙源性肿瘤,2017版WHO牙源性肿瘤新分类中将其重新归为牙源性囊肿[1,3,5]。临床诊疗中,往往需要将成釉细胞瘤与牙源性角化囊肿进行鉴别诊断,两者在临床表现及影像学表现上存在一定的相似性,并且角化囊肿能转变为或同时伴有成釉细胞瘤,导致诊断难度增大。另外根据口腔颌面功能外科的要求,由于角化囊肿并非良性肿瘤,临床治疗可偏向相对保守的治疗。因此寻找两者间的特异性标志物不仅有助于精准诊断,还有助于精准治疗。此外通过寻找两者之间的差异基因,筛选出与成釉细胞瘤侵袭生长相关的标志物,可为临床治疗成釉细胞瘤和牙源性角化囊肿提供新的思路。

目前对于成釉细胞瘤和牙源性角化囊肿的发病和术后复发机制尚未明确。既往有研究发现BRAF V600E在含成釉细胞的牙源性肿瘤中特异性高表达,认为其是成釉细胞瘤的特异性分子标志物[6-7]。Kaye等[8]认为BRAF V600E有希望成为治疗成釉细胞瘤的靶点。他们对1例肺转移的成釉细胞瘤患者使用BRAF V600E突变的靶向药物20周后,口腔原发灶与肺转移瘤体明显缩小。但是由于角化囊肿存在转变为或伴有成釉细胞瘤的现象,这对临床运用BRAF V600E诊断造成了一定困难。而对于牙源性角化囊肿,抑癌基因PTCH的突变过去被认为是在牙源性角化囊肿中特异性表达,随着进一步研究发现,PTCH突变多见于痣样基底细胞癌综合症患者,在散发的牙源性角化囊肿患者中并不多见[6,9]。目前还未有一个明确的特异性标志物来进行两者的诊断。

生物信息学是近年来迅速发展起来的在生命科学的研究中,以计算机为工具对生物信息进行储存、检索和分析的一门新兴学科,其研究重点是基因组学和蛋白质组学。在肿瘤领域,生物信息学分析已经得到了广泛的运用,通过高通量的运算来获得大量的基因表达信息,进而鉴定其中的遗传变异,并探索与肿瘤发生发展相关的基因变化。近年来越来越多的学者运用生物信息学分析来探究各种癌症的表达差异基因,并研究这些基因在分子功能、细胞组成以及生物过程中所发挥的作用[10-11]。

为此,我们从GEO数据库中获取基因芯片数据,筛选出成釉细胞瘤和牙源性角化囊肿间的差异基因(different expression genes, DEGs),并对这些差异基因进行基因本体论分析(Gene Oncology, GO)和京都基因和基因组百科全书分析(Kyoto Encyclopedia of Genes and Genomes, KEGG),之后构建蛋白互作网络(Protein-protein interaction, PPI)进一步筛选出核心功能基因(hub genes)。

1 资料与方法

1.1 原始数据来源

本研究所使用的芯片数据GSE38494[12]来自于GEO数据库(https://www.ncbi.nlm.nih.gov/pubmed),使用GPL570平台(Affymetrix Human Genome U133 Plus 2.0 Array),包含15个成釉细胞瘤组织样本,12个散发牙源性角化囊肿组织样本,1个痣样基底细胞癌综合症患者组织样本,1个成釉细胞纤维牙瘤组织样本,4个正常组织样本和2个口腔鳞状细胞癌组织样本。在本研究中,我们选取了其中的15个成釉细胞瘤组织样本和12个散发牙源性角化囊肿组织样本。

1.2 差异基因分析

使用R软件读取上述27个组织样本基因芯片数据,使用LIMMA数据分析包进行差异基因分析[13]。将成釉细胞瘤组作为实验组,牙源性角化囊肿组作为对照组,以P<0.01和差异倍数log FC>2作为筛选条件来选取差异基因。

1.3 GO分析和KEGG分析

在线分析工具DAVID 6.8(https://david.ncifcrf.gov/)对所获得的差异基因进行GO分析和KEGG分析,并以筛选条件为P<0.01选出显著富集结果[14]。

1.4 PPI网络构建

我们使用交互基因检索工具(Search Tool for the Retrieval of Interacting Genes,STRING)网站(http://string-db.org)构建差异基因PPI网络[15]。之后Cytoscape软件进行结果可视化,并使用MCODE插件筛选其中的关键基因(Hub genes)[16]。GenCLiP2数据库用来进一步富集Hub基因功能,筛选条件为P<1×10-4[17]。

2 结 果

2.1 差异表达基因

首先,我们对27个样本进行了主成分分析,具体结果见图1。结果显示成釉细胞瘤与牙源性角化囊肿间基因表达存在明显差异。

红色:牙源性角化囊肿;绿色:成釉细胞瘤图1 成釉细胞瘤样本与牙源性角化囊肿样本间的主成分分析Fig.1 Principal component analysis between ameloblastoma and odontogenic keratocyst samples

之后我们通过LIMMA包进行成釉细胞瘤对比牙源性角化囊肿的差异基因筛选,获得了335个差异基因,并将相应结果用下表展示(表1)。

表1 成釉细胞瘤与牙源性角化囊肿间的335个差异基因Tab.1 355 DEGs between ameloblastoma and odontogenic keratocyst

2.2 差异基因的GO分析及KEGG分析

利用DIVID 6.8分别对335个差异基因做GO分析及KEGG分析。

2.2.1 GO分析结果 335个差异基因富集的GO条目有216条,以P<0.01作为筛选条件,56条显著富集通路被选出,其中39条(69.6%)富集在生物过程,包括神经元分化、细胞粘附、生物粘附、与分化有关的细胞形态发生、细胞形态发生、细胞命运锁定等;14条(25.0%)富集在细胞组成,包括细胞外区、细胞外基质、细胞外组分、蛋白质类细胞外基质、细胞外基质结构的构成、突触等;3条(5.4%)富集在分子功能,包括碳水化合物结合、肝素结合和转录因子活性。选取显著富集生物过程、细胞组成和分子功能前6的条目,详见表2。

表2 差异基因的GO富集分析结果Tab.2 GO enrichment analysis of DEGs

2.2.2 KEGG分析结果 335个差异基因富集到KEGG通路有11个,以P<0.01作为筛选条件,3条显著富集通路被选取,包括细胞外基质-受体相互作用、轴突导向和癌症通路(表3)。

表3 差异基因的KEGG通路分析Tab.3 KEGG pathway analysis of DEGs

2.3 PPI网络分析

将335个差异基因上传至STRING网站进行蛋白相互作用分析,将结果导入Cytoscape软件进行可视化(图2),并使用MCODE插件筛选出8个Hub基因,分别为:SPARCL1、SERPINA1、ITIH2、IGFBP5、LAMB1、C3、GOLM1、FAM20A(图3)。将差异基因的Hub基因导入GenCLiP2.0中进行功能富集,筛选条件为P<0.05,结果显示Hub基因与细胞外基质有关(图4)。

图2 差异基因的PPI蛋白互作网络Fig.2 The PPI network of DEGs

图3 Hub基因Fig.3 Hub genes

绿色:基因富集到的条目;黑色:基因未富集到的条目图4 Hub基因的功能富集Fig.4 The function enrichment of Hub genes

3 讨 论

在本研究中,我们将成釉细胞瘤作为实验组,牙源性角化囊肿作为对照组,来探究两者间的差异基因。通过对GEO数据的分析,335个差异基因被发现。之后对差异基因进行GO分析和KEGG分析。最后进行PPI蛋白互作网络构建,并通过MCODE插件筛选出其中的Hub基因。一共有8个Hub基因被确定:SPARCL1、SERPINA1、ITIH2、IGFBP5、LAMB1、C3、GOLM1和FAM20A。

通过基因功能富集分析,我们发现相对于牙源性角化囊肿,成釉细胞瘤的335个差异基因的生物过程主要集中细胞自身这一方面,如细胞粘附、生物粘附、与分化有关的细胞形态发生、细胞形态发生、细胞命运锁定等;细胞组成集中在肿瘤微环境相关的条目,如细胞外区、细胞外基质、细胞外组分、蛋白质类细胞外基质、细胞外基质结构的构成等。另外KEGG通路分析发现差异基因显著富集于细胞外基质-受体相互作用和癌症通路。这些结果与成釉细胞瘤的肿瘤临床特性有关,也说明本研究所筛选的差异基因参与成釉细胞瘤发生发展过程。

细胞外基质是指由动物细胞分泌至细胞周围的大分子物质,主要由胶原蛋白、非胶原蛋白、弹性蛋白、蛋白聚糖与氨基聚糖这五种物质组成,是肿瘤微环境的重要组成成分[18]。有研究表明,细胞外基质不仅仅只是在细胞间发挥惰性支持物的作用,还对细胞的功能、存活、增殖、分化和转移等有调节作用。细胞外基质能够相互连接,构成复杂的网架结构来支持细胞结构,进而调节细胞的各项功能活动和组织的发生发展[19-21]。目前已经证实细胞外基质中的弹性纤维与一些普外科疾病如内痔、腹股沟疝等的发生发展密切相关[22]。在肿瘤的侵袭转移过程中,肿瘤细胞将细胞外基质降解,进而突破细胞外基质是其中非常关键的一环[23-24]。基质金属蛋白酶(matrix metalloproteinase, MMP)等可以降解细胞外基质,在成釉细胞瘤中,MMP-2和MMP-9均有表达,这也一定程度上解释了为什么成釉细胞瘤具有局部侵袭性、术后高复发率以及偶见远处转移等特点[25]。在本研究中,8个Hub基因有6个基因与细胞外基质相关。

富含半胱氨酸的酸性分泌蛋白类似蛋白1(SPARCL1)是富含半胱氨酸的酸性分泌蛋白(secreted protein acidic and rich in cysteine, SPARC)家族成员,是一种小分子糖蛋白,参与胚胎发育、细胞发育与迁移和血管生成等生理过程[26]。研究发现在不同的肿瘤组织中,SPARCL1均有不同程度的表达[27-28]。Turtoi等[27]对脑胶质瘤组织进行免疫组织化学检查,发现SPARCL1在脑胶质瘤中高表达,并与肿瘤的恶性程度呈正相关。而在乳腺癌中,与癌旁组织相比,SPARCL1在肿瘤组织呈低表达[28]。丝氨酸蛋白酶抑制剂A1(SERPINA1),是一种血浆蛋白,主要在肝细胞中合成。由于其具有高度保守性,并且参与抑制血浆蛋白酶活性,被认为是一种抑癌基因[29-30]。目前已经证实SERPINA1在多种癌症组织中高表达[29-30]。人类中间胰蛋白酶抑制剂H2重链(ITIH2),是血浆丝氨酸蛋白酶抑制剂家族的一员,参与稳定细胞外基质和预防肿瘤转移。其在正常乳腺、子宫、卵巢、肺和肾组织中均有表达,而在乳腺癌、肺癌、肾肿瘤、胃癌、直肠癌和前列腺癌中被发现表达下调[31]。胰岛素样生长因子结合蛋白-5(IGFBP5)属于胰岛素样生长因子类(IGF)家族,在上皮生长过程中发挥着丝裂原和抗凋亡的作用,已知在多种肿瘤中有不同程度的表达,与肿瘤的生长相关[32]。目前发现IGFBP5在卵巢癌、宫颈癌、脑膜瘤等肿瘤中能够起到抑癌作用[32]。层粘连蛋白β1(LAMB1)是细胞外基质糖蛋白家族层粘连蛋白的一员,主要构成基底膜中的非胶原成分,参与细胞粘附、趋化、迁移、信号传导等过程[33-34]。在肿瘤组织中,LAMB1作为67-kDa层粘连蛋白单体受体的配体在多种转移性癌症中高表达,并催动癌症细胞的转移、侵袭和血管生成[34]。补体系统是存在于血清中能够辅助抗体所介导的溶菌作用的一组需经活化后才具有酶活性的蛋白质。补体成分C3是补体系统的中心分子,含量最高,也是启动旁路途径的关键分子[35]。在肿瘤患者中,补体量会升高,肝癌患者中C3含量升高最为明显,被认为是诊断标志物[36]。高尔基体膜蛋白1(GOLM1)是一种上皮细胞特异性Ⅱ型高尔基体跨膜糖蛋白,主要参与内质网蛋白合成后修饰,以及协助高尔基体完成蛋白转运和分泌[37-38]。研究发现GOLM1与多种肿瘤的发生发展密切相关,已经发现其在前列腺癌、肝癌、肾癌及肺癌等恶性肿瘤组织中显著高表达,有望在未来成为早期诊断标志物[37-38]。序列相似家族20成员A(FAM20A)属于FAM20(Family with Sequence Similarity 20)家族成员,是一种没有激酶活性的假激酶,通过与FAM20C形成功能性复合物来激活其活性。目前已知FAM20A突变将导致釉质发育不良、牙龈纤维瘤和釉肾综合征[39]。迄今为止,上述8个Hub基因虽然在其他疾病得到不同程度的研究,但是在成釉细胞瘤中尚未研究它们在其发生发展中所发挥的作用。尽管如此,本研究的成果一定程度上能为成釉细胞瘤发生发展研究提供新的思路。

本研究运用生物信息学方法,筛选出了成釉细胞瘤和牙源性角化囊肿之间的差异基因,并对其功能进行了相关分析,虽然所筛选的基因目前并未被证实参与成釉细胞瘤发展过程,但是这也提示着这些基因可能是新的研究靶点,需要进一步的实验验证,同时也为成釉细胞瘤和牙源性角化囊肿的鉴别诊断提供了一些新的角度。

猜你喜欢
角化胞外基质差异基因
基于“土爰稼穑”探讨健脾方药修复干细胞“土壤”细胞外基质紊乱防治胃癌变的科学内涵
哥德尔不完备定理的不可判定性
3例易误诊脂溢性角化病例展示及分析
脱细胞外基质制备与应用的研究现状
关于经络是一种细胞外基质通道的假说
基于RNA 测序研究人参二醇对大鼠心血管内皮细胞基因表达的影响 (正文见第26 页)
运动对衰老的骨骼肌中MMPs及TIMPs的影响
实对称矩阵对角化探究
紫檀芪处理对酿酒酵母基因组表达变化的影响
实对称矩阵正交相似对角化的探讨