婴幼儿血管瘤异常表达基因分析*

2023-02-11 15:00何丹华陈知英陈国菊
现代医药卫生 2023年2期
关键词:信息学胞外基质分子

何丹华,陈知英,陈国菊

(暨南大学附属深圳市宝安区妇幼保健院皮肤美容科,广东 深圳 518102)

婴幼儿血管瘤(IH)是婴幼儿最常见的良性肿瘤,发病率为3%~10%[1]。有研究发现,女性、高加索人、低体重早产儿、多胞胎、大龄婴儿更易患病[2]。约10%的IH患儿在1年内可自行缓解,而其余90%的IH患儿需3~10年或更长时间才能好转[3],部分患儿会留下瘢痕而影响美观[4],甚至造成永久性毁容。IH并发症包括溃疡、出血、视力障碍、气道阻塞、充血性心力衰竭等,在某些情况下IH甚至可能导致死亡[5]。如能在IH早期积极干预、促进自发消退过程、减少血管瘤对周围组织的侵袭则能改善患儿预后。因此,有必要深入探讨IH的调控过程,以更好地理解IH的发病机制,对研发相关药物具有重要意义。本研究采用生物信息学方法筛选IH的差异表达基因(DEGs)及其功能富集通路,筛选靶基因,旨在为后续研究提供新思路。

1 资料与方法

1.1研究对象 2022年2月通过公开的GEO数据库(https://www.ncbi.nlm.nih.gov/geo/)检索与IH相关文献,获取基因表达谱数据集(GSE127487)进行分析。该基因表达谱种属为人类。样本来源于皮肤组织。芯片平台:GPL10558 Illumina HumanHT-12 V4.0 expression beadchip。选取该数据集中IH患儿18例,健康对照组研究对象5例。

1.2方法

1.2.1DEGs的识别 通过R 4.1.0的GEOquery包从GEO数据库中下载 GSE127487,去除一个探针对应多个分子的探针,当遇到对应同一个分子的探针时仅保留信号值最大的探针。然后通过箱式图查看样本标准化的情况,利用R语言limma软件包进行IH组和健康对照组DEGs分析。统计学上显著的DEGs定义为|logFC|≥2,P<0.05。

1.2.2DEGs功能和通路富集分析 采用WebGestalt[6](http://www.webgestalt.org/)在线工具对DEGs进行功能富集分析,即生物过程、细胞成分、分子功能及京都基因与基因组百科全书(KEGG)富集分析。

1.2.3构建蛋白质互作网络(PPI) 通过在线分析工具STRING构建PPI[7]。由Cytoscape软件(3.8.1)对PPI进行可视化[8]。利用Cytohubba筛选构成PPI稳定结构的hub基因,通过MCC、NNC、Degree、EPC、BottleNeck 5种算法,挑选出排名前10的hub基因,然后通过在线工具InteractiVenn[9]取交集后得到hub基因,并将其用于后续研究。

1.2.4hub基因表达量分析 通过Graphpad prism 9分析hub基因表达差异,以箱式图显示。

1.2.5hub基因的诊断效能评估 通过R 4.1.0进行诊断效能评估,pROC包用于统计分析,ggplot2 进行可视化分析。最终绘制5个hub基因的受试者工作特征(ROC)曲线。

2 结 果

2.1IH的DEGs GSE127487中有416个DEGs。其中350个基因表达上调,66个基因表达下调。见图1。

注:A.火山图;B.热图。

2.2基因本体(GO)和KEGG富集分析 416个DEGs均用WebGestalt在线工具进行分析。在生物过程中DEGs富集于血管发育、血管生成、心血管系统的发育、循环系统发育、参与形态发生的解剖结构形成等。在细胞外基质结构形成、分子功能调控、生长因子结合、具有抗拉强度的细胞外基质结构成分、蛋白二聚体活性等方面显著富集。DEGs显著富集于细胞的顶端部分、质膜的固有成分、顶端质膜、质膜的组成部分、细胞外基质。主要富集在白细胞跨内皮的迁移、细胞黏附分子、血管平滑肌收缩、细胞外基质受体相互作用等信号通路。见图2。

2.3PPI构建和hub基因筛选 共得到5个hub基因,分别为PECAM1、CD34、CDH5、TEK、THY1。见图3、4。

图3 PPI

2.4hub基因表达量 与健康对照组比较,IH组PECAM1、CD34、CDH5、TEK、THY1 mRNA表达均明显升高,差异均有统计学意义(P<0.05)。见图5。

注:A.GO分析;B.KEGG分析。

图4 Cytohubba筛选5个核心基因编码蛋白质

注:A.PECAM1;B.CD34;C.CDH5;D.TEK;E.THY1。与健康对照组比较,aP<0.05。

2.5诊断效能 PECAM1、CD34、CDH5、TEK、THY1对IH均具有较好的诊断效能(ROC曲线下面积分别为1.000、0.991、1.000、0.965、0.965)。见图6。

图6 hub基因诊断IH的ROC曲线

3 讨 论

IH是婴幼儿最常见良性肿瘤之一,在正常情况下并不会出现,多在3~12个月内快速生长,部分患儿在3~7年后自然消失。在新生儿中发病率为10%~12%,在早产儿中发病率为20%,以女婴居多[10]。尽管对IH进行了大量的研究,但IH发生、发展机制尚不明确。目前,对IH的药物及激光治疗研究较多,但从分子水平研究血管瘤发生、发展的重要基因和途径较少见。因此,IH的生物信息学研究对阐明其发病的分子机制具有重要参考意义。

本研究通过对IH的微阵列数据集进行差异表达分析,分别通过火山图和热图展示了表达上调和下调的基因。对DEGs进行GO和KEGG分析发现,主要富集于血管发育、血管生成、细胞外基质结构形成、分子功能调控、生长因子结合等,主要参与白细胞跨内皮的迁移、细胞黏附分子、血管平滑肌收缩、细胞外基质受体相互作用等KEGG信号通路,符合血管瘤生长、发育过程。生物信息学方法能够将与每例患儿相关的结果和模式与所有其他患儿的结果和模式联系起来。通过生物信息学工具整合了来自分子、基因组和生物链接研究的数据。揭示了生物过程的复杂性和细节。这些生物系统的新概念将有助于理解和发现疾病的发病机制,设计高度准确的诊断方法,并开发新的治疗和预防策略[11]。

本研究通过STRING在线工具及Cytoscape对DEGs进行PPI构建及可视化,并且筛选了hub基因,结果显示,THY1、TEK、CD34、CDH5、PECAM1在血管瘤患儿中其表达均明显升高。由于是取多个结果交集找到的hub基因,因此,具有较高的准确性。本研究结果显示,IH组hub基因表达明显高于健康对照组,可作为IH的重要标志物。本研究判断了hub基因的诊断效能,通过ROC曲线发现,上述基因ROC曲线下面积均大于0.7,可见其具有较强的诊断效能。

PECAM1是一种跨膜糖蛋白,属于免疫球蛋白家族,在血小板、单核细胞、中性粒细胞表面表达。PECAM1分子通过所谓的嗜酸性连接相互结合,导致内皮形成一种特定的保护屏障。PECAM1表达下调导致内皮屏障完整性破坏和通透性增加,从而导致动脉内膜炎症过程的激活,影响血管粥样硬化病变的形成和冠状动脉疾病的发展。因此,PECAM1可能是IH的一种新的候选分子,为改善IH治疗策略提供了新的视角。

CD34是一种高度糖基化的跨膜蛋白。首先在髓系白血病细胞系中被发现,抗CD34抗体的免疫组织学反应性也在非血淋巴肿瘤中被发现,包括血管肉瘤、孤立性纤维性肿瘤、上皮样肉瘤、梭形细胞脂肪瘤、隆突皮肤纤维肉瘤、肌成纤维细胞瘤等。因此,CD34可能被认为是IH的一种新的生物标志物。

CDH5定位于内皮细胞的细胞间连接,在控制血管完整性和通透性方面发挥重要作用,并有助于内皮细胞在管状结构中的整合[12-13]。CDH5是血管内皮生长因子在内皮细胞上的生存信号[14]。CDH5在肿瘤血管生成中也很重要,其在乳腺癌血管系统中表达上调,也被认为是乳腺癌的转移标志物[15-16]。因此,CDH5可能是IH进展和靶向治疗的重要分子。

TEK是酪氨酸激酶受体亚家族成员,主要表达于内皮细胞中,是血管生成素配体ANGPT1、ANGPT2、ANGPT4的酪氨酸激酶受体[17]。TEK在调节血管生成、血管重塑、成熟和完整性方面发挥重要作用[18]。提示TEK可能参与了IH的发病机制,对TEK的进一步研究可能为开发治疗IH及相关疾病的药物提供了新靶点。

THY1也称为CD90,是一种以糖基磷脂酰肌醇为基础的糖蛋白,主要表达于血干细胞、活化的微血管内皮细胞和成纤维细胞上,是胸腺细胞祖细胞的标志物。有研究发现,THY1能促进肝纤维化发展,是肝纤维化驱动基因[19]。THY1可能与IH的发生、发展密切相关。

综上所述,本研究通过对IH与正常样本的DEGs进行一系列生物信息学分析,找出了一些与IH密切相关的候选基因和通路调控网络。结果提示,PECAM1、CD34、CDH5、TEK、THY1参与了IH的发病过程,有望成为IH诊治的靶点,为进一步诊治IH提供了依据。然而,本研究的局限性是缺乏实验验证。这些通过生物信息学分析得到的预测结果还需要实时荧光定量-聚合酶链反应和免疫印迹试验等实验研究进一步证实。

猜你喜欢
信息学胞外基质分子
脱细胞外基质制备与应用的研究现状
鸡NRF1基因启动子区生物信息学分析
分子的扩散
关于经络是一种细胞外基质通道的假说
初论博物馆信息学的形成
“精日”分子到底是什么?
米和米中的危险分子
臭氧分子如是说
miRNA-148a在膀胱癌组织中的表达及生物信息学分析
水螅细胞外基质及其在发生和再生中的作用