视网膜母细胞瘤基因表达谱芯片的生物信息学分析

2021-06-15 03:08张艳吴瑜瑜
眼科学报 2021年5期
关键词:基因芯片母细胞视网膜

张艳,吴瑜瑜

(福建医科大学附属第二医院眼科,福建 泉州 362000)

视网膜母细胞瘤(retinoblastoma,RB)是儿童最常见眼内恶性肿瘤,可损害患儿视力、眼球,甚至危及生命。2/3患者3岁以内发病,在世界范围内,新生儿发病率为1:16 000~1:18 000,每年约有8 000例新生病例确诊[1]。虽然已经发现RB1基因的突变或缺失是RB发生的主要原因,即使RB具有明确RB1突变,癌变发展过程中也会发生其他基因组的变化,例如转录相关基因(BCOR)是继RB1之后最常见的突变基因[2]。而且有一部分单侧发病的病例未发现RB1突变,因此近年来在探索RB1突变之外的其他发病机制。基因芯片技术能快速检测差异表达基因(differentially expressed genes,DEGs),经过十余年的应用,已被证明是一种可靠的技术[3],大量基因芯片上的数据存储在公共数据库中,通过这些数据库,整合生物信息学方法对RB和正常视网膜组织进行DEGs筛选,对其进行生物学功能、信号通路及差异基因的蛋白互作网络(protein-protein interaction,PPI)分析,从而帮助我们进一步研究和更好地探索RB发生发展的潜在机制。

1 材料与方法

1.1 基因芯片数据获取

从美国国立生物技术信息中心(National Center of Biotechnolog y Information,NCBI)公共数据平台GEO中获取2 组基因芯片数据谱GSE97508芯片,平台是GPL15207 [(PrimeView) Affymetrix Human Gene Expression Array)和GSE110811[4],芯片平台是GPL16686 [(HuGene-2_0-st) Affymetrix Human Gene 2.0 ST Array transcript (gene) version],该2个芯片数据分别包括6个RB组织和3个正常视网膜组织和28个RB组织和3个正常视网膜组织。

1.2 筛选DEGs

采用GEO2R在线工具对2组芯片的RB组织标本与正常视网膜组织标本之间的DEGs进行筛选,筛选条件为|log(差异倍数FC)|>2,差异显著性矫正P<0.05,log FC<0为下调DEGs,而log FC>0为上调DEGs。然后对2组芯片筛选出的DEGs用在线Draw Venn Diagrams(http://bioinformatics.psb.ugent.be/webtools/Venn/)软件取交集进一步找出共同的DEGs。

1.3 GO注释及KEGG富集通路分析

基因本体注释(gene ontology analysis,GO)是一种常用的定义基因及其RNA或蛋白产物的方法,用于识别高通量转录组或基因组数据的独特生物学特性[5]。GO注释目前包括3个方面的生物学内容:分子功能(molecular function,MF)、细胞成分(cellular components,CC)、生物过程(biological process,BP)。KEGG是1个关于基因组、疾病、生物途径、药物和化学物质的数据库集合[6]。本研究采用在线STRING检索工具(search tool for the retrieval of interacting genes,STRING)对DEGs进行GO注释和KEGG富集通路分析,并对KEGG通路进行可视化图形展示(P<0.05)。

1.4 PPI的可视化

采用STRING数据库对DEGs的PPI进行可视化[7],去除网络未连接点,并进一步筛选出中心性最高,即与其他节点关系最密切的核心基因。

2 结果

2.1 RB组织GDEs的识别

本研究中有34个RB组织和6个正常视网膜组织。通过GEO2R在线工具,我们分别从基因芯片GSE97508和GSE110811中根据筛选条件为|log(差异倍数FC)|>2,差异显著性矫正P<0.05,分别筛选出1 356和1 150个DEGs。然后利用Draw Venn Diagrams软件对2组DEGs进一步取交集共筛选到20个常见DEGs,其中RB组织中有17个下调DEGs (logFC<0),3个上调DEGs (logFC>0) (表1,图1)。

图1 通过Venn Diagrams软件对2组芯片数据(GSE97508和GSE118011)DEGs取交集共20个DEGsFigure 1 Venn Diagrams are used to intersect two groups of chip data (GSE97508 and GSE118011)DEGs,and there are 20 DEGs in total

表1 20个DEGsTable 1 20 DEGs

2.2 RB的DEGs的GO注释和KEEG富集通路

20个RB的DEGs的GO分析结果如下,1)上调DEGs对于生物过程(biological process,BP):DNA构象改变、染色体浓缩、调控有丝分裂细胞周期过程、姐妹染色单体分离、核分裂、细胞分裂;2)上调DEGs对于分子功能(molecular function,MF):DNA催化剂;3)下调DEGs对于BP:调节视紫红质介导的信号通路、光刺激的感觉、光感受器细胞的修复、视觉感知、磷酸盐代谢过程负调控、蛋白质修饰过程的负调控、类维生素A代谢过程;4)下调DEGs对于MF:细胞内环状核苷酸激活了阳离子通道活性、cGMP连接;5)下调DEGs对于CC:光感受器外节、睫状体、睫状体膜、细胞膜、质膜、感光细胞内外节、神经投射、高尔基体膜和突触(表2)。KEGG通路分析结果表明:DEGs富集于光传导信号通路,其中包括CNGA1,CNGB1,RHO,SAG四个基因均为下调DEGs,并对通路进行可视化图形展现(表3,图2)。而上调DEGs没有显著的信号通路(P<0.05)。

图2 DEGs 的KEGG 富集在光传导通路,标红色五角星为4 个DEGs,其中CNG 为CNGA1,CNGB1,RH 为RHO,Arr 为SAGFigure 2 KEGG of DEGs was enriched in the photoconductive pathway,and there were four DEGs marked with red pentagrams,among which CNG was CNGA1,CNGB1,RH was Rho,and Arr was SAG

表2 DEGs的GO功能注释Table 2 GO analysis of DEGs

表3 DEGs的KEGG富集通路Table 3 KEGG pathway of DEGs

2.3 PPI

使用Str ing在线工具对20个DEGs进行蛋白质与蛋白质相互作用网络的构建,结果显示 20节点和9条相互作用关系(图3)。发现与其他节点连接最紧密核心基因RHO,连接基因包括CNGA1,CNGB1,SAG,CABP5和BCO2。

图3 使用String (https://string-db.org/)在线工具对20 个DEGs 进行蛋白质与蛋白质相互作用网络的构建,结果显示20节点和9 条相互作用关系。与其他节点连接最紧密核心基因为RHO,连接基因包括CNGA1,CNGB1,SAG,CABP5 和BCO2Figure 3 The String (https://string-db.org/) online tool showed PPI network of 20 DEGs,and the results showed 20 nodes and 9 interaction relationships.The most closely linked core gene was Rho,which included CNGA1,CNGB1,SAG,CABP5 and BCO2

3 讨论

RB是儿童最常见的眼内恶性肿瘤,在RB早期及时诊断和干预,患儿的存活率超过95%,而一旦发生眼外转移,其存活率低于50%[8]。近年来对RB基因组学研究增多,本研究利用生物信息学分析方法对GEO数据库下载的RB组织和正常视网膜组织的基因片数据进行DEGs分析,并对其进行功能聚类分析、功能富集分析和相互作用网络分析,从而深入了解RB发生、发展的分子机制,筛选可作为除RB基因以外的诊断的关键基因和治疗药物靶点。

在本研究通过R B组织和正常视网膜组织的比较,共筛出20个DEGs,其中上调基因3个,下调基因17个,应用在线STRING数据库进行GO功能注释结果显示表达上调基因所富集的功能主要在细胞分裂、染色体浓缩、核分裂和DNA构象改变。下调基因主要富集在光传导、视觉感知、光感受器细胞修复、感光细胞内外节和调节视紫红质介导的信号通路等。这些生物学过程的调节异常是参与RB发生发展。KEGG通路显示上调基因上调DEGs没有显著的信号通路,下调基因参与光传导信号通路,其中包括CNGA1,CNGB1,RHO,SAG四个基因,通过PPI网络提示这4个基因相互联系,并发现与其他节点连接最紧密核心基因RHO。基因RHO(rhodopsin)为视紫红质,早先Donoso等[9]使用单克隆抗体组织病理研究在人胎儿视网膜和五个视网膜母细胞瘤中鉴定了视紫红质,视网膜母细胞瘤中视紫红质和s抗原的存在可能有助于理解光感受器细胞的发育,并参与视觉光转导蛋白的表达。包括与视觉直接相关的事件。之后Hurwitz等[10]研究发现:只有2种抗视紫红质抗体识别肿瘤上的表位,而在正常人视网膜上完整识别的五种表位的视紫红质分子可能在视网膜母细胞瘤中不表达。二者均与本研究筛选出核心基因RHO为下调基因情况相符,因此视紫红质低表达为RB的发生发展提供了一个新的思路,由于近年鲜有对RHO与RB相关性研究,需要对其进一步实验验证,希望有助于成为新的抗肿瘤治疗靶点。本研究KEGG通路富集在光传导信号通路与Hurwitz等[10]在RB中发现存在锥细胞特异性光转导级联反应相符,该研究推测该肿瘤沿着锥细胞谱系进行了生化分化。也与数据谱GSE11081发现感光细胞表达与视网膜母细胞瘤严重程度呈负相关有关联。因此考虑RB与正常视网膜组织差异基因通路可能与光信号转导有关。

本研究也有局限性,一是GSE11081对其提供28例RB组织进行间变质轻中重的分级,从而得出感光细胞表达与视网膜母细胞瘤严重程度呈负相关,而本研究并未对RB分级而是直接将RB组织与正常视网膜差异进行筛选,因此GSE110811研究表明的核孔蛋白表达增加,光感受器表达减少,是严重间变性RB的特征在本研究中并未发现。今后若有更多对RB轻中重分级的数据谱,可对其纳入及进行分级研究;二是基因芯片数据谱才2组偏少,且发现共同差异基因过少,这些对基因功能富集和通路分析意义都是比较有限的,期待今后能从更多的数据库纳入发现更多研究RB基因的数据谱,从而丰富差异基因。

综上所述,本文采用生物信息学方法对RB基因芯片数据进行挖掘,通过对RB发生发展的生物过程、分子功能、细胞定位和信号通路等分析,以期往能为RB发生的机制研究、肿瘤标志物的筛选及药物靶点提供参考。

猜你喜欢
基因芯片母细胞视网膜
软骨母细胞瘤样骨肉瘤穿刺标本免疫组化H3F3B、IMP3、Clusterin 联合H3F3B 基因突变检测的意义
深度学习在糖尿病视网膜病变诊疗中的应用
临床护理路径在小儿神经母细胞瘤治疗中的价值分析
如何防治裂孔性视网膜脱离
眼前有闪光、黑点、视物模糊,警惕视网膜脱落
出生时即可预判发育潜力 基因芯片精准筛选肉牛良种
顶骨炎性肌纤维母细胞瘤一例
这种恶性肿瘤,3岁以下是高发期
基因芯片技术在生物研究中的应用进展
视网膜脱离能治好吗