通过miRNA基因表达谱的基因共表达网络构建对星形细胞瘤的基因靶标进行预测

2021-01-12 09:30邵嘉敏
生物信息学 2020年4期
关键词:共表达星形靶标

邵嘉敏

(石门县人民医院 神经外科,湖南,常德 415000)

星形细胞瘤是指以星形胶质细胞所形成的肿瘤,占颅内肿瘤的13%~26%,占胶质瘤21.2%~51.6%,男性多于女性。星形细胞肿瘤可发生在中枢神经系统的任何部位,一般成年多见于大脑半球和丘脑底节区,儿童多见于幕下。星形细胞瘤为浸润性生长肿瘤,多数肿瘤切除后有复发可能,且复发后肿瘤可演变成间变性星形细胞瘤或多形性胶质母细胞瘤[1]。由于其生长缓慢,出现症状通常是隐性的,例如颅内压升高而引起的神经系统变化和不适的能力。小脑肿瘤的常见症状包括共济失调,颅神经缺损和颅内压升高的迹象(如头痛,恶心和呕吐)。当存在于视觉通路中时,肿瘤可能会导致视力丧失或视野缺损,并且当定位于下丘脑时,可能导致内分泌综合征,例如尿崩症,性早熟或电解质失衡。因此寻找其生物标志物早期诊断,并研究新的治疗方法就十分重要。

miRNA在多种癌症中存在差异性表达,相对于正常组织的对应调节物,大多数miRNA在癌症中被抑制[2-4]。通过敲低miRNA加工机制来分解miRNA可以刺激体内细胞转化和肿瘤发生[5]。这意味着miRNA表达的改变甚至可能是肿瘤发生后导致的,而且仍然还积极地促进了癌症的发展。尽管miRNA在癌症中普遍减少,但还有一些miRNA上调,其中某些可以发挥致癌作用。有研究认为白细胞中的总体miRNA水平也可能影响甲基化失调的相关癌症发展过程[6-7]。鉴于miRNA通过调节靶mRNA发挥其功能,因此预测miRNA靶标非常重要。 miRNA-mRNA相互作用的特异性主要是由miRNA的前八个核苷酸(称为种子序列)赋予的[8]。当前,有几种计算算法可用于预测目标mRNA[9],但它们远非完美。新靶标的识别随着已验证的miRNA靶标的数据积累变得更容易,但是也需要不断灵活运用已有的数据库与工具。本次研究期望通过星形细胞瘤miRNA表达谱筛选出的差异miRNA,在数据库预测其靶基因mRNA,并通过已有的研究资料来对筛选出的miRNA的潜在靶标价值进行讨论与说明,并希望对该思路与方法的效果进行探讨。

1 方 法

1.1 数据检索与获取

由于星形细胞瘤的强浸润性与复发性,常规治疗手法局限性较大,本次研究期望能够对星形细胞瘤的生物标志物与潜在治疗靶点进行探索,于是选用GEO数据库(https://www.ncbi.nlm.nih.gov/gds/)的非编码RNA基因表达谱数据作为研究数据。最终通过检索与筛选得到Chen-Xue Mao等上传到GPL18402平台的GSE138764数据集,数据集中的芯片数据来自普通人和星形细胞瘤患者脑组织中提取的miRNA。

1.2 芯片数据的差异分析

数据集中主要包括33个星形细胞瘤患者和9个健康普通人的脑组织样本的芯片数据,由于miRNA数据的特殊性,在去除Q-Value不齐项后,得到其中10个数据,选用其中5个星形细胞瘤患者数据(GSM4118879;GSM4118889;GSM4118891;GSM4118893;GSM4118896)做实验组,5个健康普通人数据(GSM4118869;GSM4118870;GSM4118871;GSM4118876;GSM4118877)做对照组。通过GEO数据库自带的在线工具GEO2R,对芯片数据进行例行匹配和分析,然后根据获得的后续结果对芯片数据进行聚类,消除非标项。为了得到有价值的miRNA,去除P值大于0.05的所有项后,得出差异均大于对照组0.6以上高表达与低表达的各5个的miRNA,并且对其LogFC值及Padj值计算。为了显示两组样本变化后的基因的大小差异,创建了1个热图以指示蛋白质的变化模式。颜色越接近黄色,表达水平越高,而颜色越接近蓝色,表达水平越低。通过MeV Heat Map软件处理原始数据,以获得可视化表达遗传差异的热图。

1.3 基因共表达网络构建与关键基因的筛选

将筛选出的差异miRNA的Gene ID输出到miRDB(http://mirdb.org/)并通过starBASE v 2.0(http://starbase.sysu.edu.cn/starbase2/index.php)验证取交集,得出miRNA的靶基因(mRNA)。将得到的靶基因输入String(https://string-db.org/cgi/input.pl)数据库,筛选有实验验证的、综合得分为0.4以 上(满分为1)的基因构建相互作用网络。然后由从String得到的mRNA共表达网络数据以及miRNA与mRNA的靶点预测关系通过生物信息学软件Cytoscape 3. 7. 1作图。使用Cytoscape 3. 7. 1的APP库中的cytohubba软件模块对miRNA-mRNA的基因共表达网络中的处于关键节点的基因使用MCC method进行筛选,得出关键基因,及其评分数据[10]。

1.4 统计分析

使用SPSS 23. 0统计软件进行统计分析。测量数据表示均值(±S),其中 t检验用于基因表达量的组间比较。P<0.05被认为具有统计学意义。

2 结 果

GSE138764数据集最终筛选出的高表达与低表达的各5个的miRNA如图1共10个:hsa-miR-29b-2-5p;hsa-miR-377-5p;hsa-miR-431-3p;hsa-miR-770-5p;hsa-miR-485-5p;hsa-miR-505-3p;hsa-miR-339-5p;hsa-miR-339-5p;hsa-miR-362-3p;hsa-miR-181a-2-3p。其P值与表达变化情况如表1。

通过miRBD与Starbase v2.0预测与验证的差异miRNA各自的Top10的靶基因如表2,靶基因与差异miRNA的基因共表达网络如图2,网络中Top20的关键节点基因有miRNA和mRNA各10个。10个差异miRNA关键性评分均并列前10,其余10个mRNA:TNRC6B;AGO1;DHX15;KMT2A;FGF2;KLHL2;CCND2;SMNDC1;SRSF4;POU2F2,分列11到20,具体情况如表3所示。

图 1 GSE138764数据集中筛选后的各5个上调和下调的差异miRNA热图Fig.1 Heat map of differential up-regulated and down-regulated miRNAs in GSE138764 dataset

表 1 GSE138764数据集中筛选后的上调和下调的差异miRNA的具体数据Table 1 Specific data on differential up-regulated and down-regulated miRNAs screened in GSE138764 dataset

miRDB(http://mirdb.org/)基于支持向量机(SVM)和高通量训练数据集开发了1个新的miRNA目标预测程序。通过系统地分析高通量实验数据,我们确定了对miRNA靶标结合和表达下调很重要的新功能,所有预测目标的目标预测分数在50~100。分数越高,该靶点预测的可能性就越大。预测得分> 80的预测目标最有可能是真实的,而小于60的结果可能性较小,本文保守筛选分数在70以上的靶点结果,故不特地标明具体分数。

3 讨 论

通过对图2及表3中miRNA-mRNA的基因共表达网络中mRNA在癌症中的作用进行文献资料研究,最终进行反证,得出hsa-miR-29b-2-5p;hsa-miR-424-5p与hsa-miR-362-3p3个miRNA可能作为星形细胞瘤的治疗新靶点。我们围绕这3个miRNA进行论述。

表 2 通过miRBD与Starbase v2.0预测与验证的差异miRNA的靶基因Table 2 Target genes of differential miRNAs predicted and verified by miRBD and Starbase v2.0

图 2 筛选出的差异miRNA与对应的靶基因(mRNA)的基因共表达网络图Fig.2 Gene co-expression network diagram of selected differential miRNAs and corresponding target genes (mRNAs)

与hsa-miR-29b-2-5p关系密切的关键mRNA为POU2F2与CCND2。在转移性GC细胞系和患者样品中检测到POU2F2表达增加。 POU2F2是由核因子(NF)-κB的激活诱导的,进而调节ROBO1转录,因此在功能上有助于GC转移。研究表明,NF-κB和以POU2F2为中心的SLIT2 / ROBO1相互作用网络可能对肿瘤转移起关键作用,miR-218为已知的能够调控POU2F2的miRNA,前体阻断面向POU2F2的转移网络的激活[11]。细胞周期蛋白D2(CCND2)是D型细胞周期蛋白的成员,在细胞周期调节,分化和恶性转化中起着关键作用。有研究表明明CCND2表达的降低与启动子异常甲基化密切相关[12]。

在本次研究中hsa-miR-424-5p与TNRC6B,FGF2和KMT2A关系密切。研究表明TNRC6B的两种CpGs:cg06751583和cg21034183的甲基化与癌症发展的时间有正相关,关键的miRNA加工基因TNRC6B可能在早期癌变中起作用,可能作为有用的癌症早期检测生物标志物[13]。关于FGF2,有关机理研究证实,FGF2是miR-203的直接靶标,而miR-203的上调可能会降低FGF2的表达。FGF2的异位表达部分逆转了miR-203的表达对肾癌细胞恶性表型的抑制作用[14]。而KMT2A被证实是促进人黑素瘤细胞生长的潜在靶标,通过激活hTERT信号传导促进黑色素瘤生[15]。

表 3 通过Cytoscape的MCC算法计算出的基因共表达网络中Top20的关键基因及其具体数据Table 3 Top 20 key genes and their specific data in the gene co-expression network calculated by Cytoscape’s MCC algorithm

最后,与hsa-miR-362-3p关系较为紧密的是KLHL2,SMNDC1以及SRSF4。据报道,与KLHL3同源的kelch-like 2(KLHL2)也可以靶向WNK激酶进行泛素化和降解,并可能在全身脉管系统中发挥特殊作用。KLHL2可能在FHHt的发病机理中起作用,并加重了由CUL3和WNK4突变引起的表型[16]。纳米颗粒(NPs)的生物分布可以报告肿瘤发生过程中蛋白质分布的变化,AuNP表面富集了许多癌症特异性蛋白质。通过对PPA1,SMNDC1和PI15进行功能性研究,发现3者都显着抑制卵巢癌细胞的增殖[17]。既往研究中siRNA介导的剪接调节子SRSF4的耗竭,而不是SRSF6的耗竭,消除了许多剪接改变以及顺铂诱导的细胞死亡。顺铂诱导的许多剪接改变都是由SRSF4引起的,并且它们在1个过程中有助于凋亡PI3K[18]。

除此之外AGO1,DHX15也在不同癌症发展过程起到作用[19-20]。可以确定的是hsa-miR-29b-2-5p;hsa-miR-424-5p与hsa-miR-362-3p3个miRNA作为潜在靶点确实有研究价值,而更有意思的是本文所采用的生物标志物的预测筛选方法,结果充分说明了这种灵活的思维可以节约很多时间和资源。在对现有文献资料进行研究后,发现hsa-miR-29b-2-5p;hsa-miR-424-5p与hsa-miR-362-3p未曾被作为星形细胞瘤甚至癌症的靶点研究过。

4 结 论

星形细胞瘤是指以星形胶质细胞所形成的肿瘤,星形细胞肿瘤可发生在中枢神经系统的任何部位,为浸润性生长肿瘤,多数肿瘤切除后有复发可能,因此对基因标志物的探索及靶点的筛选尤为重要。本文通过对GEO数据库的星形细胞瘤miRNA表达谱数据进行差异分析及mRNA靶点探索,最后通过对二者基因共表达网络进行MCC算法计算利用mRNA为依据探索差异miRNA作为基因标志物或靶点的研究价值。最终得到hsa-miR-29b-2-5p;hsa-miR-339-5p与hsa-miR-362-3p三个具有潜在研究价值的miRNA靶标。

猜你喜欢
共表达星形靶标
网络靶标理论、关键技术与中医药应用
星形诺卡菌肺部感染1例并文献复习
UdhA和博伊丁假丝酵母xylI基因共表达对木糖醇发酵的影响
“百灵”一号超音速大机动靶标
侵袭性垂体腺瘤中lncRNA-mRNA的共表达网络
纳米除草剂和靶标生物的相互作用
带有未知内部扰动的星形Euler-Bernoulli梁网络的指数跟踪控制
“8字形”快速突破“星形”角度问题
中国流行株HIV-1gag-gp120与IL-2/IL-6共表达核酸疫苗质粒的构建和实验免疫研究
共表达HIV-1与IL-6核酸疫苗质粒诱导小鼠免疫原性的研究