子宫肌瘤发病关键基因及信号通路的生物信息学分析与筛选

2022-10-07 02:29谢成茂范琳媛
现代妇产科进展 2022年9期
关键词:肌瘤引物通路

谢成茂,范琳媛

(首都医科大学附属北京妇产医院/北京妇幼保健院妇科,北京 100026)

子宫肌瘤(uterine myoma,UM)是女性常见的良性肿瘤,可导致患者盆腔受压、异常子宫出血、疼痛或生育能力丧失等,严重威胁女性健康[1]。子宫肌瘤的治疗措施主要为药物和手术治疗,药物治疗效果良好,但停药后肌瘤复发几率高,临床症状反复出现[2]。手术治疗主要是子宫肌瘤剔除或子宫切除,是临床治疗中应用较广的一种方法,但术后残余几率大、复发风险高、创伤大、出血多,可能对生育造成不良影响[3]。近年研究发现,子宫肌瘤的发病率明显增高,但其发病机制并不明确。因此,探索子宫肌瘤发病的关键基因和通路对子宫肌瘤的诊疗具有重要意义。近年来,生物信息学方法为在分子水平上研究各种疾病的分子机制提供了新的思路。本研究通过收集GEO(Gene Expression Omnibus)数据库中子宫肌瘤的芯片数据,对子宫肌瘤发生发展的相关基因进行挖掘,并进行生物信息学分析,以期为子宫肌瘤发生发展与早期诊断治疗提供新的方向。

1 材料与方法

1.1 数据检索及标本收集 以“Uterine myoma”为关键词在GEO数据库中检索与UM相关的基因表达谱数据集。最终选取由Hoffman等[3]提供的GSE593,其标本分为两组:子宫平滑肌瘤组织:GSM9093-GSM9097;正常子宫肌层组织:GSM9098-GSM9102。选取2019年1月至2020年12月因确诊为子宫肌瘤在首都医科大学附属北京妇产医院就诊且行全子宫切除的30例患者,术中采集部分子宫肌瘤及瘤旁正常组织,经液氮快速冷冻,-80℃冰箱保存。本研究已获得患者及家属知情同意并经医院伦理委员会审核通过。

1.2 筛选差异基因 应用R软件对差异表达基因进行筛选,筛选标准为logFoldChange>1且adjustP<0.05。

1.3 差异基因的生物信息学分析 应用R软件对筛选出的差异基因进行功能富集分析(Gene Ontology,GO)及通路富集分析(KEGG),并对相关基因进行GO与KEGG注释。将筛选出的差异基因输入STRING数据库,找出差异基因对应蛋白之间的可能互作关系,并构建相互作用网络结构图(protein-protein interaction,PPI)。应用Cytoscope将富集的通路进行可视化。研究中应用的R软件包主要有:GEO query,reshape2,DESeq2,limma,Affy,ggplot2,pheatmap,topGo,Rgraphviz,pathview,clusterPro-filer,org.Hs.eg.db,enrichplot,Cytoscape3.7.2。

1.4 GSE593差异基因结果验证 从芯片数据GSE593分析得到的结果中筛选出4个差异基因KDR、VEGFA、PIK3R1及PRKCB。收集子宫肌瘤及瘤旁组织样本各30例,RT-PCR及Western blot法检测这4个基因表达情况,对芯片结果进行验证。KDR上游引物5'-TTCTGACTGCACAAACCAGCTTC-3',下游引物5'-TTTGACACCACACACAGCTTCAC-3';VEGFA上游引物5'-AAGATCCGCAGACGTGTAAATGTT-3',下游引物5'-CGGCTTGTCACATGCAAGTA-3';PIK3R1上游引物5'-AGCAACCTGGCAGAATTACG-3',下游引物5'-GCTGCTGGAATGACAGGATT-3';PRKCB上游引物5'-ATCGCCCCCGAGATAATTGC-3',下游引物5'-GGATAGCGGGTGAAAAATCG-3'(北京梓熙)。采用RT-PCR试剂盒(购自美国Invitrogen公司),按实验步骤实行实时荧光定量PCR测定KDR、VEGFA、PIK3R1及PRKCB基因的mRNA表达水平。Western blot法对KDR、VEGFA、PIK3R1及PRKCB基因的蛋白表达水平进行验证,所用一抗包括Anti-KDR抗体(Ab134191)、Anti-VEGFA抗体(Ab1316)、Anti-PIK3R1抗体(Ab182651)、Anti-PRKCB抗体(Ab195039),均购自美国Abcam公司;二抗试剂盒(生物素标记羊抗小鼠IgG及生物素标记羊抗兔IgG)购自北京中杉金桥。实验组15例;对照组15例。

2 结 果

2.1 样本标准化处理 对选取的芯片数据进行背景矫正及标准化处理,筛选差异基因。GSE593芯片中原始探针数据(CEL文件)的分析应用稳固多阵列平均算法(robust multiarray average algorithm,RMA)在R软件中进行分析(Affy包),各探针表达的均值即为该基因的表达值。

2.2 差异基因的筛选 对GSE593进行分析筛选,最终筛选出差异基因共172个,其中高表达72个,低表达100个。差异超过4倍且P<0.01的基因为后续研究对象,根据所得结果的分布绘制火山图(图1)。上调或下调前20的基因,见表1。对所有差异基因行聚类分析,探索不同差异基因的潜在共同特征。

图1 GSE593数据集差异表达基因的筛选红色为上调,绿色为下调,黑色为无统计学意义差异基因

表1 差异表达最明显的前20位基因

2.3 GO功能富集分析 对差异基因进行GO功能富集分析后发现,筛选出的差异基因在细胞组分(cellular component,CC)层面主要富集于细胞外间隙、细胞外基质、细胞外基质蛋白等;在生物学过程(biological process,BP)方面主要集中于RNA聚合酶Ⅱ启动子转录的负调控、血管生成、促细胞成熟等;而在分子功能(molecular function,MF)方面,筛选出的差异基因主要富集于整合素结合、蛋白质结合等(图2A)。差异前50个基因主要富集于蛋白质结合、RNA聚合酶Ⅱ启动子转录的负调控等9个方面(图2B)。

图2 GSE593差异表达基因的GO富集分析及前50基因的富集分析结果A:差异基因的GO分析结果;B:差异基因前50的GO分析结果

2.4 差异基因间PPI网络分析 应用String数据库将筛选出的172个差异基因编码的蛋白进行PPI分析。结果显示,这些差异基因之间存在广泛的蛋白相互作用,如VEGF与PIK3R1、EGR1、FLT1、PRKCB及KDR,ATF3与SERPINF1,ANXA1与EMP1,FOS与BCL6等之间均存在较为密切的相互作用(图3,无相互作用蛋白已隐藏)。

图3 GSE593差异表达基因PPI网络分析

2.5 KEGG信号通路的富集 对GSE593差异基因进行KEGG信号通路富集分析并进行可视化,结果显示筛选出来的差异基因参与的主要信号通路富集于流体剪切应力与动脉粥样硬化信号通路、糖尿病并发症中的AGE-RAGE信号通路、黏着斑激酶信号通路以及EGFR酪氨酸激酶抑制剂耐药性信号通路等。表明在子宫肌瘤的发生发展过程有复杂多样的信号通路参与调控(图4A)。应用Cytoscape软件对差异基因富集信号通路进行可视化分析。发现筛选出的差异基因富集的信号通路网络庞大,结构复杂,通路之间存在多种交叉因子(图4B、表2)。表明这些通路之间可相互影响,在子宫肌瘤发病过程中发挥着极其复杂的作用。

图4 GSE593差异表达基因KEGG信号通路富集分析及可视化A:差异表达基因KEGG信号通路富集分析;B:差异表达基因KEGG信号通路富集分析可视化(红色:表达升高;绿色:表达降低;蓝色:信号通路)

表2 KEGG信号通路富集分析

2.6 GSE593差异基因验证结果 RT-PCR及Western blot结果显示,子宫肌瘤组织中PIK3R1及PRKCB表达水平明显高于对照组,KDR及VEGFA表达水平则低于对照组,与芯片结果完全一致,进一步验证了芯片数据GSE593的结果真实可靠。见图5。

图5 GSE593差异基因结果的RT-PCR及Western blot验证结果A:RT-PCR法检测;B、C:Western blot法检测;**P<0.01

3 讨 论

根据生长部位不同,子宫肌瘤分为浆膜下肌瘤、黏膜下肌瘤及肌壁间肌瘤,常可导致患者出现异常子宫出血、盆腔疼痛、尿频及便秘等压迫症状,以及不孕、流产或早产等,严重影响女性生活质量[4-5]。根据流行病学研究显示,子宫肌瘤的发病具有明显的种族差异和家族聚集性,子宫肌瘤患者的直系亲属发病率明显高于普通人群[6-8]。子宫肌瘤的发生发展是一个多基因、多通路参与的复杂过程。目前关于子宫肌瘤发病机制有多种理论,其中被广泛接受的理论是高水平的雌激素、孕激素促使子宫肌瘤的形成和发展,即子宫肌瘤被认为是一种卵巢性激素依赖性肿瘤,然而其确切病因及机制并不明确[9]。

子宫肌瘤由异常的子宫平滑肌细胞和成纤维细胞组成,周围有大量的细胞外基质,包括胶原蛋白、纤维连接蛋白、层粘连蛋白和蛋白多糖,其最重要的特点是其生长趋势取决于肌瘤的位置,并可导致特定的临床症状[10-11]。研究显示,大的子宫肌瘤生长缓慢,而非常小的子宫肌瘤生长迅速[12]。子宫肌瘤的发病过程可分为两个步骤:转化和肿瘤形成[13]。正常子宫平滑肌细胞向异常子宫平滑肌细胞的转化主要通过介体复合物亚单位12(MED12)和高迁移率蛋白AT-hook 2(HMGA2)的突变发生[14-15]。干细胞主要在激素的影响下转化并生长为子宫肌瘤,而肌瘤的生长是通过大量的细胞扩张和细胞外基质积累实现的[16]。子宫肌瘤细胞依赖于激素刺激,特别是雌激素和孕酮。现有数据表明,孕酮在子宫肌瘤的发病中起着重要的作用[17]。尽管目前研究主要集中于子宫肌瘤的发生发展与激素之间的关系,但是不能忽视这一过程中涉及的其他重要途径,因为激素不是导致子宫肌瘤发展的唯一因素[18-19]。复杂的信号通路改变对子宫肌瘤的发展至关重要,但子宫肌瘤的确切生物学基础尚不清楚。子宫肌瘤的病理生理学主要集中在类固醇和其他激素。然而,还有其他非常重要的途径,它们不仅依赖于激素[20]。

本研究中通过GEO数据库得到子宫肌瘤芯片数据GSE593,分析发现子宫肌瘤组织与正常子宫肌层组织相比差异表达基因172个,其中表达上调72个,表达下调100个。进一步对差异基因进行GO及KEGG富集分析发现,这些差异基因具有众多生物学功能并参与多条信号通路,进而影响子宫肌瘤的发生发展。从其差异基因中挑选出4个基因进行结果验证,与芯片结果完全一致,表明GSE593芯片结果真实可靠。血管内皮生长因子(vascular endothelial growth factor,VEGF)是一种对血管生长有极强诱导作用的生长因子,与血管内皮细胞上的受体高亲和力结合后可作为内皮细胞特异性有丝分裂原诱导内皮细胞增生毛细血管袢形成,刺激血管内皮细胞增殖,加速血管生成,诱导子宫肌瘤的生长[21-22]。磷脂酰肌醇-3激酶调节亚基1(phosphoinositide-3-kinase regulatory subunit 1,PIK3R1)是细胞应答并且传递细胞间信号的重要协调者,与肿瘤的发生发展密切相关,但目前关于PIK3R1与子宫肌瘤之间关系的研究很少[23-26]。子宫肌瘤组织中蛋白激酶C-β(protein kinase C beta,PRKCB)分子量为67~83kDa,属于丝氨酸激酶家族中的单链多肽家族,编码PKC-βI、PKC-βII,定位于16p11.2,全长约375kb[27]。PRKCB在细胞内定位于线粒体,这种激酶与线粒体完整性和氧化磷酸化的调节有关[28-30]。线粒体是细胞的主要能量产生者,被认为是多种细胞死亡途径的关键参与者和传感器,若其功能失调可导致多种疾病的发生发展[31-33]。目前关于PRKCB与子宫肌瘤之间的关系及其在子宫肌瘤发生发展过程中的作用未见相关文献报道,需进一步研究证实。血管内皮生长因子受体-2(kinase insert domain receptor,KDR)是VEGFA的主要受体,不仅在血管内皮细胞表达,在某些肿瘤细胞中也有广泛表达,KDR高表达的肿瘤患者预后较差[24-26]。KDR可与VEGFA结合形成VEGF-R复合物,使肌瘤血管内皮细胞对VEGFA敏感性增强,促进肌瘤中血管生长,增加肌瘤血运,进而促进肌瘤生长[34]。本研究结果显示,子宫肌瘤组织中VEGFA及KDR表达量低于瘤旁组织,这可能是因纳入的数据集及样本量偏小,同时因个体差异所致。后续将继续扩大样本量及数据集,进一步探索VEGFA及KDR与子宫肌瘤之间的关系。

总之,通过对GEO数据库子宫肌瘤芯片数据集进行生物信息学分析、挖掘,筛选出子宫肌瘤发生发展过程中表达差异的基因及相关信号通路,其中PRKCB基因及其编码蛋白可能在子宫肌瘤发病过程中发挥着重要作用。数据挖掘及生物信息学分析在疾病发病机制的探索、疗效评价及预后预测方面具有应用价值,可为疾病的诊疗提供新的思路。

猜你喜欢
肌瘤引物通路
DJ-1调控Nrf2信号通路在支气管哮喘中的研究进展
基于改进TF-IDF算法的基因通路富集方法
AngⅡ激活P38MAPK信号通路在大鼠NSAID相关小肠损伤中的机制研究
玉米杂种优势类群划分高多态SSR引物筛选
甜菜全基因组SSR引物的筛选与评价
马铃薯SSR引物的开发、特征分析及在彩色马铃薯材料中的扩增研究
腹腔镜在子宫肌瘤治疗中的应用分析
有关PCR扩增过程中的疑虑与剖析
治疗子宫肌瘤视大小及位置而定
什么样的子宫肌瘤需手术