袁长深,官岩兵,段 戡,容伟明,李 哲,梅其杰,张志敏,王 琳
骨关节炎(osteoarthritis,OA)作为一种慢性、退行性关节疾病,是导致患者活动受限、生活质量低下甚至残疾的主要原因之一。在全世界,其发病率已超过15%,并呈逐年上升趋势,预计到2030年将达35%[1]。高血压也是常见慢性疾病之一,作为心脑血管疾病的独立危险因素,已被公认致残的第三大诱因。在全球范围内,约有31.1%成年人受其困扰[2]。随着老龄化社会到来,OA和高血压共同发病较为常见。在65岁以上OA患者中,超过50%合并有高血压[3];甚至认为高血压是造成OA关节软骨稳态失调的重要诱因,使具有影像学改变的膝OA增加89%,症状性膝OA增加39%[4]。这可能源于高血压增加骨内压力,引起缺氧,进而诱发关节软骨和软骨下骨重塑,形成骨赘;或可能是诱导肾素-血管紧张素系统和内皮素系统激活Wnt信号传导途径,促进软骨降解有关[5-6]。目前OA与高血压共同发病的机制不详。因而,有效挖掘两者共同的发病基因,对进一步明确OA与高血压之间的联系、降低两种疾病共存的风险具有重要意义。生物信息学是利用计算机技术对现有生物医药数据进行筛选、分析以及预测的一种新型学科,可在基因分子层面了解生物发展的作用规律。故而,本研究利用生物信息学方法,从生物分子学角度来探讨OA与高血压之间的潜在关系,为有效防治两者共同发病提供一定的理论依据。
1.1 疾病相关基因的筛选GEO数据库(https://www.ncbi.nlm.nih.gov/geo/)由美国国立生物技术信息中心(NCBI)创建并维护,现已收录世界各研究机构提供的海量疾病基因的表达数据,可供下载与分析。在该数据库中输入检索词“osteoarthritis”,筛选出OA相关基因芯片数据集GSE55235,再通过R语言“limma”包对其差异分析后筛选出差异表达基因,即为OA相关疾病基因(筛选条件:P≤0.05和|logFC|≥1)。GeneCards数据库(https://www.genecards.org/)作为非盈利组织构建的一个整合型的生物信息数据库,可提供简明基因组、蛋白质组及相关人类基因等进行研究。在数据库中以“hypertension”为检索词,筛选出与高血压相关的疾病基因(筛选条件:相关度≥5)。
1.2 筛选共同疾病基因使用R语言软件“VennDiagram”包将OA相关基因和高血压相关基因作交集,获得OA与高血压共同疾病基因,并作出韦恩图。
1.3 基因本体论(GO)批注和京都基因与基因组百科全书(KEGG)富集途径分析GO和KEGG富集途径可用来分析并揭示基因所参与的细胞成分、分子功能、生物过程及信号通路,便于理解基因作用于疾病的潜在机制。Bioconductor作为生信分析中一款基于R语言的常用集合包,可对有关DNA微阵列或基因芯片的表达数据加与处理、分析以及注释。利用Bioconductor中的“clusterProfiler”、“DOSE”和“pathview”三个包对共有疾病基因进行GO和KEGG富集分析。
1.4 共同疾病基因蛋白质互作网络(PPI)的构建为更好地了解OA与高血压共同疾病基因表达蛋白之间的关系,使用String数据库在满足综合得分≥0.4的条件下建立PPI。
1.5 关键基因的筛选利用Cytoscape(版本3.7.2)软件“cytoHubba”插件对PPI网络进行拓扑学分析,通过Betweenness、Colseness、Degeree、EPC及MMC五种不同计算方法筛选出Hub基因。
1.6 关键基因上游miRNA的预测miRNet(https://www.mirnet.ca/)数据库可用于miRNA与靶标的相互预测和功能注释,并能通过将用户数据与现有知识进行网络视觉分析,从而可阐明microRNA(miRNA)功能及与靶标关系的在线平台。通过将Hub基因列表输入到此数据库中,预测上游miRNA,并做出Hub基因及上游miRNA的网络调控图。
2.1 共同疾病基因对OA基因芯片GSE55235进行差异表达分析,得到934个OA相关DGEs(P≤0.05和|logFC|≥1),见图1;同时在GeneCards数据库获得1325个(关联度≥5)高血压相关的有效基因。利用R语言软件“VennDiagram”包将获得的OA差异表达基因与高血压有效基因作交集,共获得131个共同疾病基因,见图2。
蓝色为下调基因,红色为上调基因,灰色为无差异性基因
红色为OA基因,蓝色为高血压基因,棕色为交集基因
2.2 GO和KEGG富集分析通过Bioconductor对共同疾病基因进行GO和KEGG富集分析发现,其基因主要富集于细胞因子活性、蛋白酶活性等生物功能和磷脂酰肌醇3激酶(phosphatidylinositol 3 kinase, PI3K)/蛋白激酶B(protein kinase B, Akt)、肿瘤坏死因子(tumor necrosis factor, TNF)、白细胞介素-17(interleukin-17, IL-17)等信号通路中,见图3。
a:GO富集分析;b:KEGG富集分析条形图越长或点面积越大代表富集的基因越多,颜色越深代表P值越小
2.3 PPI网络构建及关键基因筛选采用String数据库建立共同疾病基因的PPI互作网络,该网络包含121个节点和841条边,见图4。通过网络拓扑分析,并利用5种不同计算方法分别筛选出排名前20位的基因,进行交集后得到11个Hub基因:IL-6、胰岛素样生长因子-1(insulin like growth factor-1,IGF-1)、血管内皮生长因子A(vascular endothelial growth factor A, VEGFA)、基质金属蛋白酶-9(matrix metalloproteinase-9, MMP-9)、IL-1B、表皮生长因子受体(epidermal growth factor receptor, EGFR)、JUN原癌基因(Jun proto oncogene, JUN)、细胞间黏附分子-1(intercellular adhesion molecule-1, ICAM-1)、内皮素-1(endothelin -1,EDN-1)、IL-8、丝氨酸蛋白酶抑制因子肽酶抑制因子-8(serine protease inhibitor peptidase inhibitor-8, SERPINE-1),见表1,图5。
不同的圆代表不同基因,圆与圆之间连线的密集程度代表基因之间的关联程度
不同的颜色对应不同的算法,重叠区域的数字大小表明多种算法交集后的基因个数
表1 Hub基因在不同算法中的排名情况
2.4 Hub基因上游miRNA预测通过miRNet数据库预测11个Hub基因的上游miRNA,共发现 563个有关的miRNA,并筛选出(筛选条件:节点度≥9)综合排名前5的关键miRNA,见表2,图6。
表2 综合排名前5的miRNA信息
红色节点为Hub基因,黄色节点为miRNA,五角星为排名前5的miRNA
OA与高血压常合并发病,但两者在分子层面的共同发病机制尚不明确。因而,本研究基于生物信息学挖掘OA与高血压共同发病的关键基因,为从分子角度阐明两者相互作用机理提供参考依据。将OA相关基因与高血压相关基因交集后获得131个基因,即为共同发病基因。通过GO及KEGG富集分析发现,其基因主要富集于细胞因子活性、蛋白酶活性等生物功能和PI3K/AKT、TNF及IL-17等信号通路中。
促炎因子和抗炎因子作为细胞因子的重要组成部分,两者的相互作用是OA与高血压发病的重要因素。当致炎作用强于抗炎作用时可加快OA进展[7],也可促进血管壁增厚或血管收缩而引起高血压[8]。MMPs是蛋白酶家族的关键成员,可作为加剧OA严重程度和血压升高的重要诱因[9-10]。而在基因富集的信号通路中,PI3K/AKT信号通路参与MMP-13的表达而加速OA软骨降解[11],亦会影响血管平滑肌细胞(vascular smooth muscle cell, VSMCs)增殖和血管紧张素分泌,从而诱发高血压[12]。涉及TNF信号通路的TNF-α不仅可诱导多种MMPs及部分炎症标志物的产生导致OA软骨退变[13],而且其表达水平也能有效预估高血压患者冠状动脉内皮功能障碍所造成的风险大小[14]。在IL-17传导通路中,阻断其表达,既能有效缓解OA疼痛[15],又能降低血管紧张素II诱导的血压升高[16]。
进一步通过网络拓扑分析,并利用5种不同计算方法分别筛选出排名前20位的基因,交集后获得IL-6、IGF-1、VEGFA、MMP-9、IL-1B、EGFR、JUN、ICAM-1、EDN-1、CXCL-8、SERPINE-111个Hub基因。IL-6促进关键蛋白酶的产生而引起OA软骨退变[17],与其受体结合后还可激活一系列反应诱导高血压[18]。CXCL-8引起的炎症反应在OA中会减少原代软骨细胞增殖[19],而在血管壁中却会诱发血管收缩,进而导致血压上升[20]。VEGFA在OA关节软骨、软骨下骨和滑膜中表达,参与软骨退变、骨赘形成[21];亦可诱导VSMCs增殖,而VSMCs异常增殖又是高血压发生的关键[22]。MMP-9作为终末期OA炎症生物学标志之一,可反应OA严重程度[23],同时也是血管重塑与收缩的关键因素,在一定程度上可视为血压急性升高的重要信号[24]。IL-1β与炎症及疼痛密切相关,不仅参与OA关节软骨破坏[25],而且其介导的促炎状态与血压升高也密切相关[26]。而IGF-1、EGFR、JUN、ICAM-1、EDN-1、SERPINE-1尚未有在OA与高血压共同发病的报道。
通过对Hub基因进行上游miRNA预测,选取前5位miRNA(has-mir-34-5p、has-mir-155-5p、has-mir-16-5p、has-mir-1-3p及has-mir-124-3p)进行分析。has-mir-155-5p过表达时,既可以延缓OA进展,引起软骨细胞增值及细胞外基质(EMC)分泌[27],也可作为心血管疾病潜在新生标志物,使血压明显升高[28]。当has-mir-16-5p受到lncRNA SNHG12调控后,使其表达水平下降进而诱发OA软骨细胞凋亡、ECM降解[29];此外has-mir-16-5p还可协同has-mir-19b-5p通过减少心室纤维化和心肌细胞凋亡降低高血性心脏病患者的血压[30]。has-mir-124-3p不仅可调控IL-6/NF-kB信号传导途径介导中药提取物发挥效应以抑制OA炎症,减轻软骨破坏[31],还是降低血管紧张素Ⅱ依赖性高血压的重要影响因素[32]。虽然预测has-mir-34-5p、has-mir-1-3p是OA与高血压共同发病的miRNA,但尚未见相关报道。
综上所述,本研究挖掘出OA与高血压共同发病的关键基因,从生物功能、信号通路和下游miRNA等相关特征多维度揭示OA与高血压合并发病潜在联系,这或可为今后防治两者合并发病提供一定的参考依据。但本研究也存有不少局限之处,例如OA基因芯片包含的样本数量不够大,筛选出来的差异基因可能存在偏差;此外只在理论层面进行研究,缺少动物或细胞实验加以证实,以期寻求更大样本数量的基因芯片或多个芯片进行合并扩大样本量,并补充相关体内外实验,优化此研究方案。