章晓云 李华南* 陈锋 柴源 甘斌 李松
1.江西中医药大学,江西 南昌 330004
2.广西中医药大学,广西 南宁 530000
骨质疏松症(osteoporosis,OP)是一种广泛的全身性及慢性疾病,骨量减少及骨微结构破坏是其主要病理特征,易导致低能量骨折。OP是老年人群中最常见的疾病之一,目前影响着全世界约2亿人,而且随着全球老龄化进程日益加剧,其发病率正快速增长[1]。椎间盘退变(intervertebral disc degenerative,IDD)是一种常见的肌肉骨骼疾病,可导致椎间盘突出症,椎管狭窄,退行性椎体滑脱等脊柱退行性疾病的发生,从而造成人们日常生活质量的下降,并增加医疗成本及社会经济的负担[2-3]。随着生活节奏的加快及生活方式改变,IDD的发病率不断上升,而且呈年轻化趋势。OP与IDD之间的发病病理过程均与年龄增长密切相关,两者的发病机制有相似之处,临床上很多患者同时患有两种疾病。研究表明OP对IDD的发病有着显著影响,但两者之间存在的相关具体机制尚不清楚[4-5]。
随着以基因芯片为代表的高通量测序技术的发展,目前可在短时间内获取疾病的相关信息,进而从基因层面进行更全面的生物标志物筛选。因此,本研究通过GEO数据库查找OP和IDD血清基因芯片表达谱进行生物学信息学分析,筛选出各自的差异mRNA并进行映射取交集,根据蛋白互作网络筛选出核心mRNA,最后对其进行富集分析,为确定OP和IDD之间共同发病机理创造条件,并为OP和IDD治疗药物的研发提供有效的作用靶点。
软件与数据库见表1。
表1 数据库与分析平台Table 1 Involved database and related analysis platform in the study
以“osteoporosis”、“intervertebral disc degeneration”、“human”、“RNA”为关键词,在GEO公共数据库[6]中检索与OP及IDD相关的芯片,获得编号为GSE56116的OP外周血基因表达谱数据,包含10位OP患者和3位健康对照,其所处平台为GPL4133;获得编号为GSE56081的IDD髓核组织基因表达谱数据,包含5位IDD患者和5位健康对照,其所处平台为GPL15314。
利用Perl对数据进行重注释,并利用R语言校正、分类,limma包对基因进行差异分析,再以P<0.05和∣logFC∣≥0.5作为过滤条件,筛选差异基因。最后运用Venny平台将所得OP和IDD的差异基因进行映射取交集,得到交集基因。
使用Cytoscape软件将交集基因导入,运用Bisogenet插件,在Identifiers下选择“Gene identifiers only”,限定研究物种为“Homo Sapiens”,同时在Data Settings下选择“Protein Protein Interaction”,构建直接或间接蛋白互作(protein-protein interaction,PPI)网络。并运用CytoNCA插件进行拓扑分析,筛选出节点连接度(degree,DC)>80和节点介度(betweenness,BC)>2 000的基因[7],构建PPI核心网络图,获取所获取的基因是直接或间接调控发挥治疗OP和IDD作用的关键基因。
利用DAVID数据库[8]对关键基因进行GO功能富集分析,通过统计学P值和FDR值来评估GO生物过程 ( BIOLOGICAL PROcess) ,研究关键基因在OP和IDD发生发展过程中的主要生物功能。
利用DAVID数据库对关键基因进行KEGG功能富集分析,根据所富集的通路功能条目,探究OP和IDD发生发展相关的信号通路。
对OP芯片进行分析,共得到971个明显改变的基因,其中上调基因541个,下调基因430个;对IDD芯片进行分析,共得到9 125个明显改变的基因,其中上调基因4 764个,下调基因4 361个。将2组差异基因分别绘制成火山图,见图1。图中黑色的点代表无差异基因,绿色的点代表下调基因,红色的点代表上调基因。同时在上调和下调的基因中分别选取差异最显著的10个基因绘制差异基因热图,见图2。
将OP和IDD的差异基因上传至Venny平台进行映射取交集,共得到205个交集基因,见图3。该205个交集基因在OP与IDD的发生发展中均发挥着重要作用。
利用Cytoscape的Bisogenet插件构建PPI网络,共涉及3 242个节点、 69 536条边。再利用CytoNCA插件进行拓扑分析,设置DC>80,获得465个节点,16 635条边的网络。最后设置BC>2 000,获得一个涉及8个节点,17条边的PPI核心网络,见图4。结果表明UBC、YWHAZ、TP53、CUL3、NTRK1、BRCA1、Mcm2、ESR1排名靠前,在整个网络中起着关键作用,可能是治疗OP与IDD的关键靶点,其基本信息见表2。
表2 关键基因的基本信息Table 2 The basic information on the key genes
利用DAVID数据库对8个关键基因进行GO功能分析,共确定571条生物过程,主要涉及蛋白质-DNA复合物组合、蛋白质-DNA复合物亚基组织、蛋白质去泛素化、蛋白质小分子修饰、染色体组织的调控等过程。GO分析结果得出的结果与OP和IDD的发生发展过程密切相关。选取富集前15位进行图片展示,见图5。
使用DAVID数据库对8个关键基因进行KEGG富集分析,共确定14个KEGG信号通路条目,主要涉及PI3K/Akt信号通路、泛素介导的蛋白质水解、线粒体自噬、影响细胞周期及凋亡相关通路、神经营养素信号通路、甲状腺激素信号通路等。选取全部结果进行图片展示,见图6。
椎间盘退变是下腰痛的主要发病诱因,经常导致腰椎间盘狭窄、椎间盘突出、椎体滑脱等脊柱退行性疾病的发生,严重影响患者的生活质量。随着人口老龄化加剧,脊柱退行性疾病往往伴随着骨质疏松,尤其是绝经后女性,体内雌激素的迅速下降导致骨密度降低,骨质量下降,骨质疏松发生率较高,而且椎间盘退变更严重。因此本研究通过生物信息学分析了解OP与IDD之间的相关性,筛选两者发病的共同基因,阐释两者之间的相关发病机理,为药物研发提供一定的参考资料。
本研究通过GEO数据库查找获取OP血清基因表达芯片GSE56116和IDD血清基因表达芯片GSE56081,对两种芯片进行生物学信息分析共获得205个交集基因并对其进行拓扑分析,结果表明UBC、YWHAZ、TP53、CUL3、NTRK1、BRCA1、Mcm2、ESR1可能是治疗OP与IDD的关键靶点。研究表明骨质疏松症的发生与成骨细胞和破骨细胞之间介导的骨稳态密切相关[9],骨稳态的平衡还可保证脊柱生物力学的稳定性,可减少IDD的发生几率[10-11]。骨稳态涉及骨形成与骨吸收之间的动态平衡,研究表明UBC在血管生成及骨形成过程中是必不可少的,其可促进骨膜血管生成并提高成骨细胞的活性[12],而TP53在原发型骨质疏松症被上调并发挥着重要作用,其抑制表达后同样可促进机体血管形成和成骨作用减缓骨质疏松病情发展[13]。另有研究[14]表明UBC与TP53参与了IDD发生发展,可能是IDD的潜在治疗靶标。因此笔者认为UBC与TP53通过调节机体骨稳态从而影响OP与IDD疾病的发生与发展。研究[15]表明YWHAZ是治疗骨质疏松症的关键靶点,YWHAZ表达抑制对骨矿化,成骨细胞分化和骨形成发挥抑制作用,从而影响OP的发生和发展。生物信息学研究[16]表明YWHAZ和TP53与IDD的发生发展密切相关,是治疗IDD的关键基因。CUL3在Spop介导的泛素化过程中发挥作用从而影响机体软骨细胞和成骨细胞分化,增加骨密度,促进人体骨骼发育,为临床上骨质疏松、椎间盘退变、骨关节炎等疾病的诊断与治疗提供潜在的靶标[17]。NTRK1基因的突变会影响人体矿物质不足,骨质形成缺陷,引起人体出现复发性骨折和骨质疏松,进而影响脊柱的稳定性,增加椎间盘退变的发生机率[18]。雌激素通过多种途径影响破骨细胞、成骨细胞、免疫细胞和其他细胞的功能从而维持骨矿物质密度至关重要。研究[19]表明ESR1的多态性与人类的骨量相关,在OP发生发展过程中发挥着重要作用,另有研究[20]发现ESR1表达差异会引起人体椎间盘及髓核病理改变诱发椎间盘退变。BRCA1的表达增加导致雌激素受体介导的转录受到抑制从而影响机体的骨形成导致骨质疏松发生[21-22],而BRCA1损伤后会导致椎间盘退变引起脊柱退行性变的发生[23]。因此笔者认为UBC、YWHAZ、TP53、CUL3、NTRK1、BRCA1、ESR1等共同调控OP与IDD的发生发展,它们会诱发椎体骨质疏松,进而引起椎体承受压力能力减弱而导致压力往椎间盘上转移,从而引起椎间盘弹性减低,髓核持续受压后导致其突出概率增大。
为充分了解关键基因在OP与IDD中涉及的共同通路及功能,我们进行了GO 及KEGG分析。GO结果显示靶基因主要通过蛋白质-DNA复合物组合、蛋白质-DNA复合物亚基组织、蛋白质去泛素化、蛋白质小分子修饰、染色体组织的调控等过程,这些生物过程参与成骨细胞增殖分化、细胞凋亡,从而影响机体骨稳态,造成骨量丢失,造成骨质疏松的同时引起椎体生物力学失衡,进而导致椎间盘退变。KEGG分析结果显示信号通路主要涉及PI3K/Akt信号通路、泛素介导的蛋白质水解相关通路、线粒体自噬相关通路、影响细胞周期及凋亡相关通路、神经营养素信号通路、甲状腺激素信号通路等。研究[25]表明FoxO1通过PI3K/AKT途径发生磷酸化从而影响代谢,细胞周期变化及细胞死亡等生物过程,进一步调控骨代谢以改善骨质内微观结构,骨密度及强度,可有效延缓OP病情进展,减少IDD的发生。与GO分析结果一样,KEGG也同样显示泛素介导的蛋白质水解相关通路与影响细胞周期及凋亡相关通路在OP与IDD的发生发展过程中发挥着重要作用。研究表明泛素蛋白酶体系统通过靶向蛋白质底物进行泛素化,在调节成骨细胞和破骨细胞的分化功能介导骨重塑过程中发挥着重要作用,可影响成骨细胞周期及凋亡,调控骨稳态平衡影响OP发生发展,进而导致椎体骨质流失引起IDD发生。自噬和线粒体自噬在成骨细胞分化,矿化和存活过程中发挥着关键作用,越来越多的证据表明成骨细胞自噬和线粒体自噬是OP发病机理中的一种新机制[24]。线粒体功能障碍,氧化应激和髓核细胞凋亡是IDD发生和发病的重要因素,研究[25-28]已证实Parkin介导的线粒体自噬通路激活可有效减轻椎间盘退变。人体在正常生理状态下,成骨与破骨细胞之间的功能平衡才能维持机体骨稳态的正常。研究表明自噬可通过调节骨髓间充质干细胞、成骨细胞及破骨细胞的功能状态参与机体骨稳态的维持,自噬水平降低会导致细胞成骨分化能力减弱,破骨细胞活性增强,从而导致骨稳态失衡引起人体骨质丢失,最终导致OP的发生。OP是全身性疾病,各椎体出现骨质疏松后,其强度和硬度降低,进而影响各椎体承受压力的大小,当椎体受到以往同样的外界压力后,其力量会传导至椎间盘,最终引起OP与IDD在同一位患者中相继出现。椎间盘变性与局部炎症和神经营养蛋白的表达增加有关,神经营养素信号通路的激活可引起神经营养蛋白增加减轻IDD病情[30-31]。人体与动物实验研究[32-33]均表明骨骼与神经系统之间存在密切关联,骨骼细胞与神经组织之间的联系对于促进骨骼的生长,体内平衡和修复非常重要,神经营养蛋白基因表达异常是OP发病的危险因素。吴毅华等[34]研究表明甲状腺激素辅助治疗颈椎退行性椎间盘疾病合并骨质疏松症患者,可有效提高骨密度及成骨相关基因,临床疗效显著,而生物信息学实验验证表明甲状腺激素在OP发病过程中起着关键作用[35],因此甲状腺激素通路是否激活对于OP与IDD病情发生发展至关重要。
总之,OP和IDD均存在庞大的疾病基因网络,但这些网络并非各自独立,而是存在密不可分的联系。本研究获得OP和IDD各自疾病基因网络的交叉部分正是二者相关联的部分,也是研究OP和IDD相互关系的突破点,同时也可为药物同时干预两种相互关联的疾病提供较为可靠的路径和作用靶点。且从侧面反映出不同疾病可通过应用同一药物治疗的特色,与中医辨证论治中的“异病同治”思想不谋而合,以此促进中药现代化发展。为临床两种疾病治疗提供一定的临床指导,让医生及患者了解两种疾病合并治疗的重要性。此外该研究尚存在一些缺点,首先,由于筛选条件的限制,只能对主要蛋白基因、作用靶点、信号通路进行分析,在一定程度上使得研究结果具有局限性;其次,对差异基因信息进行整合处理依赖于生物信息学技术的发展,疾病数据库的完整性、准确性直接决定着整合后信息的可靠性。故本文虽然能够筛选出大量靶点和通路,但仍需后续结合体内外实验进一步验证与支持,使理论更加可靠。