骨质疏松症的遗传及表观遗传因素*

2021-11-30 13:31刘天资郑启文杨鹏温冰涛赵宇
中华骨与关节外科杂志 2021年10期
关键词:甲基化表型骨质疏松症

刘天资 郑启文 杨鹏 温冰涛** 赵宇

(1.中国科学院精准基因组医学重点实验室,中国科学院北京基因组研究所/国家生物信息中心,北京 100101;2.北京大学国际医院骨科,北京 102206;3.中国医学科学院北京协和医学院北京协和医院骨科,北京 100730)

骨质疏松症(osteoporosis,OP)是一种进展缓慢的全身性代谢性骨病,直接成因为骨吸收增多和骨形成减少,典型特征主要为骨量减少、骨微结构破坏、骨脆性增加及容易引起脆性骨折。骨质疏松症分为原发性和继发性两种。骨质疏松症会极大地增加骨质疏松性骨折的风险,主要发生在前臂、髋部和腰椎[1],人群发病率、致残率和死亡率均较高。国家卫生健康委员会2018年发布的中国骨质疏松症流行病学调查结果显示,骨质疏松症已经成为影响我国50岁以上人群健康的重大问题,中老年女性患病率水平显著高于欧美国家。我国50岁以上人群骨质疏松症患病率为19.2%,其中男性为6.0%,女性为32.1%;65 岁以上人群骨质疏松症患病率达到32.0%,其中男性为10.7%,女性为51.6%。不健康生活方式和年龄增大是骨质疏松症高发的主要原因。随着我国城市化、人口老龄化进程的不断加快和不健康生活方式的广泛流行,我国骨质疏松症的防控形势还将日益严峻。

骨质疏松症是由遗传因素和环境因素共同作用的复杂疾病。骨质疏松症具有较高的遗传度(25%~80%)和家族集聚性[2],同时与性别、年龄、体重、营养、饮食、吸烟、饮酒、生活习惯及女性生育情况等环境因素相关[3]。前期研究发现了大量与骨质疏松症及骨密度相关的分子标志物。本文章将从遗传及表观遗传两个方面进行回顾和综述,并探究骨质疏松症的分子机制。

1 骨质疏松症遗传学研究

人类基因组计划已经完成,各种类型的后基因组计划正在蓬勃开展,人们对于遗传变异和疾病的关系也有了深入的认识。人类基因组上的任何一种变异都可能会引起个体的表型或特征发生改变甚至引起疾病,遗传易感性研究通常关注的是与人类疾病相关的基因组变异。对于复杂疾病的遗传因素,全基因组关联分析(genome-wide association study,GWAS)是最常用的研究方法,即针对全基因组上数百万个遗传位点进行关联分析,鉴定与表型或疾病相关的变异,并通常伴随着独立样本的验证。

1.1 骨质疏松症或骨密度表型的GWAS研究

既往研究通过GWAS 已鉴定了数百个与骨质疏松性骨折或骨密度相关的基因和位点。首例骨质疏松症相关表型GWAS研究发表于2007年,基于241个家系的1141 例样本的全基因组芯片分型数据,发现14 个遗传位点与骨量相关,且LRP5、VDR、MTHFR、ESR1、COL1A1和CYP19基因与骨质疏松症风险相关[4]。GWAS分析为了尽量多地检出与表型显著相关的位点,需要大规模的样本量来提高统计能效,因此多中心合作的大规模meta 分析是经常用于提高样本量的方法。多项大规模的骨质疏松症GWAS 均发现及验证了一些列在骨代谢中发挥重要作用的基因与骨质疏松症或骨密度相关。目前,大规模的国际骨质疏松症队列骨质疏松症遗传因素联会(genetic factors for osteoporosis consortium,GEFOS)收集了骨质疏松症及相关表型和全基因组数据。GEFOS 分别在2009年和2012 年发表了骨质疏松症GWAS 的meta 分析。其中,第一阶段基于近两万例欧洲样本,共鉴定出20个与骨密度相关联的位点[5];第二阶段基于总计8 万例样本发现56 个骨密度相关位点和14 个与骨质疏松性骨折相关联的位点[6]。

2017 年发表的一项研究使用了来自英国生物样本库(UK biobank,UKBB)的14 万例样本的足根超声扫描骨密度表型进行了GWAS 分析,鉴定了153 个遗传位点与骨密度流失相关,其中12 个位点在此前报道的8540个因跌倒骨折的样本中与骨折风险相关[7]。2019 年,Morris 等[8]基于UKBB 的42 万例样本数据再次进行了骨质疏松症GWAS 研究,鉴定了518 个骨密度相关的基因位点,并在多达120 万例样本(包含UKBB 和23andme 两个队列)中发现了13个骨折相关的遗传位点。两次研究均在小鼠中进行了基因敲除实验,检测敲除小鼠的骨骼代谢情况及骨折发生率的改变,以验证鉴定的基因位点的功能。与骨密度关联性较强的GPC6基因编码了一种在细胞表面存在的编码糖基磷脂酰肌醇锚定蛋白,且与罕见的常染色体隐性骨骼发育不良相关[7]。在动物模型中移除该基因或许就能够增加机体的骨质厚度。DAAM2基因为骨细胞特征基因,在小鼠颅骨成骨细胞和骨髓来源的破骨细胞中高表达[8]。DAAM2敲除能造成小鼠的骨骼异形,并和人类成骨细胞的矿化能力相关。由于GPC6和DAAM2功能与骨骼发育发育相关,或许可以作为新型药物的潜在靶点。

1.2 骨质疏松GWAS研究成果的临床应用

GWAS 研究的结果能够帮助研究者更好地理解骨质疏松症的遗传机制。将遗传学发现进行临床转化,最终应用于疾病的早期筛查和防治是GWAS研究的终极目标。前期研究发现,将骨密度相关的遗传位点应用于骨质疏松症的风险评估模型,可以提高骨质疏松性骨折的预测准确性[9,10]。一项研究发现基于62 个骨密度相关的SNP 位点估算的遗传打分每增加一个单位,骨折风险相应增加约20%,且这种遗传关联独立于年龄、既往骨折史、是否跌倒等因素[10]。另一项研究基于UKBB 样本的骨密度GWAS 发现的DNA 多态位点进行遗传打分,发现基于遗传位点的预测结果与骨密度强相关(R2=0.415),骨折风险预测准确度(AUC)达到0.80[11]。

同时,具有较大遗传效应的骨密度和骨质疏松性骨折风险易感位点在药物靶点设计等临床应用方面可能更有价值。八种经批准的骨质疏松疗法中,有五种(63%)参考了GWAS 研究发现的基因[12],如地诺单抗的药物靶点RANKL[13]。另一方面,骨密度和骨质疏松性骨折的部分易感位点同时与其他多种疾病相关。例如,ACHE基因与骨密度相关,其抑制剂为一种经批准的治疗阿尔茨海默病的药物(多奈哌齐,第二代乙酰胆碱酶抑制剂)[12]。研究表明,骨质疏松症和髋部骨折是阿尔茨海默病患者常见的并发症[14],因此,多奈哌齐可能同时也是骨质疏松症的潜在药物。

1.3 GWAS研究方法的优势及不足

虽然通过GWAS 发现了骨质疏松症及其相关表型的一系列易感基因位点,但仅能解释疾病及表现的一小部分变异。比如GEFOS-1 所发现的20 个基因只可以解释5%的表型变异[15],基于UKBB 样本的骨密度GWAS 发现的数百个位点只能解释12%~20%的表型变异[7]。因此,目前仅凭GWAS 发现的骨质疏松症的易感遗传位点无法实现表型变化的精准预测,即便利用基于大量遗传位点信息构建的预测模型也不能达到相关领域实际应用所要求的准确度。GWAS 方法的“缺失的遗传度”现象不只发生在骨质疏松症研究中,对于大多数不具有主效基因的复杂表型,传统的仅利用基因组数据的GWAS研究方法具有较大的局限性,不仅无法解释环境因素对表型的影响,且检出效率对样本数量的依赖性非常强,已无法满足当前复杂表型和疾病研究的迫切需求[16-18]。

2 骨质疏松症相关的表观遗传学研究

表观遗传修饰对基因的表达起到非常重要的调控作用,主要包括DNA 甲基化和组蛋白修饰等。前期研究表明,多种环境因素与骨质疏松症相关[19],表观遗传因素对骨细胞的分化和活性有很大的影响[20],并与骨质疏松症的发病相关[21]。甲基化位点不改变原始DNA 序列,而是通过影响基因的结构和表达方式来影响细胞分化和发育,从而调节多种复杂表型和疾病的遗传风险和环境影响[22]。因此,DNA甲基化修饰被认为是连接基因型和个体表型之间的桥梁。且与GWAS分析方法对应的是,全基因组水平的表观基因组关联研究(epigenome-wide association study,EWAS)方法也被应用到骨质疏松症及骨密度表型的研究中。

2.1 骨质疏松症及骨密度的候选基因差异甲基化研究

早期的骨质疏松症表观遗传研究通常集中在一些在骨生物学中已知具有重要功能的候选基因上。例如,一项研究基于4 例绝经后骨质疏松妇女和4 例健康对照的骨活检样本,比较了SOST基因启动子区域的DNA 甲基化水平[23]。该研究发现骨质疏松症患者的SOST启动子甲基化水平显著上调,并在63 名绝经后妇女(27 例患者,36 名健康对照)的独立队列中验证了这一结果。同时,该研究还观察到骨骼样本SOST的mRNA 水平和血清硬化蛋白水平(骨形成的抑制剂)及骨密度之间显著正相关。因此骨质疏松症患者SOST启动子甲基化上调导致的SOST表达的降低可能是一种抵消骨质流失的补偿机制。然而,2019 年的一项研究报告了相互矛盾的结果,该研究比较了16 例中国骨质疏松症患者和16 名对照组的股骨组织,在骨质疏松症患者中SOST基因表达(mRNA 和蛋白质)水平显着增加并且SOST启动子轻微低甲基化[24]。因此,SOST甲基化修饰与骨质疏松症之间的关系有待进一步确定。此外,前期研究发现人骨髓来源的间充质干细胞和脂肪组织来源的间充质干细胞在诱导成骨分化之后,RUNX2基因启动子低甲基化且表达上升,同时成脂相关基因PPARV基因启动子高甲基化且表达降低,表明骨代谢相关基因通过改变启动子的甲基化水平来调控基因表达[25]。

2.2 骨质疏松症或骨密度表型的EWAS研究

另一方面,全基因组水平的DNA 甲基化与人类骨质疏松症的EWAS 也先后发表。2013 年发表了第一项人类骨骼EWAS 研究[26]。该研究基于27 例骨质疏松性髋部骨折患者和26例髋关节骨关节炎患者的股骨头小梁骨标本,检测到241 个差异甲基化的CpG位点。迄今为止,最大的使用骨组织标本的EWAS研究是在84名骨密度表型差异很大的绝经后妇女中进行的,并确定了63 个与骨密度相关的差异甲基化CpG[27]。由于难以获得人体骨组织样本,一些EWAS研究使用外周血DNA 甲基化水平检测骨质疏松症及骨密度相关的DNA 甲基化位点。然而,前期研究表明外周血DNA 甲基化模式可能无法有效反映骨细胞的表观基因组状态[28,29]。

2.3 运动通过改变DNA甲基化水平作用于骨代谢

由于环境因素具有较大的时空变异性,因此,与表型相关的外周血DNA 甲基化位点不仅可用于疾病和相关表型的风险预测,而且可用于疾病等表型的预防或干预。运动产生的机械效应能够调节骨转换、生长和矿化,有效刺激骨生长,因此,运动干预方法常被用于骨质疏松症患者的复健。研究表明,运动可以通过DNA 甲基化水平的改变来影响骨代谢基因的表达。前期研究将小鼠的间充质干细胞进行机械刺激,发现骨桥蛋白OPN 启动子甲基化下降了35%,表达水平增加了2.3倍,并发现机械刺激与生化诱导分化对OPN的表达影响程度差异不大[30]。此外,前期研究对成年个体的人脂肪组织多能基质细胞施加循环机械拉伸,观察到成骨率明显升高,并检测到位于NESP、GNASXL的两个基因上的共计三个位点甲基化水平显著降低,最终促进成骨分化[31]。

综上所述,基于骨质疏松症及骨密度相关的DNA 甲基化位点及甲基化年龄估测的衰老程度,能够提高骨质疏松症及骨密度表型的解释比,从而提升骨质疏松症风险预测模型的准确度,并能够作为术后干预效果的有效衡量指标,对骨质疏松症的预防和治疗有重要的实际意义。

3 骨质疏松症的跨组学研究

GWAS 发现的易感性位点大部分位于并不改变基因编码序列的非编码区及基因间区,虽然部分GWAS位点可以以形成染色质环等多种形式,功能性远距离调控相关基因的表达,但是大部分GWAS位点的生物学功能尚不明确[32]。因此,为了更加深入的理解疾病和复杂表型的分子机制,对GWAS发现的位点进行功能研究或跨组学功能注释是非常重要的环节。前期研究基于成骨细胞、破骨细胞或骨骼相关组织的表达数量性状基因座(expression quantitative trait loci,eQTL)分析发现了一系列非编码遗传位点及其下游靶基因在骨质疏松症中的功能。例如,一项研究基于95 例样本的未分化成骨细胞的微阵列谱,对前期GWAS研究发现的骨密度相关位点进行了eQTL 注释[33]。另一项研究将淋巴细胞和外周血的eQTL 信息用于骨密度GWAS 发现的位点,并发现LINC00339基因为骨质疏松症的潜在致病基因。

4 小结

骨质疏松症作为一种典型的复杂疾病,虽然前期研究发现了一系列相关的遗传和表观遗传位点,但其背后的分子机制目前尚未完全探明。骨质疏松症的功能基因组学和包括表观遗传学的其他组学研究存在较大局限性,例如难以获取大量的人体骨组织样本、队列特征不佳或缺乏健康对照等。尽管如此,前期研究发现了一系列骨质疏松症的遗传位点,并揭示了Wnt/β-catenin 信号通路及维生素D 内分泌途径及其他骨代谢途径中的表观修饰和基因表达与骨质疏松症及骨密度表型关系,为骨质疏松症的预防和治疗提供了潜在的分子标志物和药物靶点。

基于多组学生命大数据研究方法,能够从多维度系统理解遗传、表观遗传、基因表达、代谢及环境间互作,从而在个体化预防、治疗和用药指导等方面发挥重要作用,因此是包括骨质疏松症在内的复杂疾病的未来研究方向。同时,由于骨质疏松症是老年疾病,因此生理性衰老的研究对预防骨质疏松症也具有重要的意义。未来应综合前期研究发现的包括遗传和表观遗传在内的多组学分子标志,构建涵盖遗传-环境-衰老的动态交互新型风险评估模型,并辅以精准个体干预方案以降低复发率,最终实现对骨质疏松症的早期筛查及高效防治。

猜你喜欢
甲基化表型骨质疏松症
基于电子病历的表型分析方法及应用综述
基于衰老相关分泌表型理论探讨老年慢性阻塞性肺疾病患者衰弱发生机制
一种肿瘤甲基化谱纯化的统计方法朱宜静
5-氮杂胞苷调节植物基因表达研究进展与应用展望
QCT与DXA对绝经后妇女骨质疏松症检出率的对比
有些骨质疏松可治愈
甲基苯丙胺改变成瘾小鼠突触可塑性基因的甲基化修饰
植物DNA甲基化研究进展
幽门螺杆菌感染与骨质疏松症相关性研究进展
骨质疏松症采用阿仑膦酸钠联合注射用骨肽治疗的效果