王洋曾静李春霖龚燕平
解放军总医院第二医学中心内分泌科,老年医学临床研究中心,北京 100853
骨质疏松症(osteoporosis,OP)是以骨量降低,骨组织微结构受损,致使骨骼力学强度下降、骨折风险上升为表现并随着年龄增长发病率增高的一种退行性疾病[1],全世界大约有2亿人患有OP[2]。世界卫生组织推荐使用双能X线测量骨密度(bone mineral density,BMD)作为OP的诊断标准:绝经后女性及50岁以上男性的股骨颈BMD较白种人年轻女性骨量峰值低2.5个标准差(standard deviation,SD)以上即为骨质疏松[3];国内推荐使用低于峰骨量2个SD作为诊断标准;骨质疏松性骨折(osteoporotic fracture,OF)是骨质疏松患者最严重的并发症,也是患者就诊最常见的原因。
骨量减少是导致OF的重要因素,研究表明BMD值每降低1SD,主要部位骨折风险升高1.5~2倍,对于髋部而言骨折风险升高2.5倍[4];但是单独使用BMD预测OF风险准确率并不高,50%以上的OF患者BMD值正常或稍低,并没有达到OP的诊断标准[5]。美国的一项研究报道,8065名绝经后女性,243位患者在5年内发生了髋部骨折,这些骨折患者中仅有46%的患者BMD T Score≤2.5,所以单纯依靠BMD预测OF将导致很多患者不能做到早诊断、早预防[6-7];其他非骨骼因素如年龄、跌倒、激素使用等[8-10]也会使骨骼脆性异常导致OF。因此,将临床风险因子(clinical risk factor,CRF)与BMD联合应用以提高预测OF的准确性和灵敏度势在必行[11-12],OF的CRF很多,有不可控因素如种族、人口老龄化、女性绝经、脆性骨折家族史等,还包括可控因素如吸烟、过量饮酒、维生素D缺乏,和影响骨代谢的疾病如风湿性疾病、血液系统疾病、使用影响骨代谢的药物如糖皮质激素、抗癫痫药物等[13-18]。目前综合各种CRF开发出40多个风险评估工具,但只有少数工具在大人群样本中进行过验证,运用广泛和准确率得到公认的有Fracture Risk Assessment Tool(FRAX,网址https://www.sheffield.ac.uk/FRAX/?lang=chs)、QFracture(网址https://qfracture.org)和Garvan nomogram (网址http:// www. fractureriskcalculator.com),本综述主要目的是阐明这些预测工具的优缺点并对比不同。
我国老年人骨质疏松症发病率为36%,其中女性较高为49%,男性为23%,2010年我国流行病学调查和2013年国际骨质疏松基金会(International Osteoporosis Foundation,IOF)在亚洲的调查报告中显示[19],中国OF患者高达233万例,其中椎体骨折111万例,髋部骨折36万例,其他类型骨折86万例,医疗花费649亿人民币,预计到2050年,我国OF患者将达到599万例,医疗花费甚至高达1 745亿人民币,可见骨质疏松症是我国的重要公共卫生问题[20-21]。英国皇家医师学院基于50岁以上人群进行了骨质疏松研究,在1999年和2000年发布了预防和治疗指南骨质疏松症的研究,后分别于2009、2013和2017年进行更新,该研究将OF风险等级分为低、中、高三级,并依据风险等级进行不同干预:低风险的患者只需改变生活方式和定期随诊,中度风险患者需测量BMD然后再判断是否进行治疗,高度风险则需要接受治疗,结果显示按此方法可有效减少髋部骨折概率[22-24],由此可见,进行OF风险评估意义极大。
三种预测工具所包含的风险因素差异很大,有简单的只需要5个风险因子的Garvan nomogram,还有需要十几个风险因子的FRAX和QFracture,见表1。
表1 三种骨质疏松性骨折预测工具的风险因子及输出结果Table 1 Risk factors and outputs of three osteoporotic fracture prediction tools
FRAX是2008年英国Kanis教授等人研发的现今应用广泛、认可度极高的骨折风险评估工具,风险因子有11个(见表1),能够预测10年内骨折风险,BMD可以选择性加入;在女性患者中其风险评估能力为0.74(0.68~0.80),加入BMD后可升高至0.79(0.73~0.85);在男性患者中其风险评估能力为0.71(0.65~0.77),加入BMD后升至0.77[25-26]。
QFracture是基于英国一项前瞻性开放队列研发出的OF风险评估工具,该研究收集了英格兰和威尔士200多万30~85岁的男性和女性数据,与FRAX工具一样,QFracture考虑了吸烟、饮酒和类固醇使用史、父母史(髋部骨折或骨质疏松症)等,但与FRAX不同的是,QFracture还包括跌倒史和其他大量的临床危险因素,却没有BMD,经过了来自相同人群的内部验证和类似人口的外部验证;预测年限为1~10年范围内任意年份,其特点是风险因子在三种预测工具中最多,包含风险因素,全面预测骨折的评估能力(AUC,95%CI)也是三种工具中较高的,女性0.89(0.88~0.89),男性0.87(0.86~0.88)[27];临床医生可以根据QFracture评分将患者进行风险分组,并可根据风险高低制定下一步的检查治疗方案[28]。
Garvan nomogram是澳大利亚科研机构基于国际知名的Dubbo骨质疏松流行病学数据研发的,只包含5个风险因素(BMD可以选择性加入),能够评估5年或10年内发生OF的风险,根据是否加入BMD分为2种模型,模型II(不加入BMD)的AUC女性0.72、男性为0.74,均低于模型I(加入BMD)的男性、女性均为0.75; Sandhu等[29]使用Garvan nomogram和FRAX两种风险评估工具在澳大利亚人群中进行比较研究,结果显示在女性人群中两种工具无明显差异,但在男性人群中Garvan nomogram的OF风险评估能力优于FRAX。
以色列的一项回顾性研究直接比较了三种预测工具的准确性,该研究为消除不同人群样本带来的差异,在1 024 815名50~90岁人群样本中进行了独立外部验证,以2010-2014年电子病历中出现OF为终点,将观察到的骨折率与2010年预测的概率进行比较,实际结果为:人群5年髋部骨折发生率为2.7%;Qfracture的AUC为82.7%,FRAX为81.5%,Garvan nomogram为77.8%;经外部验证分析得出QFracture(30~100岁)的髋部骨折预测AUC为88.0%,FRAX(50~90岁)为81.5%,Garvan nomogram(60~95岁)为71.2%。可以看出在不同人群及相同人群中三种工具预测能力均稳定,QFracture和FRAX对髋部骨折预测均有较高的判别能力,结果相近,而Garvan nomogram表现稍差[30]。
三种预测工具除所需风险因子的不同外,还存在适用人种、年龄范围等不同,见表2。
表2 三种骨质疏松性骨折预测工具的不同Table 2 Differences among the three tools for predicting osteoporotic fractures
FRAX的适应人种是最多的,其在9个国家26项研究进行过验证,也是三种骨质疏松性骨折风险预测工具中唯一在中国人群经过研究验证的工具,研究人种较全面,包括白种人、黄种人和黑种人;QFracture只在英国和爱尔兰2个国家应用过,且只限于白种人,缺少广泛的人群和地区验证[28],Garvan nomogram在澳大利亚、新西兰和加拿大3个国家进行过验证,同样只限于白种人;FRAX适用年龄是40~90岁人群,男女均可,相比于QFracture的30~99年龄范围跨度小,比GARVAN nomogram的56~96岁年龄范围大。
GARVAN nomogram在3个国家6项研究进行验证,预测年限为5或10年,QFracture可以预测1~10年内骨折风险,可选范围大;而FRAX只能预测10年内骨折风险,可选空间小。对于老年人来说以10年为单位计算显得有些长,不适用于非常老的人群[31],相比而言QFracture在此方面显得更加灵活。
QFracture在2个国家3项研究进行过验证,由于其风险因素包含较多,对于个人不便使用,与FRAX和Garvan nomogram所需风险因素相比,非专业人员在使用QFracture自测过程中会遇到一些困难,因为部分数据需要医生检测[32];相对而言,FRAX和Garvan nomogram使用比较便捷,此两种工具所提供的风险因素数据,绝大部分不用专业人员或医疗器械检查就可获得,大部分人通过其官网就可以进行OF的风险自测。
目前世界上有多种OF风险预测工具,上述列举的FRAX、QFracture和Garvan nomogram是应用比较广泛的,选择OF风险评估工具应该在使用的便捷性、准确性和花费三者之间加以衡量,还要根据患者的临床特点,比如是否有特殊病史、年龄范围等方面考虑;从上述几种工具可以看出,包括CRF的QFracture有较强的评估能力,但现今只限于英国和爱尔兰两个国家,没有推广;FRAX是应用国家、人种和研究报告最多的OF风险评估工具,效果比QFracture也不逊色[33]。我国2011年发布的原发性骨质疏松症诊疗指南中建议使用矫正后的FRAX对高危人群进行骨折风险评估,在2018年我国香港的一篇报道中也肯定了FRAX在中国人群中的的骨折风险评估能力[34]。QFracture和Garvan nomogram两种工具均有各自的特点,但是两种工具是否适用于我国人群还有待验证,尤其是QFracture需要有一定专业基础的人员参与,进行研究推广存在一定困难。
BMD是WHO认定的OP诊断标准,FRAX和Garvan nomogram两种工具使用时可选择性加入BMD,根据表1可以看出,加入BMD后提高了预测工具的AUC值,但在英国的病人中很少有人做BMD检测,缺少大量患者数据验证,因此QFracture没有将BMD当作风险因子是其局限性,可能会降低其预测能力。在实际生活中检测BMD会增加患者经济负担,而且有研究指出,对于在FRAX风险评分临近基线的50~64岁的女性不建议测BMD,在65岁以后测量更有意义[35],风险高的人群股骨颈BMD几乎都是低于正常的,所以FRAX风险评分高的人群也可以不检查BMD,直接干预治疗[36];大多数OF风险评估工具都包括了年龄、性别、体重指数或体重、骨折史4个风险因素,其中年龄是OF最重要的风险因素,权重也是最大的,有报道指出只使用年龄和BMD进行OF风险评估的预测工具SOF和使用年龄与骨折史的GLOW Cohort、OST等简单工具的准确率与最复杂的包含31个危险因素的QFracture准确率相似,而且更便于医生和患者使用[37]。
激素的使用会导致药物性骨折,但是Garvan nomogram的风险因子中没有此项,可能降低评估效能[38],FRAX和QFracture两种工具中包括激素使用史,但两者不同的是FRAX没有使用激素的剂量-效应关系,使用激素剂量的高低会对OF的发生有很大影响,因此FRAX可能会低估使用大剂量激素人群的骨质疏松性骨折风险,高估使用小剂量激素人群的骨折风险[39]。
现今的研究表明跌倒是OF的一个重要危险因素,尤其是对于髋部骨折而言跌倒则尤为重要,会显著增加骨折概率[40],然而FRAX的CRF中却没有包含这一因素,可能会降低其风险评估能力。
QFracture是三种预测工具中唯一没有将BMD纳入风险因子的,但是其添加了2型糖尿病、心血管病、激素的使用、三环类抗抑郁药使用和绝经期症状等疾病,风险因子最多、最全面,AUC也是三种预测工具中最高的。在英国的一项研究中,QFracture的预测能力强于FRAX[41];虽然QFracture没有将BMD作为OF风险评估的风险因子,但是通过增加其他风险因素进而补充,效果同样很好;然而,由于其风险因素包含较多,临床医生对疾病诊断标准、录入电子病历的数据指标、病历资料的完整性都会对结果产生影响。
综上所述,FRAX有很好的适用性和操作性;Qfracture风险因素包含全面、预测能力强;Garvan nomogram使用比较简单,虽然三种OF风险预测工具有其局限性,但都可以起到有效的示警作用,为骨质疏松性骨折的预防提供参考。我国已经步入老龄化社会,骨质疏松性骨折在老年人群中发病率高,是影响老年人生活质量、导致死亡的一个主要原因,对于医生和患者来说,掌握和了解OF风险预测工具的使用方法非常重要。