黎康弟 张金山 姚云 陈垄肸 麦家杰
广州医科大学附属第三医院核医学科,广东 广州 510150
骨质疏松(osteoporosis,OP)是一种以骨量降低及骨显微结构退化,骨脆性增加易发生骨折为特征的全身系统性骨骼疾病,随着人口老龄化的日趋严重,OP已成为我国面临的重要公共健康问题[1]。目前,有多种手段可用于骨密度(bone mineral density,BMD)的测量以诊断OP及评估脆性骨折风险,各有其适用范围和局限性[1-2],其中应用双能X线吸收法(dual energy X-ray absorptiometry,DXA)定量测量则被WHO推荐为OP的诊断标准[3]。DXA具有高精密度、扫描时间短、低辐射剂量以及稳定的校准效能,价格便宜,结果精准可靠等独特优势而被广泛应用于临床。虽然DXA骨密度仪是一种高精度仪器,但必然有一定的测量误差,操作者的操作对DXA测量质量至关重要[4],故必须采取有效的质量控制方法,以确保测量结果的真实性、可靠性。本研究应用短期精密度实验,通过分析标准差的均方根(RMS-SD)和百分变异系数(coefficient of variation,CV)的均方根(RMS-CV)来观察骨密度测量的精密度误差(precision error,PE),并根据PE来计算最小显著性变化值(least significant change,LSC)和最短随访时间所需的变化,从而筛选出骨密度测量中最佳的感兴趣区(region of interest,ROI),为准确评估OP疗效和确定随访间隔时间等提供量化指标和参考依据。
根据纳入标准和排除标准共确定124例受检者,均来自本院的健康体检者,其中男性31例,女性93例,年龄25.2~79.6岁,平均年龄为(54.1±8.9)岁。全部受检者经知情同意后均连续重复测量2次,在第2次测量前,要求患者下床后再上床重新定位。由本科室4名技术员(A、B、C和D)完成测量,每位技术员均完成31例受检者的BMD测量。纳入标准:男女性别不限,年龄在20~80岁,无影响DXA骨密度测量的不良因素。排除标准:①严重的腰椎解剖结构异常,如严重脊柱侧弯、严重退行性变、扫描部位骨折、外科手术致脊柱和全髋部异常等;②椎骨明显硬化、增生;③各种可引起假性骨密度增高情况,如高密度异物、体表的药膏、放射性核素显像后有残留放射性、胃肠钡剂、造影剂残留等;④摆位时腰椎轴线倾斜、偏移、人为侧弯、髋部测量中骨内旋角不准等。
GE Lunar Prodigy型双能X线骨密度仪。
每天在检查前必须使用每日质量保证(quality assurance,QA)测试及校正自检程序完整执行每日QA程序,用GE公司提供的黑色标准校准模块来完成,该校准模块包含类等同组织的材料,并具有3个已知骨矿质含量的骨模拟室。每日QA测试通过后,骨密度仪方可正常使用。如果QA测试未通过,需重新定位校准块,重复执行QA程序,如果第2次还是测量失败,则致电GE工程师寻求协助。在本研究期间,每日QA均为一次性通过,该期间机器没有进行大维修。同时使用脊柱水模(GE公司提供的铝梯腰椎体模)独立评价校正结果,每周至少扫描体模一次。
选择腰椎及双髋部为BMD检查部位,BMD检查需注意以下事项:感兴趣区域内必须保证无任何影响骨密度测定结果的因素,必须避免任何可以削弱X射线光束的物品,例如腰带、纽扣、项链、钥匙、手机等金属性高密度物品,检查前2~3 d没有服用或注射放射性核素或钡剂等高密度药品等。
1.4.1腰椎BMD测量:采用腰椎后前位摆位法,嘱受检者仰卧于扫描床中间,以扫描床的中线作为参考来校正受检者体位。受检者的左右手臂必须远离左右髋部的边侧,自第5腰椎开始往上扫描,两侧髂脊可见。理想的腰椎扫描图像是腰椎垂直并位于扫描视野中间,扫描区域必须包含完整的第1~4腰椎,从两侧髂脊扫描到T12清晰可见。
1.4.2髋部BMD测量:采用腰椎后前位摆位法,受检者仰卧于扫面床正中后(同腰椎BMD测量),大腿略向外拉,双腿内旋15°~25°,然后将受检者的足部放在厂家提供的股骨定位装置来固定受检者的脚,选择定位按钮时,出现定位激光灯,调整激光灯的位置,使起始激光点定位在股骨干的中部,距髂嵴一手间距离,点击开始扫描。扫描区域应清晰准确包括大转子、股骨颈和坐骨,股骨干垂直,小粗隆不显示或者小部分显示(即“显而不露”)。左右髋部检查顺序时间先后不拘。检查完毕后,检查图像质量,若符合要求则点击回归静泊位,检查结束。
1.4.3PE及LSC的计算方法[5]:公式(1)~(4)分别为标准差(SD)、标准差均方根(RMS-SD)、CV、变异系数均方根(RMS-CV)的计算方法。PE用RMS-SD和RMS-CV计算表示,95%可信区间的最小显著性变化值分别用LSC-SD、LSC-CV表示,其计算公式见公式(5)。各计算公式如下:
(1)
(2)
(3)
(4)
LSC=2.77×PE(RMS-SD,RMS-CV)
(5)
间隔时间(monitoring time interval,MTI)=
(6)
(7)
其中,式中χ为检测值;n为样本例数;SD 与s同义,皆为标准差;PE为精密度误差;Z’为预计达到的可信度水平;n1为基础测量次数;n2为跟踪测量次数;MTI为随访间隔时间。
图表制作使用Excel 2003软件,统计分析使用SPSS 18.0软件,相关性分析采用非参数检验,以P<0.05为差异有统计学意义。
4位技术员的腰椎及双髋不同 ROI的骨密度测量的PE和LSC结果见表1。表2表示不同测量指标团队的水平。由此可见,不同操作者测量各感兴趣区的各项指标的水平和团队的平均水平是有差异的,各个技术员的每个测量位点的PE和LSC也不同。但采用非参数检验方法对不同技术员的CV进行统计学分析,L1~4、左、右股骨颈和左、右全髋部的P值分别为0.764、0.545、0.613、0.084和0.219(n=124)。
表1 不同技术员测量腰椎和髋部不同ROI的精密度误差情况Table 1 Precision errors of different ROIs of the lumbar and hip measured by different technicians
注:A、B、C和D表示为4位不同的操作者(技术员)。
表2 不同测量指标团队的平均水平Table 2 Average level of indicators by different measurement teams
2.2各测量部位不同感兴趣区PE与LSC的对比及变化趋势(图1~4)
图1 技术员A不同感兴趣区的PE和LSC变化趋势Fig.1 Change trend of PE and LSC in areas of interest by technician A
图2 技术员B不同感兴趣区的PE和LSC变化趋势Fig.2 Change trend of PE and LSC in areas of interest by technician B
图3 技术员C不同感兴趣区的PE和LSC变化趋势Fig.3 Change trend of PE and LSC in areas of interest by technician C
图4 技术员D不同感兴趣区的PE和LSC变化趋势Fig.4 Change trend of PE and LSC in the area of interest by technician D
由图1~4可见,对于腰椎BMD的测量,4名技术员的L1~4的PE和LSC均为最低;对于双髋部,技术员A、C、D均以左全髋部的PE和LSC最低,技术员B则是左大粗隆的PE和LSC最低,但本实验中4位技术员之间对于L1~4、左、右股骨颈和左、右全髋部测量的PE(CV)差异皆无统计学意义(P>0.05)。在各测量位点中,用标准差(SD)和变异系数(CV)这两种表达方式所表示的PE和LSC在不同测量位点的波动幅度有所不同,但是就整体而言,不管是用RMS-SD和RMS-CV来表示PE,还是用LSC-SD和LSC-CV来表示LSC,这两种表达方式的结果趋势基本一致。每个技术员个体之间在各个测量位点的PE和LSC的波动幅度也是有个体差异的,腰椎各感兴趣区的PE和LSC较双侧股骨的波动幅度小。SD所表示的PE和LSC较CV所表示的波动幅度要稳定一些。技术员C的整体波动幅度比较稳定,技术员B的整体波动幅度相对不太稳定,但是在最主要的感兴趣区,4名技术员的波动幅度都比较平稳。
由公式6计算[6]:随访MTI=LSC/预计BMD年变化率。本研究中,L1~4、左右全髋部等的PE值低、精密度误差小,应选择这几个部位进行估算MTI。例如一个患者接受治疗后,1年腰椎(L1~4)骨密度均值增加0.031 g/cm2,L1~4的LSC-SD为0.031 g/cm2,则通过公式可得出:MTI=LSC/0.031=0.031/0.031=1.0(年)。
DXA骨密度仪是一种定量测定BMD的精密仪器,但仍存在测量误差问题,测量误差包括准确度误差和精密度误差。准确度误差是一种系统误差,是指测量结果与真值的一致程度,是对骨密度仪测量真值能力的反映。在不同的时间点测量同一个标准模块,如其标准差(SD)及CV越小,则表明准确度误差越小,被测量值越靠近真实值,该设备稳定性就越好。精密度误差又叫平方根标准误(RMS-SD),是指在相同的条件对同一被测量对象进行多次独立的测量结果之间的一致性,反映了测量结果的重复性问题,可分为短期和长期两种精密度误差。长期精密度实验比短期精密度实验更重要,但长期精密度实验至少需要1年的时间,而且还存在其他一些误差因素,如仪器受局部温湿度影响、探测器漂移、设备的机械损耗、更换操作者等,长期精密度实验在实际应用中存在较大的难度。而短期精密度实验作为评价重复性的指标,只要用来衡量骨密度变化的最小显著性变化,对于每一个用于随访观察患者骨密度变化的骨位点都可进行独立的精密度研究,能更有效监督患者骨密度的变化[7]。国际临床骨密度测量学会(International Society for Clinical Densitometry,ISCD)推荐短期精密度实验方法,即重复扫描15例患者每人3次(或30例患者每人2次),每次扫描需重新定位[8]。本研究采用的也是短期精密度实验。在临床实践中,骨密度仪的精密度除了仪器的系统误差,还可能受到更换操作者或不准确的摆位及分析水平等影响,故有必要通过对受检者多次骨密度测量计算精密度误差和最小显著性变化值LSC(LSC=2.77×PE)。同时可见,PE越小,则LSC越小。因此,在消除人为因素影响的情况下,LSC与测量方法的精密度密切相关,测量方法的精密度好,LSC就小,反之则大。RMS-SD表示绝对精密度(单位是g/cm2),RMS-CV表示相对精密度(用CV%表示)。ISCD严格规定了精密度,要求每个操作者测量各骨位点的精密度误差(CV%)可接受的范围为腰椎、全髋的CV%分别为1.9%和1.8%,95%可信区间(LSC-CV%)分别为5.3%和5.0%,如果技术员的精密度误差不能满足上述最低的误差,则需对操作者进行重新培训再独立上岗[8]。在本研究中,4名技术员的腰椎和左右全髋部中全部主要的感兴趣区的相对精密度均远低于上限,均符合ISCD的要求。
每台骨密度仪都必须确定不同骨骼部位的精密度。不同的测量骨位点有不同的精密度,在骨密度测量中,最佳感兴趣区应首选精密度误差较低的位点[5],以便及时发现骨质疏松的危险因素,避免骨质疏松的漏诊。本次研究中,4名技术员的腰椎各位点的精密度误差由低到高依次为L1~4、L2~4或L1~3、L3~4或L1~2;由此可见,测量各骨位点的精密度误差以4个椎体最低,3个椎体次之,2个椎体较高。通常较大的骨骼组织,其骨密度测量的精密度越好,L1至L4或L2至L4椎体作为一个整体能够提供最大的扫描区域,股骨近端首选全股骨区域,其次为股骨粗隆[9]。ISCD的官方立场也建议骨质疏松诊断的感兴趣区选择L1至L4中所有可评估的椎体,去除病变的椎体,但至少要有两个椎体,不能只根据一个椎体的BMD来诊断和分类[8]。在本研究中,髋部感兴趣区的精密度误差以全髋部最低,大粗隆部位次之。故髋部的最佳感兴趣区应选用全髋部,一般不选用股骨颈和Ward’s区,因股骨的旋转对各部位BMD影响较大[10],Ward’s区多由仪器自动定位、面积小、取样和重复性误差而影响其精密度,Ward’s区CV最大,故不宜选用该部位进行诊断和治疗后的随访观察[11-12]。
当已确定了已知骨位点的精密度,从而就确定了骨位点真正的生物学改变,即最小显著变化(LSC)。要确定LSC,必须确定统计学可信度范围、初诊和随访检测次数(参考公式7)。ISCD在2002年报告中建议LSC应该按照95%可信度计算;只有达到或超过这个值,骨密度的变化才被认为有显著性意义。然而,95%的统计学可信度是理想的要求,影响临床诊断的可信度通常达到80%的统计学可信度水平就已满足[6,9]。
DXA骨密度测量的原理是将三维结构的骨组织投影成二维图像,得出的是面密度(g/cm2),因此,技术员摆位不正确或者有差异都可能会导致骨面积的变化,从而影响最终的骨密度值。研究显示[13],髋关节的旋转会影响DXA骨密度测量的准确性和精确度,旋转的差异对股骨颈的骨密度测量和股骨颈精度有显著影响。故在测量髋部BMD时,应使髋部向内旋转的一定角度(为15°~20°),使股骨颈平行于扫描床面,此时股骨颈的骨密度值是最低的,最能及时监测骨密度的变化,当该体位旋转过度或者不足时,股骨颈的骨密度值将会增高。
在临床实践中,要知道骨密度是否发生了真正有效的变化,随访测量结果的判断必须基于确定的LSC值。不同的感兴趣区的精密度误差有差异,故在计算最小的MTI时应选取最佳的感兴趣区,这样得出的结果才更有说服力。只要LSC一确定,就可计算首次和随访测量的最小时间间隔。MTI不仅依靠测量位点的精密度(或LSC),还依靠测量位点的预期年变化率。在已知PE和LSC预测BMD的变化,MTI确定就取决于测量部位的LSC和药物。在没有做药物治疗的情况下,当预期BMD年变化一定时,MTI仅由精密度误差(或者最小有意义变化)决定,精密度越小(或最小有意义变化越小),MTI越短,精密度误差越大(或最小有意义变化越大),MTI越长。由公式6(随访间隔时间MTI=LSC/预期BMD年变化)可见,当预计BMD年变化一定时,感兴趣区精密度误差越大,MTI越长;当感兴趣区的精密度误差一定时,MTI随着预计BMD年变化的增加而缩短。由于感兴趣区精密度误差的大小和预期年变化率对于预计随访时间影响较大,感兴趣区的精密度误差较大及预期年变化率较慢,预计MTI均较长,这可能使临床上比较难以接受,不利于及时评估疗效。因此,在骨密度测量中应首选最好的精密度和最大的年变化率的组合,故由精密度误差较小的L1~4、L2~4、L1~3及左右全髋这几个感兴趣区进行计算出来的MTI更为合理准确。
利用精密度误差来计算真正的生物学改变的骨密度最小变化量即最小显著性变化值可以判断骨质疏松患者治疗成效及后续骨量的有效变化。治疗后BMD的变化值超过至少一个LSC的范围,该个体的BMD变化判定为显著,该次的治疗疗效显效;如果BMD的变化幅度在LSC的范围内,则认为BMD的变化不显著,无法评估该个体的BMD变化是治疗的成效还是技术员的随机误差;如果治疗后BMD变化不增加反而至降少了至少一个LSC的范围,由于BMD出现了显著性的下降,则该个体的变化判定为显著,但是不管是由于生理性上的骨丢失还是该治疗的疗效不明显,此次治疗都被评定为无效。
目前,骨密度仪的生产厂商已经大幅度地提高了骨密度数据的自动分析水平,但是患者的定位和数据获得过程中的仔细监测仍然有赖于操作者的控制,如果没有正确、规范和稳定的操作,就难以达到理想的精密度[5]。ISCD的精密度评估指南中提出[14],每一个DXA测量中心都应该进行自身的精密度研究和计算各个骨测量位点的LSC,并以此计算95%可信度的LSC,多个技术员进行骨密度测量,精密度值要取所有技术员的精密度误差的平均值。在本次研究中,分析了单个技术员和团队的平均精密度误差,结果显示,4位技术员之间对于L1~4、左、右股骨颈和左、右全髋部测量的PE(CV)差异皆无统计学意义(P>0.05),这表明主要感兴趣区的骨密度测量结果不会因为技术员的不同而出现差异。本研究中,4名技术员的所有的数据不是来自于同一人群(同一组受检者),如要做到同一人群,4名技术员检查就要求每名受检者必须要做8次BMD测定,随着技术员的增加,受检者需要检测的次数就越多,这不符合医学伦理方面的要求,受检者无法接受,这也是本研究的不足之处。当然,一个熟练的操作者的精密度总是优于多个操作者共同参与的测量精密度,对于同一受检者的测量以同一操作者完成为最佳。但实际工作中,同一台DXA测定仪可能有多个操作者在不同的时间段操作使用,此时当基础测量和跟踪测量不是同一操作者进行时,可用团队的精密度值来评估BMD的疗效以使结果越接近最真值,因为如果每一位技术员精确度误差的置信区间有重叠,表明技术员内部最小的差异不是真实的差异,而反映的是计算每位技术员精确度值时内在的不确定性,因此在实际工作中取精确度误差的平均值是合理的。