王燕 张伟* 程晓光
1. 河北医科大学第三医院, 河北 石家庄 050051 2. 北京积水潭医院,北京 100035
计算机断层摄影术(Computed Tomography,CT)是目前临床应用最广的三维(3-dimensional,3D)诊断成像方式。利用已有的腹部或盆腔CT图像定量骨密度(bone mineral density,BMD)不仅具有明显性价比优势且能减少辐射,对常见椎体骨折进行回顾性机会筛检和鉴别诊断也逐渐引起关注[1]。该技术的主要困难在于缺乏校准体模扫描。本文就用于骨密度校准的体模或内部校准技术进行综述。
本文还将介绍一种称作统计参数映射(statistical parametric mapping,SPM)的临床应用证据。这种基于定量CT(quantitative computed tomography,QCT)的方法描述了所谓的特征分布,如骨密度、皮质厚度或骨应力等。尽管目前SPM的研究很少,证据有限,但这些新方法的临床潜力值得关注。
目前仍有大量骨质疏松症患者未被诊断,高骨折风险未被治疗[2]。因此,使用现有的腹部和/或骨盆CT扫描结果评估骨密度,筛查骨折风险的方法越来越引起广泛关注。这种方法可避免重复双能X线吸收法(dual-energy X-ray absorptiometry,DXA)扫描,节约成本,避免辐射。随机性筛查指的是使用诊断性CT扫描图像筛查患者骨折风险。但问题在于如何从这种“标准CT扫描”中获得关于BMD或强度的定量信息?在这种情况下,“标准”意味着并没有扫描校准体模,与QCT程序相比,无标准化图像采集和重建参数。早期已有研究发表[3],但近年出现更多研究[4-13]。一些研究也讨论了增强扫描的问题。
QCT通常是校准体模与受试者同时扫描。受试者通常需仰卧在含羟基磷灰石或磷酸钾(K2HPO4)的固体材料体膜上。当体模与扫描部位未在同一位置时,QCT自动校正扫描仪的不稳定性。如果受试对象与体模不能同时扫描,校准体模可单独扫描(不同步校准),也可根据体内组织进行内部或无模校准。内部校准程序的潜在优势是可减少患者体型和相对位置差异等因素[14]。此外,校准的BMD值不依赖于校准体模类型[15]。因此,有人建议直接使用CT值校准BMD。
患者和体模扫描的高度稳定性可避免更大的精度误差。与DXA类似,CT扫描的稳定性可通过固定时间间隔进行重复体模扫描监测。然而,用于骨密度分析的专用体模在临床CT扫描中并不是常规扫描。因此,对已有CT扫描进行回顾性分析时,实际患者扫描与校准体模扫描可能存在较大的时间差。如果CT扫描仪校准不稳定,那么依据体模值获得的不同时间的BMD可能并不准确。
关于非同步校准研究,将计算机断层X射线吸收法得出的T值与DXA的T值进行比较。两种不同方法获得的T值相关性非常高,表明CT图像的非同步校准是非常成功的。受试者的CT扫描与校准体模的扫描时间间隔约为4年。
然而,多中心临床试验使用7种不同扫描仪,每台扫描仪至少5名受试者。每名受试者获得用扫描校准模型与受试对象同时扫描的同步BMD。不同步校准通过平均校准斜率模拟,从特定扫描仪上获得的所有受试者数据中产生一个特定的非同步BMD。实验期限3~6个月,模拟的非同步校准数据间隔获得。实验期间,所有扫描仪都相当稳定。1年后随访,尽管在基线和随访时获取和重建参数均无变化,但不同扫描仪却显示出极大的不稳定性。
无模校准或内部校准可用来替代非同步校准。主要是通过内部组织的CT值作为BMD校准的参考。基于这种方法的精准骨密度测量要求所依据的内部软组织密度持续稳定。
内部校准的相关文献非常少,只有2篇针对脊柱BMD测量的技术性研究[14,16]。该技术由Boden等报告,最初由Irix公司实施。Gudmundsdottir等[17-18]用于调查与年龄相关的体积骨密度(vertebral BMD,vBMD)变化,Hopper等[3]利用增强和非增强的腹部和盆腔CT扫描探讨随机性筛查的可能性。Mueller等[16]将该技术用在飞利浦CT扫描仪,最近Pickhardt等已用于随机性筛查。
两种内部校准技术文献均以脊柱旁肌肉和皮下脂肪为参考,并分别利用与肌肉和脂肪直方图相匹配的高斯分布峰值进行校准。但均未给出关于该算法的进一步细节。
现有研究使用现行的QCT设定好的X射线管电流和扫描层厚更接近于常规QCT测量值[16],在绝经后女性的多中心研究中,这种分析精度为4%,高于脊柱QCTPro分析的1.7%精度[19]。但相关性受限也是事实,两项研究均未报告内部校准是依赖于特定的扫描仪还是依赖于特定的人群。对于设定的受试者和扫描仪,校准常数可以微调而得到高度的相关性,但一致性的限制表明受试者与受试者之间存在较大差异。显然,部分变异与外部校准过程的系统误差有关,但较大的精度误差也提示内部校准的变异。
总之,没有足够证据能判断内部校准的可行性。在制定官方立场之前,首先必须解决以下问题:内部校准程序扫描仪是否具有特异性?是否取决于获取和重建程序?例如,在校准过程中使用的峰值直方图值可能取决于噪声及曝光设置、重构内核和体层厚度。目前尚缺少内部校准稳定性的纵向研究数据。
为避免与校准有关的问题,有人建议直接使用松质骨CT值。因为临床上所有全身CT扫描仪都是根据水的CT值校准。这样可保证CT图像与给定的扫描仪制造商和模型无关,具有一致的灰度分布,这对于放射学诊断具有重要意义。临床常规的全身CT扫描仪质量控制和使用标准化水模型对其校准进行可能需要的调整是常规质控程序的一部分,适用于临床上使用的每台全身CT扫描仪。
假定校准恒定和扫描仪稳定,那么每个受试者的CT值都是相同的。因此,CT值可以代替BMD值。校准恒定和扫描仪状态稳定,每个受试者的CT值就相同。因此,CT值可以代替BMD值。
许多已有的腹部和盆腔CT增强扫描,可用于诊断低骨密度。对比剂可增加X射线吸收,因此可以预测对比剂灌注区域(例如椎体骨小梁)的BMD值会增加。对于外部校准而言这是肯定的,因为体模扫描的CT值固定改变。然而内部校准却可能出现不同,因为对比剂在骨和组织中的浓度不同。
到目前为止,Bauer、Baum和Gruber等[5-6,9]的3项研究均采用内部校准扫描,结果显示,CT增强扫描的骨密度测量结果与非增强CT扫描结果(r>0.9)和DXA骨密度测定结果(aBMD)(r>0.8)均密切相关。然而,vBMD的CT增强和非增强扫描数据有差异。目前,两种电压下场强不均匀性的差异尚不清楚。在两项研究[5,9]中,脊柱的换算方程相似,但在Baum等的研究中,回归的均方根误差为16.1 mg/cm3或16.7%,而同一组较早报告的对比度增强多层螺旋CT的短期精度误差为2.1%,长期误差为7.7%[20]。结果[5,9]不容易解释,因为在120 kV的对比增强扫描与80 kV的QCT扫描进行了比较,并且在分析[21]中是否考虑了两种电压下的场不均匀性的差异。Pickhardt等[11]基于CT值而不进行任何校准的大型研究表明,静脉注射对比剂并不影响CT区分低骨密度和正常骨密度。但对CT值的影响未做进一步讨论。
总之,目前尚无足够证据能判断对比剂对患者骨密度的影响,当前也不能确定官方立场。对比剂对骨密度的影响取决于X射线管的电压设置、造影应用的技术及对比剂的剂量,或者是骨髓腔对对比剂浓度的时间依赖性,以及CT采集或/和骨髓腔中红、黄骨髓的数量。
除了有限元建模外,根据骨标记坐标计算出骨组织的预定体积,通过解析方法求出密度、形态测量和强度测量。虽然这些方法可以识别解剖或生物力学负荷不同的骨区域,但它们与骨结构代表三维整体器官机械负荷、激素环境和血流等因素的概念不一致。最近,研究人员开始应用基于统计的定量分析方法,即计算解剖学,研究与骨质疏松相关的股骨近端结构的变化及其治疗。包括基于体素的形态计量学(voxel-based morphometry,VBM)和基于张量的形态计量学(tensor-based morphometry,TBM)方法,皮质厚度测量和统计形状分析。VBM、TBM和皮质厚度测量技术基于一种称为SPM方法。
SPM方法最初是为了区分病理脑解剖和广泛的正常变异[22-23]而发展起来的。最近该方法已扩展到髋关节CT扫描[24-34]。SPM是基于从图像中提取的“特征分布”的空间配准。这种特征图可以包括外部骨轮廓图[31]或皮质厚度图[35]。
比较个体间特征的能力是基于空间归一化。其中,一系列线性配准之后是非线性配准(翻译、旋转、定标),以消除残馀解剖变异,从而将一次扫描中的给定空间坐标映射到包含图像扫描中的解剖同源坐标。通过这一步骤,在假设注册图像中相同的空间坐标对应于相同的解剖位置的前提下,可以通过三维像素对三维像素进行局部比较。经过空间归一化后,统计分析通常是在三维像素的基础上(或以二维像素为单位)生成统计图。对P值进行校正,以用于识别多个与兴趣影响和结果明显相关的兴趣点区域。
其他方法如主动形状建模,特别侧重于分析骨骼形状[36]的变化。这种方法需要定义一个参数空间,方法是将一个密集的点网格映射到每个扫描上识别的单个地标上。然后调整每个点的空间坐标,以便在所有扫描上建立点对点的对应关系,从而使相应的点在形状地图集中具有相同的解剖位置。对于给定的形状地图集,主成分分析用于导出形状的基本集合,并且这些感兴趣的分量之间的关联可以用给定的效果来计算,例如断裂。该方法在髋关节QCT扫描中的应用中,Nicolella等[36]提出了一种基于形状和密度的髋关节参数化有限元模型。他们使用这一参数分析表明,股骨近端形态和密度分布的相对细微变化可以转化为强度上的巨大差异。
Li等[24]用SPM对髋部骨折进行横断面研究,分析了37例老年急性创伤后髋部骨折患者(用对侧髋部分析)与38例年龄、性别匹配的对照者的骨密度分布差异。骨折患者与对照组股骨颈和股骨粗隆间的影像检查的vBMD存在差异,即使与骨折区域无关的股骨头区域也同样存在差异。发现骨折受试者和对照组在不同区域的扫描中获得的vBMD密度显著差异后,这些学者后来又发明了依据统计地图的主成分分析的骨折预测方法[25],在随后的一项研究中,他们能够根据与髋部骨折患者档案扫描的图像相似性来进行骨折预测。
几年后,Carballido-Gamio等[28]对74例髋部骨折患者和148名对照组应用SPM和VBM进行分析。校正误差后,根据年龄、身高和体重进行调整体素被拟合成一个线性模型。皮质vBMD显著缺损。年龄相关差异与骨折相关差异一致。他们发现在偶发性髋部骨折患者中,下内侧皮质vBMD较低,青、中年和老年受试者中结果一致。提示髋部骨折不仅与年龄变化相关,同时还可能与生命早期就存在的承重皮质骨组成受损有关。
Poole等[30]将SPM应用于36例股骨颈骨折患者、39例股骨粗隆骨折患者及75例年龄匹配的对照组的髋关节QCT扫描,并应用SPM进行三维皮质厚度测量。通过调整骨折类型、年龄、身高和体重的统计模型,发现皮质变薄区域在骨折组和对照组之间在骨折类型上存在差异。Bredbenner等[27]将髋关节的形状模型应用于QCT扫描,从MROS研究中获得了一组独立数据,通过对预测模型的受试者工作特征曲线分析他们的形状建模方法对患者进行骨折分类是曲线下面积的0.98,而不是aBMD的0.88。
Carballido-Gamio等[29]使用TBM分析了股骨形状的变化与髋部骨折和年龄的关系,这与前面描述的VBM研究所用的年龄相同。他们构建了一组基于体素的组织扩张和收缩数据,使用年龄、身高和体重调整线性模型,将年龄较大髋部骨折患者与年轻人对照组进行比较。与女性对照组相比,骨折妇女主要受压小梁带和皮质体积减少,股骨颈髓间隙增大。与Poole等[30]的结果相一致,还观察到女性股骨颈骨折上部皮质部分缺失。
QCT扫描的SPM分析也被用来研究干预效果,包括药物干预和阻抗锻炼。Poole等[33]用SPM皮质厚度测量对骨质疏松妇女应用特立帕肽治疗24个月的随访研究。他们观察到经常承重的区域的皮质增厚。对狄诺塞麦长达36个月的治疗效果研究显示,骨皮质质量和厚度均增加,比较明显的是转子间区域[37]。Lang等[32]应用VBM技术检测接受16周阻抗锻炼的男女患者的反应,一组做下蹲和托举,另一组做髋关节外展和内收。采用VBM分析,他们发现股骨头和下方骨皮质显示出对下蹲和托举的积极反应,而位于髋关节外展肌附着处的骨皮质则表现出对髋关节外展和内收运动的反应。
从临床的角度来看,对这些方法的解释是有挑战性的。例如作为一个平均股骨的有色表面,表明一组接受治疗的人局部皮质厚度的变化。因此,这种方法扩展了传统的股骨颈、转子和转子间皮质厚度增加或减少的测量。用统计图像分析方法,每个三维像素都有关于厚度变化的局部信息。然而,这些大量的信息必须放在一个适当的解剖和/或病理生理学背景中,其实质上又需要将体素聚集成更大的感兴趣区。许多有趣的问题可以解决:肌肉附着点会发生什么?血管附近会发生什么?沿着承重和张力线会发生什么?另外,反过来,为什么某些特性在不同的位置相似?不同的特征与临床骨折有何关联?SPM的病理生理学研究尚处于起步阶段。通常只是传统全局参数,如股骨近端皮质厚度和密度的变化或骨折风险的预测是主要的定量结果参数,而不是用图像描述多与少特征分布。
总之,包括形状建模和SPM的统计图像分析方法,具有潜在的临床应用价值。它们能够描述股骨近端密度分布和形状的变化,如骨折等特定的临床终点,以及药物或运动方式等干预措施。这类分析方法显示了评估髋部骨折风险的结构性因素或药物治疗的效果的前景,其方式与髋关节的承载功能有着内在的联系。将这些方法应用于有限元分析得到的应力分布图前景可观。然而,现在制定用于临床使用这些实验工具的ISCD官方立场还为时过早,目前只有少数专家在使用。
讨论:在过去的QCT中,由于CT设备的不稳定性大于DXA设备的不稳定性,并且由于对QCT的采集和重建参数不那么规范,所以使用校准体膜扫描。特别是不同患者的扫描床高的差异至少可以部分通过同步扫描校准体膜得到补偿。在过去的10年中,CT扫描仪的稳定性有所提高,但不建议在对现有CT扫描进行回顾性分析的基础上作出诊断或治疗决定,除非了解患者和体模扫描之间扫描仪的稳定性。
在DXA中,标准化和严格的质控一体化DXA扫描仪软件被认为是精确骨密度测量的重要前提。现代DXA设备要求在受试者在同一天扫描之前,对质量控制(quality control,QC)体膜进行扫描。如果QC体模扫描分析表明扫描仪不稳定则自动监测并通知操作员。Mindways公司基于扫描专用QC体膜形式,提供一个类似的概念。定期的QC扫描分析整合到QCT程序中。如果有这样类似的概念,QCT非同步校准是可能的。这个概念带来一个好处,校准体膜可以定位在与测量骨骼位置相同的CT扫描仪上,而不是放置在受试者下方。
ISCD官方立场:对于基于QCT的密度测量,如果能保持扫描仪的稳定性,则可以用非同步校准代替体模校准。
等级:一般-B-W。
理由:非同步校准与DXA技术的完美匹配,提示 QCT可用于测量髋部或脊柱骨密度。Pickhardt等[7]研究表明,近10年CT扫描仪稳定性明显提高,有数据显示QCT采用非同步校准程序可获得很好的精确度。然而,就像DXA一样, QCT扫描仪的稳定性应该使用专用BMD模型密切监测。CT扫描仪常规的“水校准”显然不够。
讨论:过去,由于CT设备的不稳定性明显大于DXA设备的不稳定性,且QCT的采集和重建参数不规范,所以需使用同步校准体膜,甚至可部分纠正扫描床高造成的差异。近10年,虽然CT扫描仪稳定性提高,如果扫描仪不具备受试者和体模之间的稳定性,仍不建议通过已存在的CT扫描进行回顾性分析作出诊断或治疗决定。
ISCD官方立场:只有在确定了机器的截点和扫描仪的稳定性,才能对脊柱或股骨近端低骨量或低骨强度的患者进行CT随机筛查。
等级:一般-C-W。
理由:按照CT测定的低(或高)骨密度或骨强度来识别受试者骨折风险高或低,如果没有提供体模的校准数据,通常需要机器特异的截点。关于稳定性的论点与先前的立场相同。
讨论:使用腹部或盆腔CT检查预测骨折高风险的受试者面临许多困难。使用DXA进行骨折风险测定需要对测量的X射线吸收值进行验证、青年正常参考人群aBMD的均值和标准差、标准化扫描协议和持续的扫描仪质控,以便对aBMD进行校准。在随机CT扫描中,通常情况下没有一个要求能够满足。最近的研究报告避开了这些问题,比较QCT和DXA诊断筛查。用CT测得的CT值(HU单位)与DXA 测得的T值的比较,为骨密度校准的CT值提供了参考数据并且选择特异的敏感性特异性阈值,筛选标准。扫描仪的稳定性没有提及。
按照这种方法,骨质疏松或骨折风险高(或低)的受试者的扫描对比数据可以识别。尽管扫描仪存在较大差异,但BMD值仍是可识别的。然而,CT采集参数如床高、X线管电压等因素的影响还需进一步注意,筛选阈值需要进一步验证。
对骨折风险高低的人群进行筛查组间无明显差异。足够低或高的筛选阈值可能与CT扫描设备无关,随机筛选数量大时影响有限。更好的分类要求更准确的截点。然而,更准确的截点必须考虑对比度、CT设备和扫描仪稳定性的影响。最有可能的是,它们不考虑设备而需要BMD校准和纵向扫描仪质控。
因此,在新的和正在进行的研究,DXA质量控制应被适用,包括BMD校准的Hu和纵向扫描控制。如果所有与骨密度评估有关的校准和质控程序被忽略,骨折风险评估、低BMD或低骨强度诊断的准确性必须在独立人群中进一步验证。目前,没有足够证据证明CT增强扫描可以用于此研究。
使用CT扫描(例如腹部或骨盆)二次分析有助于识别高骨折风险的患者。然而,常规临床CT扫描的使用在很大程度上取决于CT扫描仪的稳定性。显然,如果主要的目的是诊断性筛查,再加上一次DXA扫描,那么扫描仪的稳定性就不那么重要,因为主要目的是区分风险高低。如果为了取消DXA扫描而又想准确评估骨折风险,CT扫描仪的稳定性和校准精度就更加重要。
内部校准技术的性能必须在不用于开发校准常数和方程的独立队列中得到验证,不同的方法必须公布和比较。必须与放射科合作实施有意义的后处理和制定随机性CT扫描协议。监测CT扫描仪的稳定性将是一个关键因素。利用诊断性CT扫描的二次分析在骨质疏松领域应用应包括定期进行非同步体模扫描,以保持骨密度校准和CT设备的标准化和纵向监测。
基于QCT的SPM应用是骨质疏松领域的创新技术。与单纯BMD相比,骨密度与皮质厚度等几何参数的结合是QCT结果参数的标准,骨折预测能力得到了提高。很多细节中许多局部评估的价值仍有待研究。本文提出的SPM方法对指导局部优化的VOIs分析具有一定的参考价值,结果可能与年龄和疾病有关。最后,必须比较各种SPM技术的性能,更好地理解图像质量(噪声和空间分辨率等)的影响。
总之,此ISCD官方立场涉及在有或无校准体模情况下CT扫描仪的应用,补充了2007年关于脊柱QCT的ISCD官方立场。在广泛探讨的基础上,提出了支持ISCD官方立场的证据。近年显示QCT技术发展迅速,建议在不远的将来再次回顾证据,更新ISCD的官方立场。