李敏,龚建平,张伟,钱铭辉
肺部CT智能诊断报告系统软件“苏华软件”是由苏州大学附属第二医院与华中科技大学计算机学院合作研发的软件,能够定量分析肺结节的体积。GE公司推出的肺结节CAD软件(Lung VCAR)是目前国际公认的优秀软件之一。本研究使用FUYO肺结节体模,比较肺部CT智能诊断报告系统软件和Lung VCAR软件在测量体模结节体积方面的准确性和一致性。
FUYO肺结节体模由FUYO公司生产,外形为直径25cm的圆柱形(图1),体模内有5种密度的16个结节,并充填塑料泡沫模拟肺组织(CT值为-900HU,图2)。体模内有4组不同大小的球形物,直径分别为2.5、5.0、10.0和20.0mm,每组3个结节,分别用亚克力、尼龙和聚丙烯材料制成,其CT值分别为100、60和-100HU,模拟肺结节;这些结节分别固定在半径为5.0、7.5和10.0cm的圆周上。此外,在半径为7.5cm的圆周四个象限区各有一个结节:两个结节直径为20.0mm,CT值分别为100和-100HU,另外两个结节直径为10.0mm,为混杂密度结节,平均CT值分别为0及-60HU。所有结节均呈球形,边缘光滑。
FUYO肺结节体模中的结节体积根据公式(1)计算得出:
其中r为体模结节的半径(单位为mm),2.5mm结节的体积为8.18mm3,5.0mm 结节的体积为65.45mm3、10.0mm 结 节 的 体 积 为 523.60mm3,20.0mm结节的体积为4188.79mm3。
采集体模摆位:将体模放置在扫描孔的中央,用CT机的激光线定位,使体模的x、y、z轴线分别与CT机的x、y、z定位线重合。
扫描参数:采用GE LightSpeed 64层螺旋CT机,管电压120kV,管电流300mA,机架旋转速度0.8s/r,准直器64×0.625mm,螺距0.984,扫描视野50cm×50cm,重建视野36cm×36cm,CHEST重建算法,行0.625mm层厚的图像重建,显示窗位-600HU,窗宽1500HU。扫描完成后间隔1h再行体模扫描2次,扫描参数和图像重建参数同前,合计扫描体模3次。将图像传至AW4.3工作站(GE,美国),图像数据以DICOM格式刻录在DVD光盘上。
Lung VCAR软件:在ADW 4.3工作站上运行,实现数据读取、结节半自动标记、结节特征的自动化分析,显示检测结果(结节体积)。16个结节合计有144个检测数据。
肺部CT智能诊断报告系统软件(以下简称为苏华软件):在通用计算机上运行,能够自动或半自动识别结节的位置,采用基于Gmac模型的分割方法对其进行分割,将结节的形态学特征量化,显示检测结果(结节体积),体积测量为分割结节的体素体积的总和。16个结节合计有144个检测数据。
软件测量体模结节体积精度评价指标采用相对误差,相对误差采用以下公式计算:绝对误差=软件测量值-体模标准值
苏华软件和GE Lung VCAR软件对FUYO肺结节模型中16个结节均能进行相应的分析和体积测量。
2.5mm结节体积测量的平均相对误差为21.1%,结节体积明显被高估;5.0、10.0和20.0mm结节体积测量的平均相对误差分别为-4.7%、-1.6%和 -2.3%,结节体积均被低估(表1)。16个结节体积的平均相对误差为1.9%,直径2.5mm结节体积测量的相对误差最大。不同直径结节体积测量的相对误差,经 Mann-Whitney U检验和 Kruskal-Wallis H 检验,直径5.0、10.0和20.0mm 结节之间的相对误差差异无统计学意义(P>0.05),三者与直径2.5mm的结节之间的差异有统计学意义(P<0.05)。
2.5mm结节体积测量的平均相对误差为15.5%,结节体积被高估;5.0、10.0和20.0mm 结节体积测量的平均相对误差分别为3%、3%和1%(表2),软件测量的结节体积与标准体积相近。16个结节体积的平均相对误差为4.7%,2.5mm结节的相对误差明显大于5.0、10.0和20.0mm结节。不同直径结节体积测量的相对误差,经Mann-Whitney U检验和Kruskal-Wallis H 检验,直径5.0、10.0和20.0mm结节之间的相对误差差异无统计学意义(P>0.05),三者与直径2.5mm的结节之间的差异具有统计学意义(P<0.05)。总体上结节越大,体积测量的相对误差越小。
表1 苏华软件测量体模结节体积的误差分析
表2 Lung VCAR软件测量体模结节体积的误差分析
图1 FUYO肺结节体模。
图2 FUYO肺结节体模扫描图像。
图3 两种软件体积测量相对误差的Bland-Altman分析图。
经统计学分析,两种软件测量直径5.0、10.0和20.0mm结节体积的平均相对误差均小于5%。使用直径5、10和20mm结节体积测量的117组数据行Bland-Altman分析,由于一些结节的软件测量数据是一样的,出现了图中一个点有多个数据的现象(图3),此外,图中3个点在95%一致性界限之外,结合原始数据,实际上为7组数据位于一致性界限之外,占6.0%(7/117)。在一致性界限范围之内,苏华软件的相对误差与Lung VCAR软件的相对误差相比,差值的绝对值最大为11.8%,两款软件的平均相对误差为-0.2%,这种相对误差的幅度在临床上是可以接受的,因此,可以认为两款软件测量结节体积的相对误差具有较好的一致性,在临床上可以相互替代使用。
随着MSCT技术的发展,亚秒级扫描速度和亚毫米级扫描层厚的容积CT日益普及,可发现各种微小病灶,病灶的形态学特征显示更清楚。诸多国际影像设备生产厂商纷纷推出各自的肺结节半自动化分析测量软件[1-3],其中 GE公司的 ALA 和 Lung VCAR 软件最具代表性。中国在这方面起步较晚,目前尚无成熟的肺结节半自动分析软件。本研究采用体模结节,使用苏华软件与Lung VCAR软件进行比较研究两种软件在体模结节体积测量方面的一致性和差异性。
Lung VCAR软件是GE公司根据ALA软件进行改进的一款半自动测量肺结节体积和密度的软件,在AW 4.3和AW 4.4工作站上运行。该款软件已通过美国FDA的认证,是国际上公认的优秀肺结节CAD软件,其前身ALA软件也是一款优秀的肺结节CAD软件,在AW 4.2工作站上运行,其体模研究和临床应用的相关报道较多[2-4],相关文献曾使用 ALA软件进行了肺结节体积测量组间和组内差异的研究[5]。Lung VCAR软件在肺结节体积测量和肺结节倍增时间评估等方面性能优越[6]。
肺结节的周围是充满气体的肺泡组织,具有良好的自然对比,也为应用图形处理技术进行肺结节分割创造了很好的条件。肺结节CAD测量结节体积的核心技术是结节分割,分割准确则体积测量准确,反之亦然。本研究结果表明,Lung VCAR软件测量直径≥5.0mm结节体积的相对误差低,平均仅为2.2%;结节体积越大,软件测量准确度越高。Lung VCAR软件测量的相对误差均为正偏差,提示该软件分割提取的结节体素总和大于标准值。Lung VCAR软件所使用的分割技术具有很高的准确性,由于涉及商业机密,我们无法获取详细的技术细节。
苏华软件的体模研究结果表明,测量直径≥5.0mm结节体积的相对误差较高,平均为-2.6%,也表现为结节体积越大,软件测量准确度越高。该款软件的相对误差均为负偏差,提示其分割提取的结节体素总和小于标准值。在测量直径≥5.0mm结节体积的准确性方面,Lung VCAR软件优于苏华软件。
对于2.5mm的微小结节,Lung VCAR软件和苏华软件所测量的结节体积均不准确,这主要与目前使用CT机的分辨力有关,微小结节体积的准确测量仍然是一个难题。在比较两款软件测量体积的准确性时,剔除了2.5mm微小结节的数据。
使用Bland-Altman分析方法,进行两种软件测量结果的一致性评价,回答“这两种软件在临床上是否可以互相替代使用”的问题[7]。结果显示两款软件测量体积相对误差的差值绝对值最大为11.84%,两种方法对直径≥5.0mm体模结节体积测量的平均相对误差为-0.2%,这种差异幅度在临床上是可以接受的。故认为两款软件体积测量的结果具有较好的一致性,可以相互替代使用。
肺结节CAD软件测量体模结节的准确性受许多因素的影响,因研究者所用的扫描和重建函数、重建视野、重建层厚、层间距及测量软件等条件不同,评价测量误差的标准各异,造成了文献报道的测量结果的明显差异[8-11](从2%~21%)。仅 Ravenel等[12]所使用的测量软件(Lung VCAR)和评价标准与本组研究相同,其研究结果显示:3、5、9和15mm体模结节体积的相对误差分别为57%、11%、2%、1%;本研究使用的Lung VCAR 软件测量结果显示:2.5、5.0、10.0和20.0mm结节体积的平均相对误差分别为15%、3%、3%、1%,和 Ravenel等[12]的测量准确性相近。
笔者认为,肺部CT智能诊断报告系统软件虽然比Lung VCAR软件在体模结节体积测量上准确度稍低,但这种差异是可以被接受的,以后可以通过研究结节的分割技术,提升苏华软件结节分割的准确性,研究和建立不同大小和密度结节的数学模型,可能会获得更加准确的体积测量结果。
[1]Ashraf H,de Hoop B,Shaker B,et al.Lung nodule volumetry:segmentation algorithms within the same software package cannot be used interchangeably[J].Eur Radiol,2010,20(8):1878-1885.
[2]Petrou M,Quint LE,Nan B,et al.Pulmonary nodule volumetric measurement variability as a function of CT slice thickness and nodule morphology[J].Am J Roentgenol,2007,188(2):306-312.
[3]Rampinelli C,De Fiori E,Raimondi S,et al.In vivo repeatability of automated volume calculations of small pulmonary nodules with CT[J].Am J Roentgenol,2009,192(6):1657-1661.
[4]Honda O,Johkoh T,Sumikawa H,et al.Pulmonary nodules:3D volumetric measurement with multidetector CT-effect of intravenous contrast medium[J].Radiology,2007,245(3):881-887.
[5]朱江涛,龚建平,朱建兵,等.人体肺小结节CT体积测量的可重复性研究[J].苏州大学学报(医学版),2010,30(1):138-140.
[6]周科峰,朱 斌,杨留发,等.ALA软件测定倍增时间在肺结节随访中的应用[J].医学影像学杂志,2008,18(10):1124-1127.
[7]陈卉.Bland-Altman分析在临床测量方法一致性评价中的应用[J].中国卫生统计,2007,24(3):308-315.
[8]Yankelevitz DF,Reeves AP,Kostis WJ,et al.Small pulmonary nodules:volumetrically determined growth rates based on CT evaluation[J].Radiology,2000,217(1):251-256.
[9]Way TW,Chan HP,Goodsitt MM,et al.Effect of CT scanning parameters on volumetric measurements of pulmonary nodules by 3Dactive contour segmentation:aphantom study[J].Phys Med Biol,2008,53(5):1295-1312.
[10]Ko JP,Rusinek H,Jacobs EL,et al.Small pulmonary nodules:volume measurement at chest CT-phantom study[J].Radiology,2003,228(3):864-870.
[11]Goo JM,Tongdee T,Tongdee R,et al.Volumetric measurement of synthetic lung nodules with multidetector row CT:effect of various image reconstruction parameters and segmentation thresholds on measurement accuracy[J].Radiology,2005,235(3):850-856.
[12]Ravenel JG,Leue WM,Nietert PJ,et al.Pulmonary nodule volume:effects of reconstruction parameters on automated measurements——aphantom study[J].Radiology,2008,247(2):400-408.