深度学习重建算法对胸部低剂量CT肺结节测量及显示影响的模体研究

2023-08-22 01:53:06刘海法杨丽王琦杜煜赵茜茜杨帆时高峰
放射学实践 2023年8期
关键词:实性低剂量偏差

刘海法,杨丽,王琦,杜煜,赵茜茜,杨帆,时高峰

随着CT的推广及人们健康意识的逐步提高,对于尚不能定性的肺结节复查的需求不断增加,受检者的受照剂量是不容忽视的问题。因而操作人员应根据受检者身体状况,在尽可能降低剂量(as low as reasonably achievable,ALARA)的原则下,制定出个性化的扫描方案[1]。目前低剂量CT主要通过管电流的自动调制以及使用迭代重建算法来实现[2]。尽管许多研究证实迭代重建算法可以有效降低图像剂量[1,3-7],但是迭代重建算法可改变图像的纹理特征,让阅片者感觉不同于传统的FBP图像,当迭代权重过大时,重建图像会变得“塑料样”[8-10]。曹源等[11]学者研究发现低剂量(100 kVp)CT扫描时采用FBP算法重建的CT图像对肺结节的检测结果优于常规迭代重建算法,显示出FBP算法在新型重建算法构建中处于不可或缺的重要地位。深度学习重建(deep-learning image reconstruction,DLIR)算法,是新一代重建算法,基于复杂卷积神经网络,利用足量优质FBP重建图像进行训练,能在保证噪声纹理和影像特征高保真的同时,有效降低图像噪声[12]。目前,DLIR算法已在模体以及人体的腹部、儿科和心血管等领域的临床科研探索中取得丰硕成果[13-15],但在胸部领域探究其对结节检测效能的研究还较少[16-19]。本研究通过胸部模体实验,比较低剂量条件下不同重建算法之间图像的各项客观和主观指标的差异,旨在探讨DLIR算法在低剂量扫描条件下对肺结节显示及测量的影响。

材料与方法

1.研究对象

采用模拟70公斤体重成年男性的胸部模型(Lung man,Kyoto Kangaku,Tokyo,日本),模型尺寸为43 cm×40 cm×48 cm。该模型具有人造纵隔和支气管血管束,人体软组织及骨骼的仿真替代材料(聚氨酯及环氧树脂)与人体组织的X线吸收率相当。本研究中在模型内放置了不同成分和大小的模拟结节共6个,包括直径分别(体积)为5(66 mm3)、8(268 mm3)和10 mm(523 mm3)的磨玻璃密度结节(ground glass nodule,GGN)和实性密度结节(solid opacity nodule,SN)各3个。磨玻璃结节采用聚氨酯泡沫树脂制成,管电压120 kVp下其CT值为-630 HU,将其作为本研究中该类结节的CT参考值,记作GGN的标称值;实性密度结节由聚氨酯树脂制成,120 kVp下测得其CT值为+100 HU,将其作为本研究中该类结节的CT参考值,记作SN的标称值。把模体内的左、右两肺按上、中、下和内、中、外均分为18个区,将6个结节分别用双面胶固定于支气管血管束上,并依次变换结节的位置(不同分区内)后进行扫描,共计扫描18次。

2.扫描方法及图像重建

使用GE Revolution 256排螺旋CT机,扫描范围自肺尖至肋膈角层面。扫描参数:100 kVp和40 mA(为低剂量扫描条件,相应的CT容积剂量加权指数值为0.84 mGy);层厚5 mm,层间距5 mm,螺距0.992,转速0.5 s/r,矩阵512×512。对扫描的原始数据分别采用50%迭代权重的自适应统计迭代重建算法(adaptive statistical iterative reconstruction-veo,ASIR-V)和中档(medium level,M)、高档(high level,H)深度学习重建算法(DLIR-M和DLIR-H)进行图像重建,采用标准卷积核,重建层厚和层间距均为0.625 mm,图像的窗宽和窗位分别设置为1200 HU和-600 HU。保证每次扫描、重建范围尽量一致。将所有重建图像导入肺结节筛查工作站(联影智能肺结节CT影像辅助检测系统,上海联影智能医疗科技有限公司),对结节进行自动检出和分析。

3.图像质量分析

图像质量客观评价:采用GE AW4.7后处理工作站对所有图像进行分析。测量并计算3组重建图像上肺组织的噪声(noise,NI)和信噪比(signal to noise ratio,SNR)、10 mm结节的噪声、信噪比和对比噪声比(contrast to noise ratio,CNR),具体方法如下。①在肺组织内放置ROI(面积100 mm2),测量得到肺组织CT值的均值及标准差(SD),分别作为肺组织的CT值(CT肺)和噪声(NI肺)。勾画ROI时注意避开周围的支气管血管束,测量3次取平均值。②在肺结节筛查工作站,可自动测量得到10 mm实性结节及10 mm磨玻璃结节的CT值和标准差,分别记作CT结节和NI结节。肺组织和结节的SNR及结节的CNR计算公式:

(1)

(2)

(3)

图像质量主观评价:由两位高年资放射科医师在不知道图像重建方式的情况下共同对3组图像质量进行主观评分,当两者商讨后意见不一致时,由第三位高年资医师进行最终评分。

基于Liket量表法制定肺组织噪声和支气管血管束锐利度(sharpness of bronchial vascular bundle,BVBS)的评分标准[20-21]。肺组织噪声的评分标准:1分,图像颗粒感重;2分,图像颗粒感中度;3分,图像颗粒感轻度;4分,图像颗粒感轻微或无颗粒感。支气管血管束利度的评分标准:1分,支气管血管束与肺组织分界模糊;2分,支气管血管束与肺组织分界欠清晰;3分,支气管血管束与肺组织分界较清晰;4分,支气管血管束与肺组织分界清晰。

4.结节的显示及测量

客观分析内容:采用肺结节筛查工作站自动分析得到5、8和10 mm SN及GGN的CT值和体积,并按照公式(4)计算结节体积和CT值的偏差度[22]:

偏差度=[(测量值-标称值)/标称值]×100%

(4)

结节显示情况的主观评价:由两位高年资放射科医师在不知道图像重建方式的情况下进行阅片分析,共同对3组图像上结节的显示情况进行主观评分,当意见不一致时,由第三位高年资医师进行最终评分。

基于Liket量表法制定实性结节和磨玻璃结节可见度的评分标准[20-23]。磨玻璃结节显示情况的评分标准:1分,结节内密度不均匀,结节与周围的与支气管血管束分界不清;2分,结节内密度欠均匀,结节与周围的支气管血管束分界欠清楚;3分,结节内密度较均匀,结节与周围的支气管血管束分界较清楚;4分,结节内密度均匀,结节与周围的与支气管血管束分界清楚。实性结节显示情况的评分标准:1分,结节轮廓模糊,与支气管血管束分界不清;2分,结节轮廓欠光滑,与支气管血管束分界欠清;3分,结节轮廓光滑,与支气管血管束分界清楚。

5.统计方法

使用SPSS 26.0统计学软件进行统计分析。计量资料采用均值±标准差表示。对图像质量及结节的所有客观及主观评价指标的组间比较均采用Kruskal-Wallis秩和检验,组间多重比较的P值均采用Bonferroni法进行校正,以P<0.05为差异具有统计学意义。

结 果

1.图像质量分析

图像质量客观评价:ASIR-V、DLIR-M和DLIR-H三组图像上肺组织和结节的图像质量参数的比较详见表1。肺组织和结节的各项图像质量客观评价指标在3组之间的差异均具有统计学意义(H=11.41~30.12,P均<0.05)。DLIR-H图像上NI肺和NIGGN均在3组中最小,SNR肺、SNRGGN、CNRSN和CNRGGN均在3组中最大,且与其它2组之间的差异均有统计学意义(P均<0.05),而在ASIR-V与DLIR-M图像之间上述指标的差异均无统计学意义(P均>0.05)。DLIR-M和DLIR-H图像上实性结节的噪声均低于ASIR-V,实性结节的SNR均高于ASIR-V,且差异均有统计学意义(P<0.001),这2个指标在DLIR-M与DLIR-H图像之间的差异均无统计学意义(P均>0.05)。

表1 胸部低剂量联合不同重建算法的图像质量客观评价指标的比较

图像质量主观评价:3组重建图像之间肺组织噪声评分的差异具有统计学意义(P<0.001),DLIR-H图像上肺组织噪声评分高于ASIR-V和DLIR-M(P均<0.01),ASIR-V与DLIR-M图像之间肺组织噪声评分的差异无统计学意义(P=0.849)。三组重建图像上支气管血管束锐利度评分的差异无统计学意义(P=0.365)。

2.结节测量

不同算法重建图像上结节平均CT值和体积的偏差度的比较结果详见表3~4。

三组图像上不同直径SN的平均CT值偏差度的差异均无统计学意义(P>0.05)。

三组图像上测得的不同直径GGN的平均CT值偏差度的差异均有统计学意义(P<0.001)。对于直径10及5 mm的GGN,DLIR-M和DLIR-H图像上测得的偏差度均小于ASIR-V(P<0.001),而DLIR-M与DLIR-H图像之间偏差度的差异无统计学意义(P=0.336);对于直径8 mm的GGN,ASIR-V图像测得的偏差度小于DLIR-M和DLIR-H图像(P均<0.001),而DLIR-M与DLIR-H图像之间偏差度的差异无统计学意义(P=0.535)。

直径8及10 mm结节的体积偏差度,在三组图像之间的的差异均无统计学意义(P>0.05);而直径5 mm的结节,不论是SN还是GGN,其体积偏差度在三组图像之间的的差异具有统计学意义(P<0.05)。对直径5 mm结节的组间多重比较结果:①实性结节的体积偏差度,在ASIR-V组与DLIR-M组之间、以及DLIR-M组与DLIR-H组之间,差异均无统计学意义(P>0.05),而在ASIR-V图像上的测量值小于DLIR-H图像且差异有统计学意义(P=0.020);②磨玻璃结节的体积偏差度,在DLIR-M、DLIR-H图像上的测量值均小于ASIR-V图像且且差异有统计学意义(P<0.05),而在DLIR-M与DLIR-H图像之间差异无统计学意义(P=0.476)。

3.结节的显示情况

实性结节和毛玻璃结节可见度的主观评价结果见表2及图1~2。不同直径(5、8、10 mm)的实性结节和磨玻璃结节的可见度评分在三组图像之间的差异均无统计学意义(P>0.05)。

图1 三组重建图像上不同直径实性结节的显示情况。不同直径的毛玻璃结节(箭)在ASiR-V、DLIR-M和DLIR-H图像上均清晰显示,结节边缘与空气模拟的肺组织分界清楚。 图2 三组重建图像上不同直径实性结节的显示情况。不同直径的实性结节(箭)在ASiR-V、DLIR-M和DLIR-H图像上均清晰显示,病灶内密度均匀,边缘与空气模拟的肺组织分界清楚。

表2 胸部低剂量扫描不同重建算法图像质量及结节可见度的主观评分

讨 论

既往的多项模体研究结果均显示相比于传统的迭代重建算法,深度学习重建算法在降低扫描剂量的同时保留了图像上原有的噪声纹理等特性[15,24-26]。在此基础上,学者们充分挖掘深度学习重建算法降低辐射剂量的潜能,在腹部、心血管、头颅和儿童等成像领域已取得显著成果[14,27-32]。亦有学者将该算法应用于胸部领域,发现可以显著降低图像噪声,提高肺组织、肌肉组织及纵隔的CNR,从而可改善图像质量[16-19,21,33]。而且有研究者认为随着深度学习重建算法的推广,有望在非肥胖人群中实现0.14 mSv超低剂量的胸部筛查[16]。但现有的研究大多仅停留在图像质量评估层面,很少更深入地对肺内结节的检测及诊断效能进行探究。本研究利用DLIR和ASIR-V算法对胸部仿真模体低剂量扫描数据进行重建,并采用各种主观及客观指标对重建图像的质量及结节检测情况进行全面深入地分析和比较。

本研究中对肺组织的噪声和SNR、实性和磨玻璃结节的噪声、SNR和CNR等客观指标及肺组织噪声等主观评价指标进行综合分析,结果显示DLIR图像质量优于ASIR-V,且以DLIR-H图像质量为最佳。本组研究结果与曾文等[19]学者的结果一致,他们通过对肺组织、纵隔和骨骼肌等部位的噪声和信噪比进行比较,认为DLIR-H算法降噪效果最佳,展示出标准卷积核的深度学习重建算法对胸部低剂量图像具有优良的降噪能力。但是在该研究中通过观察肺组织的显示情况,认为采用标准卷积核的DLIR算法对不会使肺内支气管血管束显示得更加锐利[19]。而本研究中3组图像上支气管血管束锐利度的差异均无统计学意义,证实了标准卷积核的DLIR算法并未改善支气管血管束锐利度。

对结节CT值进行测量,结果显示不同重建算法对实性结节平均CT值偏差度无显著影响(详见表3),表明DLIR算法能保证实性结节平均CT值测量的稳定性;但是本研究结果同时显示目前的标准卷积核深度学习重建算法对磨玻璃结节CT值的测量还不够稳定。对结节体积测量值进行客观分析发现,不同重建算法下直径8及10mm结节的体积测量值无显著差异,但实性结节比纯磨玻璃结节的体积偏差度更大(详见表4)。这是由于实性结节的对比度高,在对X线高衰减的结节与低衰减的肺组织的交接界面处具有较大的CT值过渡带,即具有更重的部分容积效应,导致实性结节的体积被高估;而磨玻璃结节对X线的衰减较低,但高于肺组织的衰减度,在真实的肺组织中磨玻璃结节的边界通常欠清晰,往往导致磨玻璃结节的体积被低估[16],本研究却发现磨玻璃结节的体积被高估,这可能是由于本研究中采用空气来代替肺组织,使得磨玻璃结节与周围模拟肺组织的对比度增大,所测得的体积值也随之偏高。对于直径5mm的实性结节,因为结节对比度高,更容易受到部分容积效应的影响,在三组重建图像上测得的结节体积的偏差度均较大,DLIR图像上测得的体积偏差度较ASIR-V图像并无明显改善;而对于直径5 mm的磨玻璃结节,三组图像上测得的体积偏差度均明显低于5 mm实性结节,即部分容积效应对直径5 mm的磨玻璃结节的影响低于实性结节,DLIR图像测得的5 mm磨玻璃结节的体积更准确。

表3 胸部低剂量不同算法重建图像上结节平均CT值偏差度的比较

表4 胸部低剂量不同算法重建图像上结节体积偏差度的比较

此外,许多国外学者对任务传递函数和信道化霍特林观测器等方法结合深度学习算法在检出模体内的模拟病灶的能力进行了探究,发现DLIR算法在低剂量下仍能保持对低对比度病灶的检出能力[13,15,25,26],也可以保持对高对比度病灶的空间分辨力[26]。而本研究中对三组重建图像上结节可见度进行了主观评价,结果显示,结节在ASIR-V、DLIR-M和DLIR-H图像上均得到清晰显示(图1、2),这主要是由于模体内实性结节和磨玻璃结节均由空气包绕,对比度已经较高,不同重建算法对结节可见度的提升空间小,因此DLIR与ASIR-V图像间结节可见度评分的差异并无统计学意义。

本研究具有一定的局限性:首先,仿真模体内内放置的结节仅为直径5~10 mm的球形结节,而临床上常见的肺结节多为类圆形或不规则形,且结节内有小血管、细微支气管等穿行,可能存在空泡征和空气支气管征等,使得其CT值变化范围较大,而不像体模中结节的CT值相对恒定、变化范围小;第二,模体内部为空气填充,与正常的肺组织结构存在差异,增大了肺结节与周围背景组织的密度差,使得模体研究的结果可能与临床病例的研究结果之间存在一定的差异;第三,本研究中仅对比了DLIR-M、DLIR-H和50%权重的ASIR-V三种重建算法,有待在今后的研究中对更多重建算法进行对比分析,以探寻对肺结节诊断准确性最高的扫描条件和重建算法。

综上所述,低剂量扫描条件下DLIR图像对结节CT值和体积的测量及显示情况与ASIR-V算法相当,而且5 mm磨玻璃结节在DLIR-M和DLIR-H图像上测得的CT值及体积更准确。对于肺结节的低剂量筛查及随访,采用深度学习重建算法是值得推荐的。

猜你喜欢
实性低剂量偏差
胰腺实性浆液性囊腺瘤1例
如何走出文章立意偏差的误区
学生天地(2020年6期)2020-08-25 09:10:50
两矩形上的全偏差
16排螺旋CT低剂量扫描技术在腹部中的应用
实时超声弹性成像诊断甲状腺实性结节的价值
中外医疗(2016年15期)2016-12-01 04:25:56
关于均数与偏差
系统医学(2016年8期)2016-02-20 02:55:08
自适应统计迭代重建算法在头部低剂量CT扫描中的应用
低剂量辐射致癌LNT模型研究进展
胰腺实性假乳头状瘤14例临床诊治分析
正常和慢心率CT冠状动脉低剂量扫描对比研究