刘悦 沈阳市骨科医院放射线科 (辽宁 沈阳 110044)
内容提要: 目的:探讨人工智能(AI)肋骨骨折检测系统在多层螺旋CT中提高诊断肋骨骨折效能方面的作用。方法:选取2021年5月~2022年5月沈阳市骨科医院经64排螺旋CT扫描的50例肋骨骨折阳性和50例肋骨骨折阴性的患者作为观察对象,然后分别运用AI影像分析系统(AI组)、人工组及人工+AI组对比分析肋骨的特征,得出肋骨骨折的数量,然后统计三组诊断肋骨骨折的检出时间,假阳性率,敏感性和准确率。结果:AI检测出肋骨骨折的平均时间为(63±18)s,假阳性率4.56%,敏感性87.75%,准确率95.13%;人工检测出肋骨骨折的平均时间为(203±68)s,假阳性率1.30%,敏感性84.69%,准确率97.91%;AI辅助人工检测出肋骨骨折的平均时间为(136±28)s,假阳性率0.96%,敏感性92.85%,准确率98.79%。结论:AI技术在肋骨骨折中具有较高的敏感性和诊断准确率,虽然存在一定的假阳性率,但可以辅助人工,减少阅片时间,在提高诊断质量和工作效率上效果显著。
肋骨骨折是临床工作中比较常见的胸部创伤,及时准确的诊断不仅对患者的治疗和预后有很重要的价值,同时可以为法医鉴定提供重要的指标,并能减少医疗纠纷的发生[1]。由于X射线检查为重叠影像,并且和投照角度有很大的关系,导致诊断效能较低,有研究报道称漏诊率达到50%[2]。因此,多层螺旋CT成为胸部创伤最主要的影像学检查方法,由于扫描层厚越来越薄,同时图像的大量增多,造成诊断医师的工作量剧增,当工作一定时间后就会造成视觉疲劳,并且医师的诊断水平不一,就会出现一定的肋骨骨折的漏诊和误诊[3]。近年来计算机技术的快速发展,人工智能(Artificial Intelligence,AI)深度学习模型的建立,AI诊断肺内结节和预测良恶性技术已广泛应用于临床,但应用于AI技术诊断肋骨骨折的相关报道不多,本文通过对50例肋骨骨折阳性和50例肋骨骨折阴性的患者计算机体层成像(Computed Tomography,CT)图像进行分析,探讨AI技术在肋骨骨折诊断中的价值,旨在提高肋骨骨折诊断的效能,现报道如下。
回顾性分析2021年5月~2022年5月沈阳市骨科医院经64排螺旋CT扫描肋骨骨折阳性的患者50例和肋骨骨折阴性的患者50例临床资料,其中,肋骨骨折阳性患者中女性20例,男性30例,年龄28~69岁,平均(43.2±3.6)岁;肋骨骨折阴性患者中女性22例,男性28例,年龄25~67岁,平均(48.5±5.3)岁。本次研究经过医院伦理委员会监管。
纳入标准:①所有患者均有胸部外伤史;②胸部压痛;③患者能配合医生完成检查,影像及临床资料完整。排除标准:①年龄<18岁;②意识不清,不能配合,图像质量不佳。
1.2.1 多层螺旋CT检查
选取西门子128排螺旋CT扫描机,扫描时患者采用仰卧位,头先进,双手抱头,(如不能抱头者患侧肢体置于身体侧面),扫描范围胸廓入口至第12肋骨下缘,保证包括肋骨全部。管电压120kV,管电流240mAs,层厚及层间距均为5mm,矩阵512×512,视野40cm×40cm,采用骨窗图像(窗宽1300~1500,窗位300~450)。扫描结束后用0.625mm层厚及间隔重建,再进行图像后处理。
1.2.2 肋骨骨折检测
采用基于自适应3D-CNN(3D深度学习模型)技术的深睿医疗AI影像辅助筛查系统,(V1.3.0.1,杭州深睿博联科技有限公司)将100例患者的薄层重建数据导入工作站,自动得出肋骨骨折阳性患者的部位和数量。
人工由3名主治医师单独阅片,年资分别为5、8、10年,阅片的过程可根据需要调整窗宽和窗位,利用计算机软件容积再现、多平面重组等,最后得出三组数据的平均值,统计人工和AI检测出肋骨骨折的假阴性及假阳性数、平均检测时间,根据肋骨骨折的确诊结果进行分析,对比AI和人工对肋骨骨折检出的假阳性率和灵敏度及准确率。
所选病例中50例有肋骨骨折,50例无肋骨骨折,共计肋骨2400根,其中,肋骨骨折98根,无肋骨骨折2302根。
AI检测时间与患者的扫描和重建层数有关,重建层数越多,时间相应增加,但总体变化不大,平均每例患者检测出肋骨骨折的时间为(63±18)s,人工分析肋骨骨折的变量较多,主要受胸廓结构及病变的位置影响,另外,不同年资的医师对肋骨骨折的诊断用时也大不相同,年资5年医师诊断用时为240~302s,8年医师诊断用时为210~282s,10年医师诊断用时为192~248s,检测每例肋骨骨折的平均时间为(203±68)s,而且诊断时间上在第一小时阅片速度为192~218s,在第一小时阅片速度为202~246s,随着读取数量的增加而诊断时间相应地延长。两者相比,AI在诊断肋骨骨折的时间明显优于人工检测,差异具有统计学意义(P<0.05)。
AI检测出肋骨骨折假阳性率4.56%,敏感性87.75%,准确率95.13%,人工检测出肋骨骨折假阳性率1.30%,敏感性84.69%,准确率97.91%。AI在诊断肋骨骨折的敏感性略优于人工,准确率与人工相当(χ2=0.144,P>0.05),差异无统计学意义,但人工在肋骨骨折假阳性率上明显优于AI,差异具有统计学意义(χ2=5.239,P<0.05),另AI检测错位性骨折准确率为100.00%,骨皮质扭曲的准确率为75.00%。见表1。
表1.三种检查方法对肋骨骨折检出情况对比(n=2400)
肋骨骨折是反映胸部创伤严重程度的一种指标,常由撞击、摔伤、高空坠落及车祸等外力造成[4]。肋骨骨折常伴有肺损伤,如不及时治疗会影响预后甚至生命,另外,在患者之间纠纷上确定是否存在肋骨骨折及骨折数量也非常的关键,因此对肋骨骨折的及时准确诊断有着极其重要的意义。相对于数字X射线摄影的检测,CT可有效地检出肋骨骨折,但与单层CT相比,多层螺旋图像更薄,扫描速度更快,辅助多平面重组、容积再现等后处理技术,在对肋骨的形态分析时,能进行任意平面的图像重建,可以更加立体地多角度细致地分析,但获得清晰图像的同时也会带来图像数量的成倍增加,放射科医生面对大量图像的阅读就会带来视觉疲劳,同时对不完全性骨折的诊断也依赖医师的诊断经验等客观因素,往往就会造成一定的漏诊和误诊,有报道称,人工对肋骨不完全骨折的漏诊率远大于误诊率[5,6]。随着AI诊断系统的应用,人工和AI技术的结合,可以有效降低肋骨骨折的漏诊率,明显提高工作效率[7]。目前,AI在提高肺结节的检查率上报道较多,关于深度学习诊断肋骨骨折多在研究算法和模型的构造上,对肋骨骨折实际应用方面报道较少。本研究是在AI与人工在诊断效能方面进行研究,以期为临床诊断提供一定的依据。
本次研究应用深睿医疗的AI分析软件,采用了3D-CNN(三维卷积神经网络技术),目的探讨AI对肋骨骨折检出的真实数据,结果表明,AI对肋骨骨折的检出时间仅与患者的扫描和重建层数有关,平均每例患者检测出肋骨骨折的时间为(63±18)s,相比人工检测平均每例肋骨骨折的时间为(203±68)s,在时间和效率上有明显的优势,并且AI检测受影响因素较少,不易受体位及病变的复杂程度影响,并且不会产生视觉疲劳。但人工诊断方面随着阅片数量的增多,诊断准确率及速度明显的下降,时间越长发生漏诊的概率明显增高,另发现AI诊断肋骨骨折中假阳性较高,达4.56%,这些骨折多发生在肋骨与前软骨及后椎骨的连接处、另外骨皮质密度不均匀、呼吸伪影、胸膜钙化,肋软骨钙化窦都可以发生。本次AI出现假阴性骨折12处,分析其原因主要有,肋软骨骨折、骨折轻微并且骨折线纤细、骨折愈后向骨髓腔内生长等,这与文献报道基本一致[8,9]。本次还发现AI在错位性骨折的诊断敏感度最高,骨皮质扭曲的诊断率稍低,这与临床工作中医师容易忽略隐匿性骨折的情况相符,可能的原因是大数据模型建立的样本问题。本次研究AI在肋骨骨折的敏感度略高于人工,分析原因2例患者骨折轻微的改变AI直接给予标记,不受外界因素影响,人工读片当时也怀疑是微小骨折,但是在此患者其他肋骨也发现了明显的骨折,认为此处可以忽略,后来重新组织专家复读时也一致认为有骨折的可能,因此表明AI在提示人工方面可以起到重要的作用,同时在准确率上AI与人工相当[10,11]。AI+人工在肋骨骨折的敏感性和准确率都有一定的提升,并且假阳性率有较明显降低,表明人工在AI自动肋骨筛查软件的辅助下可以有效地提高肋骨骨折的诊断效能。
本次研究仅采用了一家AI影像诊断系统,其能力和特点可能与其他公司的影像分析系统存在一定的差异,另外收集的样本量比较少,具有一定的局限性,数据源于单中心,所选的医师是在测试的状态下观察分析影像数据的,与日常工作的环境有一定的差别,另外平时工作中会有不同层次的医师进行肋骨骨折的诊断,导致研究的结果和真实有一定的偏倚[12,13]。以后随着技术的发展,应引进更多的AI分析系统,同时应扩大样本量,获得更准确的结果。因此,在以后的临床工作中,可首先利用AI诊断系统对所有肋骨图像进行初步筛查,对可疑病变进行标注,影像医师可以有针对性地进行二次筛查,重点分析,再结合各种影像重组技术,最后对肋骨是否骨折作出精准的判断,可有效地提高诊断效率和肋骨骨折的检出率[14,15]。
综上所述,AI技术在自动检测肋骨骨折上显示出良好的诊断效能,可以用来辅助人工,在提高工作效率和漏诊率上效果显著,相信随着AI技术的不断完善,将来AI系统会成为诊断肋骨骨折主要依据。