郑喻文,武玉花,陈晓飞,董馥闻,王 平,周 晟*
(1.甘肃中医药大学第一临床医学院,甘肃 兰州 730000;2.甘肃省中医院放射科,甘肃 兰州 730050;3.甘肃省人民医院放射科,甘肃 兰州 730000)
肩痛在肌肉骨骼疼痛中居第三位[1],一般人群终生患病率为6.7%~67%[2]。肩袖损伤、肩关节不稳定(shoulder instability, SI)等均可引起肩痛。影像学可通过定性、定量分析肩关节形态学[3]、运动学[4]及解剖学[5]变化评估肩部疾病,但较为耗时,且存在一定主观误差。人工智能(artificial intelligence, AI)技术辅助自动定量、定性诊断可提高诊断准确率[6],而机器学习(machine learning, ML)和深度学习(deep learning, DL) 技术为其基础[7]。本文对DL用于肩关节影像学研究进展进行综述。
肩关节骨骼、肌肉及脂肪含量与多种疾病密切相关,精确分割各组织是量化评估的基础,可由经验丰富的医师辨别并手动勾画其边界,或根据其影像学特征设置阈值进行自动分割。WANG等[8]利用脉冲耦合神经网络和全卷积神经网络(fully convolutional network, FCN)、以基于图像块的AlexNet和U-Net构建分割肩关节MRI模型,包括分割肱骨模型、分割关节骨模型、分割肱骨头模型及合成模型,其分割敏感度及戴斯相似系数(Dice similarity coefficient, DSC)最佳值分别达0.96及0.97。KIM等[9]基于nnU-Net(Non new U-Net)分割3D MRI所示肩袖撕裂(rotator cuff tear, RCT)患者肌腱、肌肉、骨骼及软骨的DSC分别为0.807、0.858、0.978及0.808。LEE等[10]对肩袖全层撕裂患者以3D U-Net分割3D MRI中的撕裂区域,其DSC达0.943。CONZE等[11]基于双侧肩关节MRI数据构建VGG-16扩展U-Net分割模型对12例单侧分娩致臂丛神经麻痹患儿分割肩关节肌肉,其分割三角肌(0.824)、冈下肌(0.820)、冈上肌(0.710)及肩胛下肌(0.828)的DSC均优于单一U-Net(0.783、0.816、0.657、0.814)。
SAAVEDRA等[12]根据Goutallier分级标准,基于VGG-19、Inception-v3和ResNet-50对T2WI所示肩袖损伤患者冈上肌脂肪润浸进行分级,其中VGG-19的诊断效能最佳,其受试者工作特征曲线下面积(area under the curve, AUC)达0.991。TAGHIZADEH等[13]以U-Net自动量化和表征CT所示盂肱骨性关节炎肩部肌肉萎缩和脂肪浸润水平,其自动分割肩袖肌肉的平均DSC达0.88,评估肌肉萎缩、脂肪浸润和整体肌肉变性效果良好(R2=0.87、0.91、0.91)。RO等[14]利用VGG-19分割MRI中的冈上肌,其分割冈上窝和冈上肌的DSC分别达0.97、0.94,准确率均高于99%。以Otsu阈值技术定量分析冈上肌脂肪浸润程度的程序简单,具有无监督特性,可自动、稳定地选择1个最优灰度阈值,且能利用图像其他特征直方图对目标进行分类;对于严重脂肪浸润,先以直方图均衡化调整图像对比度后再行分析可获得更好效果。RIEM等[15]以3D U-Net和Otsu阈值技术于RCT患者肩部3D MRI中分割肱骨、肩胛骨、锁骨及肩袖肌肉,定量评估冈上肌脂肪浸润率,其平均DSC均高于0.90。近年逐渐于相关研究中基于DL识别分割误差、自动估计分割精度。HESS等[16]针对RCT患者以nnU-Net分割肩关节3D MRI中的肱骨、肩胛骨及肩袖并自动检测分割误差,其平均DSC为0.91、平均敏感度达1.0。
当前DL用于分割肩关节影像已可实现分割疾病区域及较小解剖结构,准确率逐步提高,但多数模型仍需进一步优化后用于临床。
近来DL已用于肩关节MRI质量控制,以降低图像噪声、缩短扫描时间并保证图像质量;其中,DL-MRI重建算法(AIRTMRecon DL)及高级智能Clear-IQ引擎(advanced intelligent clear-IQ engine, AiCE)去噪技术较为常用。
DL与多种快速成像技术相结合有助于打破MR扫描时间与图像质量难以兼顾的困境。HAHN等[17]及KANIEWSKA等[18]的研究结果表明,以DL重建MRI的图像质量及伪影评分均与标准序列图像相当而扫描时间缩短,且 DL重建图像显示肩峰下囊增厚效果较好。OBAMA等[19]采集肩关节PI并行压缩感知(compressed sensing, CS)成像及基于AiCE的PI、CS成像,AiCE图像的信噪比和对比度均有所改善;而无论是否应用AiCE,CS组MR检查时间均短于PI组。SHIRAISHI等[20]认为DL可通过改变图像比例而调整降噪水平且无需经过DL重建过程;应用AiCE后图像整体质量有所提高。FEUERRIEGEL等[21]报道,针对肩痛患者,利用DL可提高MR图像质量,且评估病变准确性较高。ZHAO等[22]对膝关节及肩关节3D MRI以自动切片定位模型进行2D图像切片定位,先以多分辨率区域提案网络于3D MRI中提取感兴趣体积,再以V-net类分割网络分割图像,其准确率及精度均高于85%。
肩袖损伤是常见肩部疾病之一,自愈力低,早期诊断、及时干预对改善预后至关重要。DL基于MRI诊断RCT效能优异,亦可基于肩关节X线片筛查RCT。
MINELLI等[23]采用InceptionV3结合可微空间数值转换法预测X线片中的临界肩角(critical shoulder angle, CSA)的关键点并计算其角度,其预测CSA的中位误差为0.95°,标准差为0.97°,有助于初步筛查肩袖疾病。KANG等[24]以关节镜为标准,应用梯度类加权激活映射技术基于腋窝位X线片识别肱骨小结节改变,评估肩胛下肌腱撕裂(subscapularis tendon, SSC),其AUC为0.83;由于关节镜可能未完全展现肱骨小结节处SSC,导致训练数据中存在噪声样本而影响了模型的准确率,有待后续开展前瞻性研究进一步评估。KIM等[25]以超声或MRI为标准,在肩关节前后位、冈上肌出口位、尾倾30° X线片中进行分类标注[0(正常或小于50%的RCT)或 1(大于50%或全层RCT)]以训练DL模型,其诊断大于50% RCT的AUC为0.91、阴性预测率达96.6%。
YAO等[26]采用Resnet及U-Net多输入CNN评估MRI所示冈上肌腱撕裂,后者诊断冈上肌腱撕裂的AUC达0.943。SHIM等[27]以关节镜、DeOrio和Cofield评级结果为标准,利用Voxception-ResNet针对1 360例RCT及764例非RCT患者的肩关节MRI进行训练及测试,其诊断RCT的准确率(92.5%)、诊断用时(0.01 s)均优于外科医师(76.4%及20.3 s);且该网络采用弱监督学习方法,虽仅标记正常及撕裂大小,但仍能基于三维数据获取病灶位置、大小并生成热图。KEY等[28]采用Vision VGG-19构建DL模型,通过浅层标准分类器——k最邻近分类算法、支持向量机和人工神经网络对112例患者的295幅轴位、406幅矢状位和468幅冠状位MRI进行分类,其基于轴位、矢状位及冠状位MRI诊断肱二头肌肌腱炎RCT的精度均达96%。
SI指肩关节脱位致盂唇、关节囊及骨性结构等损伤并使关节动态及静态稳定性下降[29]。目前DL智能量化评估SI尚处于初步探索阶段。盂肱关节骨缺损(glenoid bone loss, GBL)为SI常见病因,GBL达20%~25%时多需行关节镜下Bankart修复术,修复效果较差时需行植骨手术[30]。有学者[31]以基于U-Net的2D与3D CNN全自动分割并量化质子密度加权MRI所示多种肩部疾病患者肩关节解剖学参数,包括肱骨头直径、宽度,以及关节盂直径、宽度及高度,结果显示2D模型分割肱骨及关节盂的DSC分别为0.95、0.86,3D CNN模型分别为0.95、0.86,3D CNN模型测量肩关节解剖参数最大平均误差为1.9 mm,评估GBL百分比最大平均误差为4.67%。ZHAO等[32]以2阶段网络基于肩关节CT分割并测量关节盂骨缺损,发现先以ResNet-101定位关节盂所在CT切片可减少后续U-Net对关节盂的错误预测;之后以U-Net从关节盂CT切片中分割关节盂,ResNet-101的准确率达99.28%,U-Net的平均交并比达0.96,提示其分割准确性良好。
肩部严重损伤或关节感染时,需植入假体进行修复。DL技术有利于分类植入物、预测疗效及评估预后,从而制定个体化治疗方案。YI等[33]训练ResNet-18用于检测X线片中的肩关节置换术植入物、区分全肩关节置换术(total shoulder arthroplasty, TSA)与反置式人工全肩关节置换术(reverse total shoulder arthroplasty, RTSA),并训练5个ResNet-152以区分5种不同TSA模型,结果显示ResNet-18检测肩关节置换术植入物的AUC为1.0,区分TSA与RTSA的AUC为0.97,而ResNet-152区分5种TSA模型的AUC均高于0.86。SULTAN等[34]利用改良ResNet-50、DenseNet-201和1个浅层连接网络组成密集残差网络,其分类X线片中4种肩部植入物的准确率达85.92%。KUMAR等[35]纳入7 811例肩关节置换术患者,采用线性回归、决策树及DL 3种ML方法建立模型,以预测术后多种临床预后相关指标(美国肩肘外科协会评分、美国加州大学肩关节系统评分、疼痛视觉模拟评分等),其预测准确率均较好,预测预后达到最小临床重要性阈值的AUC为0.79~0.97,其中DL技术预测各指标的平均绝对误差最小。
DL用于肩关节影像学虽已表现出优异的性能和鲁棒性,但仍存在不足:①目前DL在肩部的应用多为肩袖疾病,而较少用于SI、盂唇损伤及冻结肩等;②多采用单中心数据训练模型,且图像质量控制无统一标准;③多以监督学习技术及基于2D图像构建DL模型。期待不久的将来能够制定图像质量控制相关标准,并基于影像学获取3D信息,实现弱监督及无监督学习训练。
利益冲突:全体作者声明无利益冲突。
作者贡献:郑喻文查阅文献、撰写文章;武玉花查阅文献;陈晓飞和董馥闻修改文章;王平审阅文章;周晟审阅文章、经费支持。