甘桐嘉,石晶晶,邵剑波,朱文珍
随着医学图像信息学技术和医学影像学技术的不断发展,医学图像数据在疾病的发生发展的诊断和预后评估中不可或缺,在小儿中枢神经系统疾病中尤为重要。但是受限于医生对病变的主观定性分析经验,如病灶的形态、位置、均匀性、强化模式以及对周围组织的浸润等,因而需要全面深入发掘影像资料中未被利用的信息。深度学习能够提取影像科医生肉眼不可见的客观信息,提高诊断准确率和效率的同时评估预后,在小儿影像学中有着深远的影响,甚至成为未来影像学研究的发展趋势。
深度学习的基本概念
深度学习是人工智能的重要分支,它通过高效的算法自动提取图像信息,通过多层非线性神经网络层将数据的低级别特征进行组合并转换成高级别、复杂的抽象特征,以完成复杂任务的学习[1]。相比于传统机器学习、影像组学需要提取人为筛选的特征有独特的优势,避免了选择偏倚。深度学习过程主要分为三个阶段:图像预处理,特征筛选和特征建模,最终模型验证和输出[2]。最常用的模型评价指标包括ROC曲线、准确率、敏感度、特异度和Dice系数[3]。ROC曲线是检查可视化深度学习分类问题性能的最重要的评价指标之一,ROC曲线下面积(area under curve,AUC)越高,模型预测的能力越好。准确率、敏感度和特异度是广泛用于评估深度学习分类任务的性能指标。Dice系数是评估自动分割任务的定量指标。
综合分析和监测多种影像学资料在小儿中枢神经系统疾病中至关重要,但是小儿中枢神经系统随年龄发育阶段不同异质性较高,深度学习研究相较于成人受限。
深度学习在小儿脑组织分割中的应用
婴幼儿脑组织结构的准确分割(脑灰质、脑白质、脑脊液)是提取脑成像生物标志物的关键处理步骤。应用深度学习算法有助于小儿脑组织精准分割,IEEE上报道[4]在ISEG-2019年挑战赛中探讨了深度学习算法在婴儿(年龄6个月)脑组织分割中应用的准确性,其MRI信息来自多中心数据,最终Dice系数为:白质分割0.90~0.86,灰质分割0.92~0.82;脑脊液0.92~0.83。其次,深度学习在关键脑血管准确迅速分离也有临床应用价值。有研究对48例儿童MR图像(非血管成像)进行卷积神经网络建模,得到Dice系数为0.75,分割时间为8.3秒,对比人工1~2小时优势明显[5]。另外,在98例早产儿MR图像(T2WI)构建3DResU-net模型对弥漫性白质异常分割的Dice系数达到0.907。外部验证Dice系数达到0.877[6]。因此,深度学习在小儿正常组织和病变组织分割中都有巨大潜力。
深度学习在小儿脑发育评估中的应用
脑发育监测和评估一直是小儿中枢神经系统关注的重点。有报道以659例胎脑常规T2WI图像为基础,建立基于注意力的深层残差网络,预测胎脑年龄的总体平均误差为0.767周,R2为0.920,并且对常见脑畸形(脑室扩大、小头畸形)进行鉴别诊断,ROC曲线AUC可达0.9[7]。Rafael等[8]收集130名足月新生儿常规MR图像信息,构建深度学习模型(卷积神经网络),实现自动检测新生儿小脑发育不良,准确率达0.985。为新生儿脑发育自动化检测和分类诊断提供新的见解。同时也有收集0~24月婴儿T1WI和T2WI图像建模分析,预测婴儿年龄以及监测髓鞘发育进展,与专家预测效果相当,平均误差为8.2周(1.9个月)[9]。因此,基于MRI图像的深度学习技术能客观监测小儿脑发育,并为小儿脑发育相关疾病研究奠定基础。
早期脑影像预测预后对临床决策评估有重要意义。通过极早产儿(平均胎龄为28周)以及早产儿纠正胎龄41周时扫描DTI图像信息构建脑结构连接体借助不同深度学习建模(转移学习增强卷积神经网络模型和BrainNetCNN)预测2岁时预后(认知、语言、运动)[10-11]。He等[12]利用32周内早产儿扫描fMRI信息测试深度神经网络模型来预测认知,ROC曲线AUC为0.84。一般3~5岁才能做出认知缺陷的准确诊断。因此,深度学习有助于早产儿在纠正足月时进行风险分层,并在大脑发育最佳神经可塑性时期(3岁内)早期干预,改善早产儿发育结局。
深度学习在小儿脑肿瘤中的应用
深度学习在小儿脑肿瘤中的应用是研究热点,包括肿瘤组织的自动分割、诊断分级等方面。根据29例平均年龄5.7岁儿童交叉视路胶质瘤的MR图像(T2WI和增强后T1WI),构建深度学习模型(U-Net+ResNet),进行肿瘤组织自动分割,最终得到Dice系数为0.736[13]。对794名儿童(高级别胶质瘤、髓母细胞瘤和软脑膜种植肿瘤)构建U-net神经网络在T1增强和T2FLAIR图像上自动分割肿瘤,测量肿瘤体积大小,最终准确率达0.912[14]。根据多中心的617名后颅窝肿瘤儿童(脑桥中线弥漫性胶质瘤、髓母细胞瘤、毛细胞性星形细胞瘤、室管膜瘤)和正常对照儿童,构建深度学习模型进行分类鉴别诊断,ROC曲线AUC达0.99,与4位放射科医生的诊断准确率相当。模型肿瘤分类准确率为0.92,F1评分为0.80[15]。另外,收集儿童造釉细胞型颅咽管瘤CT和MRI数据,进行深度学习建模,对单独CT、MRI以及CT和MRI组合数据集的测试准确率分别为0.853、0.833和0.878[16]。所以,深度学习模型在小儿脑肿瘤中有应用潜力,能提高分诊效率,并且早期及时有效的非侵入性诊断方法代表临床实质性进步。
在小儿中枢神经系统其他疾病中的应用
儿童脑积水是影响脑发育的一种疾病,并影响儿童预后。目前深度学习在儿童脑脊液的自动量化有深入发展。如Grimm等[17]选取43例平均年龄5岁儿童脑积水患者常规MR图像,选用深度学习(卷积神经网络)模型进行分割,准确率达到0.9,Dice系数为0.86。另外,有研究使用脑积水患者80例CT图像进行U-Net卷积神经网络建模,用以分割和评估脑脊液的体积。结果显示接近专家评估水平,并且Dice系数为0.917[18]。因此,深度学习能够客观评估脑脊液同时改善放射科医生内部评估异质性,具有潜在的应用前景。
癫痫是儿科中枢神经系统中重要疾病,目前深度学习技术主要应用于癫痫病灶识别和预后评估。通过研究34例平均年龄为12岁的皮质发育不良患者MR图像信息,构建深度学习模型,从而自动化检测和预测癫痫病灶部位,敏感度为0.74,同时保持1.0的特异度[19]。另外也利用46例3D T1和fMRI图像建模(MLP多层感知器)学习,通过静息态磁共振图像构建脑网络功能连接,从而判断局灶性癫痫部位。最终达到0.89的准确率。相比其他传统机器学习不到0.71的准确率有明显的优势[20]。以及收集癫痫儿童DWI和fMRI图像进行卷积神经网络建模病灶定位,准确率达0.73以上[21]。这对癫痫病灶的精确快速识别以及后续治疗提供思路。Jeong等[22]收集37例(11.8±3.1岁)耐药性局灶性癫痫儿童的扩散张量纤维束成像(diffusion tensor tractography,DTT)图像,构建深度卷积神经网络来预测语言功能预后,表明DTT可能有助于预测语言障碍的严重程度,并可能为更好地理解儿童癫痫相关语言障碍的生物学机制提供帮助。
深度学习在儿童精神类疾病应用中具有巨大潜力。如深度学习早期诊断自闭症,从而促进临床早期干预并减轻发育损伤。借助276名患者不同年龄阶段(6个月、1岁、2岁)的MR图像,建立深度学习模型自动分割海马和杏仁核并测量体积,发现体积改变,准确率可达0.923[23]。有研究通过335名精神分裂症患者和380名自闭症谱系障碍(autism spectrum disorders,ASD)患者的常规MRI和rsMRI图像信息,建立深度学习模型,鉴别这两种精神疾病的准确率达0.85以上[24]。深度学习还可以联合结构MRI和功能MRI综合诊断,通过收集自闭症脑成像数据交换(autism brain imaging data exchange,ABIDE)中368例自闭症儿童的图像构建多层感知器(multi-layer perceptron,MLP)分析最终达到0.8506的准确率[25]。因此,在临床准确行为评估之前利用客观的影像信息进行评估对早期干预以及后期恢复有重要意义。
深度学习在小儿中枢神经系统应用挑战
目前深度学习技术在小儿中研究相对成人较少,一方面大型训练数据集短缺阻碍了深度学习发挥其最大潜力。可用的高质量标签数据集特别有限,因为小儿招募比在成人招募要困难得多[26]。建立全球公开数据库是提高数据量的一种方式,如ABIDE数据集和新生儿发展人类连接组计划(developing human connectome project,DHCP)数据集[27]。或者在数据预处理阶段用数据增强的方式或者迁移学习的方案[28]。另一方面与成人相比,运动伪影的出现频率更高,且胎儿、新生儿的大脑较小,扫描时间较短,对比噪声比(contrast to noise ratio,CNR)较低,未来需要在MR图像扫描过程中对图像参数和运动伪影进行改善,或深度学习技术应用于扫描过程[29],以便进行准确诊断。
目前深度学习暂未广泛应用于临床主要原因如下:第一,研究阶段参与深度学习的病例数量没有统一标准,这是一个不可忽视的问题[30]。一方面引起选择偏倚,另一方面应用到临床同质性降低。第二,影像技术发展速度快,图像参数标准不统一使图像质量参差不齐,引起外部验证测试阶段效能降低,导致难以实现多中心诊断一致性[31]。第三,深度学习模型存在过拟合情况,因此在临床广泛应用之前需要进行模型优化。第四,深度学习模型特征可解释性不强,使研究者们难以理解其基本生物学含义[32],模型结果可视化和可解释性是目前研究的重要领域。
综上所述,深度学习在小儿中枢神经系统影像学的研究广泛,在未来数据共享时代,可实现多中心诊断的同质性,不仅能减轻影像科医生的压力,而且可提高诊断的准确性及促进精准化临床决策。