利用U-net算法在头CT平扫图像上分割脑梗死的初步探究

2022-06-21 02:04李晓庆王可欣图娅李昌欣王祥鹏张晓东王霄英
放射学实践 2022年6期
关键词:病灶脑梗死手工

李晓庆,王可欣,额·图娅,李昌欣,王祥鹏,张晓东,王霄英

我国现患脑卒中人数世界第一,脑卒中已成为导致成年居民发死亡和残疾的首位病因[1],其中又以脑梗死(缺血性脑卒中,ischemic stroke)占比为多。颅脑CT平扫(non-contrast head CT,NCHCT)是目前疑似脑卒中患者的首选影像学检查方法[2],也是医学影像科最常见的检查项目之一。在急诊或常规非急诊场景下,对于临床疑似存在脑血管事件风险的患者,在首先除外出血性脑卒中之后,使用辅助诊断软件在大量NCHCT受检者中快速筛选出脑梗死阳性发现患者并增加其诊疗优先级,提高影像科医生诊断效率,为临床医师尽快选择治疗干预决策提供帮助,有利于优化实际医疗工作中的诊疗流程。近年来,人工智能(artificial intelligence,AI)技术在医学影像中的应用探索越来越多,对图像分类[3,4]、脏器分割[5,6]、病灶检出[7]等均有较多应用,在提升诊断准确性的同时提高工作效率。

本研究拟使用深度学习算法研发影像智能辅助诊断工具,对疑诊脑卒中患者的NCHCT中存在的脑梗死病灶进行分割,自动生成结构化报告,有助于患者快速分诊,进而优化临床卒中管理模式。

材料与方法

本研究为回顾性研究,获得了医院伦理委员会的批准, 按照本单位人工智能AI模型训练规范执行研究方案。

1.用例定义

根据本院人工智能(artificial intelligence,AI)项目管理方法,首先定义研发CT颅脑平扫分割 AI 模型的用例,包括: AI 模型的名称(identity document,ID)、临床问题、场景描述、模型在实际工作中的调用流程、模型输入输出数据结构等。AI生成的结果自动返回到结构化报告的“病灶列表”(图1)。

图1 研究数据入组和训练流程。

2.回顾队列建立

从本院影像归档和通讯系统(picture archive and communication system,PACS)搜集检查时间2018年5月1日-2020年8月31日共1185例影像学诊断中包含“梗死”的颅脑CT平扫图像,由两名影像医师再次读片,结合近期MR或CT随访、临床病程证实为脑梗死。入组标准:脑卒中发作时间<72 h。排除标准:①缺乏临床或影像学证据,无法证明病灶为脑梗死;②患者同时有其他脑实质病变,并与脑梗死病变有范围重合;③因患者配合欠佳、或者体位因素造成扫描图像质量过差。经上述标准筛选病例,最终共有362例NCHCT检查纳入本研究。头颅CT平扫图像采集于不同的 CT 设备(表1)。

表1 CT图像采集参数

3.图像标注

在进行图像标注前,所有医学数字成像和通信(digital imaging and communications in medicine,DICOM)格式的CT图像都被转换为神经信息技术协议(neuroimaging informatics technology initiative,NIFTI)格式。由一位具有2年工作经验的影像科医生使用ITK-SNAP(version3,Philadelphia,PA)软件对脑梗死病灶进行标注,并由一位有15年以上工作经验的影像医师修改和确认。标注时结合CT图像特征并参考患者临床综合信息以确定脑梗死病灶的位置。CT图像特征包括可识别的早期脑梗死征象,如脑实质低密度、灰白质界限消失、脑回肿胀、脑沟变浅,岛带征,豆状核模糊及大脑中动脉高密度征[8]等。临床综合信息包括NCHCT检查时的临床表现、CT灌注成像(computed tomography perfusion imaging,CTP)、CT血管造影(computed tomography angiography,CTA),或NCHCT检查后1个月内的MR或CT复查影像,以及患者的临床诊断、治疗记录等。对于发病时影像中见的陈旧脑梗死病灶或软化灶也给予标注。

4.模型训练

图2 测试集中的脑梗死分割结果。白箭指示脑梗死病灶,黄色区域为手工标注范围,红色区域为模型预测范围。a) 左侧额顶叶、放射冠大面积梗死及右侧放射冠小面积梗死,主要病灶均被识别,预测范围与手工标注范围相差较小; b) 右侧额顶颞岛叶、基底节区、胼胝体大面积脑梗死,主要病灶被识别,预测范围与手工标注范围相差较小; c) 左侧额顶叶、放射冠大面积梗死,主要病灶被识别,预测范围与手工标注范围相差较小。

将362例脑梗死患者的 NCHCT检查随机按8:1:1的比例随机分为训练集 (288例)、调优集(37例)和测试集(37例)。深度学习的模型为2D U-Net[9]。将NIFTI格式的NCHCT图像分辨率设置为256×256。采用随机噪声、平移、左右翻转、仿射变换等图像扩增方法。使用ADAM梯度下降优化算法,初始学习率(learning rate)为1×10-4,每次读取的图像数量(batch size)为 24。训练次数(Epoch)为200,研究所使用的程序语言为Python。模型训练的硬件为GPU NVIDIA Tesla P100 16G,软件包括Python3.6、Pytorch 0.4.1、Opencv、Numpy、SimpleITK等。

5.模型评价

模型输出结果包括脑梗死病灶区域,使用最小体积包围盒算法[10]计算的病灶的三维径线,基于预测标签计算的病灶体积和CT值,生成的结果自动输入到结构化报告中。

以Dice相似系数(dice similarity coefficient,DSC)评估模型预测结果与手工标注的重合度,计算公式:DSC(A,B)=2· |A∩B| / |A| + |B|,其中A是手工标注的体素数,B是模型分割的体素数。以体积相似度(volume similarity,VS)评估模型预测的病灶体积与手工标注病灶体积的一致性,以Hausdorff距离(Hausdorff distance,HD)评价模型预测的病灶与手工标注病灶形态相似度。

6.统计方法

使用R4.1.0软件进行统计分析。符合正态分布的计量资料以均值±标准差表示,不符合正态分布的连续变量表示为中位数(四分位间距)及中位数的95%置信区间。使用Bland-Altman评价模型预测的病灶体积、径线和CT值与手工标注的一致性。

结 果

1.研究数据特征

所有362例患者平均年龄(68.9±13.7)岁,均为后续能证实存在脑梗死病变的患者。患者的年龄、性别等临床特征如表2。

图3 测试集中DSC值<0.5的6例脑梗死分割结果。细白箭指示脑梗死病灶,粗白箭指示非脑梗死病灶的低密度区域,黄色区域为手工标注范围,红色区域为模型预测范围。a) 模型预测范围相对手工标注范围小;b) 模型将邻近的脑白质脱髓鞘病变包含入脑梗死病灶预测范围;c) 模型将病变临近脑沟低密度包含入脑梗死病灶预测范围;d) 模型将贴近颅底的低密度误预测为脑梗死病灶;e) 模型将不对称的单侧基底节区结构错误预测为脑梗死病变;f) 模型未能检出梗死灶。

表2 入组病例临床信息

2.模型预测结果

在测试集共37例检查图像中,31例DSC值≥0.5,主要脑梗死病灶均被识别,且预测范围与手工标注范围相差相对较小(图2)。另外的6例DSC值<0.5,其中(图3):①4例预测病变范围相对手工标注范围小,或者存在多个病灶仅能预测其中部分(图3a);②3例将邻近的脑白质脱髓鞘病变包含入脑梗死病灶预测范围(图3b);③2例将病变临近脑沟低密度包含入脑梗死病灶预测范围(图3c);④1例将贴近颅底的低密度错误预测为脑梗死病灶(图3d);⑤1例将不对称的单侧基底节区结构错误预测为脑梗死病变(图3e)。此外,尚有1例数据未能检出梗死灶(图3f)。

在测试集所包含的37例病例中,依照连通域计算共97个病灶,其中,有82个病灶位于前循环供血区,占测试集数据的84.5%;15个病灶位于后循环供血区,占测试集数据的15.5%。上述病灶具体累及各脑区的分布如表3。

3.模型定量评估

测试集中平均DSC为0.66(95% CI:0.60~0.72),平均VS为0.76(95%CI:0.69~0.82),平均HD为39.69mm(95%CI:32.38~47.01)。计算模型输出的病灶体积、径线和CT值与相对应的手工分割测量值的中位数及其95%置信区间,缺口箱线图(图4)显示两组间各个观察值中位数的95%置信区间有重叠[11]。Bland-Altman分析显示模型预测与手工标注对病灶大小和CT值测量的一致性较高,2.8%~11.1%的测量值位于95%一致性界限(95% limits of agreement,95% LoA)外(图5)。

图4 测试集定量评估。a)DSC和VS的分布。b)测量值的缺口箱线图。从左到右的5组数据分别代表病灶体积、CT值、最小径、中径、最长径的参考值(蓝色)和预测值(黄色)的统计量;这5组数据的预测值和参考值中位数的95%置信区间有重叠。

图5 测试集中手工标注和模型预测的Bland-Altman分析。a)病灶体积B-A分析结果;b)病灶CT值B-A分析结果;c)病灶最小径B-A分析结果;d)病灶中径B-A分析结果;e)病灶最长径B-A分析结果。

表3 测试集中病灶的分布

讨 论

脑卒中具有发病时间早、发病人数多和患病人群庞大等特点[12],随着老龄化加剧,脑卒中成为我国医疗系统乃至社会需要面对的重要问题之一。NCHCT是脑卒中的首选检查方法[13],影像医生应从NCHCT图像中尽早识出脑梗死征象,从而辅助临床医师及时制定治疗干预决策,这对改善病人预后具有积极影响[14]。

本研究在NCHCT上分割脑梗死病灶,是在前期NCHCT正常、异常二分类的基础上[15],进一步用AI方法检出脑梗死病变,为使用AI技术全面评估NCHCT图像进行阶段性探索。本研究结果显示使用深度学习模型对于脑梗死的早期识别诊断具有可行性,值得进一步深入研究。研究者观察到模型在部分病例中预测的范围与手工标注的范围有出入,除外手工标注的问题后,我们认为这可能与模型自身的局限性相关;此外,部分病例模型预测存在误诊,模型将脑室周围脱髓鞘病变、脑沟或者不对称的基底节区结果误认为脑梗死,研究者分析认为可能与这些病变与梗死在NCHCT中同样显示为相对低密度,且与主要病灶位置相近有关。对于不能成功预测的1例病灶,研究者推测与病灶位于脑干,邻近硬化伪影重相关;此外,对于位于颅底、头顶的病灶模型的预测也存在偏差,研究者考虑除伪影等因素外,与病变自身像素占图层比例小可能有关。

本研究目前的定位是作为辅助分诊工具,在扫描完成后即刻筛查出有明确梗死灶的患者,发出提示信息,并将结果生成到结构化报告中。在结构化报告脑梗死重点病灶评估的“CT平扫表现”模块中,左侧分类列项提示梗死病灶在NCHCT中可能存在的影像学表现,包括脑实质密度减低、灰白质界限模糊、脑沟消失、大脑中动脉致密征及出血转化等,而位于右侧的图示将同时提供在听眦线层面、鞍上池层面、室间孔层面、半卵圆中心等主要层面的病变位置信息(图1)。这一流程有利于缩短报告时间,提高救治效率。

近年来,关于脑梗死的影像辅助诊断研究是本领域的热点问题之一。Aneta Lisowsk等[16,17]使用卷积神经网络(convolution neural network,CNN)方法检测NCHCT中的缺血性病变,认为使用该方法检测NCHCT中的缺血性病变是可行的。Wu等[18]使用了一种机器学习(machine learning,ML)方法对NCHCT中的急性缺血性脑卒中病变进行分割,证实了该方法在NCHCT图像中分割结果与DWI序列显示的急性缺血性卒中病灶具有较好的一致性。Paul Bentley等[19]的ML研究基于影像预测中风治疗结果,提示ML预测卒中预后较传统方法有更高的预测性能。Manuel等[20]对于NCHCT中脑梗死进行分类,研究了数据集偏差可能存在的影响。与既往类似研究比较,本研究同样验证了用AI检出NCHCT中缺血性脑卒中病变的可行性,提示了AI在医学影像识别方面可能的广袤前景。本研究关注重点是病灶的形态学分割,并得到基于体素的定量测量值;本研究与既往类似研究相比数据量较大,分割结果较好;并且本研究中模型生成的结果未来可自动输入到结构化报告中,对促进临床流程、优化方法有一定的作用。

本研究存在许多不足之处。第一,脑梗死病灶的选取和标注有一定局限性。尽管本研究在可行范围内严格规范了入组病例的入选及排除标准,结合影像与临床信息对病灶进行标注,但本研究的参考标准并非真正的病理诊断,可能对研究结果造成一定影响,这也是多数同类研究的共同局限[14,21,22]。同时,由于我们回顾性搜索并选择影像学诊断包含“梗死”的病例,因而最终纳入研究的脑梗死病灶不包含人眼难以识别的超急性期脑梗死,对于这部分病变的识别我们的模型仍存在欠缺。第二,部分患者出现神经系统症状时的CT图像中不仅有急性脑梗死病灶,且同时存在陈旧梗死病灶。后者可能与当前症状无关,但考虑到这些病灶也属于图像识别的任务,并可以反映患者脑血管的背景状态,所以最终研究将其一并纳入标注。因此,模型输出的结果既有新鲜梗死,也有陈旧梗死,未来研究者将对此开展工作,进一步将二者区分开来,更有利于临床治疗决策的制定。第三,对急性脑梗死的评估,临床需要基于定位信息完成半定量评估指标(如Alberta Stroke Program Early CT score,ASPECTS评分)[23],本研究未给出ASPECTS评分,这是下一步研究的内容。最后,本研究作为初步研究,仅使用了回顾性数据验证模型的效能,未来还应进行外部验证,以进一步评估模型的泛化性能。

总之,基于深度学习算法训练的辅助诊断模型可用于分割NCHCT中的脑梗死病灶并自动生成报告,对脑卒中患者影像检查后分诊有一定作用。

志谢:感谢北京赛迈特锐医学科技有限公司张虽虽在结构化报告工作中的贡献。

猜你喜欢
病灶脑梗死手工
依达拉奉联合康复治疗对脑梗死患者的影响
针灸在脑梗死康复治疗中的应用
脑梗死怎样治疗
为什么要做CT增强扫描
结核球是肺上长的瘤子吗?
AP—4、EZH2基因表达量与子宫内膜癌病灶中细胞凋亡、上皮间质转化的相关性研究
手工剪纸
手工DIY
珍贵的手工面