李广明,江桂华,陈辉,徐雯,钱东东,罗召洋
1.湖北文理学院附属医院,襄阳市中心医院,湖北襄阳 441003;2.广东省第二人民医院影像科,广东广州 510317;3.广州柏视医疗科技有限公司,广东广州 519000;*通讯作者 江桂华 13828472201@163.com
新型冠状病毒肺炎(COVID-19)是一个全球突发重大公共卫生事件[1-3],CT 受检人数、受检次数以及图像量的剧增均给影像科医师及临床医师的诊断和治疗带来巨大的挑战。核酸检测是无创诊断COVID-19 的“金标准”。目前,基于病变受累的范围和表现,将COVID-19 分为早期、进展期和重症期3 个阶段[4]。结合患者的流行病学接触史,采用高分辨率CT 是筛查和诊断COVID-19 的重要依据[5-6],可用于早期COVID-19 疑似病例的筛查、诊断和鉴别,还可用于确诊患者的病情分期和随访分析,对COVID-19 患者的肺部CT 病灶分析及辅助诊断均具有十分重要的意义。随着COVID-19 病情发展,病灶在CT 影像上数目、在切片上的面积均存在一定的规律[7-8]。胸部CT人工阅片诊断COVID-19模式在本次疫情中发挥了重要作用,但无法精准、可视化地对肺炎累及范围和病情进展情况进行量化分析。因此,本研究提出一种半自动的图像分割方法,对病灶进行分割,量化COVID-19 患者的胸部影像学表现,从而为临床诊疗提供数据支持。
本研究利用COVID-19 的部位、形态、灰度分布 等特点,设计了基于区域生长和主动轮廓的图像分割算法(图1)。
图1 分割算法流程
1.1 基于区域生长的肺炎病灶分割方法 医师在病灶区域标注若干点,基于区域生长生成病灶的初始轮廓。区域生长算法有3 个关键因素:①选择合适的生长点;②确定相似性准则;③确定停止条件。
图2为区域生长的一个实例,图2A为原始图像,数字为像素点的灰度。在8 邻域内,取灰度值差异小于2作为生长准则。图2B 是第一次区域生长示意图。重复迭代此过程,直到无满足生长准则的像素点,生长停止。实施区域生长算法前需要对图像进行平滑预处理,消除噪声干扰。
1.2 基于主动轮廓的肺炎病灶分割方法 主动轮廓基于一个近似轮廓,检测得到目标的精确轮廓。
主动轮廓初始点为:
通过求解一个最小能量问题对轮廓点调整,得到目标轮廓,主动轮廓的能量函数定义为:
图2 区域生长
Eint推动曲线的形状发生改变,并保持轮廓上的点间距离:
其中,vs(s)为s处的一阶导数,vss(s)为s处的二阶导数,α(s)、β(s)为对应权重。
将vs、vss基于轮廓点间距离归一化[9];同时增加膨胀能量加速收敛,将Eint修正为:
其中,Ebal(s′i)=ni·[si-s′i],ni为Si处沿V向外的法向量,ni可通过切向量ti旋转90°得到,ti定义为:
利用图像自身的灰度和梯度信息,Eimage定义为:
其中,Eline=I(x,y)为图像的灰度值,使轮廓移 动到高或低的灰度区域(由参数wline限定)。
Eedg=|∇I(x,y)|2为图像的梯度能量,调整轮廓到边界区域。
其中,C(x,y)=Gσ(x,y)*I(x,y),对图像进行高斯平滑[10],θ=tan-1(Cy/Cx)为 C(x,y)为梯度图像的梯度角。令n=(cosθ,sinθ),则n⊥=(-sin, cosθ)。
Eterm强制轮廓由均匀的区域到目标边界上。法线方向是轮廓下降的最快方向,因此将Eedge更新为-ni*∇I(si),其中ni为si的法线方向。
Econ在论文的实现中设定为-k(s1-s2),本研究未使用Econ能量。用区域生长的粗分割结果作为主动轮廓算法的输入,对COVID-19 的区域进行精分割。
1.3 分割结果的评价指标 采用Dice[11]作为分割算法的性能评价指标,见公式(8),其中pred为预测的病灶区域,target为医师标注的“金标准”。
本研究使用CT 序列的病灶数目、最大病灶面积、病灶的平均面积作为COVID-19 的量化指标[12]。
病灶数目定义为:
其中li为每一层COVID-19 的病灶数目。
最大病灶面积定义为:
平均病灶面积定义为:
其中,areasj为第j层切片面积,areaci,j为对应切片第i个轮廓的面积。
3.1 分割的实验结果与分析 本研究在150例CT 序列上进行分割,分割的最大Dice 为0.99,平均Dice为0.95,最小Dice 为0.89。分割结果与医师的标注基本一致,分割效果见图3。
3.2 病灶量化分析 本研究对COVID-19 不同进展 期的CT 序列进行量化分析。图4 为一例患者的初期、进展期1、进展期2(处于进展期不同时期的CT)和吸收期进行量化分析的结果。由图4 分析可得,最大病灶面积、平均病灶面积及病灶数目与病情发展趋势呈正相关。由图5、6 分析可得,COVID-19 不同病理进展期对应切片上的病灶面积和病灶数目的变化与病情趋势完全一致。
图3 病灶分割效果。A~D 分别为原图、种子点图、分割的结果图、医师标注图
图4 COVID-19 病灶的量化统计
本研究基于医师标注的病灶标记点,为区域生长算法提供了稳定的初始条件,因此可以得到稳定的分割结果。同时本研究在分割的结果上,提取病灶数、最大轮廓面积和平均轮廓面积进行量化分析,这些特征也是医师在COVID-19病情进展诊断时的重要参考指标,本研究分析了这些特征的变化趋势,得出这些特征的变化趋势与患者病情的发展趋势完全一致,表明本研究提出的方法能够为医师分析病情进展提供积极的帮助。
图5 COVID-19 不同分期病灶趋势。A 为初期、进展期1、进展期2、吸收期CT 序列层a 对应切片,ROI-1 为对应的病灶区域;B 为初期、进展期1、进展期2、吸收期CT 序列层b 对应切片。ROI-1、ROI-2 为对应的病灶区域
图6 新型冠状病毒序列对应病灶量化分析。A为层a COVID-19病灶量化统计;B 为层b COVID-19 病灶量化统计
本研究方法属于一类半自动的图像分割方法,仍需医师提供少量的标注,为医师增加额外的工作,课题组后续将探讨基于无监督的深度学习方法[13]对正常CT 影像建模,以构建区别于正常影像的异常病例的预警模型,提取异常病例的异常结构,结合本研究提出的区域生长和主动轮廓分割算法建立异常病例的筛选和病灶分割的全自动模型,减轻医师的负担;课题组后续将基于本研究方法的分割结果进一步探讨临床信息[14]和组学[15]在病情分析中的应用,从多维视角挖掘更深层的特征,并分析这些特征在病情进展决策中的重要性[16],为医师分析病情进展提供指导;同时将分析机器学习方法在病例随访[17]及患者生存分析[18]等临床场景中的应用,预测患者的病情和疗效,为COVID-19 的预后提供更精准的信息。