孙兆男,崔应谱,林志勇,刘想,刘伟鹏,王祥鹏,张靖远,张晓东,王霄英
临床可用多种影像技术评估肾脏功能。MRI功能成像是主要研究方向,扩期加权成像(diffusion weighted imaging,DWI)[1]、动态增强扫描(dynamic contrast enhanced imaging,DCE)[2]、动脉自旋标记成像(arterial spin labeling imaging,ASL)[3]和血氧水平依赖成像 (blood oxygenation level dependent,BOLD)[4]等都从不同角度反映肾脏功能。虽有很多高级功能成像技术可用于肾脏评估,但从临床实用角度目前仍公认肾脏体积是反映肾脏慢性功能改变最重要影像学指标。肾窦脂肪含量是预测心血管疾病患者发生不良事件危险因素之一[5],肾窦脂肪增多时可压迫肾实质、肾血管、淋巴管及释放脂肪相关因子导致肾功能损害[6]。因此,准确且可重复肾脏定量测量数据对于肾脏疾病及心血管系统疾病诊断、判断病程发展变化有意义,定量测量肾实质及肾窦体积是医学影像报告应完成的任务。
研究[7]通过离体猪肾脏实验证实以医生手工标注CT图像测量肾脏体积有很高准确性,研究者手工勾画肾脏轮廓得到肾脏体积与真实体积基本一致。但人工逐层勾画肾脏轮廓在临床实际工作中难以广泛推广使用,医生通常在超声、CT或MRI图像上粗略测量肾脏大小及实质厚度,测量结果一致性及重复性较差,对肾脏体积微小改变不敏感。而对肾窦体积及脂肪含量测定更是缺乏便捷通用方法。近年基于深度学习分割方法已被广泛应用于医学图像分割和目标对象体积测量。Ronneberger等[8,9]提出U-Net网络在医学图像分割上取得了显著成绩,对肝脏、前列腺及肾脏分割可达到专家标注水平。
本研究目的是研发腹部CT图像上正常肾脏肾实质和肾窦自动分割模型,定量测量正常成人肾实质、肾窦体积及三维径线得到肾实质、肾窦体积及三维径线95%参考值范围,进一步对正常成人年龄、性别、身高、体重与肾实质和肾窦体积进行相关分析及多元线性回归分析,为评价肾脏体积提供客观数据支持。
本研究获得了本院伦理审查委员会批准,按照本单位人工智能(artificial intelligence,AI)模型训练规范执行研究方案。
根据本单位AI训练管理方法,首先定义研发肾脏分割AI模型用户样例(Use Case)。包括肾脏分割AI模型ID、临床问题、场景描述、模型在实际工作中调用流程、模型输入输出数据结构等。AI模型返回结果定义为双侧“肾实质径线和体积”和“肾窦径线和体积”。
搜集2018年1月1日-2019年6月30日间由于非泌尿系统疾病而住院患者腹部增强CT图像及电子病例,对于能够获得足够住院临床资料患者由两位高年资影像医生审查电病例及阅片,挑选合格病例。纳入标准:①既往无任何肾脏、心脏、免疫系统、内分泌系统相关病史,无肾毒性药物使用史等;②住院期间各项检查结果均显示肾功能正常;③年龄18岁以上;④CT扫描范围包括全部左/右肾,重建了1mm薄层肾脏皮髓质期图像;⑤图像清晰无伪影;⑥图像中双肾及肾窦大小、形态、位置、密度未见异常。排除标准:①任何影像图像见肾脏局灶性病变或者弥漫性病变者如肾脏变异(孤立肾、异位肾、重复肾、马蹄肾)、肾脏术后及CT图像见的梗阻性肾积水、肾结石、肾实质钙化、肾占位性病变等;②扫描范围不足或期相不正确,或不能获得薄层图像;③图像有伪影;④年龄<18岁;⑤根据临床资料可提示有任何累及肾脏全身性疾病。
最终挑选365例“双肾正常”病例纳入研究。搜集数据包括CT图像、患者年龄、性别、身高、体重等。其中93例用于建模(训练集48例,测试集45例),用模型预测另外272例新数据用于模型效能评价,训练集中人工标注93例和模型分割效果好的272例数据用于肾实质及肾窦定量分析(图1)。
数据标注:首先将从PACS导出DICOM格式批量转换为NIFTI(neuroimaging informatics technology initiative)格式。由1名影像科医生指导3位有基础医学知识人员使用ITK-SNAP软件标注双肾实质及肾窦共93例,由1名影像医生复核修改标注,其中48例作为训练集,45例作为测试集。标注规则(图2):①调整窗宽300HU,窗位30HU; ②肾实质标注标准包括肾皮质、肾髓质、肾乳头及肾柱。③肾窦标注标准:轴面图像肾实质内缘连线为肾窦内侧边界包括肾小盏、肾大盏、部分肾盂、血管、淋巴、神经、脂肪。
图1 研究对象纳入流程
图2 图像标注方法。 a~d)分别为双肾轴面、双肾冠状面、右肾矢状面、左肾矢状面标注情况;e)3D图像。红色label 1,左肾实质;绿色label 2,右肾实质;蓝色label 3,左肾窦;黄色label 4,右肾窦。 图3 肾实质、肾窦分割模型示意图 。皮髓质期薄层CT单层图像和人工标注肾实质及肾窦标签,输出是模型分割肾实质、肾窦结果。 图4 最小体积包围盒算法。得到长方体长、宽、高分别作为肾实质长、宽、高。 图5 a)模型预测结果;b)去除小连通域之后结果。 图6 模型预测结果3D。a)模型预测效果欠佳举例,肾窦位置预测错误;b)模型预测结果包含小连通域(左侧肠管)。
模型训练:硬件设备为NVIDIA Tesla P100 16G,内存256G,软件环境包括Python3.6,Pytorch 0.4.1,Opencv,Numpy,SimpleITK。
采用Ronneberger等[8]提出U-Net算法。模型输入是皮髓质期薄层CT图像和肾实质及肾窦标签,输出是模型分割肾实质、肾窦结果(图3)。在输入模型前首先对图像进行预处理,将皮髓质期CT图像从512×512压缩为256×256,窗宽调整为300,窗位调整为30。开始训练时每次读取到显存中图像数量(batch size)为10,学习率为0.0001,训练循环次数(EPOCH)为15次。
模型评价:客观评价方法:测试集Dice值用于评估肾实质、肾窦分割模型效果。
主观评价方法:为评价该模型分割误差是否达到临床满意,用训练好模型预测新272例数据,由两位影像医生评价模型输出分割结果逐一阅图并统计肾实质是否包全,是否包含其他结构(肝、脾、肠管、膈肌),若包含是否与肾脏主体相连。
图7 各测量值正态性检验结果(Q-Q图)。a~p)分别为左肾实质体积、左肾实质左右径、左肾实质前后径、左肾实质上下径、左肾窦体积、左肾窦左右径、左肾窦前后径、左肾窦上下径、右肾实质体积、右肾实质左右径、右肾实质前后径、右肾实质上下径、右肾窦体积、右肾窦左右径、右肾窦前后径、右肾窦上下径正态性检验结果(Q-Q图),所有点近似在一条直线附近,样本数据近似于正态分布。
测量方法:基于272例图像医生评价结果,采用去除小连通域图像处理方法,从而使脾、主动脉、左股骨、左坐骨、左耻骨、肠管、心包、左侧腰大肌等小连通域去除,仅保留肾实质和肾窦区域,从而进一步提高分割准确性。运用最小体积包围盒算法[10](图4)测量双侧肾实质和肾窦的三维径线。采用去除小连通域方法处理图像(图5),根据保留像素数计算双侧肾实质和肾窦体积。
统计方法:采用SPSS 24.0和MedCalc 15.8统计软件。经Q-Q图[11]对所有测量值进行正态性检验求出95%参考值范围。采用Pearson相关分析探讨肾实质体积、肾窦体积与年龄、身高、体重相关性,用Spearman相关分析探讨肾实质体积、肾窦体积与性别、侧别相关性,进而采用多元线性回归分析探讨肾实质体积和肾窦体积影响因素,P<0.05为差异有统计学意义。
客观评价:测试集中分割右肾实质DICE值为±0.01,分割左肾实质DICE值为0.97±0.01,分割右肾窦DICE值为0.84±0.06,分割左肾窦DICE值为0.88±0.04。
主观评价:模型预测272例分割结果,170例(62.5%)两位专家均认为分割效果可直接用于精确计算体积达到人工标注效果。1例肾窦位置预测错误(图6a)。余101例(37.1%)肾实质及肾窦分割结果好,但存在肾脏之外其他区域小连通域(图6b)如脾、主动脉、左股骨、左坐骨、左耻骨、肠管、心包、左侧腰大肌,认为采用去除图像中小连通域方法可用于精确计算体积。
临床资料:365例用于体积及径线测量病例年龄范围18~93岁。男178例,占48.8%,年龄55.79±13.74,身高(172.11±5.81)cm,体重(71.36±11.92)kg;女187例,占51.2%。年龄(52.87±14.41)岁,身高(160.53±4.74)cm,体重(58.90±10.06)kg。
图8 肾实质、肾窦体积及径线测量结果接入临床工作流程
肾实质和肾窦体积及三维径线测量结果(表1)。
经检验所有测量值均近似服从正态分布(图7),采用正态分布法统计95%参考值范围。
表1 双侧肾实质和肾窦各测量值95%参考值范围
肾实质体积和肾窦体积相关因素分析:相关性分析结果显示身高、体重与肾实质体积呈正相关(r=0.463、0.441,P=0.000、0.000),与年龄、性别、侧别呈负相关(r=-0.283、-0.369、-0.110,P=0.000、0.000、0.003)。肾窦体积与年龄、身高、体重呈正相关(r=0.283、0.342、0.485,P=0.000、0.000、0.000),与性别、侧别呈负相关(r=-0.397、-0.251,P=0.000、0.000)。
各潜在因素与肾实质体积、肾窦体积多元线性回归分析:将相关性分析中存在线性相关因素引入多元线性回归方程,其回归方程为肾实质体积=0.654×身高-0.597×年龄+0.653×体重-6.321×侧别-8.824×性别,回归方程的R2为0.304(表2);肾窦体积=0.213×体重+0.168×年龄-4.162×侧别-2.052×性别+0.122×身高,回归方程的R2为0.389(表3)。
表2 潜在因素与肾实质体积的多元线性回归分析
表3 潜在因素与肾窦体积的多元线性回归分析
完成肾脏体积及径线自动测量后,通过结构化报告系统将测量结果自动返回到报告中,包括双侧肾实质、肾窦的三维径线、体积,以及关键图像,由医生审核后自动呈现在报告界面中,实现CT图像上肾脏定量测量的自动化(图8)。
肾实质体积测量对肾脏疾病诊断及肾功能评估有重要作用,既往多用来评价慢性肾脏疾病如肾动脉中重度狭窄时,肾实质体积减小及肾小球滤过率减低[12];CKD患者分期不同肾实质体积不同程度减小[13]。此时,在报告中定性地描述“肾脏萎缩、肾脏体积缩小”也是可接受的。但随着认识水平提高越来越多医疗工作要求定量报告肾实质体积如肾脏体积是判断肾移植患者排斥反应敏感而稳定指标,发生排斥反应时肾实质体积增大,控制排斥反应后肾实质体积恢复[14],此时,准确、定量报告肾脏体积是必要的。
近年来很多研究认为肾窦内脂肪沉积量与肥胖及心血管系统疾病相关,各种原因导致肾积水会不同程度损伤肾脏功能,因此肾实质和肾窦体积都是CT影像报告中需要提及指标,并且需要肾实质及肾窦体积、三维经线正常值范围提供基线参考。目前临床测量肾脏通用方法是B超或者CT、MR图像上测量三维径线,然后运用椭圆公式计算得到肾脏体积[14]。本研究中应用模型采用自动分割及自动测量方法得到肾实质及肾窦体积,经两位影像医生评估后认为分割效果好,可代替医生手工测量,这与既往研究结果是类似的。近来年,以U-Net为代表深度学习辅助诊断模型广泛应用于多种脏器分割如前列腺[15]等。在CT和MR图像分割肾脏研究多有报告[16,17],结果均较准确,证明这种方法是可行的。不同的是既往研究多关注是肾脏整体区域,而本研究将肾实质和肾窦分别进行定量测量,由于肾实质体积、肾窦体积分别具有不同疾病诊断意义,分别地准确定量测量是有价值的。医生测量径线过程中需要调整测量层面及选择合适测量位置,不同测量者测量三维径线有一定差异性。因此,自动分割模型益处是显而易见的,其准确度高、一致性好,结果可自动返回到报告中,医生不需要花费时间手工测量,仅需审核报告中模型返回结果即可。
从临床实际操作角度自动分割软件应植入到工作流程中才能真正实现其价值。在本项目立项之初定义用例时设计将模型输出结果自动地填写到结构化报告中完成定量测量全自动流程。结构化报告可提高影像工作一致性和标准化,通过结构化报告可向临床医生更准确地传递诊断信息[18]。结构化报告工具和AI工具是相互促进的。结构化报告既可提供优质的、语义清晰结构化数据用于训练AI模型,又提供了AI结果自动呈现在临床工作中落地平台;同时好AI工具可帮助填写结构化报告中内容提高医生工作效率和准确性。以本研究为例,既往日常工作中CT影像报告肾脏均为定性描述(如肾脏大小正常、萎缩、肿大等),而接入AI模型后不仅可自动报告肾脏的三维径线和体积,而且可对测量值与正常参考值进行比较做出定性诊断。可以预期随着越来越多AI应用与结构化报告整合,医学影像报告将很快从结构化向智能化方向转变。
本文局限性:第一,仅报告了无病变肾脏分割结果,肾脏有病变时(局灶性病变及弥漫性病变)已另外研发了专门适用分割模型,由于篇幅所限未予报告。第二,完成肾脏实质分割后应进一步行皮质和髓质分割,尚未纳入研究中。第三,由于肾脏病变常常与肾血管、集合系统、肾周结构是相关的,在后续工作中应对肾脏及肾脏周围结构统一做出分割,在此基础上不仅能做到定量测量,更可以尝试研发疾病诊断AI工具。第四,正常成人肾脏体积参数范围较宽,初步统计上限大约是下限的2倍,既往研究[19-21]由于样本量、测量方法不同正常成人肾脏体积参数报道没有统一标准,其影响因素报道很不统一。本研究同样缺乏大样本、多中心正常人群作为研究对象,多元线性回归分析中拟合方程R2结果偏低,分别为0.304和0.389,虽然回归模型有统计学意义(P<0.05),但以此来说明正常人群肾脏体积参数范围及影响因素存在一定局限性,且研究对象不是来自正常志愿者人群,而是来自就诊患者,入选对象虽然严格按照“双肾正常”纳入标准挑选,但无法保证排除有影响正常测量值的隐匿性因素。但不可否认的是本研究研发了肾脏分割模型,从分割结果来看模型可有效分割CT图像上肾实质和肾窦并测量及径线及体积,为日后大样本、多中心正常人群肾脏体积参数测量及影响因素研究提供了一种高效、准确的测量工具。
总之,U-Net可有效分割CT图像上肾实质和肾窦,并测量及径线及体积,自动完成影像报告中双肾大小定量评估。
志谢:感谢北京赛迈特锐医学科技有限公司张颖静、常颖、张燕在数据标注工作贡献,张虽虽在结构化报告接入工作的贡献。