人工智能骨龄评测系统评估儿童腕骨骨龄

2019-12-19 04:00王齐艳蒲杨梅邹雪瑾
中国医学影像技术 2019年12期
关键词:骨龄年资评测

康 敏,王齐艳,蒲杨梅,丁 立,邹雪瑾

(四川省妇幼保健院放射科,四川 成都 610042)

儿科临床中,骨龄与生活年龄的差异对于诊断、治疗及监测儿童内分泌以及生长紊乱等疾病均有重要意义。目前临床广泛应用的骨龄评测方法为图谱法和计分法。图谱法简单、便捷,以手腕部整体作为骨龄评测依据,但某些疾病对儿童手腕部不同类型骨骼有不同影响[1]。计分法(如Tanner Whitehouse Ⅲ法,简称TW3法)分为掌指骨骨龄评分法、腕骨骨龄评分法。已有文献[2-5]报道基于掌指骨骨龄的人工智能(artificial intelligence, AI)骨龄评测,但对于腕骨骨龄却鲜有涉及,而后者对于诊断儿童性早熟、肥胖、生产缓慢等生长异常均有重要价值[6]。本研究探讨AI系统评测儿童腕骨骨龄的可行性。

1 资料与方法

1.1 一般资料 回顾性分析2013年12月—2019年3月于我院接受骨龄分析的4 656份儿童左手骨龄片资料。纳入标准:①包含左手掌骨、腕骨及尺桡骨远侧骨干3~4 cm正位数字化X线摄影(digital radiography, DR)片;②手部位置摆放正确,无骨骺缺失。排除标准:①严重骨畸形;②拍摄位置不佳;③年龄≥14岁。随机抽取130幅1~13岁儿童骨龄片,每个年龄段10份,共130名儿童,男52名、女78名。

1.2 仪器与方法 采用GMM Hiris Rf43 X线机,按下列要求拍摄左手后前位X线片:①左手掌紧贴平板,五指自然分开,拇指与食指约呈30°,中指与桡尺骨中轴在一条直线上;②完全显示腕部,桡骨及尺骨远端显示至少3 cm。将骨龄片以DICOM格式存储于PACS系统。

1.3 骨龄评测方法

1.3.1 骨龄参考标准确定 招募接受过中华05系统培训的3名中高年资放射科医师(其中1名为主任医师,1名为副主任医师,1名为医师),对左手骨龄片采用TW3-C腕骨评测方法,以软读片方式按照双盲原则进行评测,取3名医师评测结果的均值作为最终参考标准[7-8],并记录评测时间。

1.3.2 AI评测骨龄 采用Dr.Wise AI骨龄评测系统(即Dr. Wise骨龄和生长发育预测软件0531beta,http://label.deepwise.com,图1,包括开源深度学习框架Pytorch 1.0及英伟达Titan Xp硬件平台GPU)分析DICOM骨龄片,同时评测骨龄,记录评测时间。

图1 Dr. Wise AI骨龄评测系统

1.3.3 低年资医师评测骨龄 选取3名经中华05系统培训、工作年限<3年的放射科医师(分别设定为医师1、医师2、医师3)按照双盲原则分别独立评测130名儿童7块腕骨的发育等级,然后使用腕骨骨龄计算器(Dr.Wise骨龄和生长发育预测软件)计算腕骨骨龄,记录评测时间。

1.4 统计学分析 采用SPSS 17.0统计分析软件。计算AI系统(以下简称模型)及低年资放射科医师(以下简称医师)与参考标准之间腕骨骨龄和腕骨成熟度分值(由各腕骨发育等级查TW3表得到各腕骨成熟度分值之后求和)的均方根误差(root mean squared error, RMSE)及平均绝对误差(mean absolute error, MAE)[9-10]。采用组内相关系数(intraclass correlation coefficient,ICC)评价模型与医师评测骨龄结果的一致性,以配对t检验比较二者MAE,F检验比较二者之间RMSE。P<0.05为差异有统计学意义。

2 结果

2.1 模型、医师与参考标准间腕骨骨龄MAE、RMSE比较 模型与医师1、2的MAE、RMSE差异均有统计学意义(P均<0.05),与医师3的MAE、RMSE差异无统计学意义(P均>0.05)。见表1。

表1 模型、医师与参考标准之间腕骨骨龄的MAE、RMSE比较

表2 模型、医师与参考标准之间腕骨成熟度分值的MAE、RMSE比较

2.2 模型、医师与参考标准之间腕骨成熟度分值的MAE、RMSE比较 模型与医师1的MAE、RMSE差异均有统计学意义(P均<0.05),与医师2、3的MAE、RMSE差异均无统计学意义(P均>0.05)。见表2。

2.3 不同年龄段评测结果 除1~3岁外,随年龄增加,模型、医师与参考标准间评测结果的MAE、RMSE均上升,但上升幅度模型低于医师。见表3、图2。

2.4 结果一致性模型与参考标准 间腕骨骨龄评测结果的ICC=0.997,95%CI(0.996,0.998);医师1与参考标准之间ICC=0.994,95%CI(0.992,0.996);医师2与参考标准之间ICC=0.996,95%CI(0.995,0.997);医师3与参考标准之间ICC=0.997,95%CI(0.996,0.998)。

图2 模型、医师及参考标准对不同年龄段儿童腕骨骨龄测评结果

图3 腕骨未重叠区域(左)重叠区域(右)

2.5 评测速度 模型测评腕骨骨龄用时(0.33±0.14)s,低年资医师1、2、3分别用时(1.86±0.81)min、(2.70±1.19)min、(2.07±1.30)min;参考标准中,3位高年资医师分别用时(2.76±1.54)min、(2.98±1.30)min、(1.61±0.77)min,AI模型测评速度均高于医师(P均<0.001)。

3 讨论

评估腕骨骨龄主要依据头状骨、钩骨、三角骨、月骨、舟骨和大、小多角骨等7枚腕骨骨骺的形态变化和关节面形成过程。腕骨早期发育阶段在X线片上表现为密集的点,随发育而不断增大,最后增长至最佳大

表3 模型、医师对不同年龄段儿童腕骨骨龄测评结果与参考标准间MAE、RMSE

小和特定形状[11-12]。与长骨发育不同,腕骨在青春期之前发育较快,男孩在13岁左右、女孩在11岁左右腕骨骨龄已经接近成熟。由于腕骨分期的个体差异较大,有学者[11]建议不宜采用腕骨评测儿童骨龄,尤其对年龄稍大的儿童,应使用长骨;但相对于手腕部长短管状骨,腕骨生长发育对性激素的敏感性稍差,结合长骨骨龄的变化有助于早期诊断性早熟[1]。既往研究[13]表明,单纯性生长激素分泌不足儿童骨成熟延迟,而腕骨延迟程度较长骨更严重,故评测腕骨骨龄对诊断及治疗肥胖和生长迟缓等常见生长异常具有重要意义。男孩7岁左右、女孩5岁左右,7枚腕骨会出现重叠(图3)。由于腕骨大小、形状和方向均存在多样性,加之软组织不均匀性、骨结构与软组织对比度较低等因素,自动识别和分割骨边界极具挑战。多数自动骨龄评测系统通过识别腕骨区域再提取特征来评测骨龄,但因不能准确识别出重叠区域的腕骨而影响最终评测结果,受主客观因素影响大[14],且常比人工评测骨龄更为耗时[15]。

本研究发现采用AI骨龄评测系统可准确划分不同腕骨(包括重叠部分),进而准确评测腕骨骨龄;AI与参考标准之间腕骨骨龄和腕骨成熟度分值的MAE、RMSE均低于对照医师,且AI与医师1之间差异有统计学意义,与医师2、3间差异无统计学意义(表1、2)。在与参考标准的一致性方面,AI的一致性高于对照医师1、医师2,与医师3相同。对不同年龄段腕骨骨龄的评测结果显示,对3岁以前儿童,由于训练数据有限以及TW3-C腕骨特征跨度较大,模型和医师的骨龄评测误差均较大;之后,随儿童年龄增加,AI评测误差与对照医师评测误差均上升,但AI误差上升幅度低于医师(表3),提示随儿童年龄增加,AI骨龄评测系更趋准确,优势更加明显。

骨龄评测繁琐、耗时,腕骨骨龄评测的基本过程包括评定7块腕骨发育等级,以及根据中华05标准图表查询对应分值和腕骨骨龄。临床上可以通过骨龄计算器自动实现查询对应分值和腕骨骨龄,而评定腕骨发育等级常需要医师人工完成。本研究采用AI系统实现了全自动化骨龄评测,评测腕骨骨龄仅需时(0.33±0.14)s,显著低于高年资医师和低年资医师。

本研究的不足:仅针对四川地区儿童,腕骨骨龄数据来源地域单一,拍摄左手骨龄DR片机型单一,样本量小,且为回顾性研究。

综上所述,AI骨龄评测系统能够准确、快速评测儿童TW3-C腕骨骨龄,有待扩大样本量、进行前瞻性分析以进一步观察。

猜你喜欢
骨龄年资评测
2387 例儿童青少年骨龄调查分析
综合带教模式对骨科低年资护士进行带教的效果分析
评估身高需要定期测骨龄吗
热力站设备评测分析
次时代主机微软XSX全方位评测(下)
次时代主机微软XSX全方位评测(上)
骨龄预测身高靠谱吗
低年资护士手术体位安置流程规范性床旁观察分析
2019年资管行业十大猜想
不同项目儿童少年运动员骨龄纵向分析与应用研究