江光前,李 红
(三峡大学附属仁和医院放射科,湖北 宜昌 443001)
骨龄是人体生物年龄的重要组成,可通过骨骼发育过程中生长、成熟及衰老的规律变化而推断年龄,从而较准确地评估个体发育及成熟情况。骨龄在诊断内分泌疾病、监测临床疗效、评价儿童生长发育潜力及性成熟等方面均具有重要作用[1]。评估骨龄的传统方法是采用人工识别,根据左手腕部X线片所示骨骼发育程度及骨骺形态,利用图谱法、计分法等评价骨骼成熟情况,耗时长,且易受评估者水平的影响。随着计算机技术的发展,基于深度学习的人工智能已用于评估骨龄。
1.1 计数法 通过观察继发骨化中心开始出现的时间、数目及其成熟度而判断骨龄[2]。1926年Todd对1 000名儿童手骨进行横断面调查研究,提出骨龄=腕部骨化中心数目-1。1937年国内学者梁铎最早对手腕部骨化中心进行研究,后经刘慧芳等不断完善,最终提出小儿骨龄计数法的中国标准。该法摄片简单,但适用年龄范围窄,误差较大,现已逐渐被淘汰。
1.2 图谱法 系将被检者手腕部X线片与标准骨龄图谱对照而得出骨龄。1937年Todd实施“布拉斯”计划,制定出第1部相对成熟的骨发育图谱,开创了骨发育的系统研究;但因样本来源不均一,其应用受限。随后,1950年美国学者Greulich和Pyle对Todd图谱进行修改,制订出著名的G-P图谱。20世纪60年代,顾光宁以上海市区1 890名儿童为研究对象,制定出了顾氏图谱专著。国内学者徐济达和刘宝林于20世纪80年代制定出适用于我国婴幼儿和学龄期儿童的早期骨龄图谱。图谱法评估骨龄操作简便、结果明确,应用广泛,但主观性较强。
1.3 计分法 1962年Tanner和Whitehouse提出TW1法,该法以20世纪50年代来自英国伦敦中产阶级家庭的2 700名儿童为研究对象,拍摄左腕X线片后选取20块腕骨,依据各骨成熟度将其发育分为8或9期,根据量化分值得出骨龄。1975年该研究团队将TW1法升级为TW2法,依据骨化发育过程中生物学价值的差异给予诸骨不同权重,并将骨形态特征转化为R、C、T共3个评分系统进行数字度量。1997~2001年Tanner等修订TW2法后提出TW3法,即RUS评分法,废除了T系列,并重新修订R系列,以消除骨骼发育过程中年代、环境等因素的影响。RUS评分法不仅免受种族、地域因素的限制,且可用于预测身高[3]。
国内学者李国珍在20世纪60年代提出“百分计数法”,根据手腕部骨发育程度进行分期,通过计算骨龄指数而得出骨龄。20世纪80年代,张绍岩等对TW2法进行修改,引进选代法,剔除尺骨、舟骨、月骨、三角骨、大多角骨及小多角骨这6块权重较低的骨,制定出适合我国骨龄评价的统一标准,即CHN标准,使腕部骨发育研究由定性转向定量。随后,叶义言在CHN标准14块腕骨的基础上增加了5块腕骨和尺骨(共20块)以综合评估骨龄,此法亦被称为“叶氏法”。2006年张绍岩等参考CHN和TW3标准,制定出TW3-腕骨、TW3-C RUS及RUS-CHN骨龄评价标准,统称《中国人手腕骨发育标准》[4],简称中华05法。RUS-CHN标准在确定运动员生物学年龄和鉴定发育程度方面发挥着重要作用。
2.1 超声 作为一种无创性检查手段,既往超声在骨关节方面的应用较少。近年来,随着技术的发展,以超声评估骨龄取得了一定进步。超声主要通过测量股骨头软骨(femoral head cartilage, FHC)厚度、评价左手腕部声速变化及髂嵴骨化(Risser征)而实现评估骨龄。有学者[5]采用超声测量FHC厚度,发现FHC厚度与年龄、骨龄之间均密切相关,但敏感度较低。BonAge超声测量左手腕部声速变化是目前较为成熟的评估骨龄方法,其结果与图谱法高度符合,评估骨龄准确率明显高于X线片[6],且无辐射,具有较好的应用前景。Wagner等[7]认为Risser征与X线片上髂嵴骨化范围显著相关,但对肥胖者及Risser分度高者,超声检查存在一定困难。超声评估骨龄目前仍处于探索阶段,相信随着研究的深入,超声评估骨龄将展现出良好的应用前景。
2.2 双能X线吸收测量法(dual energy X-ray absorptiometry, DXA) DXA是利用小剂量X线穿透身体,通过计算机处理数据,得出骨矿物质含量。Hoyer-Kuhn等[8]报道,DXA评估骨龄与X线片评估结果的一致性良好(ICC=0.97),甚至在部分骨骼疾病患儿中可替代X线片。但DXA评估骨龄尚无法达到0.5岁的精度[2],且操作复杂、成本高,使其应用受限。
2.3 MRI 近年来,MRI评估骨龄成为研究热点。MRI无电离辐射,图像分辨率高,且3D图像可更清晰地显示骨骼及软骨的正常和病理特征[9]。Tomei等[10]研究显示MRI评估骨龄与实际年龄间存在强相关性(R2=0.9),且可显示软骨成熟情况,提示MRI评估骨龄可能较传统X线片更为精确。但应用MRI评估骨龄亦面临诸多问题,如检查费用较高、图像采集时间较长、禁忌证较多等。
3.1 概况及发展 随着计算机硬件的快速更新及图像处理技术的发展,利用计算机技术智能评估骨龄成为研究热点和趋势。通过建立手腕部各骨发育期图像的数字化标准,人工智能评估骨龄系统利用计算机数字影像及模式识别技术,对图像进行预处理、分割、特征提取等,将得到的数据与标准数据库进行对比,实现自动评估骨龄。
1994年Tanner等[11]提出计算机辅助骨龄评分系统(computer-assisted skeletal age scores, CACAS),使骨龄评估的速度及稳定性得到较大提升。1997年Mahmoodi等[12]提出通过建立知识的活动形状模型(ative shape model, ASM)来评估骨龄。2003年Niemeijer等[13]基于TW2法对骨骼发育各阶段建立平均形状模型,通过形状和纹理信息实现骨龄自动评估。2007年Hsieh等[14]采用反向传播算法,以径向基函数和支持向量机(support vector machine, SVM)神经网络(neural network, NN)评估指骨骨龄,结果显示该法评估骨龄的准确率高于腕骨评估。2009年Thodberg等[15]研发出全自动骨龄评估系统——Bone Xpert,该系统由3层不同功能的架构组成,评估准确率较高。2013年Harmsen等[16]采用SVM结合原型图像交叉相关的方法设计半自动骨龄评估系统,极大提高了分类器性能。2017年Spampinato等[17]对现有的卷积NN(如OverFeat、GoogLeNet、OxfordNet)进行测试,结果显示深度学习算法可较好地自动评估骨龄。2018年Darmawan等[18]使用混合人工智能模型粒子群优化人工NN评估骨龄,效果优于单纯人工NN模型,且超过单个人工智能模型。
1998年原第四军医大学(现中国人民解放军空军军医大学)研制出计算机骨龄辅助评估系统,具备自动查表和计算功能。1999年谢吉等[19]将CHN骨龄评估法计算机化,结果显示人工智能与人工评估法评估骨发育分级的一致性较好,且相对更为省时。2001年台湾国立清华大学研发了自动骨龄评估系统,但仅对7岁以下儿童的评估效果较好[20]。2003年王珂等[21]应用ASM改善边缘检测效果,将CHN标准转化为数字特征来评估骨龄,提高了结果的稳定性及正确率。2004年李孝诚等[22]首次应用插值法将骨成熟度评价标准连续化,而后使用MATLAB语言实现算法评估骨龄,结果显示该法有利于提高评估精准度及速度。2006年刘裕恒等[23]采用叶氏法研发出“中国儿童骨龄评估系统”,并发现计算机评估骨发育等级的一致性明显高于人工法。2014年王亚辉等[24]采用SVM自动评估尺骨、桡骨远端骨骺发育分级,极大提高了读片效率。
3.2 优势 传统骨龄评估方法因受医师经验水平等因素限制,无法精准、快速地得出结果,而人工智能方法可解决上述难题。蔺芳琴等[25]采用BoneXpert软件对434例2.5~15.0岁儿童进行骨龄评估,结果显示BoneXpert软件评估迅速,无主观性,适用于我国儿童。2017年Spampinato等[17]利用多种深度学习网络算法对骨骼图像进行识别,并首次应用CNN模型评估青少年腕关节骨龄,结果显示人工读片与计算机之间仅存在0.79岁的误差,实现了浅层学习向深度学习的过渡。随后,Lee等[26]对此项研究进行优化,提出一种全自动CNN深度学习平台,提升了人工智能评估骨龄的速度及准确率。2018年刘鸣谦等[27]报道,以基于多维度数据特征融合的骨龄评估模型检测到的骨龄平均绝对误差为0.455,优于传统方法和仅端到端的深度学习方法。相比传统的机器学习特征提取方法,基于特征提取的深度卷积NN在骨龄回归模型中表现更好,结合人口和性别信息可进一步提升基于图像的骨龄评估准确率。因此,人工智能评估骨龄切实可行,精准便捷。
随着计算机学习方法及NN模型的改进升级,人工智能已在众多领域应用和发展。在医学领域,应用人工智能技术检测糖尿病视网膜病变、恶性黑色素瘤等已取得成功,诊断准确率达到专业医师水平[28]。准确评估骨龄关系到疾病的诊断与治疗,未来将继续优化骨龄评估方法,通过收集大样本、多地域、多种族的大数据,建立符合本地区的数据库,完善评估标准。