张华华,赵晨,刘虎跃,李娜,王亚辉,孙俊红,陆利
(1.山西医科大学,山西 太原 030001;2.太原市中心医院影像科,山西 太原 030009;3.太原市公安局小店分局,山西 太原 030032;4.山西省儿童医院CT室,山西 太原 030013;5.司法鉴定科学研究院 上海市法医学重点实验室 司法部司法鉴定重点实验室 上海市司法鉴定专业技术服务平台,上海 200063)
法医学活体年龄推断主要根据骨骼发育过程中继发骨化中心出现及骨骺闭合的先后顺序综合判断。锁骨胸骨端是人体各大关节中继发骨化中心出现及骨骺闭合最晚的部位。近年来,薄层计算机体层扫描(thin-section computed tomography)技术与青少年锁骨胸骨端骨骺发育过程相结合的研究备受国内外学者的青睐[1-3]。另外,骨骼发育除与遗传、种族等因素有关外,还与身高、体质量以及地区等因素相关。因此,有必要构建我国不同地区人群骨龄研究数据库,为更准确地评估骨龄提供客观依据。
一直以来,我国青少年犯罪问题较为突出,而青少年犯罪嫌疑人是否达到刑事责任年龄,与法庭审理及定罪量刑密切相关。基于我国基本国情,青少年犯罪嫌疑人的年龄易受主、客观因素影响。因此,在刑事侦查及司法审判中对于真实年龄存疑的青少年,往往需要法医对其年龄进行推断[4]。基于此,本研究以山西人群为主要研究对象,基于薄层计算机体层扫描及图像重组技术构建山西省青少年锁骨胸骨端骨龄数学模型,旨在提供更多客观数据,以进一步提高骨龄推断的准确性。
收集2018年1月至2019年12月15.0~<24.0周岁454例山西省健康个体的胸锁关节薄层计算机体层扫描图像,用于构建锁骨胸骨端骨龄数学模型,其中男性238例,女性216例,按1岁分组后的人群分布见表1。另收集108例胸锁关节CT图像用于模型外部验证,男、女性各54例(每年龄段6例)。
表1 不同性别年龄组人群分布Tab.1 Population distribution of different gender and age groups (例)
纳入标准:以“国人正常身高、体质量范围调查表”[5]为准,选择身体健康、营养状况良好的个体为研究对象。
排除标准:参加特殊文体训练者,服用影响骨骼发育药物史者,曾有影响骨骼发育疾病史或外伤史者[5]。
本研究所有研究对象均签署知情同意书,符合有关医学伦理要求。
1.2.1 计算机体层成像扫描参数
采用TOSHIBA(Aquilion one)320排多层螺旋CT机(日本东芝公司),层厚1.0mm,层距1.0mm,管电压120kV,管电流300mA。研究对象采取头进仰卧位平躺于CT床架上进行CT扫描。
1.2.2 观测指标
将锁骨胸骨端薄层计算机体层扫描图像按照年龄升序排列,使用Carestream Vue PACS阅片软件(GCPACS 1.5.1.5.0417-vue121,中国锐轲公司)分析图像(包括横断面和冠状面)中骨骺发育形态,观察双侧锁骨胸骨端继发骨化中心是否出现、初期出现的形态与位置。选取0.5mm重建图像(骨窗像)导入Vital后处理工作站Vitrea®Version 6.7.2(日本Toshiba公司),进行容积再现(volume rendering,VR),由研究人员选取锁骨胸骨端干骺端及其骨骺,测量锁骨胸骨端骨骺最长径(cm)、干骺端最长径(cm)及双侧骨骺面积(cm2)、干骺端面积(cm2)(图1)。然后,分别计算双侧骨骺最长径与干骺端最长径之比(右侧用x1表示、左侧用x2表示)、骨骺面积与干骺端面积之比(右侧用x3表示、左侧用x4表示)[5-6]。
图1 锁骨胸骨端VR图像的测量示意图Fig.1 Measurement diagram of VR image of extremitas sternalis of clavicle
1.2.3 测量方法的一致性检验
使用组内相关系数(intraclass correlation coefficient,ICC)检验由放射科医师及技师在不同时间测量骨骺数据的一致性[6]。随机抽选54例研究对象(每组6例,含验证样本),由研究者A和B分别对其进行测量,将两者测量数据进行ICC检验,ICC值越趋于1,表明不同研究者的测量结果一致。
1.2.4 统计学分析
使用SPSS 24.0(美国IBM公司)及R 3.4.3软件对数据进行统计学分析。采用独立样本t检验分析x1、x2、x3、x4在性别间差异性,采用单因素方差分析检验两性别在各年龄组之间的差异性。使用配对t检验分别比较男性及女性x1和x2、x3和x4之间的差异性,明确双侧锁骨胸骨端骨骺发育是否一致。使用Pearson相关性分析分析骨龄(y)与x1、x2、x3及x4的相关性(相关系数r>0.7被认为两者相关性较强)。分别利用x1和x2,x3和x4,x1、x2、x3和x4构建多元线性回归数学模型,将样本回代入模型计算内部验证准确性(±1岁)。最后,将108例验证样本代入多元回归模型计算外部验证准确性(±1岁)。检验水准α=0.05。使用R 3.4.3软件的RandomForest包分别对男女性样本建立随机森林的判别模型,对18.0周岁及以上(≥18.00周岁)和未满18.0周岁(<18.00周岁)的个体进行判别分析,并将108例样本作为外部验证样本验证判别模型的准确率。
ICC分析结果显示,锁骨胸骨端双侧各指标ICC都在0.87以上,表明不同研究者的测量结果高度一致,可以进行后续的测量。独立样本t检验结果显示,x1、x2、x3及x4在大部分年龄段男性与女性之间差异有统计学意义(P<0.05)。配对t检验结果显示,除男性x1和x2之间差异有统计学意义外(P<0.05),其余差异均无统计学意义(P>0.05)。单因素方差分析结果显示,男性与女性中,x1、x2、x3、x4在各年龄段间总体上差异有统计学意义(P<0.05)(表2)。
Pearson 相关性分析结果显示,x1、x2、x3、x4与y均有相关性(P<0.05),其相关系数(r)在男性样本中分别为0.889、0.884、0.935、0.929,在女性样本中分别为0.904、0.880、0.940、0.934。
利用x1、x2、x3及x4分别建立3种男、女性骨龄推断的多元线性回归数学模型,所有模型均具有统计学意义(P<0.05),将所有建模样本及108例外部验证样本代入回归模型中,验证其准确性。其中基于x1、x2、x3及x4建立的男女性回归模型(4个指标全部进入模型)调整后决定系数均大于0.90,其内部验证准确率(±1.0岁)均在92%以上,108例外部验证准确率(±1.0岁)也均大于70%(表3)。
表2 观测指标在各个年龄段的均值及标准差Tab.2 Mean and standard deviation of observed indicators in each age group (±s)
表2 观测指标在各个年龄段的均值及标准差Tab.2 Mean and standard deviation of observed indicators in each age group (±s)
注:x1表示右侧骨骺最长径与干骺端最长径之比;x2表示左侧骨骺最长径与干骺端最长径之比;x3表示右侧骨骺面积与干骺端面积之比;x4表示左侧骨骺面积与干骺端面积之比。1)与相邻上一组相比,P<0.05。
年龄段/岁 男性女性n x1x2x3x4x1x2x3x4 n
表3 多元线性回归数学模型Tab.3 The multiple linear regression mathematical models
基于判别模型结果显示:男性判别模型(400个决策树,3个节点)的袋外数据错误率为0.42%,238例样本中有1个样本被判别错误,54例外部验证样本中有44例被正确识别,准确率为81.48%,受试者操作特征(receiver operating characteristic,ROC)曲线下面积为0.845;女性判别模型(100个决策树,1个节点)袋外数据误差率为1.85%,216例样本中有4例样本被判别错误,54例外部验证样本中有48例被正确识别,准确率为88.89%,ROC曲线下面积为0.909(表4、图2)。
表4 随机森林判别模型验证结果Tab.4 The classification results of random forest discrimination models
图2 随机森林判别模型分类结果图Fig.2 The classification results of random forest discrimination models
青少年活体年龄推断是法医学实践的主要任务之一,骨骼发育程度是推断活体年龄公认的可靠方法[1]。随着CT技术的不断发展,薄层计算机体层扫描技术越来越多地被应用到锁骨胸骨端骨骺的研究中,不仅可以有效地避免叠加效应,而且可以避免因层过厚而引起的容积效应,从而更加清晰地获取锁骨胸骨端骨化中心及骨骺的生长情况,同时,应用薄层计算机体层扫描技术获得的原始数据,可进行多平面重建(multi-planner reformation,MPR)及VR,从而可以更直观地观察骨骺的大小、形态,且可以实现对观测指标的准确测量[6-7]。魏华等[5]曾利用VR技术对我国华南及华东地区青少年锁骨胸骨段进行研究,建立了相应的活体年龄推断数学模型。
本研究中,各指标与年龄的相关性分析显示,年龄与锁骨胸骨端骨骺的骨化具有较强的相关性,r均大于0.85,可以进行指标与年龄相关的判别及回归分析。目前大部分研究[8-11]根据骨骼发育阶段对其年龄进行大致的区分,而在实践中往往需要对年龄进行更准确的推断。本研究通过建立不同指标多元回归分析发现,基于x1及x2建立的回归模型的调整后决定系数、内部及外部验证准确率均低于依据x3、x4建立的回归模型,结合Pearson相关性分析结果,说明x1、x2与年龄的相关性低于x3、x4,基于x3、x4建立的模型会更准确,这与魏华等[5]的研究结果相同。考虑到x1、x2与年龄的相关性也大于0.85,认为在实际应用中可综合多指标建立回归模型。本研究中,基于x1、x2、x3及x4建立的男、女性多元线性回归数学模型(4个指标全部进入模型)调整后决定系数均大于0.90,其内部验证准确率(±1.0岁)均在92%以上,外部验证准确率(±1.0岁)亦大于70%,说明该多元线性回归数学模型在年龄推断上具有较高的可靠性及预测准确性,在今后的工作中可以增加样本量提高其准确性。
《中华人民共和国未成年人保护法》保护的对象为未满18.0周岁的公民,鉴定青少年是否满18.0周岁至关重要。本研究建立的随机判别模型结果显示:袋外数据的错误率均低于2%;模型的ROC曲线下面积均大于0.80,说明判别模型具有较强的分类功能;108例男、女性外部验证结果的正确率均大于80%。由此说明,锁骨胸骨端骨骺发育对于青少年活体年龄推断特别是18.0周岁以上青少年的骨龄具有重要意义。基于锁骨胸骨端骨骺发育推断个体年龄是否年满18周岁,目前国内外的研究也有很多。HILLEWIG等[12]在锁骨胸骨端骨骺发育分级基础上建立贝叶斯模型,用于预测年龄区间,结果发现,锁骨胸骨端骨骺发育第Ⅳ期可以用于预测个体年龄是否超过18岁,研究对象双侧处于Ⅳ期年龄小于18岁的概率低于1%。UFUK等[9]认为,ⅢB期可以作为估计人体年龄≥18岁的标准,因为其研究中所有的研究对象处于ⅢB期的最低年龄为18岁。但这些研究大多是基于骨骺发育阶段对≥18岁的个体进行排除,但是对于骨骺发育未达到此期但实际年龄超过18岁的个体仍无法排除,故仍需对骨骺发育的数据进行深度挖掘做出更为准确的推断。近年来,随着计算机及数据挖掘分析技术的不断发展,也为法医活体年龄推断提供了新的方法和思路,王鹏等[13-14]尝试利用多元线性回归数学模型和Fisher两类判别模型对青少年骨龄进行鉴定。随机森林算法作为高度灵活的一种机器学习算法,本研究尝试将其应用于活体年龄推断,对骨骺发育的数据进行训练学习,结果显示,随机森林判别模型具有较高的准确性(高于王鹏等[13]、王亚辉等[14]的Fisher判别模型,其Fisher两类判别训练样本的综合判别率分别为73.5%~86.6%、68.5%~87.4%),验证了其对于青少年活体年龄推断的可行性及实用性。
本研究基于薄层计算机体层扫描技术和VR三维重组技术获取了山西地区15.0~<24.0周岁健康人群胸锁关节样本的高清图像,并对相关指标进行了准确测量,有利于更加客观、准确地进行骨龄鉴定。基于观测指标与年龄有较强相关性,可以利用多元线性回归数学模型较为准确地对青少年活体年龄进行推断、利用随机森林判别模型进行18.0周岁上、下年龄段的判别。从另一个方面,本研究结果也提示多种数学模型运用在法医学骨龄推断中具有一定的可行性。