范飞,戴鑫华,占梦军,李媛,张奎,邓振华
四川大学华西基础医学与法医学院,四川 成都610041
年龄推断是个体识别的重要方法之一,成人骨骼和牙齿发育已基本停止,青少年年龄推断常用的观测指标与方法,如骨骺闭合和牙齿发育的状况,不适用于成人年龄推断。但成人的部分骨骼仍表现出一定规律性的增龄性变化,如耻骨联合面[1]、耳状面[2]、颅缝[3]、肋软骨[4]、喉软骨[5-6]等。甲状软骨、环状软骨是喉软骨中较大的2 块软骨,大部分为透明软骨,喉软骨部位的计算机体层成像(computed tomography,CT)扫描片,可观察甲状软骨骨化、环状软骨骨化、舌骨大角与舌骨体骨性结合等在成人期表现出一定的规律性[7]。但目前喉软骨在成人年龄推断的适用性备受争议[5-10]。因此,本研究应用CT 图像重组联合数据挖掘技术探索喉软骨和舌骨用于成人年龄推断的可行性。
收集四川大学华西医院2015—2017 年的颈部薄层CT,样本年龄范围18~<80 岁,排除影响喉软骨和舌骨增龄性变化的疾病、外伤、手术史、用药史,甲状腺钙化,图片质量差等情况。共收集颈部薄层CT 413 例,其中男性179 例(43.3%,平均年龄46.53 岁),女性234 例(56.7%,平均年龄44.82 岁),详见表1。根据摄片时间和身份证记载出生日期计算样本真实年龄,保留小数点后2 位。本研究为回顾性数据收集,所有颈部CT 均为临床诊疗拍摄,样本收集符合医学伦理学有关规定。随机筛选男性20 例(平均年龄47.52 岁)、女性20 例(平均年龄42.71 岁)作为测试集,余159 例男性(平均年龄46.41 岁)和214 例女性(平均年龄45.02 岁)为训练集。
本研究颈部薄层CT 扫描均采用四川大学华西医院SOMATOM Definition AS+128 层螺旋CT(德国西门子公司)。管电压120 kV、管电流110 mAs,层厚1.00 mm。
应用Syngo CT 2011A 软件(德国西门子公司)对收集的CT 影像进行表面阴影遮盖法(surface shaded display,SSD)重组。去除周围组织,完全暴露喉软骨、舌骨。直接在CT 工作站对喉软骨、舌骨三维图像阅片,综合判断喉软骨和舌骨等级。
表1 413例样本年龄和性别分布Tab. 1 Age and sex distribution of the 413 samples(例)
甲状软骨和环状软骨分级参照TURK 等[11]的分级方法进行修订,分别分为6 级(表2)和5 级(表3);舌骨骨性结合参照FISHER 等[12]的分级方法并根据本研究样本年龄范围进行修订,分为3 级(表4)。
从总样本中随机筛选20 例样本由2 位观察者重复阅片,2 位观察者均为法医学博士研究生,第1 位观察者2 周后重复阅片,进行Kappa 检验评估方法一致性。各指标与年龄之间进行Spearman 相关性检验。应用训练集训练并建立成人年龄推断的多元线性回归(multiple linear regression,MLR)模型、支持向量回归(support vector regression,SVR;kernel=rbf)模型和贝叶斯岭回归(Bayesian ridge regression,BRR)模型。模型构建均采用scikit-learn 0.17 机器学习工具包(Python 语言)完成,Python 代码从Scikit-Learn 官网(https://scikit-learn.org/stable/)中获取。一般描述性分析和相关性分析采用SPSS 22.0 软件(美国IBM 公司),检验水准α=0.05。
为评估模型准确性和泛化能力,对模型进行留一交叉验证,并应用测试集计算年龄推断回归模型的平均绝对误差(mean absolute error,MAE)、偏差以及绝对误差(absolute error,AE)在5 岁和10 岁以内的概率。
表2 甲状软骨分级Tab. 2 Stage classification of thyroid cartilage
Kappa 检验结果显示,喉软骨和舌骨阅片分级一致性较好。其中,甲状软骨骨化分级组内一致性0.857,组间一致性0.793;环状软骨骨化阅片分级组内一致性0.779,组间一致性0.715;舌骨骨性结合阅片分级组内一致性0.879,组间一致性0.840。
从图1可知,各指标随年龄变化的趋势不大,各等级间年龄重叠较大。各指标与年龄中等或低等相关,男性与年龄相关性略高于女性,男性右侧舌骨与年龄相关性最高,女性甲状软骨与年龄相关性最高(表5)。
表3 环状软骨分级Tab. 3 Stage classification of cricoid cartilage
表4 舌骨分级Tab. 4 Stage classification of hyoid bone
年龄推断模型(表6~7)中,SVR 的准确性最高,在男性中明显优于MLR 和BRR,在女性样本中SVR的优势不明显。建立的MLR:
男性:y=-4.69+4.83x1+4.06x2+8.94x3+6.89x4(R2=0.594), (1)
女性:y=7.43+6.07x1+5.55x2+0.39x3+1.65x4(R2=0.287), (2)
其中,y为年龄,x1为甲状软骨等级,x2为左侧舌骨等级,x3为右侧舌骨等级,x4为环状软骨等级。
图1 各指标年龄变化趋势Fig. 1 The age trend of each values
表5 各指标与年龄的相关性Tab. 5 The correlation between age and each values
表6 男性不同模型年龄推断准确性Tab. 6 Accuracy of age estimation by different models in males
表7 女性不同模型年龄推断准确性Tab. 7 Accuracy of age estimation by different models in females
1958 年,KEEN 等[13]首次将喉软骨应用于年龄推断,研究133 例成人和儿童的喉软骨影像学和组织学变化,发现了喉软骨变化的性别差异。1980 年,VLCEK[14]发现甲状软骨骨化存在一定的年龄相关性,并绘制了男性甲状软骨每十年的变化特点。1993 年,TURK 等[11]将男女性甲状软骨骨化进程分别分为5 个等级,环状软骨分为4 个等级,杓状软骨分为3 个等级。2008 年,GARVIN[8]研究发现,应用Cerny 分级方法研究离体甲状软骨和环状软骨影像的年龄变化并不准确,只有28.84%的个人被分配到正确的年龄组。2010 年,DANG-TRAN 等[15]比 较 了TURK 等[11]和VLCEK[14]的甲状软骨分级方法,发现男性样本中,TURK分级更易阅片,与年龄相关性更高。因此本研究分级方法参照TURK分级法,对喉软骨骨化程度进行分级。
既往研究中喉软骨骨化影像与年龄的相关性差异较大。KEEN 等[13]研究发现,甲状软骨骨化与年龄相关性较差,骨化过程变异性较大。TURK 等[11]也发现甲状软骨骨化个体差异较大,与年龄相关性较差。GARVIN[8]、YEAGER 等[9]研究发现喉软骨骨化程度与年龄无直接相关性。DANG-TRAN 等[15]的CT 研究也发现甲状软骨骨化与年龄的相关性不显著。但也有研究表明,甲状软骨骨化与年龄相关性较好。1995年,SUGIYAMA 等[16-17]研究发现喉软骨骨化与年龄相关性非常好,可用于日本男性年龄推断。2003年,程杰等[5-6]研究发现,甲状软骨与年龄的相关性男性为0.997 1,女性为0.984 8。2003年,DE LA GRANDMAISON 等[18]研究发现,喉软骨(甲状软骨、环状软骨、杓状软骨)骨化等级总和与年龄呈正相关,总相关性为0.74,虽然相关性较好,但同一年龄层喉软骨骨化个体差异较大,因此不能单独用于年龄推断。既往舌骨与年龄的相关性研究中,也发现了较大的年龄变化[19-20]。本研究中,喉软骨、舌骨与年龄的相关性均未超过0.6,相关性呈中等或较差。同时,本研究也发现同一年龄层喉软骨骨化的个体差异性较大,致使本方法精确性不足。
既往对喉软骨年龄推断的研究以分析喉软骨骨化规律为主,较少出现年龄推断模型。而其他组织的年龄推断模型多采用线性回归模型[5-6],但线性回归模型在年龄推断中存在一定的局限性:(1)其数据特征要求具备线性关系,但法医学年龄推断指标与年龄的关系很可能为多元非线性特征;(2)用多维数据拟合的数学模型表达多维空间的某一曲线时,传统的线性回归模型通常是在线性方程后面加高阶项,由此增加的可调参数可能增加过拟合的风险。AYKROYD 等[21]提出,应用线性回归模型推断实际年龄常会有预测残差(1-r2,r表示实际年龄与指标的Pearson 相关系数),而各指标与年龄的相关系数不高,因此,应用线性回归模型常会引起较大的年龄估计误差。BUK 等[22]认为线性回归模型不太适用于年龄推断,提出数据挖掘技术可以较为客观地找寻与年龄相关性较高的骨骼发育指标,有望提高年龄推断的准确性。数据挖掘对数据无要求,可从大量、模糊、有噪声的数据中,提取隐含而有用的信息。因此,本研究应用数据挖掘技术建立了年龄推断模型的SVR 模型和BRR 模型。
2012 年,BUK 等[22]在骨盆推断年龄的研究中应用了多种数据挖掘技术,包括决策树、贝叶斯网络、最近邻算法、径向基函数和自适应进化模型等,较为全面地阐述了高功效统计方法在法医年龄推断中的应用。DUDZIK 等[23]认为,应用高功效的统计方法可提高年龄推断的准确性。数据挖掘技术通过对大量模糊数据进行分析,挖掘、揭示数据中隐含的并有潜在价值的信息,可用于回归分析。XU 等[24]比较研究了DNA甲基化推断年龄的多元线性模型、多元非线性模型、误差反向传播神经网络、支持向量机(support vector machine,SVM)的准确性,其中SVM 推断年龄准确性最高。FISHER 等[12]建立了舌骨推断年龄组的累积logistic 模型,年龄层分类准确率达60%。本研究应用数据挖掘技术建立了成人年龄推断的SVR 和BRR 模型,并与多元线性模型进行比较,结果显示,喉软骨CT推断年龄的模型中,SVR 的准确性最高。SVM 可将二维转换为高维空间,应用最优分类超平面更好地分开数据。但SVM 可解释性较差。VAN VLIERBERGHE等[25]在第三磨牙推断年龄的二次回归模型和SVM 的比较研究中也发现,SVM 准确性略高于二次回归模型。中国汉族男性颅缝推断成人年龄研究中线性支持向量机准确性亦高于既往线性模型[3]。
本研究应用CT 图像重组技术,全方位地观察喉软骨、舌骨骨性变化情况,无需复杂前处理技术,避免周围组织干扰,省时省力。同时,应用数据挖掘技术建立年龄推断模型,提高了成人年龄推断的准确性。
本研究应用数据挖掘技术建立的SVR 模型降低了喉软骨成人年龄推断误差,但本研究仍存在一定的局限性:(1)本研究样本量较小且分布不均一,20 岁以下和60 岁以上年龄层的样本量低于其他年龄层,因此后期研究将进一步提高样本量样本均衡分布,以减少样本量对年龄推断结果的影响;(2)在测试集中,SVR 模型推断年龄的MAE 仍较大(男性8.67 岁,女性12.69 岁)。因此,尚不能单独运用喉软骨推断成人年龄,需结合其他方法综合推断年龄,如颈椎等周围组织。后期,法医学年龄推断研究可探索更为高端的数据挖掘技术,如过渡分析、贝叶斯网络等,以进一步提高年龄推断的精确度和准确性。