赵家敏 ,储光 ,牟清楠 ,韩梦琪 ,陈腾 ,侯玉霞 ,郭昱成
(1.陕西省颅颌面精准医学研究重点实验室,陕西 西安 710004;2.西安交通大学口腔医院正畸科,陕西西安 710004;3.西安交通大学医学部法医学院,陕西 西安 710049)
颅面复原是结合解剖学、人类学、艺术以及计算机等技术科学恢复未知颅骨软组织外貌的一种方法,广泛应用于法医学尸源身份的个体识别案件中。传统手工方法颅面复原技术依据其复原结果分为二维重建和三维重建。主要是由一些经验丰富的医学艺术家或是解剖学家,根据对颅骨结构的分析,手工绘制出可能的面部形态或者使用黏土在颅骨模型上恢复软组织三维面型。1895年,在瑞典出生的德国解剖学家Wilhelm His通过测量尸体获得面部软组织厚度(facial soft tissue thickness,FSTT)数据,以此重建了作曲家Johann Sebastian Bach的面部结构,这被认为是最早的颅面复原研究[1]。颅面复原的手段从最初的手工方法到20世纪末期开始逐渐转变为结合计算机的软组织三维重建,但基本原理与之前相似,都是基于软组织厚度数据[2]。颅面复原在未知尸源身份的个体识别案件中具有重要的研究意义和应用价值。
目前使用的颅面复原技术主要包括人工颅面复原技术和计算机辅助的颅面复原技术,其中基于各种算法的计算机辅助的颅面复原技术是当前研究的热点。
自1895年,WILHELM HIS开始运用人工颅面复原技术至今已有100多年的历史,常用的方法主要包括泥塑法和雕刻法[1]。人工颅面复原技术主要有3种:(1)GERASIMOV于1971年提出的解剖学方法又称为俄罗斯法。此方法不考虑软组织厚度而只考虑肌肉和腺体的解剖结构和位置,由于其重建效率较低,而且需要专业人士来操作,主要用于对化石的复原,目前已经不再使用[3]。(2)KROGMAN于1971年提出的人体测量方法又称为美国法。此方法考虑了较少的解剖细节,且着眼于软组织厚度资料,降低了主观性[4]。(3)NEAVE于1977年提出的组合方法又称为英国法或者曼彻斯特法[5]。该方法是当今使用最普遍的颅面复原方法,同时考虑了软组织厚度和面部肌肉,将头骨固定在以法兰克福平面(Frankfurt horizontal,FH)为标准的可调节支架上,然后添加面部组织钉或标志点。用黏土模仿面部肌肉腺体,按照其在骨骼上的起止点进行一层层的叠加,以恢复软组织形态。
人工方法进行颅面复原的主要问题在于重建结果很大程度受到操作者的审美和技术的影响。2000年,VANEZI等[6]发现不同的操作者使用人工方法对同一颅骨进行复原,获得的结果差别较大。其次,耗时较长,对一个颅骨的重建往往需要1个月的时间,严重影响案件侦破的进度。由于技术敏感性和操作时间长等不足,国内外学者开始研究计算机辅助的颅面复原技术[7]。
计算机辅助的颅面复原技术是运用曼彻斯特法的原理,结合FSTT与形态学特征,使用计算机技术进行颅面部软组织的重建。这种方法克服了人工方法主观性强、操作技术要求高、耗费时间长等缺点,还可以进行特异化处理,如增加皱纹、肤色等信息,也可依据不同性别、年龄、体重指数(body mass index,BMI)生成不同的软组织面型,提高了复原准确性,更有利于案件的侦破[8-9]。其基本步骤是:(1)对目标颅骨进行数字化扫描;(2)选取与目标颅骨具有相同特征的模板;(3)将目标颅骨与模板进行配准;(4)通过模板数据结合不同算法进行目标颅骨的复原。
目前的计算机辅助颅面复原主要是基于软组织厚度数据的颅面重建,需要软组织数据库的支持。通过选择与目标颅骨具有相似特征的颅面部数据,利用其中特征标志点的数值以及软组织在颅骨上的分布规律对目标颅骨进行复原。根据其所需的特征标志点数目分为稀疏软组织厚度复原技术和稠密软组织厚度复原技术。稀疏软组织厚度复原技术是在目标颅骨上的标志点放置虚拟组织钉,并以组织钉的末端作为恢复的软组织表面,这种方法最早由VANEZI等[6]提出,WILKINSON等[10]研究了此方法的准确性,结果显示,大多数区域的误差在2.5 mm以内。稠密软组织厚度复原技术是将相似的已知颅骨与目标颅骨进行匹配,利用已知模板数据进行配准计算,从而复原目标颅骨[11],这种方法相对于稀疏软组织厚度复原方法来说使用了更多的软组织数据,但是只能获得面部软组织的厚度数据而无法获得眼、鼻、口、耳等五官的复原信息,需要进一步根据已有的复原理论进行选择和添加,并且由于该复原技术是在复原模板基础上实现的,获得的结果一定程度上与选择的模板相近[12]。
颅面复原是在已知颅骨的基础上进行包括软组织厚度以及眼、鼻、口、耳等五官的重建,是在FSTT基础上结合软组织形态学研究进行的,许多软组织测量方法应运而生[13-14]。STEPHAN等[15]对1883—2007年的62项相关研究进行分析,认为不同的软组织测量方法各有其潜在的优缺点,且这些优缺点影响了软组织厚度测量结果。
这种方法是将经过校准的针或者刀片垂直插入软组织,根据插入的深度计算不同解剖位点的软组织厚度。在19世纪末期,德国生理解剖学家WELCKER通过将一把小的手术刀插入尸体面部不同解剖位点的软组织以获得软组织厚度数据[16]。WILHELM HIS在19世纪90年代沿用并改良了WELCKER的方法,用前端带有橡皮托的细针进行试验,减少了由于刀片较宽而造成的组织移位,提高了测量数据的准确性[17]。该方法由于操作简单、设备便宜、无辐射而广泛使用。然而软组织穿刺法存在较多局限性:(1)无法获得足够数量的尸体样本;(2)尸体易受到死后防腐剂、组织脱水、肌肉松弛变化的影响而使测量的结果与实际存在差异;(3)测量过程中会使组织移位和变形,继而造成测量误差。
1931年,BROADBENT最先开始使用X线片进行颅面部侧貌的软组织测量分析,1943年THOMPSON使用X线进行颅面部正位的软组织测量分析[18]。GILL等[19]基于X线片对美国白人和印第安人的面部软组织厚度进行测量,探讨不同种族的FSTT差别。HAMID等[20]通过X线片在活体上对唇部形态进行研究。该方法成功规避了尸体组织脱水变形的影响,但存在的主要问题在于:(1)仅可获得二维数据而无法获得三维立体影像数据;(2)数据准确性受到投射角度的影响,距离球管近的组织图像被放大,因此应严格确定受试者的体位和投射角度;(3)具有一定的辐射性,拍摄过程中会出现伪影。
超声最初运用于生物学领域,如对家畜的脂肪厚度进行测量,紧接着被用于人类的软组织测量[21]。目前临床上使用的M型和多普勒超声检测仪均可用于FSTT的测量[22]。HELMER首次用这种方法获得了德国人的FSTT数据[15]。1985年,HODSON等[23]对美国4~14岁的白人儿童用B型超声对面部20个解剖位点的软组织厚度进行测量和比较,并认为超声对于活体软组织测量是最精确的方法。在我国,依伟力等[24]也曾用超声对18~60岁不同年龄组的82位汉族人群进行软组织测量并获得了FSTT数据。相对于放射学检查,超声具有无辐射的优点,但也存在一些缺点:(1)在接触式超声检查的过程中,会对软组织造成压迫,而在非接触式检查时,由于被检查者处于仰卧位而受到重力因素影响软组织形态;(2)如果未将检测头与组织完全垂直会造成该标志点的FSTT被夸大;(3)技术敏感性高,所得的反射峰或复杂的图像需要操作者具有较丰富的专业知识才可以被解读[25]。
计算机体层成像(computed tomography,CT)的基本原理与X线片类似,是在其基础上结合了计算机数据采集与处理、图像重建与显示,较X线片有更高的密度分辨率。RHINE等[26]首次将这项技术用于FSTT的测量,随后PHILLIPS等[27]通过对32个活体的CT扫描数据进行分析,确认CT较针刺法更加精确,他们还比较了南非混血黑人与美国白人间的软组织厚度差异。CT被广泛应用于软组织厚度影响因素(如种族、年龄、性别等)的研究[28-29]。但由于设备昂贵,易受到重力因素的影响,且由于牙齿上的金属填充物所致的伪影以及较高的辐射量等问题依然存在,影响CT在FSTT测量中的应用。与传统CT不同,锥形束CT(cone beam CT,CBCT)是使用锥形束射线围绕目标区域进行旋转扫描获得物体在每个投射角度的投影数据,通过计算机技术分析重组数据,以获得高空间分辨率三维图像的一种方法,该技术主要在口腔医学领域广泛使用[30]。FOURIE等[31]运用CBCT对荷兰人FSTT进行测量,研究结果证明,CBCT进行面部软组织测量是可靠的,较之前的测量方法有更高的精确性。CBCT近年来被应用于南非人、韩国人、哥伦比亚人等多个种族的软组织形态学研究[32-34]。与传统CT相比,CBCT测量FSTT具有以下优势:(1)更小的辐射量;(2)更高的密度分辨率;(3)拍摄时间比较短,避免了由于受试者的移动和面部表情的变化对结果的影响;(4)在站立位进行测量,避免了重力因素对软组织的影响[35]。
磁共振成像(magnetic resonance imaging,MRI)与CT一同被认为是可以精确进行FSTT测量的方法。DE GREEF等[36]认为,通过MRI进行面部软组织测量具有可重复性和较高的准确性。SIPAHIOĜLU等[37]收集了161例18~78岁土耳其人的头部MRI,并对样本的面中线处标志点进行测量,发现女性的软组织较男性薄,并且随着BMI的升高,软组织逐渐增厚。CHEN等[38]对来自汉族的233名男性和192名女性进行MRI检查、分析后发现,不同性别和年龄的人群面部解剖标志点的软组织厚度存在差异。目前,磁场强度可由原先的3T达到7T,使图像分辨率由1mm提升至0.5 mm[39]。MRI不产生电离辐射且不存在拍摄者的技术敏感差异,但是检查的费用较高。由于其只能采取仰卧位,重力因素会影响软组织形态。
这种方法是放射影像学技术(如CT和MRI)结合光学扫描仪获得人体的软组织表面情况,并借助计算机数据分析各个标志点的软组织厚度。需要对两种方法的测量影像进行匹配,使测量的各个标志点吻合。2009年,PRIEELS等[40]将低密度CT与静态全息摄影相结合,用不易受重力影响、较稳定的鼻梁和前额部区域进行迭代最近点配准。KUSTAR等[41]对匈牙利的400例患者进行CT检查和3D面部扫描,使用迭代最近点算法进行配准,应用几何形态测量学(geometric morphometric,GMM)进行三维资料分析建立更大的软组织厚度数据库,发现当采用鼻子和前额部配准时效果最好,年龄和BMI会对配准的结果造成影响。CHU等[42]通过结合CBCT以及3dMD摄像技术对来自汉族的120名男性和120名女性的鼻部软硬组织进行测量,并建立回归方程对软组织进行预测,结果显示,超过70%的软组织预测误差在10%以下,将CBCT影像与三维软组织面相配准为颅面复原研究提供了新的思路和手段。综上所述,这种结合三维软、硬组织资料并且运用计算机算法分析建立多参数模型方法的提出,使软组织测量更加数字化,特异性更高,是未来发展的主要趋势和方向。
软组织厚度的测量需要通过颅骨上的特定解剖位点实现。这些位点一般位于颅面部组织器官最凸或最凹处、组织器官的边缘处等,以方便描述面部软组织情况。然而不同的研究者选择的标志点可能存在差异,主要表现在:(1)同一个测量标志点有不同的名称,如颧弓最宽点,FOURIE等[43]称之为颧弓侧点,RHINE等[44]称之为颧点;(2)多个不同的测量标志点被用来描述同一个解剖区域的FSTT,如有3个标志点(眶下缘与眼眶正中平面交点[45]、眶下缘与瞳孔中心垂线的交点[46]、眶下缘的最低点)用于描述眶下缘区域;(3)一个标志点在不同研究中有不同的定义和测量方法。这些差异使得方法的可靠性、各研究之间的可比性受到影响。STEPHAN等[15]对各种已公开发表的文章进行统计,总结了25个最为常用的头颅部标志点,这些标志点是公认的颅面软组织测量标志点。对于一定解剖位点FSTT的测量方法存在差异这一问题,HWANG等[34]认为,垂直于骨面进行FSTT测量较垂直于软组织或是直接测量骨组织解剖位点与其相应的软组织标志点之间的距离具有更高的精度。
为了更精确地进行颅面重建,需要有精确的FSTT数据。从19世纪起便有人提出,颅面部软组织厚度在种族、年龄、性别和营养状况间存在差异,但也有学者指出这些差异中有些是可以被忽略不计的。
由于遗传因素和生活习惯的不同,不同种族面部形态存在着较大的差异,研究[19,26]结果表明,不同种族之间的软组织厚度在鼻部、面颊上部、颏部和颞下颌关节区域等差异较大。CHAN等[47]对18~87岁的101名居住于纽约的美籍华人的19个面部标志点进行测量,并将美籍华人与美国人、其他亚洲人数据进行对比,发现美籍华人面部软组织最薄。与此同时,STEPHAN等[15]认为,不同种族之间的数据差异很有可能是由于不同的测量技术引起的,这提示比较不同种族之间软组织厚度差异应该使用相近的测量方法。除了种族以外,有学者认为,同一种族不同地区的FSTT同样存在差异[27,35]。
性别与年龄同样是FSTT的重要影响因素,多项研究[12,38,46]认为,男性和女性在面部中线区域的多个标志点软组织厚度并无明显差异,面下部的差异较面中上部的差异较大,对于性别差异没有统计学意义的位点可以在研究FSTT时不考虑。对于不同年龄段人群,一些区域的软组织厚度随着年龄的增长而变厚,相反一些区域随着年龄增长而变薄,也有学者[48-49]认为,年龄与软组织厚度的相关性不大。DE GREEF等[36]对967名18~91岁的比利时成年人的面部软组织进行测量分析发现,软组织厚度与年龄的相关性非常小,该研究选取较大的年龄差值研究年龄对FSTT的影响,通过对相差50岁的个体FSTT进行测量,不同区域的软组织厚度差异不超过1mm。
不同的营养状况会影响面部脂肪的分布从而直接影响面部软组织的厚度[32,35,48]。DE GREEF 等[36]对高加索人的测量分析发现,同一年龄组的人群每个标志点的FSTT平均值随着BMI的增加而增加。但是仍有学者[27]认为,BMI的结果来源于体质量和身高这些全身性指标,无法客观地反映面部的脂肪分布情况,提出用身体脂肪百分比(body fat percentage,BFP)反映面部软组织厚度,以增加颅面复原的准确性。
除了上述影响因素外,CHU等[50]的研究结果表明,不同的矢状向和垂直向骨面型也会影响FSTT,尤其与面下三分之一区域(如上唇和颏孔区)软组织相关性较高,建议颅面复原时应当考虑骨面型差异。考虑到诸多的影响因素,许多学者主张采用多元线性回归(multiple linear regression,MLR)方程综合评价各因素对FSTT的影响[28,48]。以上研究均为颅面复原提供了思路,在一定程度上增加了颅面复原的特异性与准确性。
颅面复原的结果直接影响法医学鉴定意见,因此颅面复原方法的可靠性和结果的准确性评估就显得尤为重要。
1883—2018年公开发表的90篇关于FSTT的文章中,仅有42%的研究提到测量误差,近5年来,涉及误差分析的研究逐渐增多[22]。测量技术误差(technical error of measurement,TEM)与相对测量技术误差(relative technical error of measurement,rTEM)被广泛应用于测量误差的检验,其中TEM<2 mm或者rTEM<5%被认为是可靠的[22,51]。对于软组织穿刺法,同一实验人员不同时间测量的rTEM为3%~32%,TEM为0.2~3.0mm[52],而不同实验人员间的rTEM为4%~52%,TEM为0.3~6.4 mm。在X线片得到的数据中,rTEM范围为1.1%~8.6%。而对于CT测量所得的结果进行分析,实验人员组内检验的rTEM为0.15%~1.92%,而组间检验的rTEM为0.17%~3.91%。对于超声影像测量所获得的FSTT而言,同一实验人员不同时间测量的rTEM为3%~15%,TEM为0.1~1.9 mm;不同实验人员之间的rTEM为6%~45%,TEM为0.4~5.6mm[53]。
评价颅面复原效果的评估方法可分为定性和定量2种类型。在早期阶段,研究者通过将死者的照片与复原的面部进行比较来确定相似程度。第一个有记录的评价面部形态复原精度的研究是VON EGGELING等完成的,他认为复原结果与真人并无相似之处,而GERASIMOV等则认为颅面复原具有较高的精度,他们通过颅面复原得到的结果成功识别出尸体照片[10]。有研究[54]通过分级赋值进行颅面复原精度评价,具体评价方法为:1代表不相似,2代表低度相似,3代表中度相似,4代表高度相似,5代表非常相似。为了更好地定性研究,许多学者通过脸池进行比较,志愿者被要求在脸池中找出与复原面相对应的真人照片。CLAES等[55]在评价颅面复原效果时提出了欧氏距离矩阵(Euclidean distance matrix,EDM)法,通过逐个比较复原软组织与包含真实软组织在内的软组织标志点EDM,寻找该目标颅骨的真实身份,发现基于EDM法正确识别真实软组织的比例为100%,平均距离误差为1.14 mm。也有学者通过3D人体计量学软件将复原面相与相应的人脸进行比较来定量评价颅面复原效果,该方法将2种三维面部模型匹配,从而定量计算两种模型之间的表面轮廓差异[10,56]。定性和定量评价方法各有优缺点,对于计算机辅助手段来说,仅考虑了面部局部区域的相似程度和面部相似程度的百分比,但忽略了颅面复原是一个多区域组合的综合结果。而在脸池中辨认的方法尽管具有较大的主观性,但从整体的角度对颅面复原结果进行评价常常能够通过明显特征成功识别个体身份,将定性与定量方法合理地结合可以更科学地评估不同方法颅面复原的结果。
基于统计模型的计算机辅助颅面复原技术有效避免了颅面复原结果与模板类似的情况。研究者们采用主成分分析(principle component analysis,PCA),通过改变各个影响因素的系数来重建目标。CLAES等[2]首先运用统计模型进行颅面重建,BERAR等[57]和PAYSAN等[58]也相继使用PCA的方法建立骨组织与软组织的回归方程进行颅面重建。此外,张彦飞[7]将人脸分成若干个区域并基于偏最小二乘法对脸部不同分区进行复原,再利用光滑拼接算法将面部各区域拼接起来,其相对误差为1.50%,较整体复原模型的1.56%提升了0.65%,此方法较整体复原模型的效果更加精确。从颅面复原的历史进展来看,精确化、数字化、特异化是未来的发展趋势。不同种族、性别、年龄、BMI等因素对软组织的影响还需要进一步细化,颅面部软组织厚度数据库还需要进一步完善。
另外值得注意的是,随着生成式对抗网络(generative adversarial networks,GAN)为代表的端到端机器学习方法的发展,为颅面复原技术提供了新的思路。GAN是在2014年由GOODFELLOW等[59]提出的一种生成式深度学习模型,由生成器和判别器组成。生成器的目标是生成尽可能真实的数据,判别器的目标是区分真实数据和生成数据,生成器和判别器两者相互博弈,直到达到平衡后停止循环。GAN解决问题的思路是端到端,即从输入直接到输出,中间采用神经网络自动学习特征,避免手动特征提取的繁琐操作,不需要人工干预。目前,GAN在图像生成、图像翻译、文本与图像的相互生成、视频预测和风格迁移等领域表现出巨大的应用潜力[60]。GAN由于生成过程过于自由,训练过程中的稳定性和收敛性难以保证,容易发生模式崩塌,进而出现无法继续训练的情况,且生成样本缺乏多样性,容易出现过拟合问题。因此,以GAN为代表的端到端自动颅面复原技术还需要进一步探索。
颅面复原辨识效果还易受到头发、胡须等因素的影响,对于未知颅骨上没有残余头发的颅面复原,研究者[61]认为,恢复头发会提高复原面型的辨识率,随着人类对DNA的深入研究,该弊端有望得到解决。近10年,DNA测序技术发展迅猛,基因关联研究包括单核苷酸多态性(single nucleotide polymorphism,SNP)基因关联研究、全基因关联研究(genome-wide association studies,GWAS)和基因连锁分析可以为已知DNA信息的个体提供面部细节特征线索[62],为颅面复原提供更多的面部信息,提高颅面复原的准确性。