黄娇,周圆圆,邓恺飞,罗仪文,孙其然,李周儒,黄平,张吉,蔡红星
(1.徐州医科大学法医学教研室,江苏 徐州 221004;2.内蒙古医科大学法医学教研室,内蒙古 呼和浩特 010030;3.司法鉴定科学研究院 上海市法医学重点实验室 司法部司法鉴定重点实验室 上海市司法鉴定专业技术服务平台,上海 200063)
死亡时间(postmortem interval,PMI)通常是指死亡发生到尸体被发现的时间间隔[1]。在法医学实践中,推断死亡时间不仅为刑事案件的前期侦查工作提供了线索,还可以缩小侦察范围,对排除嫌疑人和确定凶犯具有重要的意义[2]。
传统死亡时间推断方法主要是通过观察尸体现象(如尸冷、尸斑、尸僵、胃内容物和超生反应等)进行粗略判断[3]。为了能够实现更为精确的推断,目前已有大量的技术方法被应用于人体或动物死亡时间推断的研究中。例如,ZHANG等[4-6]采用傅里叶变换衰减全反射红外(attenuated total reflectance-Fourier transform infrared,ATR-FTIR)光谱技术对兔子死后玻璃体液、心包液及血清内化学成分进行分析,并利用机器学习的方法成功建立了推断死亡时间的数学模型。PITTNER等[7]通过蛋白质印迹和酪蛋白酶谱法对40个人体肌肉样本进行了生物化学研究,发现人体肌肉组织中蛋白质降解过程与死亡时间明显相关。蔡山青等[8]利用气相色谱-质谱(gas chromatography-mass spectrometry,GC-MS)检测技术分析窒息死亡大鼠0~120 h脾代谢产物的变化,发现其死后各代谢物成分具有一定的时序性改变。这些研究为推断死亡时间提供了有价值的实验依据。
本研究拟采用FTIR光谱技术分析大鼠死后背部皮肤内化学物质的改变,通过机器学习技术,深度挖掘皮肤组织光谱信息,来识别不同死亡时间点之间的光谱变化,并建立具有不同预处理的偏最小二乘(partial least squares,PLS)回归模型,以期实现准确推断死亡时间的目的。
由上海杰思捷实验动物有限公司提供成年雄性大鼠20只,体质量(220±20)g,室温饲养2d后,用2%戊巴比妥钠溶液(0.3 mL/100 g)腹腔注射麻醉,剃毛器除去大鼠背部的毛发后颈椎脱臼法处死,置于温度为25℃、湿度为50%的恒温培育箱(HSX-250,上海南荣实验室设备有限公司)中。于处死后0、1、2、3、4、5、6、7、9、11、13、15 d取大小约3 mm×3 mm、厚度约1mm的背部皮肤,立即放入液氮中冷冻保存,每只大鼠皮肤样本重复收集。本研究动物实验经司法鉴定科学研究院科学与伦理委员会批准。
从液氮中取出皮肤,用电吹风冷风吹干,置于ATR探头金刚石晶体表面,下压ATR探头上的杠杆,使大鼠皮肤与晶体表面紧密贴合。用Nicolet 6700傅里叶变换红外光谱仪(美国Thermo Fisher Scientific公司)在4000~900cm-1范围内进行红外光谱扫描,分辨率4cm-1,扫描次数32次。在相同的实验室条件下由同一工作人员收集本实验所有组织样本的光谱数据,以保证数据的一致性。
采用MATLAB R2018a软件的PLS Toolbox 8.1.1工具箱(美国Math Works公司)对数据进行处理和分析。选取1800~900cm-1的红外光谱区域,此段含有丰富的生物信息。首先对光谱数据进行扩张多元散射校正(extended multiplicative signal correction,EMSC)、3点平滑+二阶导数、15点平滑+二阶导数等预处理,提高光谱的质量。随后对预处理后的光谱数据建立PLS回归模型,每个时间点的光谱数据按照8∶2的比例随机分成训练集和测试集,采用二十折交叉验证。
PLS回归模型通过决定系数(R2)、校正均方根误差(root mean square error of calibration,RMSEC)、预测均方根误差(root mean square error of prediction,RMSEP)和交叉验证均方根误差(root mean square error of cross validation,RMSECV)评估模型的稳定性及预测泛化能力。变量投影重要性(variable importance for projection,VIP)是评估每个变量对PLS模型拟合的贡献程度,通常用于变量的进一步选择。VIP大于1.0的变量可认为对因变量的贡献较大。
图1为20只大鼠背部皮肤组织在不同死亡时间下的平均光谱。随着死亡时间的延长,光谱的波峰峰位没有发生明显改变。然而,不同死亡时间平均光谱之间波峰的强度存在明显差异。在1800~900cm-1区域内皮肤光谱的主要特征峰见表1。区域内的吸收峰主要来自组织中脂质、蛋白质及碳水化合物内化学键或官能团的振动。
建立PLS回归模型推断死亡时间。模型结果如表2所示,所有模型的决定系数(R2)均≥0.85,最高可达0.95。不同预处理方法的比较中,以15点平滑+二阶导数交叉验证建模效果最好,预测集决定系数(R2)为0.92,RMSEP为1.30d(图2)。
应用PLS模型的VIP技术进一步确定皮肤光谱数据推断死亡时间的有效波段。如图3所示,位于1760~1700cm-1、1660~1640cm-1、1580~1540cm-1和1 460~1 420 cm-1波段区域的VIP值对模型的影响力显著高于其他波段。
图1 大鼠死后15d皮肤组织的平均光谱图Fig.1 The average spectrogram of skin tissues 15d after the rats’death
表1 FTIR光谱中主要特征峰指认Tab.1 Identification of major characteristic peaks in FTIR spectroscopy
表2 不同预处理方法对PLS定量模型性能的影响Tab.2 The effects of different pretreatments on the PLS quantitative model performance
图2 PLS回归模型预测结果Fig.2 The prediction results of PLS regression model
图3 PLS回归模型的VIP分数图Fig.3 The VIP results of PLS regression model
ATR-FTIR主要通过检测化学物质中化学键或官能团的振动来获得组织样本的结构成分信息,具有快速、灵敏、制样简单和非破坏性等检测特点,该技术已被广泛应用于生物医学领域[9],特别是在肿瘤(如脑肿瘤[10]、乳腺癌[11]、肝细胞癌[12]、结直肠癌[13])的诊断、分级及预后评估等方面。皮肤位于身体表面,分为表皮和真皮两部分。真皮的细胞外基质由胶原蛋白、弹性蛋白和其他基质成分组成;真皮细胞与胶原纤维之间存在一些不固定物质,主要由糖胺聚糖和蛋白质组成[14]。与血液、肌肉组织和骨骼等其他生物样本相比,皮肤组织具有以下优点:(1)皮肤的表皮位于最表层,是与外界环境接触的屏障,可以抵御微生物的侵袭,且具有易获取的特点。(2)真皮属于致密结缔组织,由粗大胶原纤维彼此交织成致密的板层结构,限制了死后细菌的扩散,使腐败进展缓慢。因此,皮肤组织有望成为晚期死亡时间推断的重要检材。
金波[15]对不同环境下的大鼠尸体腐败情况进行了组织形态学的观察,发现随着死亡时间的延长,大鼠皮肤内的胶原纤维遭到破坏,但到死亡晚期,仍有部分胶原纤维保持完整。KOVARIK等[16]采用组织病理学技术观察死亡1周内的皮肤组织,发现局部真皮分离,外分泌腺管自溶,真皮降解。由于这些形态改变往往伴随生物化学变化,因此,上述研究为以皮肤为检材推断死亡时间提供了重要理论及实验基础。本研究利用FTIR光谱技术检测大鼠死后皮肤组织内化学变化与死亡时间之间的关系,并基于FTIR光谱技术建立了推断死亡时间的数学模型。
FTIR光谱是根据化学物质中化学键或官能团的振动识别化学成分。一般而言,物质中不同构型的基团在FTIR光谱中都有其各自对应的吸收峰,可根据这些特征性吸收峰峰位和强度是否发生变化来推断物质分子中主要化学基团的构型和含量是否发生了变化[17]。皮肤内含有蛋白质、脂质、黏多糖、核酸和电解质等成分。然而,皮肤分子光谱带主要来自皮肤中脂质、蛋白质和碳水化合物,可能的原因是其他小分子物质的吸收峰被其覆盖。本研究结果显示,光谱波峰峰位没有发生明显改变,说明大鼠死后15 d内,皮肤所含的主要化学基团构型未发生明显的改变。相关研究[18]也表明,大鼠心肌的光谱波峰峰位不随时间的改变而发生变化。
然而,波峰的强度随着时间的改变存在差异。本研究结果表明,皮肤组织中物质的成分含量与死亡时间存在一定的关系,可以作为死亡时间推断的指标。但通过肉眼观察这些区域,无法准确地推断死亡时间。因此,我们采用机器学习技术深度分析不同时间点的光谱数据,并建立PLS回归模型。
本研究结果显示,3种预处理方法及原始模型的决定系数(R2)均≥0.85,说明以皮肤组织为样本,运用FTIR光谱技术推断死亡时间具有一定的可行性。EMSC是一种多变量散射校正技术,可以有效消除样品间散射影响所导致的基线平移和偏移现象,同时增强与成分含量相关的光谱信息[19];平滑处理是消除噪声的常用方法,可以有效提高光谱信噪比,减小随机噪声的频率,但同时较大的平滑点数也会导致信号的失真[19];通过二阶导数的处理可以分辨重叠吸收峰,提高光谱的分辨率和灵敏度。对于建立的模型,决定系数(R2)越大,模型拟合效果和准确性越好,RMSEP越小,则模型预测能力越强[20]。由结果可知,经过15点平滑+二阶导数处理后的PLS模型最优。
VIP技术是基于PLS回归的一种变量筛选方法,当多个自变量间具有较强相关性时,可通过相关自变量综合而成的主成分去描述自变量对因变量的解释能力,并根据解释能力的大小筛选自变量[21]。由本研究结果可知,VIP大于1.0的光谱吸收峰主要源于脂质和蛋白质,表明大鼠各死亡时间点的光谱差异主要是组织中蛋白质和脂质等物质组分的变化引起。该发现与早期研究结果[22-23]一致。CHOI等[22]对老鼠骨骼肌内蛋白进行分析,发现eEF1A2和GAPDH蛋白表达水平随着死亡时间的延长出现下降。靳俊峰等[23]通过苏丹Ⅲ对胸骨骨髓脂肪细胞进行染色,发现在死后1~9 d染色逐渐变浅淡,脂质含量随死亡时间延长而下降。
本研究应用机器学习技术解析FTIR光谱信息,分析大鼠死后15d内皮肤组织光谱特征的差异性,建立死亡时间推断的PLS回归模型,发现恒定温度、湿度的条件下,不同死亡时间点的光谱变化具有一定的规律。但在法医学实际案例中,尸体周围环境复杂多变,死亡时间的推断可能受到环境温度、湿度、昆虫活动及土壤特性等因素影响。因此,在未来的工作中,我们将着重考虑这些因素的影响,获取更为全面的光谱数据,最终建立可用于实际需求的死亡时间推断模型。