杜铁帅,孟西麦蒙,叶星,涂春艳,金恺迪,陈邵文,刘宁国,谢建辉,沈忆文
(1.复旦大学基础医学院法医学系,上海 200032;2.司法鉴定科学研究院 上海市法医学重点实验室 司法部司法鉴定重点实验室 上海市司法鉴定专业技术服务平台,上海 200063)
代谢组学是20世纪90年代中期发展起来的一门学科,通过对生物体内代谢物的变化进行定量分析,寻找代谢物类型和数量变化与生理、病理变化的相互关系和动态规律。代谢组学变化反映了机体整体水平的代谢状况,有利于对复杂体系的整体进行认识,是系统生物学研究的重要组成部分。在系统生物学、药物研究、临床研究等方面有着广泛的基础应用研究。在法医学方面,以往主要集中在法医毒理学研究领域,随着技术方法的推广,该方法也逐步在法医病理学开展了研究。
诞生于20世纪末的代谢组学最早由英国伦敦帝国大学NICHOLSON等[1]提出,指通过考察生物体系受刺激或扰动后,以代谢产物的变化或其随时间的变化来研究生物体系中代谢途径的一门科学。该方法利用光谱或波谱检测代谢产物,数据经多元统计分析和模式识别方法等,了解内源性代谢产物的变化,反映相关的代谢途径[2]。与其他组学相比,主要研究相对分子质量小于1000的代谢物含量变化及其变化规律,从小分子层面解释上游组学,进一步与生物表型的改变相关联[3]。近几年,成像代谢组学也逐渐凸显其作用价值[4-5],利用成像质谱技术可以揭示选定的代谢物在组织样本中的区域分布,可以结合光学成像,相互印证。鉴于代谢组学技术有着上述特点,其在疾病诊断、医药研制开发、营养食品科学、毒理学、环境学、植物学等领域有着广泛的研究。
在分析过程中,代谢组学主要可分为靶向代谢组学分析(targeted metabolomics)和非靶向代谢组学分析(untargeted metabolomics)[6]。其中靶向代谢组学分析是指测量一组有着倾向性研究目标的代谢物,通过建立标准曲线的浓度范围进行检测。此法能够更准确地对目标代谢物进行量化,为其他代谢组学的结果提供分析验证。但从分析技术的角度来看,非靶向代谢组学才是真正意义上的“代谢组学”,其通过尽可能多的定性和相对定量生物体系中的小分子代谢物,提供了客观的手段来检查多个途径相关联的代谢物,能最大程度反映样品总的代谢物信息,从而揭示代谢物的改变和随时间的变化。但在实际实验中,尚无法同时获得所有种类的代谢物,且影响代谢物含量变化的因素很多,而许多未知代谢物还无法得到鉴定,因此并不能一蹴而就。不过,非靶向代谢组学可以对一个样品中的代谢物进行较为详细的评估,揭示多种代谢物及其含量变化,应用前景巨大,而随着分析仪器的进步和数据分析方法的提高,非靶向代谢组学将呈现出更好的实验结果。
代谢组学能够对细胞、组织或器官,甚至整个生物体系内的所有小分子代谢产物进行高通量、全景式的定性、定量分析,主要用于研究有机体内的物质代谢规律和病理生理变化。研究对象一般为生物样本,主要包括生物体液(如血液、尿液、唾液和脑脊液等)、细胞提取物、细胞培养液、组织提取液以及粪便等。实验流程包括样品采集与制备、分析与数据采集、数据统计分析、代谢物结构鉴定等[7]。目前最常用的分析技术包括液相色谱与质谱联用法(liquid chromatography-mass spectrometry,LC-MS)、气相色谱与质谱联用法(gas chromatography-mass spectrometry,GCMS)和核磁共振法(nuclear magnetic resonance spectroscopy,NMR)。
LC-MS是以高效液相色谱作为分离系统,高分辨率质谱为检测系统的一种串联分析平台。该方法具有分离效能高、分析速度快、检测灵敏度高、应用范围广的特点[8]。采用多种色谱柱的方式,可以分析大多数代谢物,适用于生物样本中复杂代谢产物的检测和潜在标志物的鉴定,相比于GC-MS,更适用于检测难挥发或热稳定性差的代谢物[9]。其中超高效液相色谱-质谱(ultra performance liquid chromatographymass spectrometry,UPLC-MS)联用技术[10],因具有更高的灵敏度和分辨率,以及更宽的动态范围,在全组分分析上优势明显,常用于非靶向代谢组学研究。但利用LC-MS进行分析也有着一定的弊端,例如:分析中有着一定的偏向性;对结构信息较少的化合物分析较困难;需要标准品以及构建独立的数据库;最终结果数据量过大,而导致数据挖掘和处理困难等。其中针对分析偏向性,可采用多种分离模式相结合的方式,提高分析完整度。反相液相色谱(reversed-phase liquid chromatography,RPLC)适用于中等极性或弱极性代谢物,亲水相互作用液相色谱(hydrophilic interaction liquid chromatography,HILIC)是专门针对强极性代谢物而开发的色谱柱。研究[11]表明,RPLC和HILIC分别能提供脂质代谢和中心碳循环代谢的最大信息量,两种分离模式的数据相结合将获得更多的代谢物特征。
GC-MS是将气相色谱仪与质谱通过适当的接口相结合的分析平台[9]。该方法有着较高的灵敏度,在色谱分析重复性、分辨率以及电子轰击离子源得到的质谱碎片重复性上有着一定的优势,且受基体效应影响小,能够选择性地富集和检测大量代谢物中的痕量物质。适用于相对分子质量小于800且具有热稳定性、易挥发性的含有羟基、羧基、氨基和亚氨基等基团的强极性化合物的检测以及处理后具可挥发性物质的定性分析[12],也适合多组分混合物中未知组分的定性分析,可以判断化合物的分子结构,对复合混合物进行定性定量分析。在样品采集的基础上,通过不同的提取方式,采取适当的净化、浓缩方法,加之有效的衍生化手段(硅烷化、烷基化、酰基化、缩合反应、手性衍生等),能够进一步扩大GC-MS的检测范围、改善样品的峰形和分离度、提高检测灵敏度、利于化合物结构鉴定,使得其实际应用范围有了极大的提升。
NMR是基于具有自旋性质的原子核在核外磁场作用下,吸收射频辐射而产生能级跃迁的谱学技术[13]。常用的有氢谱(1H-NMR)、碳谱(13C-NMR)和磷谱(31P-NMR),而以1H-NMR应用最为广泛。该方法对样品无损伤,不破坏样品结构和性质,可在一定温度和缓冲液范围内选择实验条件,通过无偏向的检测,有着较高通量和较低的单位样品检测成本。适用于研究动力学过程,给出动态特性的信息。但其灵敏度较低,因此并不适合分析大量低浓度代谢物。
综上所述,质谱分析因其具有灵敏度高、重现性好等优点而在很多领域具有广泛应用。按照质量分析器的不同质谱仪可分为很多种,其中四极杆质谱仪因为价格相对低廉、结构简单且可以多个串联而具有很广泛的应用。如三重四极杆质谱仪除了具有四极杆质谱定量能力强的特点外,通过串级功能,增强了定性能力;而飞行时间质谱仪,相比于四极杆的分辨能力更好,能够很好地检测电喷雾离子源产生多电荷离子;四极离子阱则非常适合未知样品的结构解析等。目前利用LC-MS、GC-MS已经实现了高通量代谢组学的检测,由此可以更便捷地对小分子代谢物进行组学分析。
随着大量数据的获取,如何从中挖掘出更多的生物信息是代谢组学揭示问题的关键。获得的原始数据不能直接用于分析,一般需要经过一系列数据处理[14]:(1)利用仪器自带的软件或者部分自定义的程序进行峰提取,获得三维数据集。(2)针对所获得数据进行数据结构标准化操作,减小实验和分析过程中的误差,此过程数据需要通过包括归一化、数据转化、标准化、中心化等在内的多种预处理。其中,归一化是为了将所有峰信号强度转化为相对强度以减弱不同个体间代谢物的浓度差异;而数据转化一般可以通过次方转换来提高数据集的正态分布性,矫正奇异值;标准化则是为了增强各变量在不同样本中的可比性,使数据更利于观察组间差异和聚类分析,常见的可分为UV-scaling(变量除以自己的标准偏差)、Parscaling(变量除以自己的标准偏差的开方)和Nonscaling(均值中心化)3种,一般情况下都会先进行中心化再考虑是否进行进一步标度。此外,对于NMR数据,还要进行峰对齐,以消除化学位移带来的影响。(3)模式识别,即进行单维和多维的统计分析。单维即对单变量进行统计描述,主要是参数检验和非参数检验;多维分析是代谢组学数据分析的核心所在,通过统计分析考察所有变量,并寻找其中的关联。通常可以分为以聚类分析、主成分分析(principal component analysis,PCA)为代表的非监督性(unsupervised)方法和以(正交)偏最小二乘法判别分析(partial least square-discriminant analysis,PLS-DA)、人工神经网络为代表的监督性(supervised)方法[15]。通过构建稳定可信的数学模型,进一步筛选变量,通过变量权重重要性排序、载荷权重、相关系数等筛选标准得到差异变量。
实际应用中,有MAVEN、MZmine、MetaboAnalyst和XCMS Online等全功能软件方便数据处理[16],R语言、Python、MATLAB等编程语言都能应用,还有HMDB、METLIN、MassBank和PUBChen等物质鉴定网站以及KEGG、SMPDB、BioCyc等通路数据库,方便数据分析、共享[17]。以上分析手段只是代谢组学分析中常用的方法,还有大量的算法值得发掘,另外后期如何解读数据结果同样十分重要。
随着代谢组学技术的不断发展,其在法医毒理学方面已经开展了不少研究,包括毒理研究、毒性评价、确定毒物作用靶器官及相应标志物、毒物作用机制、药物滥用及药物成瘾等[7,18-20]。对于法医病理学,有学者曾提出利用该技术进行损伤经历时间研究、慢性因素致死案例的探讨等课题[18],但尚未查阅到相关文献。不过该项技术在死亡时间、死亡原因方面,已经开始了初步的探索。该项技术在法医学研究方面有着以下优势[21]:能够通过整体性的研究策略,采用多研究材料,实现代谢物的动态研究,获得丰富的检测数据;检测材料选择范围广且用量少,多元数据分析有利于进行时间相关性研究;小分子代谢物为机体变化的最终表现,与靶器官、生理机制息息相关,且种类又相对有限,利于标志物筛选;代谢物在各生物体系内类似,技术更为通用,有利于动物建模后人体样本验证;代谢组学技术所涉及的仪器多为法医毒理学分析已购置仪器,经过改造升级可以胜任研究,利于平台搭建。
死亡时间(postmortem interval,PMI)作为法医病理学的一个重要研究内容,在刑事案件划定犯罪嫌疑人方面有着重要意义,也能为其他类型案件提供重要科学依据。目前,PMI研究方法很多,但多是通过单一变量与经验相结合,实际应用效果有限。在死亡时间研究中,理想情况是得到某些生物指标,在相对时间内的变化具有一定稳定性和规律性,又能随死后时间呈现出具有统计学意义的变化,且受其他因素影响小,但在研究中往往无法得到如此满意的标志物。因此,多参数、多系统、多方法联合推断越来越受到学者们的重视[22-23],如玻璃体液研究中,在利用钾离子浓度推测死亡时间的基础上引入次黄嘌呤,在一定程度上提升了推断的准确性[24-25]。
死后尸体在微生物的作用下逐渐发生腐败,各种代谢物在组织中消耗、生成、积聚,腐败微生物和腐败产物的量随着死亡时间的延长,而不断变化。代谢组学技术可以通过单次检测对成百上千的小分子进行定性定量,在筛选标志物上有着一定优势,同时多元分析也利于构建推断模型。另外,生物体内代谢小分子种类极为相似,构建动物模型后有利于人体样本的验证。2005年,SCHEURER等[26]采用NMR分析技术,开展了代谢组学有关死亡时间推断的研究。实验在恒定温度下,对8个羊头进行了为期18 d的检测,筛选出5种代谢物(醋酸、丙氨酸、丁酸盐、游离三甲氨、丙酸盐)用于估计死亡时间,在死后250h内,预测死亡时间和真实死亡时间有着良好的相关性,虽然需要后续研究,但预测模型还是在4个已知死亡时间的人体脑组织样品中进行了验证实验。2011年,该课题组进一步研究结果[27]显示:通过对18只羊脑在设定的4种(4℃、11℃、19℃、26℃)不同的环境温度中进行检测,筛选出的8种代谢产物(乙酸、丙氨酸、天冬氨酸、丁酸、氨基丁酸、肌醇甘氨酸、琥珀酸、缬氨酸),在环境温度4~26℃,估计值和真实死亡时间之间存在高度相关性,同时这一研究也进一步揭示了死后大脑分解的过程。此外,也有研究者将94只小鼠分为3个时间点(15 min内、死后1~4 h和死后8 h以上)、3种死亡原因(窒息、过量吸食可卡因、诱导呼吸衰竭),并对股骨肌进行检测,利用NMR的代谢物信息,通过构建数学模型,在一定程度上可以用来推断死亡时间和确定死亡原因[28]。事实上,小分子代谢物用于死亡时间研究由来已久。既往研究[24-25]中,利用玻璃体液中的钾、镁离子作为死亡时间推断的标志物,当研究者引入次黄嘌呤时,该方法推断的准确性有了进一步的提高。近年来,Analytical and Bioanalytical Chemistry连续发表了两篇[29-30]关于利用GC-MS分别对不同死亡时间的大鼠全血和小鼠的肌肉、血清进行检测的研究成果,通过聚类分析、偏最小二乘法分析等数据统计、数学建模的方式进行PMI研究,分别筛选出25种(全血)、17种(肌肉)、14种(血清)与死亡时间有着密切相关性的代谢产物,同时通过构建数学模型,得到了较好的预测结果,模型本身也可以通过同批次实验得到验证。与此同时,国内研究者也开始了这方面的工作。通过在死后不同时间(0、3、6、12、24、48和72h)收集心内血液,借助气相色谱仪与质谱联用分析收集的样品。经过多元统计分析,利用内源代谢物构建正交信号校正(orthogonal signal correction,OSC)-PLS回归模型,用于死亡时间推断[31]。该模型通过验证集、预测集得到了反复验证,同时,实验在雄性和雌性大鼠之间未观察到显著差异。在此基础上,该课题组进一步通过因敌敌畏中毒死亡的动物模型,研究72h内的死亡时间推断,构建了包含23个代谢物的支持向量回归模型,结果显示模型稳定、预测结果良好[32]。另有学者[33]通过GC-MS对大鼠脾组织进行代谢物时序性变化研究,以此推断死亡时间。DU等[34]则采用LC-MS对大鼠股骨肌进行了代谢组学分析,主要应用PCA和PLS-DA来识别死后代谢物的改变,揭示了一部分代谢物随死亡时间的变化规律。代谢组学在死亡时间方面的研究已经展开,随着研究的深入,相信能有所突破。
在死亡案件中,绝大多数案例能够通过尸体剖验、案情调查得到比较明确的死亡原因,但在类似心脏性猝死、青壮年猝死综合征、溺死以及其他(如过敏等)特殊死亡原因时,往往需要借助排他法进行判断,除了包含不确定性外,也不利于案件中的责任认定。因此,对于该类死亡原因的调查,有必要进行更多的研究。目前,研究主要集中在对不同死亡原因差异标志物的筛选。其中对于心脏性猝死和青壮年猝死综合征着重通过遗传学的方法用于研究,在基因筛查推断死亡原因的同时,又能对家族成员进行预警。有研究通过1H-NMR对15名缺血性心力衰竭患者和20名健康个体的尿液进行分析,找到差异代谢物,利用代谢物通路分析,发现疾病能使三羧酸循环代谢和脂肪酸代谢以及能量代谢发生改变,此外,研究还观察到核苷酸和甲基丙二酸代谢的扰动[35]。受此启发,国内有学者率先尝试对心肌缺血-致命性心动过缓导致大鼠心脏性猝死模型的血清样本进行代谢组学分析。通过GC-MS分析方法,研究结果显示,赖氨酸、嘌呤有诊断潜能,并通过代谢通路的描述讨论了相关机理[36]。随后该课题组通过GC-MS对心肌缺血的动物模型进行研究[37]。在此基础上,该课题组还对致死性室性心律失常的大鼠模型的血清进行了基于UPLCMS的脂质分析,借助脂类相关代谢通路,筛选潜在的生物标志物,使得该方法有望成为此种死亡原因鉴定的辅助工具[38]。
由于代谢组学的检测目标处于代谢过程的末段,小分子代谢物在体内的含量以及最终的种类将更为明确,因此利用代谢组学技术,对于疾病造成的死亡诊断有着独有的优势,结合临床的相关研究有利于减少医疗纠纷。目前的临床研究显示,通过代谢组学的筛选能够得到用于恶性肿瘤[39-40]、糖尿病[41]等疾病诊断的小分子标志物。而对于心血管疾病[42],不论是动脉粥样硬化、心肌缺血、脑梗死、急性缺血性卒中等,都已有了临床实验,这些指标在一定程度上也能为判断死亡原因提供理论依据。同时在对脑创伤的血清代谢物的研究中发现,两种中链脂肪酸(癸酸和辛酸)和糖衍生物包括2,3-二磷酸甘油酸与创伤性脑损伤的严重程度有着明显相关性[43];而常因医院感染导致的败血症也已有研究[44-45]对其代谢表型进行了分析。在中毒死亡中,尤其是中草药中毒,由于药物种类多,成分复杂,以往鉴定过程中极难单纯通过毒物分析进行毒物定性,但代谢组学能够对包括主要和次要代谢物和异种生物物质进行定性定量分析,澄清活性成分在死亡原因中的作用,这将有效解决这一问题[46]。目前,已经有针对一氧化碳中毒的代谢组学研究,通过对血液样本的GC-MS分析,能够有效区分实验组和对照组,达到协助鉴定死亡原因的目的[47]。国内也有课题组通过代谢组学的方法,利用1H-NMR分析,结合多变量统计分析,对61例深静脉血栓(deep venous thrombosis,DVT)患者血清及大鼠DVT模型(n=10)进行代谢产物鉴定,发现7种在大鼠和患者体内都发生了改变的生物标志物,并解释了一部分代谢途径的变化[48]。同时该课题组还利用大鼠造模,发现尿液中的差异代谢物也能成为深静脉血栓形成的候选生物标志物,为该疾病的诊断、治疗和法医学鉴定提供研究基础[49]。由此可见,代谢组学在死亡原因研究上将大有可为。
如果将机体视作为一个整体,各种代谢物共同构成了一个网络,那么当机体受到生理病理刺激或药物扰动后,这个代谢网络的组成及各种代谢物的浓度、比例等会发生时空变化。代谢组学就是试图通过定量研究代谢网络的空间变化规律来逆向推断造成变化的影响因素及这种影响因素对机体可能造成的后果的一门科学[50]。当然,这些改变在死后也将一直发生直至完全消失。由于代谢物处于生物系统生化活动调控的末端,包含更全面的生物标志物信息,能够准确反映生物体系的状态。代谢组学又具有非破坏性、整体性、动态性等特点,可以系统研究代谢网络的整体性和动态性变化,非常适合时间相关性以及诊断性质的研究。在法医病理学相关研究中,尤其是对于晚期死亡时间推断的研究,受尸体自溶和腐败的影响,组织结构逐渐崩解、内源性化学物质不断降解,使形态学变化难以观察、辨认,但残存的组织样本仍可以进行代谢组学检测。当然,随着代谢组学的开展,其在损伤时间的应用[51],尤其是生前伤和死后伤鉴别方面,结合死亡时间的分析,相信能够得到判别。在致伤物推断中,如果伤口处有残留物,代谢组学检测应当也能够提供依据。另外,代谢组学在法医昆虫学、法医植物学等方面也会成为热门。
近年来,不论是司法实践活动还是法医学本身,都显示出对经验性证据的依赖越来越少,在某些方面开始摒弃以往曾经可以作为法庭科学证据的经验性结论,而逐渐转向以实验及客观检测结果为基础的证据学科。在法医病理学方面,分子尸体检验有望成为法医学研究的下一个热点,也有学者曾提出创建代谢组学数据库的设想[18],而要解决法医病理学方面的代谢组学数据库,死亡时间方面的研究将首当其冲,只有解决腐败尸体内化合物随死亡时间改变的影响,死亡原因等其他方面的研究才能更科学、便捷地展开。相信随着现代分析仪器和技术的发展,代谢组学能够为法医病理学研究带来新的机遇。