我国人体表征分子鉴识研究的成果、挑战与展望

2019-03-24 18:01朱波峰孟昊天兰琼
法医学杂志 2019年5期
关键词:画像表型准确性

朱波峰 ,孟昊天 ,兰琼

(1.南方医科大学法医学院,广东 广州 510515;2.西安交通大学口腔医院 陕西省颅颌面精准医学研究重点实验室,陕西 西安 710004)

人体表征,即人体外部可见的一系列形态特征,包括容貌、身高、发色、肤色等。对犯罪嫌疑人外部可见表型特征(表征)的精准鉴识,可为侦查破案、缉查罪犯提供依据和线索,在公安机关侦破案件的过程中,具有重要的实际应用价值。在目前的案件侦破中,可通过获取被侵害人或目击者对犯罪嫌疑人形态特征的回忆,直接形成描述文字,或利用模拟画像技术生成模拟画像加以辅助,以配合后续的调查工作。其中,模拟画像可以直观地反映人的相貌,在案件调查过程中,当模拟画像与嫌疑人的真实相貌的相像度达到60%时,就具有推断价值,达到80%以上时辅助侦查效果就非常理想[1],有利于发现和查获犯罪嫌疑人。但在实际刑侦工作中,模拟画像的使用面临着许多挑战,如目击证人对嫌疑人体貌特征的回忆和描述可能存在偏差和错误,导致绘制出的模拟画像失真,画像人员的绘画技能,也对模拟画像的相像度有较大影响。

分子生物学和生物信息学等相关理论和技术的飞速发展为人体外部可见表型特征的刻画提供了新的研究思路。通过对遗传信息和表型特征进行关联分析,可以在特定表型与相应的遗传标记之间建立对应关系,这为通过分子标记鉴识人体表征提供了理论依据。法医DNA表型(forensic DNA phenotyping,FDP)推断研究始于20世纪末,并在最近几年受到越来越多科研工作者的广泛关注。在2019年9月举办的第28届国际法医遗传学大会(The 28th Congress of the International Society for Forensic Genetics)上,来自鹿特丹伊拉斯姆斯大学的知名专家Manfred Kayser作了题为Forensic appearance prediction from DNA——A journey through 10 years of scientific contributions的报告,回顾了其团队在色素特征、发质、身高及容貌推断等领域的研究成果,并对未来利用表观遗传学技术推断生活习惯的可行性进行了展望,充分展现了人体表征分子鉴识研究在当今法医遗传学领域的重要性和创新性。围绕这一法医遗传学的重点、热点和难点研究领域,我国研究者在过去的10多年中进行了大量的研究工作,取得了一系列成果,在此进行简要回顾与探讨。

1 我国FDP研究成果

1.1 高准确性的人体表征分子鉴识

目前,生物地理祖先、色素特征(包括虹膜颜色、发色和肤色)及年龄是FDP领域研究最为成熟的人体表征。

生物地理祖先推断根据使用的祖先信息位点(ancestry informative marker,AIM)和建模样本的不同,可进行从洲际到地区以及不同族群等不同方面的祖先来源推断。过去10多年来,我国研究人员在洲际人群遗传推断水平筛选AIM-单核苷酸多态性(single nucleotide polymorphism,SNP),基于不同检测技术和平台,构建了多种推断体系[2-10]。针对其中的27重复合SNP检测体系[4]发表了一系列验证、优化研究结果[11-15]。2018年,马咪等[16]报道了应用该体系进行祖先推断的实际案例,在该案例中,通过推断犯罪嫌疑人族群,将可疑人员范围从3000多人减少至400余人,显著缩小了嫌疑人范围,最终协助专案组成功抓获犯罪嫌疑人。在地区水平亚人群遗传推断方面,立足于我国实际情况,研究主要针对亚洲群体的细分[17-18]以及高原适应基因相关的高原人群和其他人群细分[19-20]。除SNP标记外,插入/缺失(insertion/deletion,InDel)多态性也可作为AIM进行祖先来源推断。2019年,LAN等[21]开发了基于毛细管电泳技术平台的包含39个AIM-InDels的五色荧光检测体系。该研究及相关后续研究[22]也对该体系在洲际人群及亚人群中的遗传推断效能进行了评估。此外,对于应用其他类型的分子标记,如微单倍型标记,进行祖先来源推断的可行性也有探索[23]。

在色素特征方面,由于我国大部分群体为黄色人种,头发、虹膜、皮肤颜色差异较小,色素特征的分子鉴识从研究角度而言不易收集表征不同的样本,从实际应用角度而言应用价值较低,相关研究[24-25]相对较少。

年龄的分子鉴识是我国研究人员关注较多的领域。早期研究关注外周血白细胞端粒DNA长度变化与年龄的相关性[26],在确定了外周血白细胞端粒DNA长度与年龄呈现负相关后,有研究[27]进一步探讨了性别对以上相关性的影响,并最终构建模型进行年龄推断[28-29],但遗憾的是研究中未对推断模型的准确性进行评估。此外,信号结合T细胞受体删除环(signal joint T-cell receptor excision circle,sjTREC)用于年龄推断的潜能受到关注。2011年,OU等[30]探讨了中国人群外周血白细胞sjTREC水平与年龄之间的定量关系,并给出回归方程,结果显示年龄推断标准误差为10年左右。此后,有研究[31-32]进一步探索证明血痕中的sjTREC水平也适用于年龄推断。另外,RNA和DNA甲基化标记也被用于年龄推断研究[33-44],其中基于DNA甲基化的年龄推断获得了更多关注,研究人员筛选了年龄相关的CpG位点,建立了相应的年龄推断模型,推断结果误差多在5岁以下[38-39,41-44]。

1.2 具有一定准确性的人体表征分子鉴识

除上述人体表征外,身高和容貌也是FDP研究所关注的重要人体表征,但与生物地理祖先、色素特征、年龄等推断准确性较高的人体表征相比,目前这些人体表征的分子鉴识准确性还有待进一步提高。

研究结果[45]表明,身高受到遗传、环境等多种因素的影响,其中遗传因素所占的比例最大。但作为受多个基因影响的复杂性状,尽可能全面地筛选身高相关分子标记,是准确进行身高分子鉴识的难点之一。我国研究人员在汉族、藏族等群体中筛选验证了部分与身高相关的基因(位点)[46-49],同时发现部分基因(位点)在中国群体中的多态性发生频率与国外人群存在差异[46,48],部分SNP位点的基因变异情况在我国群体与欧洲人群中效应不同[49]。还有部分研究基于年龄相关分子标记建立推断模型,准确性(曲线下面积,area under curve,AUC)在0.6~0.8[50-53]。

人的容貌具有高度的辨识性,在案件侦查过程中,往往是最直接和有效的线索。通过甄选与面部形态特征相关的分子标记,构建相应的推断模型,形成具有一定相似性的“分子模拟画像”,是FDP研究的重要目标之一。“分子模拟画像”的准确性,既依赖于与面部形态高度相关的分子标记,也依赖于科学合理的推断模型。2017—2018年发表的两项研究成果[54-55],通过全基因组关联分析(genome-wide association study,GWAS)筛选面部特征相关SNP,并在此基础上构建分子模拟画像推断模型,经验证基于面部特征相关SNP推断获得的分子模拟画像与真实脸型的相似性高于完全随机推断脸型,但现有推断模型还不够成熟,推断标记还需进一步筛选、优化,要真正将这项技术应用于法医学实践,还需要更多的探索。2019年,LI等[56]报道了位于不同基因座上的8个影响欧亚人群面部特征的SNP位点,丰富了欧洲和亚洲群体之间面部形态特征遗传差异的研究。

2 我国FDP研究的挑战与展望

2.1 人体表征鉴识分子标记筛选

研究表明,人体表征鉴识分子标记在亚洲人群和其他人群中的表型特征相关性和影响效应可能存在差异[49],基于其他人群筛选出的分子鉴识标记应用于我国群体时,可能会影响推断结果的准确性[50]。目前,筛选更多有效的推断位点,提高推断准确性依然是FDP研究的难点之一。在中国群体中继续开展全基因组水平的表征鉴识分子标记的筛选,以发现中国群体特异性的人体表征鉴识分子标记,将有助于进一步提高推断准确性。与此同时,充分利用大量基于其他群体的FDP研究成果,对这些标记在中国群体中的适用性进行验证,也有助于形成适合我国群体的人体表征分子鉴识标记体系。

2.2 选择适宜的人体表征作为研究对象

我国大部分人群属于东亚群体,仅有少部分人群具有洲际混合遗传成分,多数人具有典型的黄色人种表型特征,这一情况决定了在我国的法医学实践中,部分人体表征分子鉴识的重要性与有效性和其他国家存在一定的差异。美国是移民国家,美国人可能存在欧洲、非洲、亚洲、美洲等多种洲际祖先来源,因此,洲际祖先来源推断结果对案件的侦破具有较高的参考价值;而对我国而言,则更需要进行民族之间的细分,或所属地域的推断。欧洲人群中,色素特征较为多变,对头发和虹膜颜色的推断有助于缩小侦查范围;而我国人群多为黄色皮肤、黑色头发、棕色眼睛,色素特征的推断对案件侦破提供的帮助相对有限。因此,针对我国实际情况,选择适宜的人体表征作为研究对象,一方面更易获得研究样本,另一方面有利于未来在我国法医学工作中的实际应用。此外,以往研究结果[57-59]表明,雀斑、重睑、耳垂形态等人体表征同样具有遗传相关性,因而也具有分子鉴识潜能。这些局部表征的分子鉴识,可对“分子模拟画像”进行细化,从而提供更多线索信息。

2.3 深化合作,积极开展学科交叉研究

人体表征分子鉴识研究,是涉及样本收集(包括表型特征信息收集和生物样本采集)、分子标记筛选、推断模型建立及验证等多个环节和步骤的复杂研究,每一个环节都存在多学科合作和交叉的可能。研究样本的获取是开展人体表征分子鉴识研究的基础,建立和优化生物样本库、遗传信息数据库,将有利于样本资源的合作开发和数据信息的深度挖掘。同时,国外许多FDP研究样本来自临床队列研究,对资源进行有效整合和合理充分利用,节约时间和经济成本,值得我们借鉴。体质人类学研究中,也涉及大量人体表征信息的收集,同样存在合作收集、资源共享的可能。而针对模型的建立及验证,与生物统计学、计算生物学、人工智能等学科或领域的交叉合作,有利于开发更为先进合理的推断模型。例如,将人工智能技术运用于人体表征分子鉴识研究,对法医学而言,将有望构建出准确性更高的推断模型。对人工智能领域而言,则拓展了技术的应用方向,利用成熟的技术解决新的问题,可能为技术的进一步发展提供新的思路。

除原创性研究论文外,还有许多科研工作者发表了人体表征分子鉴识相关的综述文章[60-63],对同期国内外相关研究情况进行归纳梳理和分析提炼,一方面便于关注人体表征分子鉴识领域的研究人员在较短时间内了解最新的研究动态,另一方面也可为交叉领域的研究人员提供新的研究思路或方向。本期专题收录了人体表征分子鉴识相关的多篇综述和原创性研究论文,内容涉及年龄[64]、族群地域[22,65-66]、容貌[67]、色素表型[68]等多种人体表征[69-70],希望能对人体表征分子鉴识研究在我国的发展起到推动和促进作用。

猜你喜欢
画像表型准确性
威猛的画像
浅谈如何提高建筑安装工程预算的准确性
“00后”画像
画像
建兰、寒兰花表型分析
影响紫外在线监测系统准确性因子分析
论股票价格准确性的社会效益
GABABR2基因遗传变异与肥胖及代谢相关表型的关系
慢性乙型肝炎患者HBV基因表型与血清学测定的临床意义
72例老年急性白血病免疫表型分析