张陈明,周 密
(1.安徽百友司法鉴定中心,合肥 230081;2.芜湖市公安局,安徽 芜湖 241000)
时常有委托人要求运用STR检验鉴定疑似祖父母与被检孩子之间的亲缘关系,即祖孙关系鉴定。在祖父母均参与的情况下,祖孙鉴定有下列3种常见类型:
1)双祖亲母鉴定(double grandparents and biological mother, DGBM),指已知母亲为孩子生母,鉴定祖父母是否为孩子的亲生祖父母;2)双祖疑母鉴定(double grandparents and alleged mother, DGAM),指祖父母与孩子的关系未知,母亲与孩子关系也未知,同时鉴定祖父母和母亲是否为孩子的亲生祖父母和生母;3)双祖鉴定(double grandparents, DG),指鉴定祖父母是否为孩子的亲生祖父母。其中双祖亲母和双祖鉴定多见于司法鉴定,双祖疑母鉴定多见于公安机关的灾难事件、拐卖失踪和无名尸体等案件鉴定。《生物学祖孙鉴定规范》[1]已提供双祖亲母鉴定的祖孙关系指数(grandparent index,GI)和平均非祖父母排除率(average/mean power of random grandparent exclusion,RGE)公式,柳燕等[2]报道了双祖鉴定的GI公式,任贺等[3]报道了单亲隔代亲权指数计算方法。但双祖疑母鉴定的GI和RGE公式以及双祖鉴定的RGE公式未见报道。本文尝试对此提出相应概念和数学推导公式,并设计模拟实验 验证。
符合祖孙关系判断标准为:孩子的一对等位基因必定是其中一个来自母亲,另一个来自祖父或祖母。参照《生物学祖孙鉴定规范》,在双祖疑母鉴定和双祖鉴定中,分别定义RGE和GI如下:
1)双祖疑母鉴定的平均非祖父母排除率(RGEDGAM)指在单基因座上,随机祖父母、随机母与随机孩子排除祖孙关系的概率。
2)双祖疑母鉴定的祖孙关系指数(GIDGAM)指在单基因座上,争议祖父母、争议母与孩子之间符合祖孙关系时其遗传表型出现的概率(X)与争议祖父母、争议母与孩子是无关个体时其遗传表型出现的概率(Y)比值。
3)双祖鉴定的平均非祖父母排除率(RGEDG)指在单基因座上,随机祖父、随机祖母与随机孩子排除祖孙关系的概率。
公用设定:在某基因座上,等位基因有n个,i,j∈[1,n],i<j。等位基因A1~An的对应的基因频率为P1~Pn。
1.2.1 RGEDGAM公式推导(表1)
设Ar代表所有等位基因,则Pr=1。设As代表除Ai以外的所有等位基因,则Ps=1-Pi。设At代表除Aj以外的所有等位基因,则Pt=1-Pj。设Au代表除Ai和Aj以外的所有等位基因,则Pu=1-Pi-Pj。参照双亲皆疑排除率公式推导[4-5],将祖父和祖母视为有4个等位基因的特殊父亲。
表1 RGEDGAM公式推导Table 1 Derivation of RGEDGAM
1)当祖父母无Ai,疑母任意时,排除与孩子AiAi的亲生关系。合并概率=子概率×母概率×祖父母排除概率=Pi2(1-Pi)4。
2)当祖父母任意,疑母无Ai时,排除与孩子AiAi的亲生关系。合并概率=子概率×母概率×祖父母排除概率=Pi2(1-Pi)2。
其中1)和2)均将“祖父母无Ai且母无Ai”的情况计入,必须去除重复。重复的合并概率=子概率×母概率×祖父母排除概率=Pi2(1-Pi)6。
3)当祖父母无Aj,疑母为AiAi时,排除与孩子AiAj的亲生关系。合并概率=子概率×母概率×祖父母排除概率=2Pi3Pj(1-Pj)4。
4)当祖父母无Ai,疑母为AjAj时,排除与孩子AiAj的亲生关系。合并概率=子概率×母概率×祖父母排除概率=2PiPj3(1-Pi)4。
5)当祖父母无Ai且无Aj,疑母为AiAj时,排除与孩子AiAj的亲生关系。合并概率=子概率×母概率×祖父母排除概率=4Pi2Pj2(1-Pi-Pj)4。
6)当祖父母无Aj,疑母有Ai无Aj时,排除与孩子AiAj的亲生关系。合并概率=子概率×母概率× 祖父母排除概率=4Pi2Pj(1-Pi-Pj)(1-Pj)4。
7)当祖父母无Aj,疑母有Aj无Ai时,排除与孩子AiAj的亲生关系。合并概率=子概率×母概率× 祖父母排除概率=4PiPj2(1-Pi-Pj)(1-Pi)4。
8)当祖父母任意,疑母无Ai且无Aj时,排除与孩子AiAj的亲生关系。合并概率=子概率×母概率×祖父母排除概率=2PiPj(1-Pi-Pj)2。
综上推导,RGEDGAM公式为:
1.2.2 GIDGAM公式推导(表2)
设等位基因A、B的基因频率分别为a、b。设等位基因C代表非A的等位基因,等位基因D代表非A且非B的等位基因。设自然数m、n, 1≤m≤4, 1≤n≤4。为简化公式,将祖父×祖母基因型描述为基因型集合的形式,分为以下3种:
1)含m个A基因的基因型集合。
a. 含1个A基因的基因型集合={AC×CC,CC×AC}。
b. 含2个A基因的基因型集合={AA×CC,CC×AA,AC×AC}。
c. 含3个A基因的基因型集合={AA×AC,AC×AA}。
d. 含4个A基因的基因型集合={AA×AA}。
2)含m个A或B基因的基因型集合,代表基因型集合中的A基因个数与B基因个数之和为m个,其中A基因或B基因的个数可以为0。
a. 含1个A或B基因的基因型集合={AD×DD,DD×AD,BD×DD,DD×BD}。
b. 含2个A或B基因的基因型集合={AA×DD,DD×AA,AD×AD,BB×DD,DD×BB,BD×BD,AB×DD,DD×AB,AD×BD,BD×AD}。
c. 含3个A或B基因的基因型集合={AA×AD,AD×AA,BB×BD,BD×BB,AA×BD,BD×AA,AB×AD,AD×AB,BB×AD,AD×BB,BA×BD,BD×BA}。
d. 含4个A或B基因的基因型集合={AA×AA,BB×BB,AB×BB,BB×AB,AA×AB,AB×AA,AB×AB,AA×BB,BB×AA}。
3)含m个A或B基因的基因型集合,代表基因型集合中的A基因个数与B基因个数之和为m个。例如:含2个A基因和1个B基因的基因 型 集 合={AA×BC,BC×AA,AB×AC,AC×AB,
CA×AB,AA×DB,AB×DA,AB×AD,AA×BD,BD×AA}。
参照双亲皆疑亲权指数[5]和三联体亲权指数公式推导[6],将祖父和祖母视为有4个等位基因的特殊父亲,进行GIDGAM公式推导。
表2 GIDGAM公式推导Table 2 Derivation of GIDGAM
1.2.3 RGEDG公式推导
参照二联体非父排除率公式推导[7],将祖父和祖母视为有4个等位基因的特殊父亲。根据孩子基因型分2种类型:
1)当祖父母无Ai时,排除与孩子AiAi的亲生关系。合并概率=子概率×祖父母排除概率=Pi2(1-Pi)4。
2)当祖父母无Ai且无Aj时,排除与孩子AiAj的亲生关系。合并概率=子概率×祖父母排除概率=2PiPj(1-Pi-Pj)4。
综上,RGEDG公式为:
1.3.1 模拟随机样本
根据随机模拟法[5]产生Identifiler试剂盒的15个常染色体STR基因座的模拟随机个体,等位基因的概率参考中国汉族人群基因频率[8]。设S为单基因座的所有等位基因频率之和,则S=∑Pi[9]。对以上中国汉族人群基因频率计算后发现,只有D16S539、D2S1338、FGA、TPOX基因座的S=1,其他11个基因座的S≠1。因此对11个S≠1的基因座进行基因频率微调,确保全部基因座的S=1,并以此作为模拟实验的基础频率。
1.3.2 模拟实验设计
在单基因座上产生1 000万组,每组包含4个模拟随机个体,分别视为祖父、祖母、疑母和孩子,分别在每组中判断祖父母、疑母和孩子是否符合祖孙关系。设RGEDGAM模拟值(RGEDGAM-S)=不符合祖孙 关系的组数/总组数,分别计算各基因座的RGEDGAM-S。 根据公式(1)计算各基因座RGEDGAM公式值(RGEDGAM-F), 与RGEDGAM-S进行对比。
在单基因座上产生1 000万组,每组包含3个模拟随机个体,分别视为祖父、祖母和孩子,分别在每组中判断祖父母和孩子是否符合祖孙关系。设RGEDG模拟值(RGEDG-S)=不符合祖孙关系的组 数/总组数,分别计算各基因座RGEDG-S。根据公式(2)计算各基因座RGEDG公式值(RGEDG-F),与RGEDG-S进行对比。
基于本文微调后中国汉族人群基因频率,15个基因座的RGEDGAM-F、RGEDGAM-S、RGEDG-F、RGEDG-S对比见表3。
为了对比其他鉴定,基于同样基因频率计算二联体非父排除率(PEduo)、三联体非父排除率(PEtrio)、双亲皆疑排除率(PEAP)、双祖亲母鉴定的平均非祖父母排除率(RGEDGBM)列入表3。
表3 15个STR基因座的RGE和PE对比Table 3 Comparison of both RGE and PE calculated from 15 STR loci of Identifiler kit
对RGEDGAM的公式值和模拟值绘制散点图,见图1。以SPSS 19.0进行线性回归分析,得R2=1,P<0.001。分析表明各基因座的RGEDGAM的公式值和模拟值结果一致,公式(1)符合模拟实验 验证。
对RGEDG的公式值和模拟值绘制散点图,见图2。以SPSS 19.0进行线性回归分析,检验得R2=1,P<0.001。分析表明各基因座的RGEDG的公式值和模拟值结果一致,公式(2)符合模拟实验验证。
对比各基因座3个祖孙鉴定的RGE公式值发现,RGEDG<RGEDGBM<RGEDGAM。因此祖孙鉴定的RGE存在如下规律:双祖鉴定<双祖亲母鉴定<双祖疑母鉴定。进一步将各基因座的祖孙鉴定RGE与二联体、三联体、双亲皆疑鉴定PE对比,发现如下规律:双祖鉴定<双祖亲母鉴定<二联体鉴定<三联体鉴定<双祖疑母鉴定<双亲皆疑鉴定。
图1 RGEDGAM公式值与模拟值的直线回归分析Fig. 1 Linear regression analysis of RGEDGAM with its formula values versus simulation ones
图2 RGEDG公式值与模拟值的直线回归分析Fig. 2 Linear regression analysis of RGEDG with its formula values versus simulation ones
祖父母均参与的祖孙鉴定不仅常见于司法鉴定实践中,而且在大型灾难、打拐寻亲、失踪人口中对受害者的身份识别也具有重要的实战应用价值。本文基于规范所定的双祖亲母鉴定的RGE和GI公式,结合数学推导和模拟验证,补充了双祖疑母鉴定和双祖鉴定的概率计算方法,对于祖孙鉴定应具有法医学应用价值。特别是双祖鉴定,因为其中没有母亲参与,不能运用母子二联体鉴定,是司法鉴定中亟待解决的问题之一。
本文借鉴双亲皆疑排除率和亲权指数、二联体非父排除率的公式推导方法,将祖父和祖母视为有4个等位基因的特殊父亲,获得双祖疑母鉴定RGE和GI、双祖鉴定RGE公式。在此条件下,本文祖孙鉴定的3个分类与经典亲子鉴定(即二联体/三联体/双 亲皆疑鉴定)的3个分类可以建立一一对应关系。将祖父母对应父亲,则双祖亲母鉴定对应三联体鉴定,双祖疑母鉴定对应双亲皆疑鉴定,双祖鉴定对应二联体鉴定。祖孙鉴定与经典亲子鉴定,其定义和判别原理十分相似,可视为4个等位基因父亲参与下的特殊经典亲子鉴定。将有对应关系的祖孙鉴定和经典亲子鉴定进行逐一对比(双祖对应二联体,双祖亲母对应三联体,双祖疑母对应双亲皆疑),可见前者的排除率明显低于后者。考虑到对应的祖孙鉴定比经典亲子鉴定多发生了一次等位基因遗传,增加了很多不确定因素,因此祖孙鉴定鉴别能力相对较低也是符合理论预期的。
已报道的双祖亲母和双祖鉴定的GI公式均属于部分举例公式,主要问题是未能穷举所有可能的祖父母基因型组合。笔者参照上文双祖疑母GI公式对祖父母基因型的描述,将双祖亲母GI(GIDGBM)和双祖GI(GIDG)公式写为全覆盖的数学公式(见表4和表5),以利于人工或软件计算。本文GI公式未考虑基因突变情形,当需要时可参照规范中的举例公式,进一步推导3种祖孙鉴定的突变计算方法。
表4 GIDGBM公式Table 4 Formulae of GIDGBM
表5 GIDG公式Table 5 Formulae of GIDG
对于祖父母均参与的祖孙鉴定案例,应可推定:
1)同样适用于外祖父母和孩子的鉴定,根据父亲参与情况分为生父、疑父和缺父3种类型,可直接套用本文的分类方法和计算方法。
2)尽可能让母亲参与鉴定,因为有母亲的RGE(双祖亲母/双祖疑母)大大高于无母亲的RGE(双祖),此不仅意味着鉴别能力高,而且GI值也能大大提高。
3)如有必要,可补充Y-STR或X-STR检验,以进一步降低风险。