张珊珊 ,唐玉秋 ,张茂修 ,3,高洪梅 ,3,王 昌 ,3,汪运山 ,3,韩淑毅
(1.山东大学齐鲁医学院,山东 济南 250012;2.山东大学附属济南市中心医院,山东 济南 250013;3.济南迪恩法医司法鉴定所,山东 济南 250013)
山东是个历史悠久、文化底蕴深厚的大省,又被称为“齐鲁大地”。在历史演进的过程中,山东省内逐渐形成了三个独具特色的文化区[1],分别为鲁东文化区、鲁中-鲁西北文化区及鲁西南-鲁南文化区。本研究拟通过检测19个常染色STR基因座在上述山东三个文化区人群的遗传多态性,对三个文化区人群的遗传关系及人群交流情况展开探讨。
本研究共采集了1 044名山东地区无血缘关系且至少三代均生活在同一个文化区内的健康汉族志愿者的血样,其中鲁东文化区186名、鲁中-鲁西北文化区405名、鲁西南-鲁南文化区453名。每名志愿者均抽取2mL静脉血,并置于含有EDTA的抗凝试管中。志愿者在样本采集前均进行风险告知,并签署知情同意书。
本研究采用 Chelex-100法提取DNA,并应用Goldeneye®DNA身份鉴定系统20A试剂盒[基点认知技术(北京)有限公司]在9700型PCR仪(美国AB公司)上进行扩增。该试剂盒包含19个常染色体基因 座 (D19S433、D5S818、D21S11、D18S51、D6S1043、D3S1358、D13S317、D7S820、D16S539、CSF1PO、Penta D、vWA、D8S1179、TPOX、Penta E、TH01、D12S391、D2S1338、FGA)和 1 个性别基因座(Amelogenin)。 按说明书使用 10 μL 体系(2.8 μL 去离子水、4.0 μL 缓冲液、2.0 μL 引物、0.2 μL Taq 聚合酶及 1 μL DNA模板)进行扩增。扩增条件为:95℃ 5min;94℃ 30s,60℃ 1min,70℃ 1min,30 个循环;60℃ 30min。 将扩增变性后的产物在3500基因分析仪(美国AB公司)上进行毛细管电泳检测,并用GeneMapper®ID-X v1.3软件(美国AB公司)对原始数据进行基因座分型分析。此外,本实验采用DNA标准品9947A[基点认知技术(北京)有限公司]作为阳性对照,去离子水作为阴性对照。
采用Modified-Powerstates软件检验19个常染色体STR基因座是否符合Hardy-Weinberg平衡,并统计分析鲁东、鲁中-鲁西北和鲁西南-鲁南人群19个常染色体STR基因座的等位基因频率及群体遗传学参数:杂合度(heterozygosity,H)、多态信息含量(polymorphic information content,PIC)、个体识别率(discrimination power,DP)及非父排除率(probability of paternity exclusion,PE)。应用 Arlequin v3.5 软件计算三个文化区人群之间的遗传距离(用Fst值表示)及相应的P值。最后采用MEGA v4.0软件在Fst矩阵的基础上绘制系统发育树。
本研究通过对鲁东、鲁中-鲁西北和鲁西南-鲁南三个文化区1044名汉族无关个体在19个常染色体STR基因座的扩增检测及软件分析,获得各基因座在三个文化区人群中的等位基因频率和群体遗传学参数(表 1~2)。
经χ2检验,19个常染色体STR基因座在三个文化区人群中,仅在鲁西南-鲁南文化区人群的Penta E基因座上观察到P值小于0.05,即该基因座偏离Hardy-Weinberg平衡,其余基因座的P值均大于0.05,符合Hardy-Weinberg平衡。据文献[2]报道,Hardy-Weinberg平衡在本质上是一种较为理想的状态,一般人群的平衡状态都是相对的,很难达到真正意义上的绝对平衡。当群体样本量较少,存在近亲婚配、自然选择、突变或者是人群迁移时,就可能会出现不同数量的基因座偏离Hardy-Weinberg平衡的现象[2-3]。
由于19个常染色体STR基因座相互独立,在山东三个文化区人群中的平均累积个体识别率和平均累积非父排除率分别为0.9999999999999999999999685和0.999 999 974 8,表明这19个常染色体STR基因座构成的检测系统在山东汉族人群中具有较好的多态性,适用于山东汉族人群的法医学鉴定和群体遗传学研究。
STR基因座在不同人群中可以表现出不同的遗传多态性,即具有群体特异性。在检测的19个常染色体 STR 基因座中,D19S433、D5S818、D21S11、D18S51、D6S1043、D13S317、D7S820、D16S539、Penta D、vWA、D8S1179、Penta E、D12S391、D2S1338、FGA 这 15 个STR基因座在山东三个文化区汉族人群中H>0.7、PIC>0.7、DP>0.9,因此可认为这 15个 STR 基因座在山东三个文化区人群中具有高度多态性[4-5]。D3S1358、CSF1PO、TPOX和TH01这4个基因座则在山东三个文化区人群中具有较低的多态性。据文献报道,D3S1358、CSF1PO、TPOX和TH01这4个基因座在吉林汉族[6]、湖北汉族[7]、广西壮族[8]、云南彝族[9]、韩国[10]人群中也具有较低的多态性。另外,发现D3S1358、CSF1PO、TH01 基因座在新疆维吾尔族[3]、巴基斯坦[11]、摩洛哥[12]、日本[13]人群中却表现出较高的多态性;D5S818、D13S317、D16S539基因座在临夏回族自治州的撒拉族[5]、巴基斯坦[11]、摩洛哥[12]人群中却表现出较低的多态性。因此在未来的法医学实践中,我们可以针对不同人群选择特异的高度多态性基因座组成检测体系,以提升其在检测人群中的鉴别能力。
本研究通过Arlequin v3.5软件分析获得山东三个文化区汉族人群之间的Fst值及P值(表3),其中鲁东与鲁中-鲁西北两文化区人群之间的遗传学差异具有统计学意义(P<0.05)。
经MEGA v4.0软件绘制出三个文化区汉族人群的系统发育树(图1)。在系统发育树中,鲁中-鲁西北与鲁西南-鲁南人群聚为一支,而鲁东人群单独分为一支。
]4 5 3=南西南西鲁1 0.0 0 1 1 0.0 0 1 5 0.0 3 7 4 0.0 8 9 1 0.1 0 7 1 0.0 0 1 6 0.1 2 3 1 0.1 3 9 6 0.0 2 7 1 0.0 0 1 4 0.0 0 4 5 0.0 4 7 1 0.1 8 2-1 0.1 6 1 6 0.0 5 9 2 0.0 0 2 0 0.0 1 1 3 0.0 0 3-南西鲁-1 0.0 9 7 7 0.2 6 2 7 0.0 6 0 9 0.5 1 9 6 0.0 3 8 0 0.0 2 1-南西鲁7 0.0 0 7 4 0.0 5 7 1 0.1 2 9,n鲁4 0 5=北中,n鲁1 8 6=东6 S 1 0 4 3 D北中鲁 东鲁--5 0.0 0 2 7 0.0 0 2 6 0.0 3 4 5 0.0 2 1 0 0.0 8 4 4 0.0 9 1 3 0.1 3 8 6 0.1 1 5--3 0.1 3 8 2 0.1 4 5 2 0.1 4 3 6 0.1 5 8 3 0.0 1 7 8 0.0 1 0--9 0.0 0 4-3 0.0 3 8 6 0.0 3 7 1 0.1 7 4 5 0.1 5 0 5 0.0 0 2-4 0.1 7 0 1 0.1 8 0 7 0.0 4 0 5 0.0 5 6 2 0.0 0 1-2 0.0 0 6 1 0.0 1 6 7 0.0 0 3 1 0.0 0 8-4 0.0 0 5 0 1 H T北中鲁 东鲁-7 0.0 0 2 8 0.1 1 4 4 0.0 9 1 5 0.2 8 1 4 0.2 5 5 1 0.0 5 3 5 0.0 6 4 1 0.4 9 0 2 0.5 2 4 7 0.0 4 5 4 0.0 4 8 6 0.0 1 3 4 0.0 1 3 2 0.0 0 1-2 S 1 3 3 8 D北中鲁 东鲁9 0.0 0 4-4 0.0 7 0 0 0.0 7 8 7 0.1 0 3 2 0.1 4 5[n鲁因基位7 9 1 0 11 1212.3 13 14 1515.3 16 17 1818.2 19 2020.3 2121.322.3因基位5 6 7 8 9 9.3 1011因基位1 6 1718等等等南西鲁-5 0.2 3 9 7 0.0 2 8 1 0.1 8 2 6 0.2 4 0 3 0.2 0 5 7 0.0 9 2 0 0.0 1 1-南西鲁-1 0.0 0 1 1 0.0 0 1 7 0.0 9 2 8 0.0 7 2 0 0.1 2 8 7 0.2 5 1 7 0.1 7 7 4 0.1 6 3 9 0.0 9 4 3 0.0 1 4 2 0.0 0 2-南西鲁3 0.0 3 5--6 0.0 0 6 5 0.0 4 7 0 0.1 1 7 9 0.0 9 4 0 0.0 4 3 4 0.0 7 8 A v W北中鲁 东鲁2 0.0 0 1 8 0.0 1 0 5 0.2 8 1 5 0.1 8 5 6 0.0 3 4 9 0.0 2 6 7 0.1 8 2 6 0.2 0 1 6 0.2 2 9 2 0.2 7 4 4 0.1 7 0 6 0.2 0 1 1 0.0 7 4 0 0.0 8 6 7 0.0 2 4 8 0.0 1 0 2 0.0 0 1 7 0.0 0 2 8 S 1 1 7 9 D北中鲁 东鲁2 0.0 0 1-7 0.0 0 3 7 0.0 0 2--2 0.1 0 1 9 0.1 1 2 3 0.0 5 9 2 0.0 6 7 6 0.1 1 3 9 0.1 5 5 3 0.2 5 4 4 0.2 2 0 6 0.2 0 8 4 0.1 7 7 7 0.1 6 6 0 0.1 7 2 1 0.0 7 4 2 0.0 6 7 1 0.0 1 1 1 0.0 1 6 9 0.0 0 4 1 0.0 0 8 2 0.0 0 1-E e n t a P北中鲁 东鲁7 0.0 6 6 0 0.0 4 3 2 0.0 0 1-4 0.0 0 7 4 0.0 1 3 6 0.0 0 8 4 0.0 0 5 7 0.0 4 0 3 0.0 4 0 1 0.1 1 1 6 0.1 1 5 8 0.1 1 9 5 0.0 9 9 9 0.0 4 6 1 0.0 5 1 5 0.0 8 1 0 0.0 7 8因基位等13 14 15 16 17 18 19 2021因基位等7 8 9 1 0 11 12 13 14 15 16 17 1819因基位等5 7 8 9 1 0 11 12 1314南西鲁-1 0.0 0 1 3 0.0 3 5 9 0.0 0 9 1 0.2 6 7 1 0.0 0 1 5 0.3 2 4 7 0.0 0 7 9 0.0 0 9 0 0.0 9 6 8 0.0 7 2 3 0.0 2 4 0 0.1 0 6 3 0.0 0 3 5 0.0 3 7 1 0.0 0 1 2 0.0 0 2南西鲁1 0.0 0 1 7 0.2 7 3 7 0.1 4 5 6 0.1 4 4 0 0.2 2 3 7 0.1 6 6 9 0.0 3 0 3 0.0 1 4南西鲁1 0.0 1 2 7 0.2 8 3 8 0.0 9 3 3 0.2 5 8 2 0.2 1 5 5 0.1 2 2 2 1 S 1 1 D北中鲁 东鲁-7 0.0 0 2 2 0.0 0 1-6 0.0 3 4 1 0.0 5 1 4 0.0 0 7 8 0.0 1 0 1 0.2 4 8 5 0.2 7 1 2 0.0 0 1 4 0.0 0 5 4 0.2 9 1 1 0.2 5 8 4 0.0 0 7 4 0.0 1 3 9 0.0 0 4 4 0.0 0 5 6 0.1 2 9 2 0.1 1 0 2 0.0 6 4 9 0.0 6 9 3 0.0 3 8 6 0.0 3 7 9 0.1 2 5 0 0.1 2 1 9 0.0 0 4 4 0.0 0 5 0 0.0 3 7 6 0.0 3 7--7 0.0 0 3-1 3 S 3 1 7 D北中鲁 东鲁5 0.0 0 2-4 0.2 4 9 3 0.2 8 2 9 0.1 3 0 3 0.1 1 8 9 0.1 4 6 5 0.1 4 2 6 0.2 5 0 4 0.2 5 5 8 0.1 7 7 5 0.1 5 0 0 0.0 3 7 9 0.0 3 4 9 0.0 0 4 1 0.0 1 6 1 6 S 5 3 9 D北中鲁 东鲁9 0.0 0 9 8 0.0 1 0 9 0.3 0 4 3 0.2 8 2 5 0.1 1 8 1 0.0 9 4 0 0.2 5 8 1 0.2 6 6 0 0.2 0 0 4 0.2 1 2 3 0.0 9 6 6 0.1 1 5因基位等26 27 28 28.2 29 29.2 30 30.230.3 31 31.2 32 32.2 33 33.2 3434.2因基位等7 8 9 1 0 11 12 13 14因基位等8 9 1 0 11 1213南西鲁1 0.0 0 1 2 0.0 0 2 1 0.0 0 1 8 0.0 4 0 9 0.0 0 9 5 0.2 7 1 5 0.0 4 7 4 0.2 4 9 5 0.1 2 2 6 0.0 7 0 9 0.1 4 7 8 0.0 0 8 3 0.0 2 4 2 0.0 0 2-南西鲁-7 0.0 0 7 1 0.0 0 1 9 0.0 8 3 4 0.1 8 5 2 0.3 4 2 7 0.2 3 0 0 0.1 3 8 9 0.0 0 9 1 0.0 0 1南西鲁3 0.0 0 3 1 0.0 0 1 8 0.0 2 9 4 0.1 9 5 2 0.2 3 6 8 0.1 5 7 1 9 S 4 3 3 D北中鲁 东鲁--9 0.0 0 4 4 0.0 0 5 5 0.0 0 2-3 0.0 3 3 7 0.0 4 5 4 0.0 0 7 1 0.0 0 8 9 0.3 0 4 7 0.2 9 5 1 0.0 4 8 9 0.0 2 6 4 0.2 2 8 5 0.3 5 7 7 0.1 0 3 7 0.0 4 5 0 0.0 8 4 8 0.0 9 6 6 0.1 2 9 9 0.0 6 9 0 0.0 1 6 9 0.0 2 6 6 0.0 2 9 5 0.0 2 1 9 0.0 0 4-5 0.0 0 2-5 S 8 1 8 D北中鲁 东鲁2 0.0 0 1 7 0.0 0 2 1 0.0 1 1 1 0.0 1 6 7 0.0 0 3 4 0.0 0 5 7 0.0 6 6 5 0.0 5 6 9 0.1 6 7 7 0.2 1 7 6 0.3 2 9 9 0.3 1 9 3 0.2 3 8 5 0.2 2 8 4 0.1 6 5 4 0.1 3 4 3 0.0 1 2 4 0.0 1 3 7 0.0 0 3 4 0.0 0 5 1 8 S 5 1 D北中鲁 东鲁2 0.0 0 1-9 0.0 0 4-1 0.0 3 2 6 0.0 3 7 7 0.2 2 4 0 0.2 0 7 8 0.1 9 8 2 0.1 9 6 7 0.1 6 6 9 0.1 9 0因基位9 1 1 11.2 1212.2 1313.2 1414.2 1515.2 1616.217.218.2因基位6 7 8 9 1 0 11 12 13 1415因基位1 0 11 12 13 1415等等等表个常染色体基因座在山东三个文化区汉族人群中的等位基因频率分布
?
?
图1 山东三个文化区人群的系统发育树
据文献记载,山东三个文化区汉族人群的共同祖先是东夷人[1],他们的族群是中国最古老的民族之一,与中原华夏民族、南方苗蛮民族鼎足而立[14]。随着历史和时代的变迁,山东地区逐渐演变成现在的三个独特文化区域。其中,鲁中-鲁西北文化区地处内陆,主要受到泰山文化和黄河文化的影响,属于齐鲁方言区之西齐区,特色民居为台房、四合院。鲁西南-鲁南文化区亦位于山东内陆地区,受孔子“礼”文化的影响较深,属于齐鲁方言区之西鲁区,民居以四合院为主[1]。本研究中,鲁中-鲁西北与鲁西南-鲁南汉族人群之间的遗传距离最近,差异无统计学意义,且两文化区人群在系统发育树中聚为一支,可以看出两文化区人群的遗传结构较为相似。鲁东文化区位于山东半岛,三面环海,深受海洋“渔”文化的影响,属于胶东方言区(与齐鲁方言区形成对比[15]),特色民居是海带草房。自上古时代,鲁东文化区就是一个相对独立的地理单元[1],其文明早在旧石器时代晚期就已经出现,具有自己的起源和发展谱系[15-16],因而有别于内陆鲁中-鲁西北与鲁西南-鲁南文化区的原始文化。鲁东人群在三个文化区人群的系统发育树中也单独分为一支,并且与鲁中-鲁西北人群的遗传距离最远。此外,人群的迁徙和融合会影响人群的遗传结构[3]。在本研究中,鲁东与鲁西南-鲁南文化区人群之间没有明显的遗传学差异,可能是随着区域经济的发展和交通的便利,两文化区人群之间的来往和基因交流更加频繁所致,后续会继续增加各地区样本量和遗传标记以进一步验证。
综上所述,本研究获得了19个常染色体STR基因座在鲁东、鲁中-鲁西北及鲁西南-鲁南文化区汉族人群中的等位基因频率分布和群体遗传学数据,并分析了三个文化区汉族人群之间的遗传关系,为山东三个文化区基因数据库的建立、法医学应用及群体遗传学研究提供了理论基础和数据支持。