云南地区汉族群体21个常染色体短串联重复序列基因座遗传多样性及群体遗传学关系

2023-10-27 07:35苏永东万洪静陈冲霍立文
海南医学 2023年19期
关键词:基因座法医学汉族

苏永东,万洪静,陈冲,霍立文

1.重庆市合川区公安局刑警支队,重庆 401520;

2.丽江市公安司法鉴定中心,云南 丽江 674100

人类遗传多样性是人类自50 万年前起源于非洲后,在不同的自然环境、疾病困难及生活方式改变的影响下不断富集的遗传信息的总和[1]。随着人类基因组计划、千人基因组计划等全基因组测序计划的完成[2],遗传学家对不同的遗传标记的遗传多样性有了更清楚的认识,常见的遗传标记包括传统的限制性片段长度多态性、短串联重复序列、单核苷酸多态性、插入缺失遗传多样性及迷你单倍型、微单倍型[3-4]。法医学短串联重复(short tandem repeats,STR)序列是一种以2~6 bp 为基本序列的具有高度多态性的遗传标记,广泛地存在于基因组的非编码区域。作为目前法医学个体识别及亲缘关系鉴定的金标准[5],STR 检测具有技术成熟、检测自动快捷标准化、各种比对数据库建立趋于完善等优点。

云南省是我国西南地区少数民族聚集比较密集的省份,近年来法医学相关的STR遗传标记在少数民族群体中的遗传多样性及其法医学特征先后被报道(云贵地区汉族[6]、云南白族[7]、云南壮族[8]、云南傣族[8]、云南哈尼族[8]、云南苗族[9]、云南彝族[10]),但相关研究在云南汉族群体较为缺乏。本研究拟采用AGCU EX22STR荧光检测试剂盒(无锡中德美联生物技术有限公司)对云南地区大样本汉族群体的常用STR遗传多样性及群体遗传价值进行研究。

1 材料与方法

1.1 样本收集 1 418 名个体的血痕收集于云南昆明、丽江等地区的随机个体,其中男性个体1 077名,女性个体341名。所有参与者都需是本地土著居民且在样本采集之前都签订了样本采集知情同意书。本实验通过了重庆市合川区公安局物证鉴定所与云南省丽江市公安局司法鉴定中心相关的伦理审批。

1.2 DNA 提取、扩增及电泳 纳入研究样本利用ΒSD600DUET 自动打孔机(澳大利亚ΒSD Robotics公司),打孔技术采取1.2 mm 大小的样本。采用直接扩增技术检测。利用AGCU EX22 荧光检测试剂盒(无锡中德美联生物技术有限公司)扩增21个常染色体STR 基因座及性别基因座Amelogenin。DNA 扩增产物用3130xl 基因分析仪(美国AΒ 公司)进行分型。等位基因命名采用Genemapper®ID软件(美国AΒ 公司)分析。每批次实验(扩增、电泳)都采用水作为阴性对照,9947A作为阳性对照。

1.3 统计学方法 采用Power States V 1.2 软件包(美国Promega公司)计算21个常染色体STR基因座等位基因频率及相关的群体遗传学参数,包括观察值杂合度(observed heterozygosity,Ho)、个体识别率(power of discrimination,PD)、多态信息含量(polymorphism information content,PIC)和非父排除率(probability of exclusion,PE)。利用Arlequin 3.5 软件[11]计算期望杂合度(expected heterozygosity,He)、Hardy-Weinberg平衡检验及连锁分析。本研究纳入地理位置相近的早期研究—21 个群体[12-22]的遗传多样性信息,基于不同检测体系的19 个重叠基因座(D2S1338,D3S1358,D5S818,D6S1043,D7S820,D8S1179,D12S391,D13S317,D16S539,D18S51,D19S433,D21S11,CSF1PO,FGA,TH01,TPOX,vWA,Penta D和Penta E)的遗传变异信息探索云南汉族群体和相关纳入的参考群体的遗传关系。纳入群体包括两个四川汉族[8,17]、重庆汉族[22]、湖南汉族[6]、湖北汉族[19]、江西汉族[6]、广西汉族[6]、广东汉族[18]、闽南汉族[20]、闽西汉族[6]、厦门汉族[7]、云贵地区汉族[12]、新疆维吾尔族[9]、云南白族[13]、云南越南群体[21]、云南苗族[14]、云南彝族[15]、云南壮族[16]、云南傣族[16]、云南哈尼族[16]、伊犁锡伯族[10]。利用Phylip3.695软件计算群体间的Nei遗传距离。使用SPSS21.0 软件[23]进行多维尺度分析、MVSP 软件进行主成分分析、Mega7.0 软件[24]基于邻近连接法(Neighboring-Joining)进行系统发生分析。

2 结果

2.1 基因频率分布 纳入研究的1 418名无关个体在21 个常染色体STR 基因座上共检测到277 个等位基因,其频率分布为0.000 4 (D16S539)到0.528 6(vWA)。TPOX拥有最少等位基因个数7个,Penta E拥有最多等位基因个数28个,见表1。

表1 云南地区汉族人群21 个STR 基因座等位基因频率分布情况(n=1 418)Table 1 Frequency distribution of alleles of 21 STR loci in the Han population in Yunnan(n=1 418)

2.2 群体遗传学统计 经多重检验Βonferroni矫正,所有检测的21 个位点都符合Hardy-Weinberg 平衡。对21个基因座进行连锁不平衡检验,未发现连锁不平衡现象。如表2 所示,云南汉族群体中,He 为0.617 0~0.915 1,Ho为0.607 9~0.914 0,PIC为0.555 6~0.908 6,PD 为0.793 9~0.986 1,PE 为0.300 5~0.824 0,研究基因座在云南汉族群体中的累积匹配概率为7.335 4×10-26,累积非父排除率为0.999 999 993,累积个体识别能力为0.999 999 999 999 999 999 999 93。

表2 云南地区汉族群体21个常染色体STR遗传标记法医学相关参数Table 2 Forensic parameters related to 21 autosomal STR genetic markers in Han population in Yunnan

2.3 Nei 遗传距离及多维尺度分析 东亚地区群体起源、进化、迁移及混杂历史复杂,中国目前拥有56 个官方认可的少数民族。本研究基于不同试剂盒之间重叠的19个STR基因座的遗传多样性信息,探索了云南汉族群体和21个周边相关群体的遗传关系。图1 显示,云南汉族与四川汉族(0.001 0 和0.004 9)、云南白族(0.004 7)、云贵地区汉族群体(0.001 9)有较小的Nei遗传距离,但同云南苗族有较大的Nei遗传距离(0.080 9)。图2显示,云南汉族群体和其他纳入群体比较的汉族群体紧密聚集在一起位于正中央,新疆维吾尔族群体和伊利锡伯族群体位于左上角,越南苗族和云南越南群体位于右上角,云南的其他少数民族位于正下方。

图1 云南汉族群体与21个周边相关群体之间的Nei遗传距离热图Figure 1 Heat map of Nei genetic distance between Yunnan Han population and 21 neighboring related populations

图2 云南汉族群体与21个参考群体多维尺度分析Figure 2 Multidimensional scale analysis of Han population and 21 reference groups in Yunnan

2.4 主成分分析及系统发生重建 本研究提取了第一成分(50.153%)和第二成分(16.249%)探索云南汉族和其他21 个群体的遗传结构相似性(图3)。如主成分分析结果显示,第一成分明显地将云南苗族和云南居住的越南群体与其他20 个群体区分开。第二成分可以清楚地将新疆的维吾尔族群体和锡伯族群体与其他群体区分开,同时也能将云南傣族及壮族群体与其他群体区分开。云南汉族与邻近汉族群体(如重庆汉族、四川汉族、云贵汉族)紧密聚集在一起。从图4可知,云南苗族和云南越南群体聚成一支,其他20 个群体聚集在另一支。本研究群体首先同厦门汉族群体聚在一起,随后相继同四川汉族和云贵汉族群体聚集在一起。整体群体分布规律同上述多维尺度分析、主成分分析结果一致。

图3 云南汉族群体与21个参考群体主成分分析Figure 3 Principal component analysis of Yunnan Han population and 21 reference populations

图4 云南汉族群体与21个参考群体系统发生重建Figure 4 Systematic reconstruction of the Yunan Han population and 21 reference groups

3 讨论

东亚地区人群起源迁移复杂,近年来一直是考古学、语言学、人类学及法医学探索的热点地区[25-29],这里有适应高原的藏族群体,也有人口数量超过13亿的全球最大群体—汉族群体。本研究利用AGCU EX22试剂盒在1 418名云南地区无关汉族个体中共检测出21个STR 基因座、277 个等位基因。21 个基因座均具有较高的杂合性和足够的PD和PE。该复合扩增体系可应用于云南汉族人群进行个体识别和三联体亲子鉴定。

在云南汉族群体的21 个STR 基因座频率分布同21个地理位置相近的群体比较中,Nei遗传距离分布、多维尺度分析、主成分分析及系统发生重建揭露出云南汉族群体与周围四川汉族、云贵地区汉族群体拥有较近的遗传关系,与本地少数民族中的彝族亦拥有较近的遗传关系,如同云南白族(0.004 7)。本研究基于常染色体遗传标记基因多样性揭示了中国不同地区的汉族群体和少数名族群体的遗传关系与其他基于性染色体遗传标记多态性研究的群体遗传关系一致[30-33]。整体上中国不同地区的汉族群体具有极强的基因相似性,汉族群体同多数少数民族还存在极大的遗传结构差异,如苗族和维吾尔族群体,需要注重相关群体的群体数据库的建立。

本研究观察了云南汉族群体21 个常染色体STR遗传标记的遗传多样性及群体遗传关系,为建立云南地区汉族群体基础数据提供依据。法医学特征分析结构显示,21个STR基因座在云南地区表现出很高的多态信息含量和遗传多样性,研究位点适合该地区汉族群体的个体识别及亲缘关系鉴定的法医学实践需求。Nei遗传距离、多维尺度分析、主成分分析及系统发生重建的结果显示,云南汉族群体与四川汉族、云贵地区汉族群体有着较近的遗传关系,同新疆维吾尔族群体有着相对较远的遗传关系。

猜你喜欢
基因座法医学汉族
国清荣
54例鼻骨骨折诊断的法医学鉴定分析
听觉诱发电位在法医学上的应用价值
Study on Local Financial Supervision Right and Regulation Countermeasures
改成汉族的满族人
DXS101基因座稀有等位基因的确认1例
临夏回族自治州撒拉族人群15个STR基因座遗传多态性
DYF387S1基因座分型异常现象
国家视野中的河湟汉族
腰椎外伤并椎体血管瘤法医学鉴定1例