苏州市吴江地区人群Y染色体STR和SNP的遗传结构分析

2019-09-19 01:03吴泽陈天发曾志凡张义为汤真苏开元范辰韵李士林
法医学杂志 2019年4期
关键词:基因座吴江家系

吴泽,陈天发,曾志凡,张义为,汤真,苏开元,范辰韵,李士林

(1.复旦大学生命科学学院,上海 200438;2.苏州市吴江区公安局,江苏 苏州 215200)

Y染色体遗传标记由于其父系遗传的特点,在法医学个体识别、混合样本鉴定、家系溯源等方面应用广泛[1],其中又以Y染色体短串联重复(Y chromosome short tandem repeat,Y-STR)序列和Y染色体单核苷酸多态性(Y chromosome single nucleotide polymorphism,Y-SNP)应用最为广泛。Y-SNP与Y-STR相比具有极低的突变率(约为3.0×10-8)[2],并且基本不会出现回复突变。精确的Y-SNP单倍群可以对应到一个或几个Y-STR单倍型,即对应到一个或数个家系,相对于分布着大量Y-STR单倍型、只能依靠基因座遗传频率排序归类进行大海捞针式的粗糙数据处理的人群来说,自有排序体系的Y-SNP单倍群分类系统更为直观简便,对于数据库体系的构建也有着更为重要的价值。

目前基于Y-STR单倍型建立的数据库系统中,由于筛选了部分高突变STR遗传标记,来自不同祖先的汉族男性个体Y-STR单倍型可能与其他汉族男性个体Y-STR单倍型一致,或者存在1~3个STR位点基因型不同,那么,仅利用Y-STR单倍型数据进行家系排查及确定案件侦查方向时,就会存在很多的假阳性结果。对基于Y-STR单倍型的数据库,通过加入家系特异性SNP遗传标记,可以更科学准确地定位现场嫌疑人的相关男性家系,从而使Y染色体数据库成为功能更强大的侦破工具。

考虑到上述Y-STR和Y-SNP遗传标记各自的特点以及Y-SNP单倍群的家系特异性和区域特异性,在构建特定地区的Y染色体数据库时,需要联合考虑区域人群的Y-STR和Y-SNP,并分析家系特异性的核心单倍群和区域特异性的遗传结构。本研究对苏州吴江地区(横扇镇、平望镇和七都镇)472名汉族男性个体进行Y-STR分型、Y-SNP推断和实验验证,并联系Y-STR单倍型和Y-SNP核心家系单倍群,进一步分析其乡镇人群的遗传结构,为实现精确的家系溯源提供理论支持,为该地区Y染色体数据库的建设奠定理论基础。

1 材料与方法

1.1 样本

随机采集472名苏州市吴江地区(横扇镇、平望镇和七都镇)汉族男性个体的末梢血样本,保存于FTA采血卡(英国Whatman公司)。样本采集遵照知情同意原则。

1.2 试剂与仪器

YfilerTMPlus PCR扩增试剂盒、甲酰胺(Hi-DiTM)、分子量内标GeneScanTM500 LIZTM均购自美国Thermo Fisher Scientific公司,分子量内标QD550购自阅微基因技术有限公司,9700型PCR仪、3500xL基因分析仪均购自美国AB公司。

1.3 PCR扩增

按照YfilerTMPlus PCR扩增试剂盒说明书,对472份血卡采用直接扩增法在9700型PCR仪上进行扩增。反应体系为 10 μL,包含引物 4 μL、PCR Mix 2μL、ddH2O 4μL。血卡打孔直径1.2mm。PCR程序:95℃变性1 min;94℃ 4 s,61.5℃ 1 min,60℃22min,共30个循环;60℃延伸22min;4℃保存。

1.4 电泳与分型检测

按照甲酰胺(Hi-DiTM)1 000 μL+GeneScanTM500 LIZTM标准品20μL配制混合液,分装时每孔加入8μL混合液和1μL PCR产物,在3500xL基因分析仪上进行毛细管电泳检测。使用GeneMapper ID-X v1.2软件进行基因分型。

1.5 数据分析

用直接计算法计算各基因座的等位基因频率和单倍型频率,基因多样性(gene diversity,GD)和单倍型多样性(haplotype diversity,HD)的计算公式如下:

其中n为样本数,pi为等位基因频率或单倍型频率。

用本实验室开发的Y-Predictor软件(待发表),根据27个Y-STR数据推测各样本的Y-SNP单倍群。Y-Predictor的数据库是由本实验室在千人基因组计划Ⅲ期中筛选分析东亚地区Y-SNP和对应的YSTR得到的数据,根据Y-SNP单倍群构建系统发生树,一个样本的Y-STR单倍型可以通过其所属的YSNP单倍群追溯到系统发生树具体的支上。通过计算待测样本的Y-STR单倍型与数据库中已有的YSTR单倍型之间的遗传距离,就能够判断其在系统发生树上的位置[3]。两个Y-STR单倍型遗传距离(d)的计算公式[4]如下:

其中n为参与计算的Y-STR基因座数目,ai为待测样本A第i个Y-STR基因座的等位基因的数值,bi为已知样本B第i个Y-STR基因座的等位基因的数值,mi为第i个Y-STR基因座的突变速率。根据待测样本与数据库中每一个已知样本之间的遗传距离,通过加权算法可以推测出与该样本最接近的3个Y-SNP单倍群。

对于推测的结果:若同一样本的3个结果来自相同的Y-SNP大支,且权重合计大于80%,则认为推测结果准确;若推测结果距离较远或权重过低,则认为推测结果不准确。

1.6 Y-SNP实验验证

为了验证Y-Predictor软件推测的Y-SNP单倍群是否准确,通过扩增阻滞突变系统聚合酶链反应(amplification refractory mutation system-polymerase chain reaction,ARMS-PCR)对吴江地区427名汉族男性样本的E-M96、D-JST021355、N-M231、C-M130、OP186、O1-M119、O2-M122、O1b-M268、O1b2-M176、O2a1-KL1、O2a2b1a1-M117(Page23)、O2a2a1a2-M7、O2a2b-P164、N1a1-M46、D1a1a1-N1、O2a2-P201、D1a2a-P47、C2-M217、I-M170、IJ-M429、K-M9、QRM45、G-M201M201、IJKLT-M522共24个SNP位点进行检验。反应体系为 25 μL,包含引物 5 μL、Master Mix 10μL、ddH2O 10μL。PCR条件:95℃变性5min;94℃ 20s,59℃ 90s,共30个循环;60℃延伸60min;4℃保存。按照甲酰胺(Hi-DiTM)1000μL+分子量内标QD550 30 μL配制混合液,分装时每孔加入8 μL混合液和1μL PCR产物,在3500xL基因分析仪上进行毛细管电泳检测。使用GeneMapper ID-X v1.2软件进行基因分型。

2 结 果

苏州市吴江地区472名汉族男性人群27个Y-STR基因座的等位基因频率分布见表1。472名汉族男性样本中,共检出453种单倍型,其中435种单倍型出现1次、17种出现2次、1种出现3次,人群的HD值为0.997 696 93。除DYS385a/b和DYF387S1a/b以外的23个Y-STR基因座共检出等位基因182种,各基因座检出4~16个等位基因,频率分布在0.002 1~0.809 3。DYS385a/b基因座共检出42种单倍型,频率分布在0.0021~0.1695。DYF387S1a/b基因座共检出36种单倍型,频率分布在0.0021~0.0890。

表1 苏州市吴江地区汉族男性人群27个Y-STR基因座的等位基因频率 (n=472)

续表1

27个Y-STR位点的GD值见表2,范围在0.3218~0.9531。其中DYF387S1a/b的GD值最高(0.9531),其次是 DYS385a/b(0.9478)、DYS449(0.8584)和 DYS627(0.844 7)。DYS438的GD值最低(0.321 8),其次是DYS391(0.4075)、DYS437(0.4536)和 DYS533(0.4704),除此4个基因座外,其余基因座的GD值均大于0.5。

表2 苏州市吴江地区汉族男性人群27个Y-STR基因座的GD值 (n=472)

采用Y-Predictor软件根据吴江地区472名汉族男性个体27个Y-STR数据推测其各自的Y-SNP单倍群,得到来自C、D、N、O和Q等单倍群下游的132种不同的单倍群,其中推测结果准确的有352个,分布如表3所示。

表3 吴江地区3个镇区人群的Y-SNP核心单倍群(个)

从表3可以看出:在推测结果准确的352个个体中,214名个体来自O1和O2单倍群分支,超过总人数的60%,统计加入Oα、Oβ和Oγ单倍群时达291人(82.67%);O单倍群的比例在79.74%(平望镇)至86.75%(横扇镇),在横扇镇和七都镇占比超过80%,其中除O2在横扇镇(31.33%)占最高比例以外,其余两镇中均为O1占比最高,分别为35.29%(平望镇)和43.97%(七都镇)。此外,Oα、Oβ和Oγ单倍群在各镇区中也占18.97%(七都镇)至28.92%(横扇镇),而C单倍群的比例在3.61%(横扇镇)至15.03%(平望镇),N单倍群的比例在4.58%(平望镇)至7.76%(七都镇),而D和Q单倍群占比在0.00%~3.61%。

为了验证软件推测的Y-SNP结果的准确性,对认定为推测准确的352个样本和推测不准确的120个样本分别进行了ARMS-PCR实验验证。352个认定为推测准确的样本,其实验结果的单倍群大支与推测结果完全一致,表明按照本筛选标准得到的软件推测结果较为可靠;认定为推测不准确的120个样本中,41个样本的分型结果属于O2a1,20个样本属于O1b,1个样本属于D1a1,有58个样本在IJK单倍群下游不能细分,需要进一步检测更多SNP位点。图1展示了两个认定为推测不准确样本的分型结果,其中:图1A样本的推测结果为C2b1但权重不足10%,其分型结果为O2a1;图1B样本的推测结果为D1a1或C2b1,分型结果验证其为D1a1。

图1 两个认定为推测不准确样本的ARMS-PCR检测结果

在3个镇区人群中,O1a1a1a1a*-F794是其共有的核心单倍群,聚类了67个不同家系的Y-STR单倍型(横扇镇10个、平望镇28个、七都镇29个),与其邻近的O1a1a1a1*-SK1567也有来自平望镇(12个)和七都镇(9个)的21个家系。此外,平望镇另有来自O1a1a1a1a*-F4149、O1a1a1a1a1-F707等9个O1下游单倍群的14个家系,七都镇另有来自O1a1a1a1*-SK1527、O1b1a2a1-F977等8个O1下游单倍群的13个家系,构成各自区域的核心单倍群和核心家系;横扇镇则有来自O2a2a1a2a1c1-F863、O2a1c1b1a12*-F806、O2a2a2a*-F2216等17个O2下游单倍群的26个家系,构成其核心单倍群和核心家系。

根据横扇镇O2单倍群样本绘制网络图(图2),可以看到相同单倍群的家系聚集成簇,而簇又大致形成距离较远的两个大簇,聚集成大簇的家系基本属于相近的单倍群。

图2 横扇镇O2单倍群27个Y-STR的网络图

3 讨 论

吴江古时为苏州府吴江县,以吴江(现吴淞江)为名,始建于后梁开平三年(公元909年),吴江地处南北漕运走廊,大运河穿过松陵镇,水系发达的平望则是连接周边的交通枢纽,发达的丝绸产业吸引大量外来人口至此从事缫丝、纺经和往来贸易,使得这些商业发达的镇区有了频繁的人群流动[5]。而比邻太湖的横扇、七都等镇由于其充沛的水源和肥沃的土地,主要以发展渔业和农业为主,人群一般世代在本地聚居,形成了相对固定的本地主要家系[6]。对于这样群体结构相对复杂的地区,家系遗传结构的具体分析在数据库建设中显得尤为重要。

Y-SNP突变具有迭代累加的特性,比如当某个父亲Y染色体上某个SNP位点发生了A突变,那么他的所有男性后代的Y染色体上都会出现A这种突变。如果这群人中的某个人的另一个SNP位点出现了B突变,那么这个人的男性后代就会同时出现A和B两种突变,故根据Y-SNP位点突变基因型可以定位男性家系的特异性遗传标记[7]。

除了家系特异性以外,由于人类走出非洲后形成了不同的迁徙路线[8],Y-SNP单倍群在地域上也有着鲜明的特异性分布。在东亚地区最为常见的单倍群C、D、N、O中,C主要出现在北亚、东亚、大洋洲和美洲人群[9-10],D则只出现在亚洲,尤其是中国西藏和日本[10-12],N 广泛分布于亚欧大陆[7,13],而东亚地区人群80%~90%都属于单倍群O[14-18]。

本研究在苏州市吴江地区获取了472名橫扇镇、平望镇及七都镇本地随机男性样本的完整27个YSTR基因型。为提高Y-STR技术的群体溯源和家系排查能力,本研究在Y-STR结果的基础上,利用YPredictor软件和ARMS-PCR技术,引入Y-SNP遗传标记对家系进行进一步细分,结果表明,C、D、N、O和Q单倍群在3个镇区人群中均有分布但差异明显,其中以O单倍群为主(占总体82.67%),与东亚人群的分布[2,7-8]基本相符合,而D和Q单倍群则分布极少。这一方面是由于此类单倍群人群在当地本身不多,另一方面则是因为Y-Predictor软件对吴江地区人群中推测为此类单倍群的样本给出了不同的推测结果或较低的可信程度,因此许多样本被认定为推断不准确,在进一步的实验验证过程中,发现了1例来自D1a1单倍群的样本,对于其他无法细分的样本则需要检测更多SNP位点以确认其具体单倍群。

根据Y-STR和Y-SNP的结果来看,横扇镇的人群结构可划分为两个主要的单倍群。由于横扇镇比邻太湖,从明清开始就形成了发达的捕鱼业,且地处太湖冲积平原,气候和土地条件适宜耕作。据《乾隆震泽县志》记载,横扇人群主要为渔民、农民聚居,人员流动较少,因此形成了较为稳定的本地家系。而清道光年间,有难民自河南逃难至此,于太湖以南的滩涂围垦湖田,由于此处天然肥沃的土地和充沛的水源,便成功以务农在此定居[19]。因此,距离较远的另一簇样本则很可能与此次人群迁徙有关。因此本地世居从事渔农的人群和外来逃难、务农定居的人群共同组成了如今的横扇群体。

综上所述,本研究利用Y-STR复合Y-SNP研究,对乡镇级别区域人群的遗传结构进行了分析,得到了区域核心单倍型和核心家系。本研究方法和数据适用于法医学实践中的亲权鉴定和家系溯源,为公安系统重点人群监控和实际案件中精确个体识别提供了科学依据和技术手段,为建设具有吴江地区特色的Y染色体数据库提供了理论依据和数据支持。

猜你喜欢
基因座吴江家系
加州鲈“遇冷”!端午节后市场疲软,吴江大量出鱼冲击多地市场
发育性癫痫性脑病75型家系的遗传学分析
广东肇庆汉族人群20个STR基因座遗传多态性
多拷贝Y-STR基因座在法庭科学领域的研究
娘做的面
娘做的面
马氏珠母贝红色闭壳肌F1代的家系选育及家系评定
一个非综合征型聋家系的分子病因学研究
两个雄激素不敏感综合征家系中AR基因突变检测
PowerPlex21系统在亲子鉴定中的应用评估