基于基因组SNP和ROH的剑白香猪群体遗传结构解析

2023-10-29 04:34胡紫平王立刚宗文成侯任达苏艳芳牛乃琪王立贤张龙超
畜牧兽医学报 2023年10期
关键词:亲缘公猪基因组

胡紫平,王立刚,宗文成,侯任达,苏艳芳,牛乃琪,王立贤,王 源,张龙超*

(1.中国农业科学院北京畜牧兽医研究所,北京 100193;2.青岛农业大学动物科技学院,青岛 266109)

中国是世界上地方猪品种遗传资源最丰富的国家之一[1]。许多中国地方猪种有着自己独特的特点,如产仔数高[2]、抗病力强[3]及抗逆性强[4]等。但是由于商品猪种的引入,导致本土猪品种的生存空间减少,许多本土猪品种的数量和群体规模都急剧下降,遗传资源濒临灭绝[5]。因此,评估本土猪种的遗传多样性和群体结构势在必行,以开发基于基因的选择工具和品种保护。随着单核苷酸多态性(single nucleotide polymorphism,SNP)芯片和重测序技术的发展,可以分析个体的基因型信息[6],构建个体或群体间的遗传关系,这极大的帮助了中国本土猪种选育和保种工作。近年来,基于SNP芯片和重测序数据分析,对金华猪[7]、宁乡猪[8]、江曲海猪[9]、安庆六白猪[10]和莱芜猪[11]等一些品种进行了遗传多样性和群体结构的研究,有助于推动遗传资源的研究和保护。Wang等[12]对江西省3个地方品种东乡斑点猪、萍乡两头乌、玉山黑猪的研究发现,东乡斑点猪和玉山黑猪最近经历了严重的近亲繁殖。这两个品种显示出较大的纯合度值,连锁不平衡的长程范围和观察到的杂合度降低。相比之下,萍乡两头乌遗传多样性丰富,近交个体少。Meng等[13]利用全基因组SNP芯片数据分析闽猪保守种群的遗传结构发现,闽猪保护种群的遗传多样性水平不足,近5代中,保守种群近亲繁殖程度显著提高,有效种群含量大幅下降。由于欧洲商品猪种的渗入,以及育种过程的不科学,有必要构建闽猪核心保护种群的分子谱系。

剑白香猪是我国珍贵的猪品种遗传资源,原产于贵州省黔东南苗族侗族自治州剑河县,是小型猪的代表猪种[14]。剑白香猪头部、尾部为黑色,中间白色,称之为两头乌;耳尖下垂、腹部微凹,四肢短小,总体体型矮小,故而当地又称之为萝卜猪[14]。剑白香猪具有肉质细嫩,肉香味美的特点[15],是我国重要的遗传资源之一。受非洲猪瘟影响,剑白香猪能繁母猪的规模从2018年以前的500头以上迅速锐减至如今的150头以下,种业安全受到极大威胁。并且,对于剑白香猪当前群体结构的研究尚未见报道。因此,本研究利用SNP芯片信息,对剑白香猪当前群体的遗传多样性和群体结构进行解析,以便掌握剑白香猪群体的遗传现状,为剑白香猪种质资源保护提供理论依据,也为剑白香猪的种业安全和群体复壮提供重要的数据支持。

1 材料与方法

1.1 试验材料

以贵州省黔东南苗族侗族自治县南寨镇、柳川镇、岑松镇和磻溪镇养殖户养殖的138头剑白香猪(母猪119头,公猪19头)为研究对象,采集耳组织样本并放入冷冻保存管中,后迅速放入-20 ℃冰箱中保存,用“苯酚-氯仿法”提取样品DNA。

1.2 基因分型和质量控制

利用Porcine SNP50 BeadChip(Illumina, United States)芯片对138个剑白香猪DNA样品进行全基因组SNPs检测,累计得到50 697个SNPs用于后续分析。使用plink(v1.90)进行SNP数据质量控制,质控标准如下:剔除个体缺失率>10%的个体;剔除SNP缺失率>10%的个体;剔除最小等位基因频率<5%的个体;剔除性染色体上的SNPs。质控后共获得了137个剑白香猪个体的基因型数据,得到19 518个SNPs用于后续分析。

1.3 方法

1.3.1 主成分回归分析 PCA(principal component analysis,PCA)又称主成分回归分析或主分量分析, 在统计学中采用降维思想, 将多变量转化为少数几个综合变量, 能够简化数据集, 在多元统计分析中是一种重要的统计方法, 选出主成分以有效利用大量数据并降低工作量[16]。所谓主成分就是通过原始变量的线性组合形成的数个综合指标。目前,PCA已广泛应用于畜牧业,已成为研究畜禽品种分类、来源和进化、选育以及各种生产性能的重要工具。使用GCTA(v1.93)来计算剑白香猪的前10个主成分,然后使用前两个主成分用R(v4.2)脚本来构建散点图。

1.3.2 遗传距离分析 遗传距离是一个物种之间或种群之间的遗传差异的程度,它是由不同个体从共同祖先分化的时间和程度决定的。IBS全称Identity By State, 又叫做状态一致,指两个或两个以上的个体具有相同的等位基因序列,IBS遗传距离可以衡量群体内个体间的相似性,评价彼此的亲缘关系[17]。IBS只考虑个体之间遗传标记或等位基因的相似性,而不管他们是否来自同一祖先。因此,不需要亲本基因分型。基于IBS的遗传距离仍然可以在没有谱系或祖先样本信息的情况下分析群体的遗传关系。使用plink(v1.90)来计算IBS距离,并使用R(v4.2)脚本来构建热图。

1.3.3 亲缘关系分析 亲缘关系是指两特定材料的遗传相似度与任意材料之间的遗传相似度的相对值。其不仅是评价种群遗传结构的关键参数,也是育种中选择和品种保护的依据。本研究基于SNPs芯片数据,利用plink(v1.90)、GCTA(v1.93)构建亲缘关系矩阵(G矩阵)。结果利用R(v4.2)可视化。

1.3.4 系统发育分析 雄性个体是保护种群谱系构建的主要载体。因此,对雄性个体进行系统发育分析,并确定它们之间的亲属关系。按照选育原则,在种群遗传育种过程中三代不相关,按个体间的亲缘系数小于0.062 5的标准划分家系。使用plink(v1.90)计算IBD值,基于邻接法,使用MEGA(v11.0)软件对公猪个体进行进化树的构建。

1.3.5 ROH分析 通过plink(v 1. 90)软件检测基因组上出现的一定数量和密度SNPs表现为纯合的区域,即为连续性纯合片段(ROH)。主要参数如下:20个SNPs的滑动窗口沿染色体滑动、每个滑动窗口的杂合子个数不超过1个、最小长度>500 kb、两个SNPs最大间隔1 000 kb、SNP个数/ROH>30、最小SNP密度>100 kb/SNP[18]。然后用R(v4.2)基于ROH计算近交系数(FROH),基于ROH从基因组数据测量纯合度定义为ROH覆盖的基因组总长度除以SNP或序列覆盖的基因组总长度,如下所示[19]:

式中,∑LROH为一个个体中检测到的所有ROH的总长度之和,LAUTO为常染色体基因组总长度。

2 结 果

2.1 主成分分析

剑白香猪群体的主成分分析是利用GCTA计算,PCA图(图1)则用计算结果的第一个主成分和第二个主成分绘制。从图中可以看出,剑白香猪群体的个体有较好的分散,大致可以划分为3个部分,主要原因是由于样本采自几个不同的场区;分析中PC1和PC2主成分可以解释的遗传变异分别为11.90%和7.95%。19头种公猪未见明显聚集,这表明剑白香猪群体结构无明显分层。

图1 剑白香猪PCA分析结果Fig.1 PCA analysis results of Jianbai Xiang pig

2.2 遗传距离和亲缘关系分析

基于IBS值计算剑白香猪个体间的遗传距离(1-Dst)和亲缘系数,构建遗传距离矩阵和亲缘关系(G)矩阵,并可视化(图2和图3)。结果显示,群体内个体间的遗传距离范围为0.000 02~0.355 37,平均值为0.273 0±0.015 8,证明该群体大部分个体间的遗传距离较大(图2中偏红及深红的方格),少数个体的遗传距离较近(图2中偏白的方格)。大部分的剑白香猪个体间的亲缘关系程度中等(图3中偏蓝的方格),小部分个体间的亲缘关系较近(图3中偏白及偏黄的部分)。IBS距离矩阵和G矩阵的结果表明部分个体存在近交风险,配种时需注意近交情况的出现。

图中每一个小方格代表第一个到最后一个个体两两之间的遗传距离,该值越大(即两个个体的遗传距离越大)小方格越接近红色,反之越接近黄色 Each small square in the figure represents the genetic distance between two individuals from the first to the last one. The larger the value (the greater the genetic distance between the two individuals), the closer the squares are to red, and the closer the genetic distance between the two individuals is to yellow图2 遗传距离矩阵可视化结果Fig.2 Visualization results of genetic distance matrix

图中每一个方格代表第一个到最后一个个体两两之间的亲缘关系值,该值越大越接近橙色,反之越接近蓝色Each square in the figure represents the value of the relationship between the two individuals from the first to the last one. The larger the value, the closer it is to orange, and vice versa图3 亲缘关系G矩阵可视化结果Fig.3 Visualization results of genetic relationship G matrix

2.3 基于剑白香猪公猪的进化树分析

基于19头剑白香猪公猪的遗传距离用plink(v1.90)及MEGA(v11.0)软件进行聚类分析,并采用邻接法构建系统发育树,分析剑白香猪群体中公猪的家系结构。以亲缘系数为0.062 5作为划分家系的阈值。阈值的设置是基于不同的公猪血统其3代内没有亲缘关系,若3代内有亲缘关系即为近交个体,其近交系数为0.031 25;若个体间没有近交,其近交系数至少应为0.031 25,那么亲缘系数应小于0.062 5[20]。结果如图4所示,19头公猪共划分为4个家系,每个家系内的公猪数量不等,从左至右分别为2、5、3、9个。

图中数字代表公猪样品编号,红线代表亲缘系数值为0.062 5The numbers in the figure represent the number of the boar sample, the red line represents a coefficient of affinity value of 0.062 5图4 19头公猪遗传距离聚类图Fig.4 Clustering diagram of genetic distance of 19 boars

2.4 ROH分析

ROH长度和频率可反映群体历史。ROH越长表示亲缘关系越近,长的ROH片段越多表明家系内存在近交的可能性越高。从全基因组水平对剑白香猪群体进行ROH分析,137头剑白香猪共检测到了2 893个ROHs,个体ROH的平均长度约为7.18 Mb;所有ROHs的范围在0.92~86.86 Mb之间,主要集中在0.9~5.0 Mb之间(占58.17%)(图5A);从染色体上分析,ROH集中分布较为平均,其中14号染色体的ROH数量最多,为268个,占9.26%,此外,未在18号染色体上检测到ROH(图5B)。对剑白香猪个体分析,个体ROH数量在5~38个之间(图5C),剑白香猪个体ROH的总长度分布在11.79~458.75 Mb之间,平均ROH总长度约为151.63 Mb(图5D)。基于FROH的结果表明,剑白香猪群体平均近交系数为0.27%。

3 讨 论

本研究基于SNP芯片基因型数据,依次通过PCA、遗传距离矩阵、G矩阵、NJ聚类,对该剑白香猪群体进行了群体结构分析。本试验从4个方面分析了剑白香猪的群体结构,从主成分分析中可以看出剑白香猪群体是一个没有明显分层的群体。群体内个体间的遗传距离范围在0.000 02~0.355 37之间。剑白香猪遗传距离的平均值约为0.273 0±0.015 8,高于丫杈猪和青峪猪,低于蓝塘猪和马身猪,分别是0.259 5±0.028 8、0.260 4±0.025 2、0.284 2±0.046 5和0.332 6±0.033 9[21-24],这表明剑白香猪群体具有中等的遗传距离,但部分个体具有较近的亲缘关系。公猪对于一个群体的繁衍十分重要,家系的划分都是以公猪为主,若某个群体的公猪只有一个家系,随着世代的增加和闭锁繁育,会导致近交系数增大,种群的多样性下降[17],进而导致种群出现衰退严重甚至面临灭绝。本试验结合遗传距离将19头剑白香猪公猪分为4个家系,以亲缘系数0.062 5作为划分家系的阈值,划分的标准是三代以内无近交,即近交系数小于0.031 25,亲缘关系大于0.062 5。

目前,ROH已经成为评估种群近亲繁殖的常用方法[25-26],不同长度ROH片段可以分别区分古代和近代的近亲繁殖历史[27]。ROH普遍存在于受选择强度密集的基因组区域内,一般来说,选择强度大的品种具有更长、更多的ROH[28]。中国猪的平均ROH长度差异很大,从金华猪的最低值4.11 Mb到滇南小耳猪的最大值168 Mb[12,29]。本研究中,剑白香猪的ROH平均值为7.18 Mb。与其他品种相比,闽猪的ROH平均值为9.31 Mb[13]、通城猪为23.71 Mb[20],剑白香猪的ROH处于较低水平,可能存在较远世代的近亲交配。

本研究所得的近交系数是基于ROH片段计算出的近交系数,相对基于其他类型的基因组或系谱信息所得出的近交系数更为可靠[30]。此次研究中剑白香猪群体的平均近交系数值为0.27%。Wang等[31]在研究里岔黑猪的遗传多样性时,计算其群体平均近交系数为0.11[31];Yuan等[32]研究通城猪的遗传多样性时,排除了兄弟姐妹对FROH的影响并计算出对于41个没有同胞个体的FROH为0.04%[32];Liu等[33]分析梁山猪的种群遗传结构,基于ROH计算的近交系数显示,全种群的平均值为0.026;戴丽荷等[34]在利用SNP标记研究淳安花猪群体时平均近交系数值为0.199。本研究中剑白香猪的近交系数处于中等偏低的水平,表明该剑白香猪群体的遗传多样性较高。

4 结 论

本研究使用Porcine SNP50 BeadChip(Illumina, United States)芯片对138个剑白香猪样本进行基因分型,首先利用PCA分析大致了解该群体的遗传结构,分析结果表明群体内的个体有较好的分散,公猪未见明显的聚集;IBS遗传距离分析以及基于G矩阵的亲缘关系分析结果显示剑白香猪群体的遗传距离和亲缘关系中等;NJ聚类分析将19头公畜划分为4个家系,家系之间不存在重复出现的个体。基于ROH分析,该剑白香猪群体的平均ROH长度和FROH处于较低水平,表明群体内最近较少出现近亲交配的现象;FROH处于较低水平,表明该剑白香猪群体的遗传多样性较丰富。

猜你喜欢
亲缘公猪基因组
谷子近缘野生种的亲缘关系及其利用研究
《全国优秀公猪站》手册2022 版征集
《全国优秀公猪站》手册2022 版征集
中国医学科学院药用植物研究所药用植物亲缘学研究中心
牛参考基因组中发现被忽视基因
《全国优秀公猪站》手册(二)
菊科药用植物遗传多样性及亲缘关系的ISSR分析
PIC-408系列采用育种技术控制公猪异味
小白菜种质遗传多样性与亲缘关系的SRAP 和SSR分析
基因组DNA甲基化及组蛋白甲基化