师睿,张毅,王雅春,黄涛,卢国昌,岳涛,卢振西,黄锡霞,卫新璞,冯书堂,陈军,乌兰·卡格德尔,茹先古丽·阿不力孜,努尔胡马尔·木合塔尔
研究报告
利用SNP芯片信息评估新疆近交牛基因组纯合度
师睿1,张毅1,王雅春1,黄涛2,卢国昌3,岳涛4,卢振西3,黄锡霞5,卫新璞6,冯书堂7,陈军8,乌兰·卡格德尔8,茹先古丽·阿不力孜8,努尔胡马尔·木合塔尔8
1. 中国农业大学动物科技学院,农业农村部动物遗传育种与繁殖(家畜)重点实验室,畜禽育种国家工程实验室,北京 100193 2. 新疆石河子大学动物科学技术学院,石河子 832000 3. 新疆锦盛旺农业科技有限公司,塔城 834700 4. 新疆塔城地区畜牧科技研究推广中心,塔城 834700 5. 新疆农业大学动物科学学院,乌鲁木齐 830052 6. 新疆呼图壁种牛场有限公司,昌吉 831100 7. 中国农业科学院北京畜牧兽医研究所,北京 100193 8. 新疆维吾尔自治区畜牧总站,乌鲁木齐 830009
新疆近交牛是经45年近亲繁育形成的近交群体,但由于繁育记录缺失,其原始亲本品种未知。为了明确新疆近交牛的遗传背景,并探索利用基因组信息评价牛群近交水平的可行性,本研究利用该群体及荷斯坦牛、新疆褐牛和哈萨克牛等16个国内外牛品种的SNP芯片数据,应用主成分分析和Admixture方法对塔城地区新疆近交牛的群体结构进行分析;通过进一步计算新疆近交牛、荷斯坦牛、新疆褐牛和哈萨克牛的群体遗传学参数以及基因组近交指标评估各群体近交程度;结合新疆近交牛的体型分类和基因组近交指标信息,探讨了个体近交程度与体型表现的关系;最后,基于对新疆近交牛和哈萨克牛高频长纯合片段区域的筛选,鉴定了新疆近交牛基因组特征区域。研究结果显示,新疆近交牛的遗传背景与哈萨克牛基本一致,近交牛基因组纯合程度明显高于其他群体,且基因纯合率越高的近交牛其体型越小,在一定程度上呈现了近交衰退对体型的影响。本研究还鉴定到与新疆近交牛基因组特征区域相关的6个基本生物学通路以及与重要经济性状相关的32个数量基因座(quantitative trait loci, QTL)。本研究结果为新疆近交牛这一特殊遗传资源的育种规划及未来该群体的开发利用提供了科学依据。
新疆近交牛;群体结构;基因组近交;长纯合片段
近交群体的形成是由于群体内具有血缘关系的个体进行了交配,致使其后代基因纯合性增加。但随近交程度的增加,隐性致病基因的纯合概率也会上升,因此近交往往伴随着后代各种性状表型衰退,即近交衰退[1]。当群体连续20代以上进行亲子交配或全同胞交配后,近交系数可达99.8%以上,群体内基因达到高度纯合并且稳定时,该群体可称为近交系。我国已成功育成小鼠()、鸡()和猪()等近交系动物,但由于牛()的世代间隔长、繁殖效率低、育种成本高等原因,近交系牛罕有报道。
1974年,新疆塔城地区某家庭牧场以1头母牛和其子开始了近交牛培育,随后一直采用母子、父女及兄妹交配等高度近交的繁育模式,通过45年的封闭近亲繁育,形成了现有100头规模的近交群体。该牛群个体间在体型、生产性能等方面有很高的相似性,虽然与塔城地区哈萨克牛相比,生长较慢且体型较小,但是在恶劣的生存环境下能保持较正常的繁殖性能和生活力。马力鹏等[2]使用微卫星技术对该群体展开了鉴定研究,发现该群体具有较高纯合度,为遗传纯度较高的近交群体;经过当地科技局鉴定,2018年该群体被命名为新疆近交牛。但由于最初的繁育记录缺失,无法追溯和确认该群体原始亲本的品种。
近年来,高密度单核苷酸多态性(single nucleotide polymorphism, SNP)芯片被广泛应用于群体遗传学研究。基因组SNP能准确解析群体的遗传构成,以确定未知群体的品种来源[3]。如Gao等[4]利用SNP信息解析了中国不同品种牛只的血统组成。利用标记间的连锁不平衡(linkage disequilibrium, LD)程度,高密度SNP可以估计有效群体大小(effective population size,N)等群体遗传学参数[5];利用标记纯合度能够准确地反映个体真实基因组纯合度和分子近交水平,且较传统的系谱估计更加准确[6,7]。另外,基因组的长纯合片段(runs of homozygosity, ROH)也在多个物种的研究中[8~10]被用于定位功能基因和数量性状基因座(quantitative trait loci, QTL)。Kim等[8]对北美荷斯坦牛的研究发现,不同群体的ROH分布存在一定差异,能够反映群体的基因组特征。
本研究以国内外有代表性的牛品种为参考,对新疆近交牛进行遗传背景分析,并进一步使用多种群体遗传学指标,比较新疆近交牛、哈萨克牛(塔城)、新疆褐牛和荷斯坦牛之间的近交程度;通过筛选群体高频ROH位点,以寻找新疆近交牛基因组特征区域,旨在从多个角度对新疆近交牛进行遗传学分析,并为其繁育及未来群体的保护和利用提供科学依据。
近交牛样本来自新疆塔城市恰夏镇,散养且与其他牛群无遗传交流。本研究选择牛群中健康且大于12月龄的牛69头,测量体高、体斜长、胸围和管围等表型指标,采集静脉血。
为了便于群体间比较,本研究还采集了20头哈萨克牛(塔城)及50头新疆褐牛的样本,来源分别为新疆塔城市恰夏镇随机农户和新疆塔城种牛场。
采用GeneSeek Genomic Profiler (GGP) Bovine 50K芯片检测该新疆近交牛及哈萨克牛(塔城)样本。采用GeneSeek GGP Bovine 150K芯片测定新疆褐牛样本,50头随机选取的荷斯坦牛150K芯片数据来自中国奶牛基因组评估平台数据库(数据未发表)。
此外,本研究通过整合已发表的数据,形成不同的群体组合共4个数据集用于新疆近交牛的基因组分析,具体信息见表1。
数据集1用于分析新疆近交牛的遗传背景,包括本研究所检测的3个群体、荷斯坦牛以及已发表的国内外代表性牛品种12个,共310头牛。为了使各品种样本数均衡,避免样本量差异对结果的影响,本研究从新疆近交牛、荷斯坦牛和新疆褐牛群体中各随机挑选20个样本进行Admixture分析。使用PLINK v1.90[13]进行质量控制,标准如下:最小等位基因频率≥0.05,个体基因型缺失率<10%,标记基因型缺失率<10%,哈迪–温伯格检验显著性> 10E-05,然后保留16个牛群共享的位点。质量控制后保留常染色体上共9476个SNP。
数据集2用于新疆近交牛的基因组近交程度分析,包括新疆近交牛、哈萨克牛(塔城)、新疆褐牛和荷斯坦牛共170头。数据质量控制标准同上。另外,为保证各群体的SNP密度相同,本研究将荷斯坦牛和新疆褐牛的SNP位点进行了筛选,仅保留了与新疆近交牛和哈萨克牛(塔城)共享的位点,最终保留了常染色体上共33,590个SNP。
数据集3用于近交衰退分析,仅包含新疆近交牛,质量控制过程和保留的SNP数量与数据集2相同。分析中将该数据集划分为两个子集分别分析。
数据集4用于基因组特征区域分析,是在数据集2的基础上保留了新疆近交牛和哈萨克牛(塔城),经过相同的质量控制过程后,保留了常染色体上40,723个位点。
1.3.1 新疆近交牛群体遗传学分析
本研究使用主成分分析(principal component analysis, PCA)以及Admixture1.3软件[3]分析遗传背景结构。Admixture采用非监督型算法,设定祖先血统数量=2~5。使用PLINK计算4个群体LD指标2[14]。依据各标记间的距离(0~10 Mb),计算不同标记距离下2的均值,以展示不同群体LD的衰减程度。使用SNeP软件[15]中的Sved方法[16],基于LD的信息对4个群体的N进行估计。
表1 本研究使用的各样本数据
*新疆近交牛群体总数为69头(≥12月龄),其中≥24月龄的个体数量为40头。
1.3.2 同态相同位点分析
使用PLINK软件计算两两个体之间的同态相同位点(identical by state, IBS)比例,最终生成N´N大小的IBS矩阵。个体间IBS比例反映了个体之间遗传关系远近以及群体的近交历史。
1.3.3 基因组近交分析
ROH指连续纯合的染色体片段,它是由于亲代的同源单倍型传递给后代所致,其长度和频率能够反映群体的交配历史。另外,较长的ROH片段可以指示较近的亲缘关系。因为较长ROH片段的存在说明其没有被多个世代染色体的随机重组分割成不同小段。相反,较短的ROH则可以反映较远的亲缘关系[17]。基于ROH的近交系数也被证明与系谱近交系数之间存在高度正相关(0.75)[18],因此可以用于衡量基因组的近交水平。近交可能导致ROH片段的最小长度增加[19]。
本研究利用PLINK软件扫描基因组中的ROH,扫描参数为:扫描窗口为30个SNP,定义的ROH长度大于0.5 Mb,连续SNP之间的距离小于1 Mb,扫描的ROH中最多允许出现一个杂合子。根据50K芯片数据的研究[9],将所得ROH片段依据其长度进行分组:0.5~5 Mb,5~10 Mb和10 Mb以上,用于比较不同群体的ROH分布差异。
采用2种方法计算个体基因组近交系数:(1) ROH覆盖率(ROH%),即个体ROH总长占染色体总长的比例;(2)纯合位点占比(HOM%),即个体的纯合SNP位点数占总位点数的比例。
1.3.4 近交衰退分析
为了评估新疆近交牛的近交衰退效应,本研究将新疆近交牛按体型分为大、中、小3组,统计分析各组的基因组近交系数差异。分组方法采用K-means聚类算法[20],基于4个体型表型指标对个体进行聚类划分。考虑到年龄对体型的影响,本研究将牛只按月龄分为:(1)≥12月龄的牛只共69头;(2)进一步筛选≥24月龄的牛只共40头。对两个数据集分别进行近交衰退分析。
1.3.5 新疆近交牛的基因组特征区域分析
本研究分析了新疆近交牛和哈萨克牛(塔城)的ROH在各染色体上的分布特征,以定位近交群体内ROH出现频率(ROH)较高的位点,ROH是统计群体水平下ROH覆盖特定位点的频率(N覆盖/N)。最终筛选了两群体全基因组水平ROH前1%的SNPs,用于确定新疆近交牛的基因组特征区域。
基于UCSC数据库(http://hgdownload.soe.ucsc. edu/goldenPath/bosTau9/bigZips/genes/),在候选SNPs上下游100 kb内注释相关基因,使用DAVID (https:// david.ncifcrf.gov/)进行GO(gene ontology)富集分析,并使用牛QTL数据库(https://www.animalgenome. org/cgi-bin/QTLdb/)定位QTLs。
2.1.1 遗传背景分析
本研究使用PLINK对16个牛群的基因组信息进行PCA分析,结果显示,第一主成分(PC1)和第二主成分(PC2)分别占总变异40.49%和12.22%,新疆近交牛(XI)与哈萨克牛(塔城,TL)、哈萨克牛(伊犁,KA)和蒙古牛(MG)聚在一起(图1A)。
本研究利用Admixture分析了16个牛群的系祖结构。分析显示(图1B),当K=2时,普通牛群体和瘤牛群体(温岭牛和吉尔牛)明显分开,新疆近交牛、哈萨克牛(塔城)和中国北方牛品种(蒙古牛、延边牛和哈萨克牛(伊犁))血统组成相似,普通牛血统占84%,瘤牛血统占16%;中原牛(秦川牛、晋南牛、南阳牛和鲁西牛)含有较高比例瘤牛血统(40%~77%);当=5时,新疆近交牛与哈萨克牛(塔城)的血统构成已有些许不同;哈萨克牛(塔城)深蓝色的系祖占比达到20%,与中国北方牛群的遗传组成类似,尤其与哈萨克牛(伊犁)最接近。
2.1.2 连锁不平衡分析
本研究利用PLINK检测了新疆近交牛、哈萨克牛(塔城)、新疆褐牛和荷斯坦牛4个群体的LD特征,结果表明,4个群体均呈现LD逐渐衰减模式(图2A),物理距离较近的SNP位点之间的2较高,当标记间距离增加时,2则迅速下降。但新疆近交牛的LD程度明显高于其他3个牛群,当标记之间物理距离为8 Mb时,其他牛群标记之间的关联系数<0.20,而近交牛则为0.25。相反,哈萨克牛(塔城)的LD衰减速度最快,在1 Mb之前标记之间2<0.2,反映出该群体近交程度最低。
2.1.3 有效群体大小
基于群体LD信息,本研究使用SNeP软件估计了新疆近交牛、哈萨克牛(塔城)、新疆褐牛和荷斯坦牛的历史N。结果显示4个群体的历史N都随着世代数的增加而增加(图2B)。哈萨克牛(塔城)的N在10~102世代前都明显大于其他3个群体,从102世代前的749头减小至10世代前的86头。新疆褐牛和荷斯坦牛两个群体的N低于哈萨克牛(塔城),新疆近交牛的N则在各世代中都是最小的,体现出该群体内SNP标记间存在较强LD。在10个世代以内,新疆近交牛和哈萨克牛(塔城)的N皆小于新疆褐牛和荷斯坦牛,当前世代下4个群体的N分别为13、16、29和33头。
IBS可以直观反映个体间的基因组相似性和亲缘关系,本研究通过PLINK计算了新疆近交牛、哈萨克牛(塔城)、新疆褐牛和荷斯坦牛4个群体个体间的IBS矩阵。从热图可以看出,对角线上呈现3个亮度高且内部相似的模块,反映群体内较群体间具有更高的基因组相似性(图3A)。新疆近交牛个体之间基因组相似性最高(IBS=0.735±0.008),反映出该群体通过几个世代的近交,个体间亲缘关系非常近。新疆褐牛(IBS=0.694±0.007)内也具有较高的相似性,而荷斯坦牛(IBS=0.670±0.003)和哈萨克牛(塔城) (IBS=0.678±0.003)个体间相似性较低(图3B)。
利用PLINK在新疆近交牛、哈萨克牛(塔城)、新疆褐牛和荷斯坦牛的常染色体上进行了ROH扫描。经统计后,4个群体各自的ROH数量和ROH长度之间呈正比关系(图3C),新疆近交牛的斜率明显小于新疆褐牛和荷斯坦牛,尽管ROH数量较少,但每个个体ROH的总长度较大。哈萨克牛(塔城) ROH长度的分布集中于0.5~20 Mb,且ROH数量多于新疆褐牛和荷斯坦牛,而新疆近交牛ROH分布较为分散,且长ROH的数量明显要比其他牛群多(图3D)。
图1 新疆近交牛与其他品种的遗传关系
A:主成分分析;B:Admixture分析结果(=2或5)。图中每一列表示一个个体,不同颜色片段的长度表示该个体基因组中某个祖先所占的比例,表示本研究假定的祖先群体个数。HO:荷斯坦牛;BS:瑞士褐牛;SI:西门塔尔牛;JA:加尔梅克牛;YB:延边牛;MG:蒙古牛;KA:哈萨克牛(伊犁);QC:秦川牛;JN:晋南牛;NY:南阳牛;LX:鲁西牛;WL:温岭牛;GI:吉尔牛;XB:新疆褐牛;XI:新疆近交牛;TL:哈萨克牛(塔城)。
图2 各群体的连锁不平衡(LD)衰减以及历史有效群体大小(Ne)
A:4个牛群的连锁不平衡(LD)衰减;B:常染色体估计4个牛群不同世代的有效群体大小(N)。XI:新疆近交牛;TL:哈萨克牛(塔城);XB:新疆褐牛;HO:荷斯坦牛。
对ROH进行分组后,本研究统计了4个群体不同长度的ROH在常染色体上的分布。结果可见,新疆近交牛(图4A) ROH数量虽然较少,但其长ROH片段在各染色体上的分布要比其他群体多,且ROH%也更高。对于新疆近交牛而言,1号染色体ROH数量最多,13号染色体数量最少;27号染色体的ROH%最高,7号染色体最低。但是,新疆近交牛28号染色体虽然ROH数量最少,但其覆盖率则达到了第2,仅次于27号染色体。哈萨克牛(塔城)的ROH数量及ROH%都处于较低水平,且29号染色体上未检测到ROH(图4B)。新疆褐牛的6号染色体ROH数量最多(图4C),而荷斯坦牛ROH数量随染色体编号增加呈现递减趋势(图4D)。除了哈萨克牛(塔城)外,其余3个群体ROH%都随染色体编号增加呈上升趋势。
图3 各群体中同态相同(IBS)比例以及长纯合片段(ROH)的分布情况
A:不同个体两两之间的同态相同(IBS)关系(浅色表示同态相同程度高,深色则表示程度低);B:不同牛群内个体与剩余群体的IBS平均值分布情况;C:各群体中长纯合片段(ROH)数量与总长度之间的关系,Pop:品种名称缩写;D:各群体中ROH数量和长度的分布情况。XI:新疆近交牛;TL:哈萨克牛(塔城);XB:新疆褐牛;HO:荷斯坦牛。
基于ROH与SNP纯合位点数量,本研究计算了4个群体HOM%和ROH%,从结果可以看出,新疆近交牛的两个指标都显著高于其余群体(表2)。各群体之间的HOM%皆有差异,新疆近交牛与哈萨克牛(塔城)之间差异达到0.104,荷斯坦牛的HOM%最小,为0.541。在ROH%指标中,新疆褐牛与荷斯坦牛之间不存在差异,且哈萨克牛(塔城)的ROH%最小,为0.021,与新疆近交牛相差0.115。
图4 各群体长纯合片段(ROH)在常染色体上的分布
A:新疆近交牛不同长度的长纯合片段(ROH)在常染色体的分布情况;B:哈萨克牛(塔城)不同长度的长纯合片段(ROH)在常染色体的分布情况;C:新疆褐牛不同长度的长纯合片段(ROH)在常染色体的分布情况;D:荷斯坦牛不同长度的长纯合片段(ROH)在常染色体的分布情况。红线表示各染色体的ROH%。XI:新疆近交牛;TL:哈萨克牛(塔城);XB:新疆褐牛;HO:荷斯坦牛。
表2 各群体基因组近交指标
上标不同字母表示不同群体均值之间存在差异(<0.05)。
本研究利用新疆近交牛的4个体型参数进行-means聚类后,统计了不同月龄分组下体型与近交指标的关系(表3)。结果显示,在≥12月龄分组情况下,HOM%和ROH%随体型的减小皆呈现上升趋势;≥24月龄分组的结果仍是相同趋势(由于筛选≥24月龄个体,无小体型牛分组)。
新疆近交牛的ROH均值为0.131,最大值达到0.600,这意味着30个个体的ROH覆盖到位于5号染色体的高频位点(图5A)。而哈萨克牛(塔城)的均值仅有0.005,最大为0.080,在整个基因组范围内ROH皆小于阈值(图5B)。
表3 新疆近交牛不同体型分组各参数平均值及标准差
图5 两个群体ROHf在基因组上的分布图
A:新疆近交牛ROH在各染色体上的分布;B:哈萨克牛(塔城)ROH在各染色体上的分布。灰色横线表示ROH>0.32作为位点选择阈值,即前1%的SNP位点。XI:新疆近交牛;TL:哈萨克牛(塔城)。
本研究在新疆近交牛中检测到8个高频ROH区域,包含332个SNP位点并注释到了130个相关基因。设定GO富集分析阈值为0.05,找到的4个生物学过程通路主要与神经和免疫系统功能相关,两个分子生物功能通路与膜结构相关(表4)。
本研究在高频ROH区域还定位到32个与牛重要经济性状相关的QTLs(附表1)。其中11个与产奶性状相关,7个与体型性状相关,5个与繁殖性状相关,5个与肉质和胴体性状相关以及4个与长寿性状相关。所有QTLs均分布于5、12和22号染色体上,其中22号染色体上定位到了23个QTLs。这些QTLs分布的染色体与新疆近交牛ROH的峰值位点所在染色体相一致(图5A)。
表4 GO富集分析结果
本研究PCA分析结果表明,新疆近交牛、哈萨克牛(塔城)、哈萨克牛(伊犁)和蒙古牛的遗传背景相似,这与它们的地理位置分布相一致,都处于中国北部。综合PCA与Admixture结果,本研究推测新疆近交牛与哈萨克牛遗传关系最近,这与其培育人对牛群近交培育历史的记述内容相一致。
不同群体间LD程度的差异是由有效群体数量以及群体的历史所造成的[21,22],通常本地品种的LD程度较小,因为其相对于基因交流具有普遍性的品种(例如荷斯坦牛)而言N的数量较大[23]。本研究中各群体随着标记距离增加,LD程度迅速下降,该趋势与已有报道一致[24~26]。新疆近交牛LD程度较高,说明该群体染色体上相邻位点间的关联性强,这反映了其培育起始于少量系祖,呈现群体奠基者效应(founder effect)。而哈萨克牛(塔城) LD程度较低,可能与当地牛选育程度低有关。另有研究显示野猪与家猪相比,在所有常染色体上的LD程度最小,且衰减速度最快[23]。本研究中,选育程度较低的哈萨克牛(塔城) LD特征与之相似。
本研究估计的历史N趋势与荷斯坦牛和绵羊的结果相一致,随着历史世代数增加,N逐渐增大[27,28]。基因交流具有普遍性的群体中N较低,可能是由于人工选择使得群体中优势基因型比例上升,人为导致了高强度LD,因此N下降[27]。估计10世代以内N时,标记间的物理距离约为5.33 Mb,此距离之后新疆褐牛和荷斯坦牛LD程度低于新疆近交牛和塔城哈萨克牛,导致N估计值较大。本研究N的估计依赖于LD,由于估计近世代时标记间LD程度低(除新疆近交牛外r< 0.06),N估计的准确性可能会受到影响[27]。此外,样本群体大小也会显著影响N的估计值[29],本研究仅使用了50头荷斯坦牛,与其他同品种研究相比偏小[30,31],导致结果偏低。尽管如此,各群体N的增加趋势及大小也与图2A各群体LD特征相一致,该结果可以用来进行不同群体之间的比较。
Di Gaetano等[32]对意大利人种的遗传结构分析发现,IBS群体均值的分布情况能够分辨不同的亚群体遗传背景。本研究通过比较群体间的IBS,从结果可以看出,荷斯坦牛与其他3个群体关系最远,而新疆近交牛、哈萨克牛(塔城)与新疆褐牛都具有一定亲缘关系,这也与各群体的历史及当前塔城地区新疆褐牛为主推品种的现状相一致。
本研究结果表明,群体ROH数量与ROH长度之间存在正比关系,这与多篇研究报道的结果相一致[9,33]。新疆近交牛的长ROH数量明显多于其他群体,该结果也印证了图3C中新疆近交牛的斜率较小。哈萨克牛(塔城)样本数量较少(仅20头)可能导致本研究未能在其29号染色体上检测到ROH。长ROH片段预示着近期的近交[17],本研究结果也证明了这一点。也有研究表明ROH数量与染色体长度之间呈正比[34],本研究中新疆褐牛(图4C)和荷斯坦牛(图4D)的趋势较为明显,哈萨克牛(塔城)由于样本数量较少而未呈现明显趋势。
HOM%和ROH%的结果说明了新疆近交牛的近交程度最高。杨湛澄等[9]利用Illumina 54K芯片检测了中国荷斯坦牛的ROH%和HOM%,其中ROH%为0.064,略小于本研究中荷斯坦群体的结果。这可能是因为本研究ROH检测的参数较为宽松,包含了长度<1 Mb的ROH,因此ROH%偏高。此外,Purfield等[18]研究表明,芯片密度也会影响ROH的检测结果,因此本研究在各群体提取出相同密度的标记进行比较。杨湛澄等[9]研究表明,荷斯坦公牛HOM%的范围为0.625~0.750,高于本研究母牛的结果(0.541)。究其原因可能是本研究荷斯坦牛所使用的标记是从150K芯片中提取的部分标记,导致一些纯合位点被忽略,致使HOM%较低。
为避免月龄对体型大小评估的影响,本研究分别对≥12月龄和≥24月龄的个体进行分组。HOM%和ROH%在不同体型分组间的差异都未达到显著性水平(>0.05),这可能与体型数据样本量少有关。但本研究结果表明:个体位点纯合率越高,其体型就越小。这说明近交对体型性状有影响,在一定程度上造成了牛只生长方面的近交衰退。
研究表明,经过多个世代的近交,新疆近交牛的SNP位点纯合率上升[1],也导致ROH检出概率提高,致使ROH明显高于哈萨克牛(塔城)。ROH在基因组中的分布差异较大,该分布特征与其他多个物种的研究相一致[8~10]。Kim等[8]利用50K芯片数据对北美荷斯坦牛的ROH进行了检测,发现未经选择的荷斯坦牛群体各SNP的ROH皆小于0.09,且未检出高频区域。人工选择在一定程度上导致了近交,从而使位点纯合率上升,而未经选择的群体中,ROH在染色体上的覆盖率较低。本研究也未能在哈萨克牛(塔城)中检测出高频ROH区域,这说明其近交程度较新疆近交牛低,新疆近交牛多个世代的近交繁育导致了高频ROH区域的出现。
新疆近交牛基因组特征区域鉴定的基因主要参与了基本的生物学过程和分子功能,且定位的QTLs与重要经济性状相关联,说明多个世代的近交可能对这些区域的遗传特征产生了影响。本研究也发现新疆近交牛的体型大小与位点纯合率存在一定趋势,有可能纯合位点区域覆盖了与生长和体型性状相关的基因或QTLs,积累了有害突变,致使性状表型出现衰退。
本研究从多个方面证明了新疆近交牛在基因组上达到了很高的近交纯度,该群体是我国难得的反刍动物近交资源。目前尚未对新疆近交牛的重要经济性状进行系统记录,若能积累准确且充足的表型数据,该群体在研究大型反刍动物近交衰退的表型表现及其遗传调控机制方面将具有重大意义。
附表1详见文章电子版www.chinagene.cn。
衷心感谢新疆石河子大学谢苏和公红斌同学,新疆农业大学胥磊、徐庆磊、杨明路和邱文卿同学,以及中国农业大学张海亮和胡丽蓉同学在本研究样品采集过程中给予的大力帮助;感谢新疆近交牛的培育人卢国昌以及老先生的爱人李秀英、儿子卢振宇(邮箱: zhangll1000@163.com)、儿媳朱晓静、孙子芦金龙等一家人对近交牛培育的支持。
[1] Zhang Y. Animal Breeding. Beijing: China Agriculture Press, 2001.张沅. 家畜育种学. 北京: 中国农业出版社, 2001.
[2] Ma LP, Huang T, Lu GC, Li XY, Lu ZY, Zhai TJ, Cheng YC, Feng ST. Study on identification of Xinjiang Brown Cattle inbred group., 2015, 42 (12): 3274–3281.马力鹏, 黄涛, 卢国昌, 李秀英, 卢振宇, 翟腾蛟, 程悦聪, 冯书堂. 新疆褐牛近交群体的鉴定研究. 中国畜牧兽医, 2015, 42(12): 3274–3281.
[3] Alexander DH, Novembre J, Lange K. Fast model-based estimation of ancestry in unrelated individuals., 2009, 19(9): 1655–1664.
[4] Gao YH, Gautier M, Ding XD, Zhang H, Wang YC, Wang X, Faruque MO, Li JY, Ye SH, Gou X, Han JL, Lenstra JA, Zhang Y. Species composition and environmental adaptation of indigenous Chinese cattle., 2017, 7(1): 16196.
[5] Sørensen AC, Sørensen MK, Berg P. Inbreeding in danish dairy cattle breeds., 2005, 88(5): 1865–1872.
[6] Wright S. Coefficients of inbreeding and relationship., 1922, 56(645): 330–338.
[7] Woods C, Valente EM, Bond J, Roberts E. A new method for autozygosity mapping using single nucleotide polymorphisms (SNPs) and EXCLUDEAR., 2004, 41(8): e101.
[8] Kim ES, Cole JB, Huson H, Wiggans GR, Van Tassell CP, Crooker BA, Liu G, Da Y, Sonstegard TS. Effect of artificial selection on runs of homozygosity in U.S. Holstein cattle., 2013, 8(11): e80813.
[9] Yang ZC, Huang HT, Yan QX, Wang YC, Ying Y, Chen SH, Sun DX, Zhang SL, Zhang Y. Estimation of genomic inbreeding coefficients based on high-density SNP markers in Chinese Holstein cattle., 2017, 39(1): 41–47.杨湛澄, 黄河天, 闫青霞, 王雅春, 俞英, 陈绍祜, 孙东晓, 张胜利, 张毅. 利用高密度SNP标记分析中国荷斯坦牛基因组近交. 遗传, 2017, 39(1): 41–47.
[10] Liu JX, Wei X, Deng TY, Rui R, Han JL, Du LX, Zhao FP, Wang LX. Genome-wide scan for run of homozygosity and identification of corresponding candidate genes in sheep populations., 2019, 50(8): 1554–1566.刘家鑫, 魏霞, 邓天宇, 谢锐, 韩建林, 杜立新, 赵福平, 王立贤. 绵羊全基因组ROH检测及候选基因鉴定. 畜牧兽医学报, 2019, 50(8): 1554–1566.
[11] Decker JE, Taylor JF, Kantanen J, Millbrooke A, Schnabel RD, Alexander LJ, Macneil MD. Origins of cattle on Chirikof Island, Alaska, elucidated from genome-wide SNP genotypes., 2016, 116(6): 502–505.
[12] Decker JE, McKay SD, Rolf MM, Kim J, Molina Alcalá A, Sonstegard TS, Hanotte O, Götherström A, Seabury CM, Praharani L, Babar ME, Correia de Almeida Regitano L, Yildiz MA, Heaton MP, Liu WS, Lei CZ, Reecy JM, Saif-Ur-Rehman M, Schnabel RD, Taylor JF. Worldwide patterns of ancestry, divergence, and admixture in domesticated cattle., 2014, 10(3): e1004254.
[13] Chang CC, Chow CC, Tellier LC, Vattikuti S, Purcell SM, Lee JJ. Second-generation PLINK: rising to the challenge of larger and richer datasets., 2015, 4(1): 7.
[14] Hill WG. Estimation of linkage disequilibrium in randomly mating populations., 1974, 33(2): 229–239.
[15] Barbato M, Orozco-terWengel P, Tapio M, Bruford MW. SNeP: a tool to estimate trends in recent effective population size trajectories using genome-wide SNP data., 2015, 6: 109.
[16] Sved JA. Linkage disequilibrium and homozygosity of chromosome segments in finite populations., 1971, 2(2): 125–141.
[17] McQuillan R, Leutenegger AL, Abdel-Rahman R, Franklin CS, Pericic M, Barac-Lauc L, Smolej-Narancic N, Janicijevic B, Polasek O, Tenesa A, MacLeod AK, Farrington SM, Rudan P, Hayward C, Vitart V, Rudan I, Wild SH, Dunlop MG, Wright AF, Campbell H, Wilson JF. Runs of homozygosity in European populations., 2008, 83(3): 359–372.
[18] Purfield DC, Berry DP, McParland S, Bradley DG. Runs of homozygosity and population history in cattle., 2012, 13(1): 70.
[19] Kirin M, McQuillan R, Franklin CS, Campbell H, McKeigue PM, Wilson JF. Genomic runs of homozygosity record population history and consanguinity., 2010, 5(11): e13996.
[20] Hartigan JA, Wong MA. A K-means clustering algorithm: Algorithm AS 136., 1979, 28(1): 100–108.
[21] Tenesa A, Navarro P, Hayes BJ, Duffy DL, Clarke GM, Goddard ME, Visscher PM. Recent human effective population size estimated from linkage disequilibrium., 2007, 17(4): 520–526.
[22] Ardlie KG, Kruglyak L, Seielstad M. Patterns of linkage disequilibrium in the human genome., 2002, 3(4): 299–309.
[23] Muñoz M, Bozzi R, García-Casco J, Núñez Y, Ribani A, Franci O, García F, Škrlep M, Schiavo G, Bovo S, Utzeri VJ, Charneca R, Martins JM, Quintanilla R, Tibau J, Margeta V, Djurkin-Kušec I, Mercat MJ, Riquet J, Estellé J, Zimmer C, Razmaite V, Araujo JP, Radović Č, Savić R, Karolyi D, Gallo M, Čandek-Potokar M, Fernández AI, Fontanesi L, Óvilo C. Genomic diversity, linkage disequilibrium and selection signatures in European local pig breeds assessed with a high density SNP chip., 2019, 9(1): 13546.
[24] Daly MJ, Rioux JD, Schaffner SF, Hudson TJ, Lander ES. High-resolution haplotype structure in the human genome., 2001, 29(2): 229–232.
[25] Farnir F, Coppieters W, Arranz JJ, Berzi P, Cambisano N, Grisart B, Karim L, Marcq F, Moreau L, Mni M, Nezer C, Simon P, Vanmanshoven P, Wagenaar D, Georges M. Extensive genome-wide linkage disequilibrium in cattle., 2000, 10(2): 220–227.
[26] Amaral AJ, Megens H-J, Crooijmans RPMA, Heuven HCM, Groenen MAM. Linkage disequilibrium decay and haplotype block structure in the pig., 2008, 179(1): 569–579.
[27] Ni GY, Zhang Z, Jiang L, Ma PP, Zhang Q, Ding XD. Chinese Holstein Cattle effective population size estimated from whole genome linkage disequilibrium., 2012, 34(1): 50–58.尼桂琰, 张哲, 姜力, 马裴裴, 张勤, 丁向东. 利用全基因组连锁不平衡估计中国荷斯坦牛有效群体大小. 遗传, 2012, 34(1): 50–58.
[28] Zhao FP, Wang GK, Zeng T, Wei CH, Zhang L, Wang HH, Zhang SZ, Liu RZ, Liu Z, Du LX. Estimations of genomic linkage disequilibrium and effective population sizes in three sheep populations., 2014, 170: 22–29.
[29] Hill WG. Linkage disequilibrium among multiple neutral alleles produced by mutation in finite population., 1975, 8(2): 117–126.
[30] Kim ES, Kirkpatrick BW. Linkage disequilibrium in the North American Holstein population., 2009, 40(3): 279–288.
[31] Qanbari S, Pimentel ECG, Tetens J, Thaller G, Lichtner P, Sharifi AR, Simianer H. A genome-wide scan for signatures of recent selection in Holstein cattle., 2010, 41(4): 377–389.
[32] Di Gaetano C, Voglino F, Guarrera S, Fiorito G, Rosa F, Di Blasio AM, Manzini P, Dianzani I, Betti M, Cusi D, Frau F, Barlassina C, Mirabelli D, Magnani C, Glorioso N, Bonassi S, Piazza A, Matullo G. An overview of the genetic structure within the italian population from genome- wide data., 2012, 7(9): e43759.
[33] Mastrangelo S, Tolone M, Di Gerlando R, Fontanesi L, Sardina MT, Portolano B. Genomic inbreeding estimation in small populations: evaluation of runs of homozygosity in three local dairy cattle breeds., 2016, 10(5): 746–754.
[34] Martikainen K, Sironen A, Uimari P. Estimation of intrachromosomal inbreeding depression on female fertility using runs of homozygosity in Finnish Ayrshire cattle., 2018, 101(12): 11097–11107.
The evaluation of genomic homozygosity for Xinjiang inbred population by SNP panels
Rui Shi1, Yi Zhang1, Yachun Wang1, Tao Huang2, Guochang Lu3, Tao Yue4, Zhenxi Lu3, Xixia Huang5, Xinpu Wei6, Shutang Feng7, Jun Chen8, Wulan Kagedeer8, Ruxianguli Abulizi8, Nuerhumaer Muhetaer8
Xinjiang inbred cattle is a population which has been highly inbred for 45 years. However, the breed origin of this population cannot be traced back due to the lack of original records. To demonstrate the genetic background of Xinjiang inbred cattle, we analysed the worldwide genomic information of 16 cattle breeds using principal components analysis, and Admixture method. Furthermore, the shared SNP markers of Xinjiang inbred cattle, local Kazakh cattle, Holstein cattle, and Xinjiang Brown cattle were extracted to calculate population genetic parameters and genomic inbreeding indicators in order to evaluate the magnitude of inbreeding in each population. We also evaluated the relationship between inbreeding indicators and body size in the Xinjiang inbred population. Finally, the high frequency runs of homozygosity (ROH) regions for Xinjiang inbred cattle and local Kazakh population were selected for genes and QTL annotations. These results demonstrate that the ancestry proportions of inbreeding breed are similar to those of Kazakh cattle. The genomic homozygosity of Xinjiang inbred cattle is significantly higher than other populations; the inbreeding depression is observed in body size to a certain extent because body size decreased when corresponding homozygosity increased. Totally, six basic bio-pathways and 32 QTL regions that related to bovine economical traits were annotated. Our results provide the insights into breeding strategies, future protection, and utilization plan design for this special genetic material-Xinjiang inbred cattle.
Xinjiang inbred cattle; population structure; genomic inbreeding; runs of homozygosity
2020-03-15;
2020-04-09
现代农业(奶牛)产业技术体系建设专项资金(编号:CARS-36)和长江学者和创新团队发展计划项目(编号:IRT_15R62)资助[Supported by China Agriculture Research System (No. CARS-36), and the Program for Changjiang Scholar and Innovation Research Team in University (No. IRT_15R62)]
师睿,在读硕士研究生,专业方向:动物遗传育种与繁殖。E-mail: srandeffy@163.com
王雅春,博士,教授,研究方向:分子数量遗传学。E-mail: wangyachun@cau.edu.cn黄涛,博士,副教授,研究方向:动物遗传育种。E-mail: taohuagn100@sina.com卢国昌,新疆近交牛培育人。
10.16288/j.yczz.20-071
2020/5/11 12:14:54
URI: http://kns.cnki.net/kcms/detail/11.1913.R.20200509.1608.001.html
(责任编委: 赵要风)