基于基因组和系谱信息的不同选配方案效果模拟研究

2022-10-29 04:02张鹏飞王立贤赵福平
畜牧兽医学报 2022年10期
关键词:同质交配方差

张鹏飞,何 俊,王立贤*,赵福平*

(1.中国农业科学院北京畜牧兽医研究所 农业部动物遗传育种与繁殖(家禽)重点实验室,北京 100193; 2.湖南农业大学动物科技学院,长沙 410128)

在基因组选配提出之前,主要是利用系谱信息进行优化的选种选配,如最佳遗传贡献选择(optimal contribution selection,OCS),是将选择反应和近交组合成候选亲本遗传贡献的函数,以平衡遗传进展、近交和共祖系数。最佳遗传贡献选择在动物育种中应用较多,用以改良近交水平较高的群体。最佳遗传贡献选择理论提出后被不断改进,并且加入一些额外的约束条件进行优化,其中包括有最小共祖选配(minimum coancestry,MC)和最小化祖先间遗传贡献的协方差(minimising the covariance between ancestral contributions,MCAC)。通过增加具有遗传贡献祖先的独立性和降低它们之间的混乱性来实现低近亲繁殖率,分散了它们在育种种群中的贡献,从而增加了每个后代具有贡献的祖先数量。这使得祖先更接近确切的阈值线性关系,从而降低近亲繁殖率。Kinghorn等使用配偶选择来最大化预测后代的价值。配偶选择包括两个组成部分:1)配偶选择指数(MSI);2)用于寻找最大化MSI的配偶集合的配偶选择算法。这些策略被称为前瞻性配偶选择(look ahead mate selection,LAMS)。

基因组选配充分地利用基因组信息来计算亲本间的遗传关系,并结合标记效应来决定哪些基因组合来获得下一个优秀的育种群体。基因组选配可以控制群体近交的增长速率,维持遗传多样性,同时实现长期且可持续的遗传进展。然而基因组选配是对群体中所有个体进行选配,找到最优的交配组合,这与实际的育种工作有点相悖。因此,本研究将通过计算机模拟在选择GEBV排名靠前的最优秀的个体后,比较不同的选配方案下后代群体的遗传进展、近交系数、遗传方差的变化情况,评估基因组选配的效果,以期为在畜禽育种中开展基因组选配提供参考。

1 材料与方法

1.1 基础群个体数据的模拟

表1 基因组参数设置Table 1 Genome parameter settings

1.2 GEBV估计及其个体选留

本研究使用BayesB方法计算基因组估计育种值(GEBV)。将基础群中具有表型值和基因型的9 000头个体作为参考群,使用R语言软件包BGLR计算标记效应,Bayes模型参数设定迭代次数为20 000次,预烧(burn-in)为1 000次,并将公畜和母畜根据GEBV高低进行排序,选出GEBV排名前30头公猪、900头母猪作为种用个体繁育下一代。

在每个世代中,都采用上述方案选留个体。将每个世代中有表型和基因型的个体加入到参考群中,用于参考群的更新,并且每个世代重新估计标记效应。

1.3 基因组选配

本研究在基因组选配的目标函数中考虑遗传进展、近交系数和家系间方差来优化选配,遗传进展和近交系数的具体计算公式如下:

其中,为Nc×N的交配矩阵,N为亲本的个数,Nc为后代的数量;为基因组关系矩阵;为孟德尔抽样离差;为基因型矩阵。

使用R包TrainSel进行基因组选配。基因组关系矩阵(genomic relationships matrix,)使用VanRaden文章中的公式计算,通过R包rrBLUP完成。参数设置:公畜30,母畜900,交配组合数设置为900,遗传算法参数中群体大小设置为200,迭代次数设置为800,其余参数设为默认值。

1.4 传统选配方式

1.4.1 随机交配 对选留的个体以随机交配的原则进行交配。

1.4.2 同质选配 根据个体的GEBV大小进行排序,将公畜按照降序的顺序与按照降序排序的母畜依次进行交配,每头公畜配30个母畜。

1.4.3 异质交配 根据个体的GEBV大小进行排序,将公畜按照升序的顺序与按照降序排序的母畜依次进行交配,每头公畜配30头母畜。

1.5 后代基因型、育种值和表型模拟

1.5.2 后代个体育种值和表型值的模拟 个体真实育种值用以下模型模拟:

其中,是个体的近交系数,是个体的父亲到共同祖先的相关通径链的数量,是共同祖先A的近交系数。

个体性状表型值用以下模型模拟:

=++

以上过程通过R语言自写程序实现。

1.6 评估标准

1.6.1 遗传进展的计算 每个世代的遗传进展计算公式如下:

1.6.2 近交系数的计算 本研究计算了2种近交系数,第一种是由Wright提出的系谱近交系数(),其计算公式:

其中,是个体的近交系数,是个体的父亲到共同祖先的相关通径链的数量,是共同祖先的近交系数。

第二种,基于SNPs估计的近交系数(),其计算公式:

其中,是SNP的数量,是等位基因频率,是第个SNP的拷贝数。

近交系数每世代增长量(Δ)计算公式:

Δ=1-

其中β是ln(1-)在世代的线性回归的斜率,是在世代出生的动物的平均近交系数。

1.6.3 后代遗传方差的计算 本研究将每个世代9 000头个体的基因组估计育种值(GEBV)的方差作为群体的遗传方差。计算公式:

1.7 模拟试验

本研究假设世代间不重叠,每个世代群体规模设置为9 000。每个世代选出GEBV排名前30个公畜和前900个母畜作为种用个体繁育下一代,后代数设置为10,具体过程见图1。每种方案模拟选育5个世代,并计算每代群体的平均GEBV、遗传进展、近交系数以及遗传方差,重复5次取平均值,并且在每个世代对不同选配方案的平均GEBV、近交系数以及遗传方差进行T检验。

图1 模拟试验技术路线Fig.1 Technical schematic of simulation study

本研究在Linux系统下通过调用R统计编程语言编写完成的所有数据模拟和计算的脚本实现,Linux服务器配置为40核2.40 GHz Intel(R) Xeon(R) Gold 6148的处理器和768 GB内存。

2 结 果

2.1 基因组选配方案的确定标准

本研究采用遗传进展、近交和家系间方差3个因素对选择效果进行评估,三者之间并不是独立的,而是彼此间相互牵制。TrainSel通过对这3个指标进行优化权衡后会得出一系列帕累托最优解(pareto optimality),通过三维图可以表示(图2)。图中的每一个点都对应着该3个指标下的一组交配组合,在没有其他限定条件下,图上的曲面上所有的点都可以作为一个交配方案。本研究根据这3个指标指定的不同交配方案,在每个世代分别选取遗传进展最大的交配方案、家系间方差最大的交配方案、近交最小的交配方案进行连续5个世代的选育。

图2 基因组选配计算得到的最优解Fig.2 The optimal solution of genomic mating

2.2 遗传趋势和平均每世代的遗传进展

图3比较了6种方案在5个世代中的遗传趋势。基因组选配中选取遗传进展最大的方案在每个世代的平均GEBV均极显著高于随机交配和异质选配(<0.01),在第1世代均极显著高于其它选配方案(<0.01),在1~4世代的平均GEBV均显著高于基因组选配中选取近交最小的方案(<0.05),在第1、2世代显著高于基因组选配中选取方差最大的方案(<0.05)。基因组选配中选取近交最小的方案在第2世代高于异质选配(<0.01)。基因组选配中选取方差最大的方案在第4、5世代的平均GEBV高于异质选配(<0.05)。

图3 遗传力为0.5时6种不同交配方案经过5个世代选育后的遗传趋势Fig.3 Genetic trend of 6 mating schemes over 5 generations at heritability of 0.15

不同选配方案的ΔG如表2所示,经过5个世代的选育,基因组选配的3种方案的ΔG均显著高于随机交配和异质选配(<0.01),其中,基因组选配中选取遗传进展最大的方案的ΔG高于同质选配,比同质选配高4.3%。

表2 遗传力为0.5时6种不同选配方案重复5次后平均每个世代的遗传进展和标准差Table 2 Average rate of genetic gain (ΔG) and standard deviation for each generation after 5 repeats of 6 different mating schemes at heritability of 0.5

2.3 近交系数的变化趋势和平均每世代的近交增长量

不同选配方案的5个世代的平均系谱近交系数()如图4所示,同质选配在每个世代的平均均极显著高于随机和异质选配和基因组选配中选择近交最小的方案(<0.01),显著高于基因组选配中选择遗传进展最大的方案和基因组选配中选择家系间方差最大的方案(<0.05)。

图4 遗传力为0.5时6种不同交配方案经过5个世代选育后的平均系谱近交系数变化趋势Fig.4 Trends of average pedigree inbreeding coefficient of 6 mating schemes over 5 generations at heritability of 0.5

不同选配方案的ΔF如表3所示,经过5个世代的选育,基因组选配的3种方案的ΔF比同质选配低22.2%~94.1%。其中基因组选配_近交最小方案的ΔF比异质选配低11.8%。

表3 遗传力为0.5时6种不同选配方案重复5次后平均每个世代的近交增量和标准差Table 3 Average rate of inbreeding (ΔF) and standard deviation for each generation after 5 repeats of 6 different mating schemes at heritability of 0.5

2.4 遗传方差的变化趋势

不同选配方案的平均遗传方差变化趋势如图5所示,同质选配在第1世代极显著高于其它选配方案(<0.01),随着选育的进行,同质选配的遗传方差迅速降低,在第5世代显著低于除基因组选配中选择遗传进展最大的方案以外的所有方案(<0.05)。经过5个世代的选育,基因组选配的3种方案的遗传方差比同质选配高10.8%~32.2%。

图5 遗传力为0.5时6种不同交配方案经过5个世代选育后的平均遗传方差的变化趋势Fig.5 Trends of average genetic variance of 6 mating schemes over 5 generations at heritability of 0.5

3 讨 论

本研究使用模拟数据比较了使用基因组选择留种后,使用基因组选配进行最优的配对组合的效果,并与传统选配方案进行了比较。在评估不同选配方案后代群体近交水平时,计算了系谱近交系数()和基因组近交系数(),但是基因组近交系数()计算结果是负值,这与其它研究报道一致。因此本研究中主要以系谱近交系数进行讨论。综合来看,基因组选配能取得比其它3种方案更高的遗传进展,近交水平远低于同质选配,接近异质选配,而遗传方差下降幅度小于同质选配,高于异质选配和随机交配。这表明基因组选配不仅能获得足够大的遗传进展,有效的控制群体近交,还能保持群体内的遗传变异。

TrainSel在计算最优的交配组合时,公畜和母畜的数量、配对数、SNP的数量以及遗传算法参数中群体大小和迭代次数都对计算速度有影响。而且遗传算法参数中群体大小和迭代次数直接决定了是否能获得理想的结果。本研究中,每个世代选留30头公畜和900头母畜,以及配对数设置为900,就存在27 000个可能的配对组合,这需要大量的计算时间去对每个组合所得结果进行预测。经过前期试验发现,TrainSel中遗传算法参数中群体大小设置为200和迭代次数设置为500以上才能获得较为理想的结果。本研究对群体大小设置和迭代次数分别设置为200和800,这都会大大增加计算时间。因此,在本研究中只模拟了一条染色体上的500个标记位点作为参考,每次计算最优交配组合需要时间约24 h左右。为了验证结果的广谱性,又对群体大小为1 500头,选择GEBV排名靠前的10头公畜、150头母畜作为种用个体,SNP位点数为1 500个时,基因组选配效果的模拟研究。由于时间的限制,只将第一个世代的结果进行了总结(图6),结果发现,此种情况下不同选配方案的变化趋势与SNP位点数为500和群体为9 000时的基本一致。

图6 SNP为500和1 500时6种不同选配方案在第1个世代的平均GEBV、系谱近交系数和遗传方差Fig.6 Average GEBV, pedigree inbreeding coefficient and genetic variance in the first generation for 6 different mating schemes at SNP of 500 and 1 500, respectively

本研究通过基因组育种值进行选留个体,然后采用R包TrainSel提供的基因组选配方法得到最优的交配组合,这些交配组合并不唯一,但是都比其他的选配方案的效果要好。该方法与其他算法如最佳遗传贡献选择还在存在明显的不同,最佳遗传贡献选择只是给出了候选亲本对后代的遗传贡献比例,没有给出具体的配对组合。但是基因组选配通过构建交配矩阵,把焦点问题转移到配偶的选择上。通过基因组选配可以计算出父母贡献比例,但是无法从遗传贡献比例计算出最优的交配组合。

目前基因组选配还处于计算机模拟阶段,在真实数据上的研究不多。基因组选配比基因组选择需要考虑更多问题,既需要考虑个体本身的遗传,也需要考虑配对间的互补关系,以及一些品种的特性,从而使群体近交水平降低以及基因频率的改变。因此,基因组选配是一个非常复杂的问题。目前本研究只是针对单性状的加性遗传效应,除了用于优化选配方案外,基因组选配还可以用来估计杂交动物、预测高产或低产个体出现的概率等或其他应用领域。目前基因组选配还处于初步研究阶段,仍然存在许多问题需要深入地探索。

4 结 论

本研究通过对基因组选择下不同的基因组选配方案经过5个世代的遗传进展、近交系数、遗传方差进行比较得出,相对于其它交配方案,在实际的育种中基因组选配方案具有明显的优势。基因组选配中选取遗传进展最大方案的ΔG比同质选配高4.3%,ΔF比同质选配低22.2%,遗传方差比同质选配高10.8%。基因组选配作为一种有效的可持续育种方法,在动物育种中开展十分有必要。基因组选配同时考虑了亲缘和价值育种,不仅可以获得较高的遗传进展,同时可以有效的控制群体的近交水平,并且考虑了家系间方差,保证了一定的遗传变异,是一种可行的可持续育种方法。以上研究为下一步在畜禽育种中开展基因组选配提供了参考。

猜你喜欢
同质交配方差
“貌异质同”话类比
交配的最佳工具
比较中的“同质”与“异质”
方差生活秀
“形同质异“的函数问题辨析(上)
近现代中国与西方体育文化间性研究
对几道自由交配(随机交配)考题的反思
揭秘平均数和方差的变化规律
方差越小越好?
方差在“三数两差”问题中的妙用