叶 健,周 梅,王 静 ,徐成良 ,王重龙*
(1.安徽省农业科学院畜牧兽医研究所,猪分子数量遗传学安徽省农业科学院重点实验室,畜禽产品安全工程安徽省重点实验室,安徽合肥 230031;2.农业农村部猪肉质量安全控制重点实验室,安徽亳州 236700;3.温氏食品集团股份有限公司,广东新兴 527400)
跨群体遗传评估指联合处于不同地理位置或不同亚群的动物,利用表型、系谱或基因型等信息对合并群体进行联合评估,提高选择准确性和选择强度,最终达到提高遗传进展的目的。在猪育种中,由于受到资金、土地、环保、疫病、生产模式和生产管理水平等因素影响,单场饲养动物群体规模受到限制。由于单场规模的限制,针对单一群体的育种工作,常会面临选择强度较低、群体变异较小等问题,使得此类种猪群体遗传进展较慢,育种基础逐渐变窄。因此,探索不同群体或亚群之间的联合遗传评估,促进种猪育种单位之间的遗传交流,有利于整体育种效率的提升。
当前全球的种猪育种模式,一类是以跨国育种公司为主导,该类公司将其育种核心群全球布局;另一类是中小企业或家庭农场的联合育种,这种模式一般是以国家或者行业协会为主导。在我国,这两种模式处于并行发展的阶段[1],前者以温氏种猪公司为例,无论是其育种技术的研发和应用,还是其育种核心群体的布局和建设,都处于行业领先水平;后者以中小企业为主,通过遴选国家级生猪核心育种场实现全国或区域联合育种,扩大了核心母猪群体,使得整体遗传联系和表型进展得以快速提升[2]。
在种猪遗传评估中,如何联合不同群体或亚群进行遗传分析,是大公司以及中小企业在育种工作中共同面临的问题;加之非洲猪瘟影响,会促进育种核心群的分点布局。因此,如何利用好跨群体遗传评估,是一项重要的研究内容,而群体间遗传联系是跨群体联合遗传评估的基础。本文综述了当前应用较多的基于表型和系谱信息的评价群体遗传联系的方法,介绍了基于基因组信息来评价基因组遗传联系的方法,并阐述了不同评价方法在奶牛和猪育种中的应用,以期为推动联合遗传评估提供参考。
1.1 基于表型和系谱信息 不同种猪群体之间的关联度的大小是评价能否联合遗传分析的基础,关联度影响各场个体估计育种值比较的准确性。用预测误差方差(Prediction Error Variance of Difference,PEVD)评价不同场或群体组关联性是理想的度量方法,不同场之间通过比较所有个体两两配对的平均预测误差方差来表示,计算公式(1):
但是,在大规模的遗传评估计划中,可能是2 个场的大量个体进行配对,也可能有数个场之间的个体进行两两比对,这样计算非常耗时。
目前常用关联率(Connectedness Rating,CR)来度量,其利用混合线性模型,将场效应设置为固定效应,计算场效应估计值的方差和协方差,并利用公式(2)来计算:
其中,Var(hi),Var(hj)和cov(hij)分别是相应场效应的方差和协方差。
Kennedy 等[3]的模拟研究表明,CR 计算结果和PEVD 之间的相关程度达到0.995,原因可能是对于每个配对比较来说,个体EBV 差异的预测误差方差(PEV)可以分为2 部分。一部分与个体本身及其亲属有关,这部分取决于每个EBV 的PEV,2 个个体的相关程度和个体与场效应之间的协方差;另一部分与场效应本身有关,包括场效应估计值的方差和不同场效应间的协方差。计算2 个场个体的PEVD 时,第一部分个体本身及其亲属有关的部分,在所有配对进行平均后会相互抵消;第二部分中与场效应有关的部分是相同的,所以PEVD 近似等于2 个场效应的估计值的PEV,即场间关联率[4]。
有研究表明,随着场间关联率的提升,场间EBV比较的误差方差逐渐降低,在关联率达到3%时,误差方差达到0.5 左右[5]。不同群体间联合遗传评估需要的关联水平取决于场或同期组的大小、显著水平、需要检测出的EBV 平均差异值以及残差方差,样本含量越大,相同的检测差异比例、需要的关联率水平越低;且随着样本含量的上升,CR 的大小越来越依赖于遗传联系[4]。
2.2 基于基因组信息 近年来,以基因组选择技术为代表的分子育种技术在猪育种中逐步应用,该技术利用覆盖全基因组的遗传标记,将标记信息与表型信息建立关联,以此来实现对个体种用价值进行更加准确地评定。在联合遗传评估中,利用基因组信息,也将能够更加准确和及时地评估不同群体或不同亚群之间的遗传联系。
基于单核苷酸多态(SNP)标记信息的基因组联合育种,其准确性依赖于与数量性状基因座(QTL)或致因突变位点(QTN)处于连锁不平衡(LD)的标记位点在不同群体中连锁模式存在相似性。参考群与验证群遗传联系越紧密,参考群遗传标记的估计效应在验证群中使用,育种值估计的准确性越高[6]。评估群体之间的遗传相似性有多种方法:
不同群体之间相同标记的LD 之间的相关性,可用来评估群体间的遗传相似性,以此来从侧面反映不同群体联合遗传评估EBV 准确性的高低。也可根据标记之间LD 衰减的特征,来评估群体之间联合遗传评估所需的最少标记数[7]。处于同一染色体2 个标记位点之间的LD 水平,常用r 来表示[8],计算公式(3):
其中,pA1B1是基因座A 上等位基因1 和基因座B 上等位基因1 同时出现的频率,pA1是基因组A 上等位基因1 出现的频率。
另外,在群体遗传学中,评价不同群体之间的遗传联系,常用的表达方式还有主成分分析(PCA)、进化分析(系统发生树)和admixture 分析(structure 图)。此外,也可通过比较Fst指数来评价群体的分化程度,来间接反映群体之间的亲缘关系。
PCA 的思想是将数据的n 维特征映射到k 维上(k<n),k 维是全新的正交特征,以此来达到减少特征数、减少冗余和减少过渡拟合的目的,一般用影响最大的因素PC1 和PC2 做二维图形,直观展示群体之间的遗传联系,如图1 所示[9]。系统发生树用以反映具有共同祖先的各物种相互间的演化关系,在树形结构中,其用枝长的累计距离来反映样本差异的大小,如图2 所示[10]。Structure 图(图3)能够反映不同群体之间遗传物质的交流情况[11],该方法将群体预分为若干个亚群,并假设各个亚群内部应该符合哈代-温伯格平衡,且采用贝叶斯算法,对每个模拟的分组值产生一个最大似然值,该值越大,说明对应的分组值越接近真实群体的情况。当分组值不断增加,会出现一个饱和的最大似然值,该点对应的分组值所生成的图即为最合适的模拟图。Fst指数利用种群期望杂合度和亚群预计杂合度,来计算反映群体的基因杂合性水平,以此来衡量种群分化程度。
在跨群体基因组选择研究中,上述指标常作为定性的指标加以利用,用以反映和比较群体之间的混杂程度。如对墨西哥奶牛群体的研究表明,不同生产系统的奶牛有共同的祖先,但存在不同的遗传特性[12];此外,在对不同来源奶牛群体的育种值进行联合遗传评估中,通过比较不同联合群体的LD 相关和主成分,解释了不同群体构成育种值估计准确性差异的原因[13]。
为了更加清晰跨群体遗传评估的应用和研究现状,下文以跨群体联合遗传评估较多的奶牛群体为例,阐述当前奶牛联合育种的进展,并以此为参照,探讨联合育种在猪育种中的应用前景,为下一步研究指明方向。
2.1 奶牛 在奶牛育种中,主导的奶牛品种是荷斯坦牛,又由于该奶牛的主选性状均集中在产奶量和乳成分上,因此,在基于该品种及其相似性状的选育上,主要的联合育种策略是联合组建大规模的参考群体,利用该群体能够对标记效应进行更加准确的估计,当前较为成功的是美国-加拿大以及欧洲奶牛联合育种[14]。在其他奶牛品种,如西门塔尔牛和瑞士褐牛的遗传改良中,也在借鉴荷斯坦奶牛联合育种的做法,通过联合不同国家相同品种的参考群来提高基因组选择的准确性。该策略已然成为联合遗传评估的主流方法[15]。
在联合不同群体构建参考群的过程中,联合基因组育种值评估准确性差异的原因也是较多研究的对象。如前所述的LD 之间的相关、PCA 和admixture 分析等,是主要的研究方法。有研究分析了法国、美国和中国参考群体之间两两联合遗传分析,育种值评估准确性差异的原因,结果显示法国和美国群体联合分析有较高的准确性,而与中国群体联合分析,准确性偏低,原因是法国和美国群体相同位点LD 值相关性更大,PCA 聚类更加紧密[13];此外,针对墨西哥奶牛群体的遗传分析表明,该奶牛群体遗传背景与引进的加拿大和美国奶牛群体存在遗传交流[16]。
另外,针对不同品种的跨群体遗传评估,也有相关报道。De Roos 等[7]研究分析了不同奶牛群体间的连锁不平衡程度,以荷斯坦奶牛和娟珊牛为例,至少300K的标记位点才能够满足联合遗传评估的需要;Pryce 等[16]评估了联合3 个品种牛与单一品种牛育种值估计的差异,结果表明不同品种联合构建参考群,育种值估计的准确性更高。无论是不同品种还是品系,基于单核苷酸多态(SNP)的跨群体联合遗传评估,单一群体与不同群体之间亲缘关系的远近,其本质在于QTL 的效应在不同群体之间的相似性以及与其连锁的SNP 的LD 水平,SNP 在不同群体的多态性也是影响联合遗传分析的因素之一[15]。因此,在跨群体联合遗传评估之前,需要更多关注群体结构和目标性状的遗传特性,这样才能够更有方向性,保证结果的可信度和可应用性。
2.2 猪 由奶牛联合遗传评估的研究和应用进展可知,联合构建参考群是其跨群体遗传评估的主要方式,并结合群体遗传学手段(如LD、PCA 和进化分析等)来辅助评估育种值估计的差异性,猪联合育种也可以借鉴这种方式。然而在猪育种中,金字塔式的育种体系和多品种多品系多目标性状的特点给猪联合育种带来更大的复杂性。
我国当前开展的种猪联合育种工作,场间联系性的评价指标为场间关联率,通过全国以及区域水平核心种猪场育种水平的提升以及场与场之间的遗传交流的开展,联合育种取得了一些成绩,部分场之间已经达到联合遗传评估的要求[2,17]。然而,基于基因组信息的联合育种工作才刚刚起步,2017 年,我国启动了基因组选择联合育种计划,以期通过利用基因组水平的分子标记信息,将能够更加准确和及时地评估不同群体或亚群之间的遗传联系,助推联合遗传评估工作的开展,提升种猪水平。
在我国种猪跨群体基因组联合遗传评估中,目前主要研究对象是不同公司相似来源背景的种猪群体。有研究以北京周边三家养猪公司的大白猪群体为研究对象,结果显示在系谱间关联较少的情况下,多场基因组联合遗传评估育种值估计的准确性高于单场,并克服了场间常规遗传评估育种值无法比较等缺点[18]。可见在猪中,借鉴了许多奶牛联合遗传评估构建混合参考群的做法。此外,结合猪育种特点,采用杂交群体构建基因组选择参考群体,以此来对纯种群体进行选择[19];或以纯种群体构建的参考群预测杂交群体[20]。或通过分析不同地理位置和饲养管理环境下基因组与环境的互作,以此对参考群构成进行优化,这些研究都有利于更好的开展猪的跨群体联合遗传评估。
在猪育种中,存在许多跨群体联合遗传评估的问题,如杂交群体信息的利用、降低核心群到商品群的遗传滞后性和不同品系间进行联合遗传评估等,利用基因组信息为解决这些问题提供了更好的手段。