北京地区大白猪基因组联合育种研究

2019-07-06 03:00张金鑫唐韶青宋海亮高虹蒋尧江一凡弥世荣孟庆利于凡肖炜云鹏张勤丁向东
中国农业科学 2019年12期
关键词:系谱公猪准确性

张金鑫,唐韶青,宋海亮,高虹,蒋尧,江一凡,弥世荣,孟庆利,于凡,肖炜,云鹏,张勤,丁向东

(1中国农业大学动物科技学院/畜禽育种国家工程实验室/农业部动物遗传育种与繁殖重点实验室,北京 100193;2北京市畜牧总站,北京 100107;3北京六马养猪科技有限公司,北京 101308;4北京养猪育种中心,北京 100194;5北京顺鑫农业发展集团有限公司,北京 101300)

0 引言

【研究意义】养猪业是畜牧业的支柱产业,良种是生猪生产发展的基础。2010年我国《生猪遗传改良计划(2009-2020)》[1]开始实施,总体目标是初步形成以联合育种为主要形式的生猪育种体系。猪联合育种实际上就是利用多个群体来构建大规模的育种核心群,对猪场进行跨场、跨区域甚至是全国性的联合评估,挑选出符合选育要求的优秀种公猪,在联合群体间共享,以达到共同利用优秀遗传资源的目的[2]。联合育种的前提是建立稳定的场间遗传联系,自 2010年生猪改良计划实施以来,我国场间关联率呈上升趋势,但场间遗传联系总体依然偏低,制约了全国性联合育种的开展[3]。随着生物技术的发展,基因组选择已成为动植物育种领域的一个研究和应用热点[4],在奶牛[5]、猪[6,7]、肉牛[8]、鸡(家禽[9])、作物[10-11]、林木[12]和水产生物[13-14]中开始大量研究和应用,是畜禽育种中继表型选择、育种值选择之后,具有重大应用前景的分子育种方式。如SCHAEFFER[5]2006年提出基因组选择能够将奶牛世代间隔缩短至1.75年,大幅度提高了奶牛遗传进展。FORNI[6]等人研究表明,基因组选择对低遗传力性状改良作用至关重要,如猪产仔数基因组选择准确性比传统BLUP选择准确性增加了68%。基因组选择同时为开展联合育种提供了新的解决方案[2,15]。【前人研究进展】常规的联合育种是基于系谱信息的,同一品种不同群体之间往往无法利用系谱构建亲缘关系矩阵,进行联合遗传评估。研究表明通过高密度SNP芯片,可以建立个体间基因组亲缘关系矩阵,实现通过系谱无法建立的不同群体间的遗传联系,从而扩大基因组遗传评估的参考群体,进而提高基因组选择准确性[16]。我国种猪来源多样,构建遗传背景相同的基因组选择参考群难度较大。SONG等[7]利用不同来源的大白猪群体构建基因组选择参考群,研究结果表明混合群体参考群可以提高基因组选择的准确性。【本研究切入点】由于多种原因,实施全国性的常规联合育种难度很大,而基因组选择可利用遗传背景不同群体组成的混合参考群,实行联合基因组遗传评估和联合育种,可成为未来我国猪育种发展的方向[2,17]和尽快赶超国际种业发达国家的有效方法,因此研究和实施基因组联合育种对我国猪联合育种具有重要的理论和实践意义。【拟解决的关键问题】为探讨猪基因组联合育种的可行性,利用北京地区3家国家生猪核心育种场数据(由于缺乏场间联系,无法开展常规联合遗传评估),构建大白猪基因组选择混合参考群,对3个场刚出生的大白公猪进行联合基因组遗传评估,实施早期选择,并评价基因组联合育种效果,为我国开展猪基因组联合育种提供依据。

1 材料与方法

试验于2017年11至2018年6月,在中国农业大学动物科技学院农业部动物遗传育种与繁殖重点实验室进行。

1.1 数据

1.1.1 表型数据 本研究数据来源于北京地区3家国家生猪核心育种场,北京六马养猪科技有限公司(BJLM,简称北京六马)、北京养猪育种中心(BBSCB,简称养猪中心)和北京顺鑫农业发展集团有限公司(BJXD,简称顺鑫农业),达100 kg体重日龄(age at 100 kg live weight , AGE)、100 kg活体背膘厚(backfat adjusted to 100 kg , BF)、总产仔数(total number born , TNB)等3个性状2007—2017年场内性能测定记录,其中繁殖记录为54 888条,生长记录为78 540条。

1.1.2 基因型数据 参考群体:来自上述3个场的4 020头大白猪组成基因组选择的参考群体,本研究样品利用天根血液基因组 DNA提取试剂盒提取试验猪血样,个体基因型由 Illumina公司 Porcine SNP 80KBeadchip芯片SNP分型得到,共包含68 528个SNP位点。对芯片数据进行如下质控处理:

(1)单个SNP的call rate要求达到90%以上;(2)个体的call rate达到90%以上;(3)SNP位点的最小等位基因频率不能低于0.05;(4)每个SNP位点哈代-温伯格平衡检验P值要大于10-6

质控筛选后,共有4 020个个体、56 490个SNP位点满足要求。芯片数据格式处理和质控填充分别利用plink[18]、beagle[19]软件完成。

候选群体:分批基因组预测北京六马、养猪中心和顺鑫农业3个育种场刚出生的大白公猪,共计1 879头,其中338头公猪已完成性能测定。每头候选公猪DNA提取和SNP基因型测定及质控与参考群体相同。参考群体和候选群体信息见表1。

1.2 方法

1.2.1 场间关联率 本研究参照 MATHUR[20-21]方法,用达100 kg体重日龄数据,计算了3个大白猪群体间场间关联率。MATHUR[21]将一个场的平均关联率定义为它与体系内其它所有场关联率的平均值,这个体系可以是几个场,也可以是几十个场。

1.2.2 育种值估计(estimated breeding value, EBV)本研究对各猪场大白猪达100 kg体重日龄、达100 kg活体背膘厚和总产仔数 3个性状育种值分别进行估计,估计育种值采用最佳线性无偏预测法(best linear unbiased prediction, BLUP)。参照全国种猪遗传评估中心遗传评估模型(www.cnsge.org.cn),生长性状采用双性状动物模型,固定效应为场年季性别;繁殖性状采用单性状重复力模型,固定效应为场年季效应,使用软件为GBS[22-23]。

表1 基因组联合育种大白猪参考群体和候选群体规模统计Table 1 Population size of reference and candidate population from three Yorkshire breeding farms in genomic joint breeding

1.2.3 基因组选择 本研究按图 1开展基因组育种,利用构建的来自3个场的混合参考群体进行所有个体的基因组联合遗传评估,对候选公猪进行基因组选择。如图1所示,主要有3次选择(1)初选,淘汰有生理缺陷、弱小的猪只。从剩余公猪中挑选一部分个体作为候选公猪送测,进行芯片基因型检测;(2)第一次基因组选择或早期选择。根据候选公猪的各性状GEBV及基因组综合指数(大白猪采用基因组母系指数)进行二选,成绩优秀的公猪被选留,进行性能测定,此项工作在公猪去势前完成;(3)第二次基因组选择或终选,待性能测定结束以后,结合性能测定信息再次基因组联合遗传评估,计算各性状新的GEBV和基因组母系指数,对优秀个体进行终选留种。

图1 基因组选择实施流程Fig. 1 Workflow of Genomic selection

基因组选择的核心是基因组育种值估计。本研究采用一步法(Single-Step GBLUP,简称SSGBLUP)估计基因组育种值,反应变量选用校正表型Yc,由育种值计算获得,具体细节参照SONG[16],一步法能够同时利用基因组信息和系谱信息,构建包含A矩阵(根据系谱信息)和G矩阵(根据基因组信息)的H矩阵,以此来估计个体基因组育种值[24-25]。其GEBV模型如下:

其中Y为各性状校正表型值向量;b为场固定效应向量;g为加性遗传随机效应向量,服从正态分布N(0,Hσ2g),σ2g为加性遗传方差,H阵为由基因型和无基因型个体构成的个体亲缘关系矩阵;e为随机残差效应向量,服从正态分布N(0, Iσ2e),σ2e为残差方差;X和Z分别为b和g相应的结构矩阵。

1.2.4 基因组选择准确性 本研究采用准确性、无偏性和理论准确性评价基因组联合育种效果。

(1)准确性:由GEBV和候选公猪校正表型Yc之间线性相关系数计算得到r(Yc, GEBV)。

(2)无偏性:由校正表型Yc对GEBV的回归系数b衡量。b越接近1,表明此方法的无偏性越好。

(3)理论准确性:理论可靠性开方即为理论准确性。Henderson用理论可靠性来评价传统动物个体育种值估计的可靠性[26],同样个体基因组育种值理论可靠性与传统育种值的可靠性相似[27],可以通过如下公式计算出每个个体的EBV和 GEBV理论可靠性:

其中,σ2g加性遗传方差,SEP为个体的 GEBV/EBV预测标准误。

2 结果

2.1 场间关联率

表2列出了3家核心育种场及分场的场间关联率。养猪中心(BBSCB)、北京六马(BJLM1,BJLM4,BJLM5,BJLM6)和顺鑫农业(BJXD1,BJXD2)3个场之间的遗传联系较差,彼此间都为 0,说明从系谱上看不出3个场之间群体有遗传联系,但3个核心场内分场之间的关联性很好。

表2 北京地区3家核心育种场大白猪场间关联率Table 2 Connectedness rating among three Yorkshire populations in Beijing

图 2(a)进一步显示了北京六马和顺鑫农业两猪场间基于系谱建立的个体亲缘关系,结果表明,场间个体间亲缘关系都为 0,由于两场从系谱上追踪不到共同的祖先存在,从基于系谱的A阵上无法建立两场间的联系。但基因组信息可以反映出个体间的亲缘关系,如图2(b)所示的基于基因组信息的G矩阵亲缘关系,不同群体间个体的基因组亲缘关系系数并不全都为0,有很多高于0.25甚至0.5。

2.2 基因组选择准确性评价

2.2.1 基因组选择准确性与无偏性 表 3列出了338头已完成性能测定的候选公猪作为验证群体,评价基因组选择的准确性和无偏性。结果表明,第二次基因组选择由于加入了候选公猪的测定信息,两个生长性状达100kg体重日龄(Age)和100kg活体背膘厚(BF)的基因组选择准确性由第一次基因组选择的0.55和0.62分别提高到0.72和0.84,提高了17和22个百分点。无偏性反映了基因组选择预测的偏差情况,无偏性值越接近1,表明预测的偏差越小。如表3所示,第二次基因组选择Age和BF两个性状无偏性分别为0.96和1.00,远好于第一次的0.82和0.91,表明终选时预测偏差更小,预测结果更为准确。

表3 已有表型的候选公猪基因组预测准确性和无偏性Table 3 Accuracy and unbiasedness of genomic prediction

图2 北京六马(LM)和顺鑫农业(XD)大白猪基于系谱和基因组信息的亲缘关系Fig. 2 Relationship of two Yorkshire populations based on different information

2.2.2 基因组育种值、系谱指数和育种值理论准确性比较 常规育种中依据系谱指数与育种值进行二选(公猪去势前)和终选(性能测定结束),在基因组育种中则根据基因组育种值。表4分别列出了二选和终选时GEBV与系谱指数和EBV的理论准确性比较。为了验证通过基因组早期选种结果与性能测定后选种结果相比是否可靠,我们将候选公猪第一次和第二次基因组选择时的GEBV与其系谱指数(即利用父母信息对个体预测的结果)、有测定成绩后的EBV的理论准确性做了比较。结果显示,二选时,达100kg体重日龄、100kg活体背膘厚和总产仔数3个性状基因组选择的理论准确性高于系谱指数的理论准确性10,14和19个百分点;终选时,3个性状基因组选择的理论准确性高于EBV理论准确性8,12和19个百分点,低遗传力的繁殖性状提高幅度最大。生长性状基因组选择理论准确性标准差均小于系谱指数和EBV理论准确性标准差,基因组选择准确性波动范围小、精确度高。终选时EBV与二选时系谱指数相比,增加了候选公猪的性能测定信息,因此100 kg体重日龄(Age)和100 kg活体背膘厚EBV理论准确性分别高出系谱指数15和16个百分点,同样,两个性状第二次基因组选择的理论准确性比第一次增加了13和14个百分点。由于尚无总产仔数记录,因此EBV与系谱指数、两次基因组选择理论准确性相同。各性状利用测定信息与芯片信息估计的基因组育种值准确性均高于仅利用测定信息估计的育种值准确性。

表4 不同选择阶段的公猪GEBV、系谱指数和EBV理论准确性Table 4 The theoretical accuracy of GEBV, pedigree Index and EBV in different selection stages

3 讨论

3.1 联合育种

联合育种是我国猪育种的方向,由于单个猪场育种群数量有限,联合育种能够扩大育种群规模,从而增大遗传变异、提高育种值估计准确性和加大选择强度,获得较大的遗传进展。场间遗传联系是联合育种的前提,完整的系谱登记是评价育种场之间遗传联系的基本依据。场间遗传联系实际上是两个猪场系谱间的联系,即可以追踪到共同祖先。MATHUR等[20-21]利用加拿大育种数据进行分析,结果显示场间平均遗传联系大于等于 3%时开展联合遗传评估效果较好,本研究中的三个大白群体由于来源不同,从系谱上无法建立起场间联系,各场间关联率为0(表2),导致常规联合遗传评估无法开展,这在我国当前生猪遗传改良中普遍存在[3]。虽然从系谱上无法找到这些大白猪之间的遗传联系,但是由于他们都发源于英系大白猪,不同品系间仍有着共同祖先的 DNA印记,即使遗传背景不同仍然存在亲缘关系(图 2)。本研究结果表明芯片信息相比系谱信息,能更真实的反映出个体间的亲缘关系,利用芯片信息能够建立起不同群体间的遗传联系。因此,基因组信息可以建立起不同群体间的场间联系,进而可以开展基因组联合遗传评估和联合育种。本研究利用北京地区三个遗传背景不同的大白猪群体,构建了混合参考群体,开展了基因组联合育种,不同阶段基因组选择准确性都高于相应的常规基于单场信息的系谱指数和育种值选择,表现出基因组联合育种的优势。因此,基因组选择为我国种猪联合育种提供了一条新途径。

3.2 混合群体效果及性能测定的重要性

参考群体规模[15,28]、性状遗传力[29]、标记与QTL之间的连锁不平衡[29-30]和标记密度等都是影响基因组选择准确性的因素。基因组育种值估计时利用的表型信息都来自于参考群,参考群规模直接影响着表型信息量的大小,因此扩大参考群体规模是提高基因组选择准确性的有效途径。直接扩大单个群体规模最为有效,合并来源不同的群体构建混合参考群体也是一个选择,这个在奶牛、肉牛的基因组选择中有诸多研究[31-33]。LUND[31]等利用合并不同国家荷斯坦公牛群体开展基因组选择,结果表明混合群体基因组选择准确性比单个群体基因组选择准确性提高了 10个百分点,其中针对不同群体不同性状基因组准确性提高幅度在2%—19%之间。我国猪种遗传背景复杂多样,建立单一遗传背景的基因组参考群难度较大,混合群体的基因组选择对我国开展基因组联合育种具有现实意义。本研究构建的混合参考群对刚出生的小公猪实施基因组选择后,选择准确性大幅提高。早期选择时,达100kg体重日龄、100kg活体背膘厚和总产仔数的选择准确性由 55%、 56%和 60%分别提高到65%、70%和 60%。候选公猪性能测定结束后,由于增加了测定信息,达100kg体重日龄、100kg活体背膘厚两个性状基因组选择准确性进一步提高到78%和84%。同时本研究发现,常规的性能测定十分重要,达100 kg体重日龄、100 kg活体背膘厚EBV准确性远高于仅依赖父母信息的系谱指数准确性15和16个百分点,也高出第一次基因组选择(候选公猪无性能测定信息)的准确性5和2个百分点,表明个体的测定信息对提高育种值或基因组育种值估计准确性影响更大,因此坚持性能测定十分重要。

3.3 基因组早期选择

本研究结合我国当前生猪市场情况,主要对公猪进行了基因组选择应用,这一流程同样适用于母猪选择。研究结果表明,基因组选择可以很好的对公猪进行早期选择,公猪去势前进行的第一次基因组选择与终选时的EBV选择准确性相当,且相关很高,表明第一次基因组选择的个体与常规育种选择个体排序基本一致,基因组早期选择可以达到常规育种性能测定结束时的效果。综合指数结果排名前20的个体,早期选择时基因组母系指数与传统母系指数秩相关0.6、终选时基因组母系指数与传统母系指数秩相关0.62。两者相关较高,说明传统母系指数排名靠前的个体,其基因组母系指数排名也很靠前,两者排序一致性好,对优秀个体有着较高的选择准确性。同时,利用基因组选择,可以对公猪有针对的提前去势淘汰,减少后期常规测定的繁琐工作量及测定成本。本研究也表明,基因组选择对低遗传力性状总产仔数准确性提高幅度最大,这与其他研究相同[6,34],另外,基因组选择对屠宰性状和难以测定的肉质性状[35-36]更具有无法比拟的优势。

3.4 一步法估计基因组育种值优势

基因组育种值估计是基因组选择的核心,人们提出了一系列方法估计 GEBV,按基因组育种值估计思路大致可分为两类:一类是间接法,通过估计等位基因的效应值来预测 GEBV,即根据参考群体估计出每一个SNP等位基因或不同染色体片段的效应值,再根据相应的基因型预测候选个体 GEBV,主要有 RRBLUP和基于贝叶斯的一些列方法BayesA[15]、BayesB[15]、BayesC、BayesCpi、BayesR和 BayesLasso[37-38]等。另一类是直接法,像传统的BLUP方法那样,通过基于个体亲缘关系矩阵预测GEBV,利用个体基因型信息计算基于基因组信息的个体亲缘关系G阵,替代传统方法基于系谱构建的A阵,直接估计所有个体GEBV[39](这一方法为GBLUP方法)或者将G矩阵与A矩阵共同合成一个H矩阵,来估计个体 GEBV的一步法(sing step GBLUP,SSGBLUP)。该方法利用系谱信息、性能测定信息和基因组信息,能对所有个体进行基因组遗传评估,准确性最高[24,40]。实际育种中,只有一小部分猪有芯片基因型信息,大部分猪只有表型测定信息,一步法模型通过基因型-系谱合并矩阵做到了常规育种与分子育种的有机结合,利用一步法进行个体的联合遗传评估将成为猪遗传评估的趋势。我国的联合育种工作应该逐步深化,将基因组选择技术与常规遗传评估相结合,逐步实现全国性的基因组联合遗传评估和基因组联合育种,推动我国生猪遗传改良计划升级。

4 结论

利用混合群体参考群开展北京地区基因组联合育种研究,结果表明北京地区三家核心场场间关联率偏低,无法开展传统联合遗传评估,但通过基因组选择能够开展基因组联合评估,实行基因组联合育种。基因组选择的准确性高于传统的系谱指数和育种值选种,低遗传力性状提高幅度最大,能够实现早期选择,提高育种效益。

猜你喜欢
系谱公猪准确性
《全国优秀公猪站》手册2022 版征集
《全国优秀公猪站》手册2022 版征集
《论风格》文本系谱与论争
浅谈如何提高建筑安装工程预算的准确性
非经典型21-羟化酶缺陷症1例家系调查及妊娠期治疗分析
理解语境与名句的关系,提高默写的准确性
《全国优秀公猪站》手册(二)
管好种公猪可提高受胎率
教你如何治好“遗传病”
1982—2011年江苏大麦育成品种亲本分析