基因组选择在反刍动物中的应用与研究进展

2024-05-08 12:52王海锋李诚兰岳耀敬
中国草食动物科学 2024年1期
关键词:反刍动物表型准确性

王海锋,李诚兰,岳耀敬

(中国农业科学院兰州畜牧与兽药研究所,兰州 730050)

近年来随着生活水平的不断提高,人们的饮食结构也随之发生改变,更加追求膳食营养的全面性。羊肉因具有纤维细嫩、胆固醇含量低、营养价值高、脂肪分布均匀的优点,其消费量稳步增加[1],目前我国已成为世界上主要的羊肉生产国和最大的消费国[2]。羊奶因其营养温和、易于吸收、致敏性低[3]的产品特性受到消费者的喜爱,而且羊奶的总体营养成分更接近于人奶,在替代母乳方面有更广阔的应用前景[4]。毋庸置疑的是,反刍动物的肉、毛、奶、皮革等畜产品均有重要的经济价值,但是其生产肉、奶、皮革等畜产品的性能低下,不能满足当前的市场消费需求。因此,如何加速改良牛、羊等具有重要经济价值的反刍动物,是动物选育工作中亟待解决的问题。

随着科学技术的迅猛发展,使得动物育种工作的关注点从宏观性状转变到微观基因,融合了现代繁殖生物技术与育种的分子育种技术,即分子标记辅助选择法(Marker assisted selection,MAS)随即建立。MAS较传统育种方法而言,能够有效地缩短育种年限,提高育种效率[5-6]。但是在研究中发现,大量经济性状是由多个微效多基因所控制,且应用于功能基因或分子标记的数量非常有限[7],同时也由于MAS 难以解释复杂的数量性状,这使得MAS 在育种过程中受到限制。鉴于MAS 的缺陷和不足,2001 年基因组选择(Genomic selection,GS)或称全基因组选择(Whole genome selection,WGS)问世[8]。

基因组选择技术是以覆盖参考群体全基因组高密度SNP 标记,结合表型值或系谱记录来计算个体基因组的估计育种值,对低遗传力、检测周期长或者测量成本较高的性状都可以进行提前有效的预测,从而实现群体的早期选育、缩短时代间隔、降低育种成本[9-10]。与MAS 相比,基因组选择可以同时使用全基因组标记来估计育种值[11],这使得预测的个体育种值更加准确。现阶段,畜禽基因组测序工作陆续收官,计算机运算能力不断增强,应用GS 的成本越来越低,这也为新育种技术的发展创造了条件。为此,本文主要从基因组选择的原理、在具有重要经济价值的反刍动物中的应用与研究进展,以及所面临的机遇与挑战等角度来论述,可为日后基因组选择技术在反刍动物育种中的应用提供理论依据和参考。

1 基因组选择

1.1 基因组选择的原理

基因组选择是整个基因组标记图谱信息和表型信息的综合运用,通过评估每个分子标记或染色体片段的效应值来得到个体估计育种值,称其为基因组育种值(Genomic estimated breeding value,GEBV)[9-10]。理论上假设SNP标记中至少有一个标记与所有控制性状的QTL 处于连锁不平衡状态(Linkage disequilibrium,LD),与MAS 相比,GS 不仅可以减少部分抽样误差,而且可以使用覆盖全基因组的全部遗传标记进行育种值估计,从而弥补MAS 的缺陷,提高估计育种值的准确性,同时实现早期选择,减少近亲繁殖[11-13]。从理论上来说,基因组选择本质也是标记辅助选择,但此方法不同于传统标记辅助选择的是,后者只能利用有限的遗传标记来进行遗传评估和育种值估计,而GS可以充分应用分布在整个基因组上的所有标记信息进行育种值估计,因此,基于该方法估计得到的育种值是基因组级别的估计育种值[13]。目前已经通过大量的实验验证了基因组选择可以提高遗传进展的巨大潜力。

基因组选择具有既不依赖表型信息,又能够捕获基因组中所有的遗传变异以及减少近交等无可比拟的优点。可利用基因组选择进行早期选择,加快育种进程;对低遗传力的性状进行预测,降低育种成本;区分个体间差异,增强选择强度;降低选用同胞作为种用的几率,减少近交增量。

1.2 基因组选择的常见算法

育种方法由MAS 到GS 是从显著性检验转向估计所有标记效应的不断优化。根据分析使用的统计模型不同,可以将基因组育种值的计算方法大致分为以BLUP理论为基础和以贝叶斯理论为基础的方法。

1.2.1 基于BLUP理论的方法

BLUP 是将线性统计模型方法论与数量遗传学相结合而形成的,目前基于BLUP 理论衍生出一系列计算方法来应对不同情况、不同品种、不同性状等,来得到更为准确的育种值。如岭回归最佳线性无偏估计(RRBLUP)、基因组最佳线性无偏预测(GBLUP)和一步法GBLUP(SS-GBLUP)等。Whittaker 等[14]提出了RRBLUP,该模型的基本原理是基于等位基因效应,假设所有标记效应的方差服从正态分布且方差相等,估算出每个标记的效应值后相加即得到个体估计育种值。该模型充分利用所有亲属信息,避免了因随机交配而产生误差,也可对不同群体进行联合遗传评估,但此方法不适用于较大染色体片段效应性状的方差估计。Kennedy等[15]提出了GBLUP单个位点的混合线性模型,该模型是通过已测定的基因型来计算个体间的相关关系,此方法可以有效减少估计方程组的个数,降低计算强度。

1.2.2 基于贝叶斯理论的方法

Bayes方法是Meuwissen等将标记效应的方差假定为某种先验分布而提出的,与此同时通过对标记效应进行不同的假设进而衍生出一系列的Bayes 方法,主要包括Bayes A、Bayes B、Bayes C 以及Bayes LASSO 等等。在Bayes A 中,标记效应gi服从零均值正态分布,而效应方差服从逆卡方分布,gi的条件后验分布为t分布;对于Bayes B 来说是假设少数SNP 有效应,且效应方差服从逆卡方分布,而大多数SNP无效应,其在运算过程中引入一个参数T,假定标记效应方差为0的概率为π,则服从逆卡方分布的概率则为1-π,当π为1时,所有SNP 都有效应,此时与Bayes A 等价;对于Bayes C来说是将Bayes B 进行了一定程度的优化,将π作为一个未知参数,假设服从U(0,1)的均匀分布,并假设具有效应的SNP 的效应方差不同;对于Bayes LASSO 则服从拉普拉斯(Laplace)分布,即背靠背拼在一起的两个不同位置的指数分布,与BayesA 假设标记效应服从正态分布不同的是它用相对于差的绝对值来表示,因此,Laplace 分布的尾部比正态分布更加平坦,即可允许极大值或极小值以更大的概率出现[16]。

1.2.3 基因组选择常见算法的比较

贝叶斯方法的重点和难点在于如何对超参数的先验分布进行合理的假设,相对于BLUP 方法往往具有更多的参数估计,在提高准确度的同时带来了更大的计算量,而高的精度往往需要上万次。Sun 等[17]用模拟数据集对Bayes B、RRBLUP 和GBLUP 等方法的准确性进行了比较研究,发现Bayes B 的准确性远高于RRBLUP 和GBLUP 方法,但Bayes B 方法最显著的缺点就是计算时间太长,导致其在生产中的应用受限,而GBLUP 凭借计算时间短、使用简单的优势被广泛应用于猪[18]、牛[19]、羊[13]、鸡[20]等畜禽的实际选育当中。Habier 等[21]用奶牛生产性状数据对GBLUP、Bayes B 和Bayes C 等方法的准确性进行了比较研究,结果表明Bayes B 方法在产奶量和乳蛋白量性状的预测中准确性最高。朱韶华等[22]采用50K 和630K 两种不同密度的微阵列数据,运用GBLUP 和Bayes Alphabet 模型对821 只高山美利奴羊遗传力水平不同的6种羊毛品质性状进行基因组预测分析,结果表明GBLUP 模型更适用于中等遗传力水平性状的基因组预测,Bayes B 和Bayes LASSO 模型更适合高遗传力水平性状的基因组预测。因此,在应用基因组选择技术时,应根据不同的群体、不同的性状选择使用不同的算法模型,只有这样采取针对性的方法,才能更准确地评估育种值[23]。

2 基因组选择在反刍动物中的应用现状

基因组选择技术为反刍动物育种改良提供了新的视角,加快了育种进程,推动了育种策略的优化与创新,对畜牧业的可持续发展带来了诸多积极影响。

2.1 基因组选择在牛育种中的研究

2.1.1 基因组选择在奶牛育种中的研究

基因组选择在奶牛上的应用最早且较为成功,为奶牛选种选育带来了革命性变化,已成为商业选择奶牛品种的主要方法,其通过缩短世代间隔、提高选择准确性、降低后裔检测成本等多途径迅速提高了奶牛的遗传进展[24]。2012 年起,我国就开始启动中国荷斯坦公牛的基因组选择育种工作,记录包括高密度基因分型、产奶、健康、体型等34 个性状的表型数据。卢徐斌[25]参考以上34 个性状的表型数据,采用GS 技术对中国荷斯坦牛产奶性状的参数和基因组进行了预测,发现该技术对性状的预测准确性可以达59%~76%,较传统方法的准确性提高了13%~30%。Schaeffer[26]从经济角度分析得出,在奶牛育种中运用GS技术可以使其育种成本降低92%。Garner 等[27]结合11 年的气象站数据,对荷斯坦牛和泽西牛的耐热性进行了基因组预测,结果显示,基于基因组育种值预测的耐热性奶牛比热敏感奶牛的产奶量降低幅度小,这对热应激事件的发生和持续时间的研究都有非常重要的意义,同时对提高奶牛的福利保健和生产性能都具有一定的贡献。

2.1.2 基因组选择在肉牛育种中的研究

我国有众多的肉牛品种,但育种群体的规模相对较小,且生产性能和谱系记录系统不够完善,制约了我国肉牛育种工作的发展。基因组选择在奶牛中的成功应用,使得肉牛也将基因组选择引入了育种计划,中国西门塔尔牛的基因组选择计划于2008 年正式启动。Magalhaes 等[28]从牛的肉质性状的研究中验证了基因组选择的准确性和可行性;Hayes等[29]通过对747头安格斯牛的甲烷排放性状表型的研究,获得了甲烷性状的基因组EBV(GEBV),并对630 000 个SNP 进行了基因分型,在273头安格斯牛中对GEBV的准确性进行了测试,发现测试结果与其表型特征相同,采用此法进行选育可使安格斯牛在10 年中减少约5%的甲烷排放量。所以相较于奶牛来说,应用基因组选择在肉牛产业上还有很长的路要走。

2.2 基因组选择在羊育种中的研究

目前我国羊产业的发展受到了诸多因素的限制,其中主要问题包括肉羊良种化程度不高、生长速度缓慢以及繁殖效率低等。此外,羊品种资源丰富,用途广泛,但个体经济价值较低,基因分型成本较高,这些因素都抑制了基因组选择在羊育种方面的应用。亟需创新应用基因组选择等育种关键新技术到羊育种中,以改良品种品质,提高生产性能。Dodds等[30]对3种肉毛兼用羊通过GBLUP 计算方法进行了GEBV 估计与验证,结果表明GS技术不但可以在混合品种的群体中进行GEBV 估计,而且当考虑品种结构的效应时还可以提高GEBV 估计值的准确度;Newton 等[31]对澳大利亚绵羊的繁殖性状进行了基因组信息评估,结果表明,不同年龄的基因组信息会影响遗传增益。McLaren 等[32]调查了29 个群体的2 957 只纯种特克塞尔母羊,发现母羊乳房的形状与乳腺炎的发生具有密切的关联,同时也对羊肉产量和品质产生一定影响,该研究指出,通过利用GS方法分析出可以改变乳房形态的基因,进而提高羊肉产量和改善肉品质,为肉羊育种提出了新的思路。

2.3 基因组选择在其他反刍动物中的研究

Gregić 等[33]研究发现,基因组选择在马育种中可以成为提高运动或者育种选择成功的宝贵工具,可以在出生前计算评估其重要特征,包括预测目前难以测定的性状。付东海[34]以354 头1.5 岁母牦牛作为试验参考群体,运用GBLUP、Bayes B 以及Bayes Cπ等3 种算法对参考群体的基因组育种值以及准确性进行预测。结果表明,Bayes Cπ方法在体高、体斜长、胸围以及体重等4 个生长性状和红细胞数、血红蛋白、血细胞容积等8 个血常规指标上都表现出极佳的预测效果,可作为牦牛群体基因组选择的最佳方法。李浩东等[35]利用261 只梅花鹿的体重体尺数据对GBLUP、Bayes A、Bayes B、Bayes C、RRBLUP 等模型进行比较研究,发现体重、体高、体斜长、管围、胸围、臀端高预测准确度最高的分别为GBLUP、Bayes B、Bayes C、Bayes B、Bayes A、RRBLUP,为梅花鹿生长相关性状的基因组选择与实际应用提供了重要的参考信息。

3 基因组选择在反刍动物育种中面临的挑战与机遇

如今科学技术迅猛发展,自基因组选择技术问世以来,算法模型和测序技术不断完善成熟,在奶牛育种中取得的成果较多,在肉牛、羊以及其他反刍动物的育种中也进行了相关研究与应用,不可否认的是,基因组选择技术开启了反刍动物育种的新篇章,推动动物育种迈向全面信息化、精准化、智能化育种新时代。

3.1 减误提质、育种更准确

在生产性能测定中,误差对育种结果具有重要的影响。测量误差可能来自多个方面,例如测量设备的准确性、测量方法的规范性、环境变化等因素。为了减少测量误差的影响,可以采取一些措施,例如选择精确的测量设备(多模图像融合技术、三维构建羊体尺测量模型等)、采用标准的测量方法、定期对测量设备进行校准等。此外,还可以对测量数据进行审核和修正,以减少测量误差对结果的影响。在概率论中,实验次数越多,频率越趋于概率,因此在减少测定误差的同时,要尽可能记录更多个体的表型信息,即参考群数量越大,标记效应估计越准确。Meuwissen等[36]通过模拟实验得出结论,在对遗传力为0.3的性状进行育种值估计时,样本数大于2 000 时的准确性较高。因此,在条件允许的情况下尽可能扩大参考群体、构建完整的系谱记录和繁殖记录。

3.2 数芯智库、育种更智慧

在对基因序列进行深入测序和解析时,会产生大量的数据,如何快速的将繁杂的数据准确地转化为对育种有用的信息,这就需要不断优化基因组选择的方法,提高模型计算的准确性和效率,提高计算机的算力。目前基因组选择主要依赖于表型信息、SNP 关联分析信息或生物学先验信息[37],因为基因组变异到表型变异经过了翻译、转录等过程,无法直接捕获,但随着高通量测序技术的不断完善和成熟,获取多组学数据(基因组、转录组、蛋白组、代谢组等)进行预测已经变得非常容易,这为研究从基因组变异到表型变异提供了桥梁。可以尝试将人工智能、表型信息、全基因组关联分析信息、多组学信息等综合应用优化基因组选择模型,使得预测的育种值更为准确。相信未来人工智能等数据解读和决策工具在动物育种中会发挥更大的作用,将形成以人工智能加分子育种技术的智慧育种新局面。

3.3 院企协同、育种技术落地生根

目前我国育种产业的发展受到了一个重要制约因素,科研院所在试验场地、品种推广等处受限,育种企业在高素质人才队伍建设、前沿育种技术应用、设备资源等处受限,这制约了我国育种产业的发展。基因组选择的本质是一种选种选育技术,涉及对数据的处理、复杂模型运用以及软件的分析,对人员具有很高的要求,需要其掌握基因组学、数量遗传学、统计学、数值分析等方面的知识,而且需要具备一定的编程能力来处理海量数据,同样这在实际操作中也需要相应完善的配套技术和设备,因此可以探索组建科研院所+育种企业+农户的模式,形成企业和科研院所优势互补,同时带动农民创收。科研院所进行新品种培育,企业提供试验场地和品种推广,农民参与养殖,企业回收畜种,这样不但使得育种技术可以应用于生产,落地生根,而且还能带动农民就业,促进农民增收,助力乡村振兴,开花结果。

猜你喜欢
反刍动物表型准确性
浅谈如何提高建筑安装工程预算的准确性
系统基因组学解码反刍动物的演化
建兰、寒兰花表型分析
反刍动物瘤胃酸中毒预防及治疗策略
美剧翻译中的“神翻译”:准确性和趣味性的平衡
论股票价格准确性的社会效益
GABABR2基因遗传变异与肥胖及代谢相关表型的关系
降低反刍动物胃肠道甲烷排放的措施
慢性乙型肝炎患者HBV基因表型与血清学测定的临床意义
72例老年急性白血病免疫表型分析