王嘉福
(贵州大学农业生物工程研究院,贵州 贵阳 550025)
动物分子育种(Amimal Molecular Breeding)是依据分子遗传学和数量遗传学理论,利用DNA重组技术改良畜禽品种的新方法,内容包括转基因育种(Transgenic Breeding)和基因组育种(Genomic Breeding)等方面。近年来,随着生物技术迅速发展,利用高通量测序、分子标记等先进的生物技术和信息技术手段,架起了种质基因资源信息与高通量、大数据的桥梁,建立起常规育种与分子育种相结合的平台,大幅度提高了育种效率,使育种工作实现了由“经验”向“科学”的根本性转变。
人类对畜禽的表型进行选择以提高其生产性能是动物育种的重要内容。孟德尔对遗传规律的发现,开创了动物育种学的新时代。20世纪20年代,英国统计学家和遗传学家费希尔、美国遗传学家赖特及英国生理学家和遗传学家霍尔丹奠定了数量遗传学的理论基础,1937年美国学者拉什出版了《动物育种方案》,初步奠定了现代动物育种的理论基础(鲁绍雄和吴常信,2002)。1950年代以来,数量遗传理论逐渐应用到动物育种实践中,并逐步成为主要的育种手段。从数量遗传学诞生以来,畜禽育种工作取得了巨大的进展,畜牧生产水平也得到了极大的提高。然而进入1980年代以来,由于畜禽经历了相对长期的选择,遗传改良的速度呈现了变慢的趋势,急需寻求一种具有突破性的育种方法。正是在这一时期,分子生物学,尤其是基因工程技术飞速的发展,以分子数量遗传学为理论基础的分子育种也随之产生,DNA分子标记,即分子遗传标记技术的成熟,使得畜禽数量性状图谱越来越系统化和完善,一些数量性状位点已被确定,发现和鉴定了一批经济性状关联的DNA分子标记和功能基因,从而为畜禽改良提供了新的有效手段(Goddard and Hayes,2009,Hayes and Goddard,2001)。其中最主要的是如何利用分子遗传标记对数量性状基因型进行辅助选择,即标记辅助选择。分子标记辅助育种通过寻找与重要性状紧密连锁的DNA分子标记,从基因型水平上实现对目标性状的直接选择,从而加快育种进程,提高育种效率,选育抗病、优质、高产的品种(Lande and Thompson,1990,Kashi et al.,1990,Tyrisevä et al.,2011)。
标记辅助选择可提高畜禽育种效率。但是标记信息所能带来的额外准确性主要取决于它能够解释的遗传变异。畜禽遗传改良的多数目标性状都是数量性状,受多个基因控制,每个基因只能解释很小比例的遗传变异。因此,通过候选基因(candidate gene)、数量性状基因座定位(quantitative trait locimapping,QTLmapping)和全基因组关联分析(genome-wide association study,GWAS))(Do et al.,2013)等策略发现的基因或标记也只能解释较小比例的遗传变异。显然,以上策略均难以显著提高育种值估计的准确性,这些都限制了标记辅助选择在畜禽育种中的应用。
人类基因组测序的完成推动了农业动物基因组研究工作,如美国的动物基因定位计划和国家动物基因组研究计划,中国华大基因“千种动植物基因组计划”等。动物基因组测序的完成和高通量基因分型技术的快速发展,出现了高密度的SNP芯片,产生了海量数据,极大促进了数量遗传学的发展。随着大多数畜禽物种高密度全基因组SNP分型芯片的开发和成本降低,为了将高密度全基因组标记信息更有效地用于遗传改良,Meuwissen等(2001)首次提出了全基因组选择(genomic selection,GS)方法,即全基因组范围的标记辅助选择(Marker Assisted Selection,MAS),指通过检测覆盖全基因组的分子标记,利用基因组水平的遗传信息对个体进行遗传评估,以期获得更高的育种值估计准确度。近年来,针对全基因组选择的计算方法、影响因素、应用策略和育种方案的研究大量涌现,二代测序技术的发展,全基因组选择方法已经成为世界畜禽遗传育种领域新的研究热点(张哲等,2011);同时,计算机的飞速发展和分子数量遗传学理论的进步,也为大批量数据的运算提供了技术支持。这两者都促进了全基因组选择方法由理论变为实践,借助于全基因选择方法在动物育种中的应用,目前在农业上全基因组选择已极大地促进了动物育种和生产的发展。
全基因组选择具有其无可比拟的优势,全基因组选择是在全基因组层面上分析目标性状表型的所有遗传变异,能够同时选择多种经济性状,从而达到多性状选育的育种模式(Werf,2013)。全基因组选择是动、植物育种的国际新趋势。目前,基因组选择处于大规模的理论研究和小规模实践应用并行的阶段。主要表现在,美国、加拿大、德国、荷兰、丹麦、瑞士、澳大利亚等众多国际前沿的研究机构都在集中开展高通量的SNP芯片检测技术和高效的统计分析方法的研究,技术更新迅速,统计模型也在不断优化,育种值估计的准确性在不断提高。另一方面,由于这一研究将带来育种上的重大进展,具有重要的商业价值,国际上的大型育种公司已经在部分商业品种中对全基因组选择策略加以应用,以期占得技术先机。国际上两家著名的芯片服务公司Illumina和Affymetrix正是看到了SNP标记检测的广阔前景,积极开发用于人、小鼠、果蝇等模式生物,以及经济作物和动物的SNP检测芯片,并已经投入商业使用。而目前随着鸡牛猪羊等农业动物以及水产动物基因组序列图谱及SNP图谱的完成或即将完成,提供了大量的分子标记用于进行基因组研究。一些科研机构也在根据研究的需要,定制畜禽的SNP芯片。随着分子生物学的发展,芯片的测序成本将会越来越低,密度将会越来越大,这都为基因组选择提高了便利条件。
现代动物育种方法已逐渐从分子标记辅助选择过渡到全基因组选择育种。全基因组选择方法的应用成为了继20世纪四五十年代的杂交育种技术和90年代的BLUP技术之后的新的精准分子育种技术。
传统育种技术与现代生物技术的交融,正在从深度与广度上推进动物育种科学的发展(Flint and Woolliams,2008,Tyriseväet al.,2011)。根据美、英等畜牧发达国家政府和联合国粮农组织的预测,21世纪全球商品化生产的畜禽品种都将通过分子育种技术进行选育,而品种对整个畜牧生产的贡献率亦将超过50%。对于瘦肉生长和肉质这类复杂性状,用传统选择方法进行改良进展十分有限,而且会出现此起彼伏的现象,分子育种将有望成为新的育种手段。国内外大型的育种公司已经使用分子标记辅助选择技术开展猪、牛等动物的遗传改良,并加大研究投入和研究力度开发研制具有独立知识产权的基因并应用于育种实践,这已成为目前各国育种工作者研究重点(VanRaden and Sullivan,2010,Singh et al.,2014)。因此,应用分子育种技术来改良动物品种是21世纪品种改良的趋势。
在动物的遗传育种中,标记辅助选择(MAS)的应用可使遗传进展从15% 增加到30%,依据这种趋势,MAS的总的遗传进展估计可达到44.7%~99.5%(Edwards and Page,1994)。模拟研究表明采用标记辅助选择比传统指数选择的理论相对效率可提高24倍(Bishop et al.,1995)。标记辅助选择由于充分利用了表型系谱和遗传标记的信息,与只利用表型和系谱信息的常规选种方法相比具有更大的信息量(鲁绍雄和吴常信,2002)。目前MAS在动物的选育中已得到广泛应用,由分子标记定位的控制动物重要经济性状的主基因目前已检测出了许多,1996年全球最大的猪育种集团PIC公司利用DNA标记技术清除其育种群中的氟烷敏感基因,使猪只死亡率由过去的4‰~6‰降至0,同时商品猪的肉质也得到了明显的改进;Hanset等(1995)已经将大白猪的正常等位基因固定在皮特兰猪中,并在3次回交后获得氟烷阴性的皮特兰品系。另一个成功例子是PIC公司在商业化瘦肉型猪繁育体系中导入中国梅山猪的高繁殖性能基因,将ESR基因型作为参数加入核心群母系选择指数中,可以使产仔数的遗传进展提高了30%,这些核心群母猪的后代杂种母猪平均窝产仔数也有明显增加(Rothschild and Plastow,1999)。国际上其他猪育种公司也在应用DNA标记技术改良肉质性状等方面做了大量工作,都取得了明显的效果(Dekkers,2004a,2012b)。法国、新西兰和德国等将一些信息(连锁平衡标记即LE标记)用于畜禽育种中,发现了很多与肉质生长和繁殖性状有关的基因,如与肉质性状有关的激素敏感脂肪酶基因(HSL)、钙蛋白酶抑制蛋白基因(CAST)、猪氟烷基因(HAL)、基因猪热激蛋白 70.2 基因(HSP70.2)、组织蛋白酶基因(CTSF)、心脏脂肪酸结合蛋白基因(H-FABP)及脂肪细胞脂肪酸结合蛋白基因(A-FABP),与生长性状有关的生长激素基因(GH)类胰岛素因子I(IGF-I)和Myostatin基因等,与繁殖性状有关的雌激素受体基因(ESR)、促卵泡素B亚基基因(FSH-B)、促乳素受体基因(PRLR)、猪表皮生长因子(EGF)基因和在绵羊上发现的Booroola基因,绵羊的多胎基因(FecB基因)定位于第6号染色体上,同时发现了一些与FecB基因相连锁的分子遗传标记。牛的双肌(DM)基因和鸡的矮小(dw)基因也在育种和生产中得到应用。对牛的初步研究发现FSHR基因5'端B型等位基因可能对牛的产犊性能有提高作用。这些基因控制的性状在我国当前育种中尤为重要,利用标记辅助选择具有十分重要的现实意义。
Genus-PIC(Genus Pic Annual Report,2013,傅衍,2014)是最早开展标记辅助育种的猪育种公司,在过去的二十年里,PIC研发及应用的分子标记在动物育种公司中是最多的,遗传标记有关的专利有50多项,涉及的性状有饲料利用率、疾病抵抗力、肉质、生产性能和繁殖性能等,候选遗传标记数量突破15000个、常规应用185个。近年来,PIC已从遗传标记、候选基因的发掘和应用及标记辅助选择,过渡到了全基因组连锁分析及基因组选择。PIC最新应用于育种实践的研发成果是基因组评估中的“Imputation”技术(填充技术),通过 Genus建立的Imputation技术,可以将对猪的400个SNP分型填充至6万个SNP,从而使高密度基因组评估的成本从100美元下降至15美元,这使得基因组选择真正成为了可大量应用于猪育种实践的实用技术。Genus研发团队正在从事的有潜在应用前景的其它研究有:公畜生产单性别精液技术(非物理和化学方法)、通过生殖细胞转移让普通公猪生产超级公猪精液的技术、以及基因编辑技术等。
根据国际牛协(Interbull Centre Activity Report,2013/2014)统计,目前,在许多国家用基因分型的方法对奶牛的表型和家系进行选择。全世界超过50,000头奶牛进行了50,000个标记的基因分型,奶牛的选择育种已从遗传学向全基因组选择转变。
在我国,前期的大量工作已为主要畜禽基因组选择的实施铺平了道路。如在我国的奶牛育种中,随着近年来奶牛生产性能测定(DHI)体系的建立和完善,已积累了大量可靠的生产性能测定数据,这为估计SNP标记效应奠定了基础;另外在鸡,猪的研究中,已检测出大量针对我国特有品种的SNP标记,为定制这些畜种SNP芯片提供了条件。同时在单倍型推断和育种值估计方面,国内已开展了大量相关研究工作,这些都为我国畜禽基因组的选择的开展提供了不可多得资源优势和技术支持。在国际上,新西兰已经减少了后裔测定公牛数目,增加了基于基因组信息选择种公牛数目。而且一旦参考群体被确定以后,低密度的基因分型能够降低未来基因分型的费用。获得基因结果以后,母牛和年轻公牛有着比基于系谱信息估计的育种值更高的准确性。2010年,Macciotta等(2010)借助50K芯片在美国安格斯牛上对屠宰性状进行基因组育种值估计,结果表明准确性在0.50-0.65。Saatchi等(2012)在美国利木赞和西门塔尔肉牛上实施基因组选择,他们的参考群体是由2239头利木赞和2703西门塔尔牛,基因分型使用的是Illumina的50k芯片,分析了多个重要的经济性状,研究结果表明基因组育种值有较高的准确性(Saatchi et al.,2012)。另外,美国等正在研究将全基因组选择等新技术引入到奶牛育种体系中,降低后裔测定和种公牛选种在现有育种体系中的重要性,进而消除杂交育种带来的品种不纯等负面影响,而合理利用杂交育种带来的杂种优势。在猪的育种中,杂交是被广泛使用的,这样充分利用杂种优势和品种互补,使用杂种猪作为参考群体进行基因组选择来进行选择纯种猪,这能够允许进行一个更有效的选择。在家禽育种中,Wolc等(2011)在蛋鸡上使用了基因组选择,研究结果表明基因组选择在蛋鸡早晚期选择中能够显著地提高准确性。Gonzalez等(2009)在肉鸡群体中实施基因组选择,他们选用333只和61只后裔测定的公鸡分别作为参考群体和验证群体,对肉鸡的饲料转化率进行了研究。在水产动物中,挪威大西洋鲑鱼育种公司(Aqua Gen)联合 Affymetrix公司,设计了包含 923,627 SNPs的高密度芯片,计划开展大西洋鲑鱼抗病和寄生虫等经济性状的分子育种研究。总的来说,目前基因组选择在猪、羊、鸡以及水产动物中的研究报道还较少,应用范围不及奶牛广泛。
标记辅助选择由于充分利用了表型、系谱和遗传标记的信息,与只利用表型和系谱信息的常规选种方法相比,具有更大的信息量。同时由于标记辅助选择不易受环境的影响,且没有性别、年龄的限制,因而允许进行早期选种,可缩短世代间隔,提高选择强度,从而提高选种的效率和准确性,尤其是对于限性性状、低遗传力性状及难以测量的性状,其优越性就更为明显(Lande and Thompson,1990,Xie and Xu,1998)。从理论上而言,MAS改良数量性状比常规表现型选择有效的多,但实际育种中应用并不理想,其原因是QTL定位与效应的估算精确度不高,并且QTL与分子标记的关联性,因群体和世代不同而异。动物多数经济性状为复杂的数量性状,发育过程中涉及到众多的基因表达调控及其相互作用。分子标记不是基因,其变异并不能完全解释性状的遗传变异,此外基因型与环境互作也是重要影响因素。而目前的MAS方法大多基于简单加性模型或单基因座双基因座模型,还不能分析基因型与环境的互作和上位效应以及性状在不同时空表达的复杂遗传现象。目前国内外有大量关于动物的一些重要经济性状QTL作图的报导,但尚没有应用QTL进行辅助选择的报导。为此开展能分析复杂数量性状的遗传模型,并探讨其在育种实践中应用十分必要。
目前要做的是利用分子标记图谱发掘QTL资源,从整个基因组水平上进行QTL定位,探索其效应大小、作用方式等。发展基于QTL图谱的标记辅助选择的新方法,逐步建立完善抗病抗逆高产优质等重要性状相关基因标记的筛选及其辅助育种技术。随着各国动物基因组计划的深入开展,许多影响畜禽重要经济性状的QTL已经或正在被成功定位,人们对标记辅助选择的研究也将不断深入,标记辅助选择也必将在未来的动物育种改良中发挥出更加重要的作用。
近10年来,动物全基因组标记辅助选择策略是育种工作者们关注的焦点和热点,也被认为是精准估计育种值的最佳方案,虽然这一方案在试验及分析技术方面已经比较成型,并且在奶牛、肉鸡育种中得到了应用,但实际上它的技术成熟度还远远不能满足商业需求,面临着在理论和实际应用方面诸多难题。因此全基因组选择技术在动物种业领域的主要任务和发展重点应包括一下几个方面:
①SNP检测的成本是全基因组选择大规模的在动物种业领域应用的重要限制条件,因此应提高全基因组选择检测的效率,缩短检测时间,革新SNP芯片制作技术,降低芯片制作技术成本,通过优化检测技术,提高芯片的利用效率,使得全基因组选择能够得到广泛应用。
②在数据挖掘方面,高密度SNP芯片同样是育种学家面临的挑战。主要集中于与如何对SNP进行准确的单倍型推断,更多的利用标记信息;以及如何估计单倍型及SNP的遗传效应,使之成为育种值准确估计的依据。基因型选择的核心思想是估计出覆盖整个基因组的SNP的单倍型效应,每个染色体区段上单倍型效应的累加即个体的基因组估计育种值,因此单倍型效应估计的准确性显得十分重要。当前大部分基因组选择理论方面的研究仍假定单倍型已知,而在实际应用中,单倍型很难通过实验方法检测到,更多是利用统计学方法进行推断。虽然已有正对家养动物的单倍型推断方法,但它们都存在局限性,因此建立针对主要畜禽不同实验设计的单倍型推断方法,提高单倍型效应分析准确性,构建一套适合全基因组SNP标记的单倍型推断方法尤为必要。
③开展鸡牛猪羊等农业动物以及鱼类(鲆鲽鱼类、鲤科鱼类等)和贝类(牡蛎、扇贝等)参考群体的构建、全基因组重测序、SNP标记批量发掘和抗病等重要性状相关分子标记筛选、SNP标记与重要性状关联分析及其遗传效应值评估、基于全基因组选择的系谱信息分子矩阵及遗传算法等技术研究,研制重要动物基因分型用的高密度全基因组SNP芯片和育种用的低密度SNP芯片,建立动物全基因组选择育种技术。
④建立分子育种设计技术,构建重要农业动物抗病、高产和优质等重要性状相关基因调控网络,构建重要性状关键基因功能验证及其互作网络,以及重要经济性状的G-P模型的建立,研究不同个体关键基因和优良性状聚合技术。
基因组选择在动物育种中有很大优势,能够加快动物遗传育种进展,它也向人们表明了在基因组时代,计算技术和分子生物学技术已经在动物遗传改良中发挥着巨大的作用。可以预期随着生物技术和计算技术的不断进步,基因组选择方法将会在动物遗传育种领域得到广发应用,且必将为动物育种学研究带来深远的影响。
全基因组SNP标记辅助选择策略正在成为现实,这一技术在奶牛和肉鸡的商业育种中得到了应用,当前实施全基因组选择技术进行育种还存在一定的硬件限制,因为目前开展全基因组选择技术成本依然很高,降低全基因组SNP芯片成本,革新SNP芯片制作技术,提高分析鉴定技术,建立简单规范的操作体系,是首先应解决的问题。同时全基因组选择过程中需要对数万个标记的效应进行估计,其算法比较复杂,亟需建立简单的单倍型的推断方法和育种值估计方法,并且需要具有相关知识的研究人员和高性能的计算机或服务器才能完成这种海量数据计算,因此,在实际育种中运用全基因组选择需要配套技术和完善设备。建议采取使用Tag SNP进行选择或使用中等密度的SNP图谱进行辅助选育,这样可以相应地降低分型检测的成本,提高效率。随着基因分型技术的发展和成本的降低,可以逐渐地提高SNP位点的密度,提高精确度,为畜禽新品种的快速培育提供重要指导。
同时,如何优化已有的全基因组技术平台,建立完善的“群体设计——分子检测——标记效应评估——精准估计育种值——选种”的技术体系,为畜禽新品种的快速培育提供重要指导,仍然需要深入的探索和研究。
目前我国的畜禽和水产养殖企业育种起步晚,技术水平不高,缺乏进行全基因组选择等前沿技术研发的技术力量和平台条件。因此,全基因组选择等育种前沿技术的研发应该由国家级科研机构或高等院校牵头、联合水产育种企业协同攻关来进行,形成产学研一条龙的研究格局有利于充分发挥各方的优势、有利于前沿技术的及时转化和应用。
[1]TyriseväAM,Meyer K,FikseWF,et al.2011.Principal component approach in variance component estimation for international sire evaluation.Genetics Selection Evolution,43:21.
[2]Flint APF and Woolliams JA,2008.Precision animal breeding.Phil.rans.R.Soc.B 363,573-590.doi:10.1098/rstb.2007.2171.
[3]Singh U,Deb R,AlyethodiRR,2014.Molecularmarkers and their applications in cattle genetic research:A review.Biomarkers and Genomic Medicine,1e10.Available online atwww.sciencedirect.com.
[4]DoDN,Strathe AB,Ostersen T,2013.Genome-Wide Association Study Reveals Genetic Architecture of Eating Behavior in Pigs and Its Implications for Humans Obesity by Comparative Mapping.PLOSONE,www.plosone.org.8(8):e71509.
[5]Dekkers JC,2012.Application of Genomics Tools to Animal Breeding.Current Genomics,13,207-212,207.
[6]Bishop M,Hawkins G,Keefer C,1995.Use of DNA markers in animal selection.Theriogenology,43:61-70.
[7]Dekkers JC,2004.Commercial application ofmarker-and gene-assisted selection in livestock:strategies and lessons.J Anim Sci,82 E-Suppl:E313-328.
[8]Edwards M and Page N,1994.Evaluation ofmarker-assisted selection through computer simulation.Theoretical and Applied Genetics,88:376-382.
[9]Goddard M E and Hayes BJ,2009.Mapping genes for complex traits in domestic animals and their use in breeding programmes.Nat Rev Genet,10:381-391.
[10]Gonzalez RO,Gianola D,Rosa GJ,etal.2009.Genome-assisted prediction ofa quantitative traitmeasured in parents and progeny:application to food conversion rate in chickens.Genet Sel Evol,41:3.
[11]Hayes B and Goddard M,2001.Prediction of total genetic value using genome-wide densemarkermaps.Genetics,157:1819-1829.
[12]Kashi Y,Hallerman E,Soller M,1990.Marker-assisted selection of candidate bulls for progeny testing programmes.Animal Production,51:63-74.
[13]Lande R and Thompson R,1990.Efficiency ofmarker-assisted selection in the improvement of quantitative traits.Genetics,124:743-756.
[14]Macciotta NP,Gaspa G,SteriR.2010.Using eigenvalues as variance priors in the prediction ofgenomic breeding values by principal component analysis.JDairy Sci,93:2765-2774.
[15]Rothschild MF,and Plastow GS,1999.Advances in pig genomics and industry applications.Ag Biotech Net,1:1-7.
[16]Saatchi M,Schnabel RD,Rolf MM,et al.2012.Accuracy of direct genomic breeding values for nationally evaluated traits in US Limousin and Simmental beef cattle.Genet Sel Evol,44:38.
[17]WerfVD.2013.Genomic selection in animal breeding programs.Methods Mol Biol,1019:543-561.
[18]Wolc A,Stricker C,Arango J,et al.2011.Breeding value prediction for production traits in layer chickens using pedigree or genomic relationships in a reduced animalmodel.Genet Sel Evol,43:5.
[19]Xie C,Xu S.1998.Efficiency ofmultistagemarker-assisted selection in the improvement ofmultiple quantitative traits.Heredity(Edinb),80(Pt4):489-498.
[20]HansetR,Dasnois C,Scalais S,et al.1995.Effets de l'introgression dans le génome Piétrain de l'allèle normal au locus de sensibilitéà l'halothane.Genet Sel Evol,27(1):77-88.
[21]Meuwissen THE,Hayes BJ,Goddard ME.2001.Prediction of total genetic value using genome-wide densemarkermaps.Genetics,157:1819-1829.
[22]VanRaden PM,Sullivan PG,2010.International genomic evaluationmethods for dairy cattle.Genetics Selection Evolution,42:7.
[23]Genus pic Annual Report.2013.http://www.genusbreeding.co.uk/Interbull Centre Activity Report.2013/2014.http://www.interbull.org/
[24]傅 衍.2014育种企业的技术创新与实践Genus集团的案例,http://www.picchina.com/
[25]张 哲,张 勤,丁向东.2011.畜禽基因组选择研究进展[J].科学通报.56(26):2212-2222.
[26]鲁绍雄,吴常信.2002.动物遗传标记辅助选择研究及其应用科学[J].遗传.24(3):359-362.