杨鹏 张华 李欣淼 张子敬 刘贤 赵杨杨 田全召 王二耀 雷初朝 陈宏 黄永震*
(1.西北农林科技大学动物科技学院,陕西咸阳 712100;2.农业农村部科技发展中心,北京 100176;3.河南省农业科学院畜牧兽医研究所,河南郑州 450002;4.河南省鼎元种牛育种有限公司,河南郑州 450000)
随着全球农业反刍动物产业技术的发展,我国人民对于优异种质资源认识和需求的加深,家畜培育、养殖及相关产业对我国国民生活水平和国家经济发展有重要意义。我国具有动物遗传资源丰富的天然优势,但随着科技水平的发展和人民生活水平的提高,国内及国际市场对畜产品的需求发生了巨大的变化,仅依靠自然选择获得的品种远不能满足当前的需求。而在一些地方,“重引进、杂交,轻培育和保护” 的情况非常严重,导致本土品种遗传资源缺失,且培育效果不佳。20 世纪末,随着分子生物技术的迅猛发展,以DNA 水平的各种技术为支撑,发展出了一套分子标记鉴定技术,突破了常规育种的限制因素,提高了育种精确度。在此之后,基因芯片技术的兴起与发展,扩大了遗传标记的检测范围,实现了大量标记并行检测。而随着测序技术的发展,基因组学飞速发展,本文旨在对分子育种技术进行分类总结,并综述了分子标记、基因芯片和全基因组选择在黄牛育种中的应用,以期为后续育种工作提供材料参考和技术支撑。
DNA 分子标记是利用测定遗传物质产生的变化来确定样本DNA 的变异情况,并以此作为标记。这种技术为遗传多样性的研究提供了新的形式[1]。分子标记可以通过检测准确反映出检测个体遗传物质遗传变异的特征信息。优良的分子标记具有多种优点,包括①较高的多态水平,基因多态是指在家畜群体中,影响个体表型的同种基因以多种基因型存在,而较高的多态水平和样本量,有利于在试验中检测出个体间的差异,差异性越大,越能体现出优势基因和优势基因型;②范围大,覆盖群体面积大,有利于我们在家畜群体中开展研究;③分子遗传标记不受个体年龄、性别和环境等因素限制,提高了育种的速度和效果;④基因的明确性,可确定所有基因型[2-3]。根据不同原理,分子标记可分为以下几种:①以分子杂交为核心内容的技术,包括限制性片段长度多态性(Restriction Fragment Length Polymorphism,RFLP)、数目可变串联重复多态性(Variable number of tandem repeats,VNTR)。限制性片段长度多态性是指同种生物不同个体间DNA 序列产生差异,形成可被限制性内切酶识别的序列进而可被消化,被消化后的产物由于长度不同可通过电泳进行分型[4]。数目可变串联重复多态性是多态性程度高,重复性高的DNA 片段,分布广并且种类多,又分为微卫星序列(又称简单重复序列)和小卫星序列[5];②以PCR 为核心的分子标记技,包括随机扩增多态性DNA(random amplified polymorphic DNAs,RAPD)[6],扩增片段长度多态性(Amplified Fragment Length Polymorphism,AFLP)[7]等;③第三种是较为新颖的分子标记,如单核苷酸多态性(Single Nucleotide Polymorphism,SNP)、表达序列标签(Expressed Sequence Tags,EST)[8]。依靠PCR、电泳等技术对重要基因进行分型来研究基因表达和调控规律逐渐不足以满足育种需求,基因芯片的产生,很大程度上改善了这一问题。
基因芯片(gene chip)又可称为DNA 微阵列(DNA microarray),是一种通过在固体支持物上设置成千上万的核酸探针,将检测样本置于芯片上进行杂交,检测信号确定受检个体的遗传信息[9]。20 世纪80年代,研究者们参考计算机芯片将寡核苷酸分子固定在固相载体上,制成首个芯片[10]。基因芯片根据不同标准具有不同分类,例如依据固相载体上的探针种类可分为cDNA 芯片和寡核苷酸芯片[11];根据不同固相载体可分为玻璃芯片、硅芯片等;根据其功能还可以分为DNA 测序芯片、表达谱芯片等[12]。目前,单核苷酸多态性(single nucleotide polymorphism,SNP)芯片广泛引用在家畜育种工作中,包括品种起源、群体组成和功能分析等。
2009 年,牛基因组的公布标志着研究者们对牛的研究将进入新阶段[13]。牛基因组涵盖了至少22000 个基因,其中14345 个基因与其他7 个哺乳动物存在同源关系。全基因组中存在高密度特异性区域,泌乳与免疫方面存在物种特异性变异,这为后续牛全基因组方面的研究打下坚实基础。在此之后,不同版本的牛参考基因组相继公布——Bos taurus5.0、UMD 3.1.1 和ARS-UCD1.2。紧接着,以牛基因组为核心,研究者们结合全基因组重测序分析和基因芯片技术将分子育种带入了全基因组选择育种阶段。全基因组选择(genomic selection,GS)是指通过对覆盖全基因组范围的遗传标记进行检测,利用获取的遗传信息从基因组水平出发对家畜个体不同性状进行育种值估计(genomic breeding values,GEBV)和选择[14]。利用全基因组选择确定的数量性状基因座(quantitative trait loci,QTL)能够更为准确地估计个体育种值,进而极大地促进育种工作并降低成本[15]。
1974 年,第一代分子标记RFLP 的提出,标志着对DNA 的研究进入了全新的阶段,扩大了人类疾病、动物育种工作的视野[16],在此之前,动物育种依靠传统的育种方式,通过观察良好表型的个体作为种用,依靠不同品种间的杂交实现了“基因重组”,实现杂交改良的目的。但是传统育种方式不可避免地会出现杂交后产生的后代优良性状不固定,效率不高,成本大等问题,这大大阻碍了家畜的育种工作。随着分子标记概念及技术的提出和发展,家畜育种的准确性和效率都得到了极大的提升。分子标记借助其DNA 水平的特点,突破了对育种目标性别、年龄的限制,并且通过对优良性状候选基因的准确筛选,避免遇到传统育种可能出现的问题。传统育种可能需要大量的样本、尝试得到理想的个体,但分子标记技术的定向选择可以在家畜育种过程中实现特定性状基因快速、高效选育,获得高产、抗病的家畜品种[17],这主要体现了分子标记的几个特点:①分子标记的基础是家畜DNA 多态性,而这种多态性在家畜DNA 序列上普遍且大量存在[18]。在家畜DNA 复制等过程中,多态性的发生对家畜个体表型产生了不同的影响,而这种变化越多,不同个体间的差异表现就越大;②动物表型受到遗传因素和环境因素的共同作用,传统育种受环境、个体年龄和性别等因素影响较大,但是分子标记打破了这一限制[19];③共显性,由于等位基因的存在,使得基因存在杂合子和纯合子的区别,而分子标记可以较为准确地判断基因型。
虽然基因芯片最初还是以杂交为核心,依旧存在制作烦琐,不利于大样本数量检测,但是随着分子技术和基因组学的发展,它实现了可以在同一时间对大量的DNA 片段进行分析,操作简洁且效率高,需要的组成成分少也使得在制作使用期间产生的损耗污染少,这一进步极大地提高了基因芯片使用性能。而随着各国公司相继进行基因芯片开发研究,牛上不同密度基因芯片相继问世,包括由Illumina 开发的位点数为50K 的Bovine SNP50 芯片和777K 位点数的Bovine HD 芯片,Affymetrix 的648KGenome-Wide BOS1 Bovine Array[20]。
基于基因组遗传信息的全基因组选择作为目前最新的育种技术,并非摒弃了之前的育种技术,相反,更是与表型、系谱和芯片等技术相结合,准确高效地实现育种值估计、个体选择等目标。由于全基因组选择基于家畜基因组信息可以提前对具有控制或影响优良性状遗传信息的个体进行准确筛选,提高了品种改良的速度;其次,结合表型和系谱信息,可获取更准确地育种值,更全面地定位品种中的优秀个体。全基因组选择损耗低,效率高,高效、准确地选择极大推动了育种工作[21]。
黄牛养殖是畜牧业经济中的重要组成部分,而在整个黄牛产业发展中,育种问题占据至关重要的地位。
随着政策、技术的发展和进步,我国肉牛的养殖方式从落后的农户散养逐渐过渡到规模化、集约化的大规模高新技术养殖方式,分子育种充分发挥分子生物学和现代遗传学优势,为大规模技术养殖提供强有力的支撑。产仔率作为肉牛繁殖方面的重要性状,是提高肉牛繁殖性能的重要内容。自然条件下,牛双胎率低,即使母牛能产下双胎,犊牛成活率也非常低,这对肉牛养殖造成了极大的限制。雷雪芹等通过PCR-RFLP 标记研究发现FSHR 基因在秦川牛和中国荷斯坦奶牛中双胎优势基因型不同[22]。在肉牛养殖过程中,除了布鲁氏杆菌病外,还有一种重要的人畜共患病会对产业、社会安全造成极大损害——牛结核病。AFLP 技术汲取了RFLP 技术和PCR 技术的稳定、准确和高效,曾广泛应用于品种鉴定、DNA 指纹图谱构建方面。杨兴元等利用AFLP 技术获取了具有良好多态性的西门塔尔牛、延边牛和南阳牛的指纹图谱,并进行比对后发现3 个品种之间存在明显差异[23]。曹瑞等通过MIRU-VNTR 方法对30 株新疆地区的牛分枝杆菌进行分型研究,发现新疆地区牛分枝杆菌与其他地区的分枝杆菌多态性存在差异,这可能作为新疆地区肉牛养殖过程中检测牛结核病的辅助标记之一[24]。
单核苷酸多态性作为目前分子标记研究方面广泛使用的技术之一,已为肉牛育种提供了丰富的内容,而相关技术的进步也使得SNP 检测丰富多样。杨颖等利用PCR-SSCP 和DNA 测序比对对南阳牛HDAC1基因的多态位点与经济性状进行关联分析,结果表明HDAC1 基因第11 外显子与3’ UTR 区域的SNP 与尻长、十字部高和体高等性状显著相关[25]。有研究通过结合全基因组关联分析(GWAS)和基因注释等方法,根据西门塔尔牛高密度芯片筛选西门塔尔牛SNPs,设计构建准确性高、低成本的低密度芯片,解析西门塔尔牛重要经济性状遗传信息,推动肉用西门塔尔牛育种工作[26]。全基因组测序技术的加入,使DNA 多态性研究进入新的阶段。张顺进等通多对郏县红牛全基因组测序,并将结果与参考基因组比对,获得涵盖全基因组内容的单核苷酸多态性(SNP),获取郏县红牛遗传变异图谱,为进一步挖掘郏县红牛经济性状重要候选基因提供参考资料[27]。容维中结合PCR-SSCP 和荧光定量PCR 技术检测早胜牛CAPN1基因和CD36 基因8 个SNP 位点共22 种基因型,确定了CAPN1 基因和CD36 基因早胜牛优势基因型[28]。
据数据统计,2021 年我国乳制品进口量增加18.7%,生鲜乳产量增加7.1%[29],尽管产量相比于2020 年有所增加,奶牛品种改良培育依旧是我国奶牛行业的重要工作,依靠分子标记、全基因组选择、全基因组关联分析等技术,育种工作者在奶牛产奶性能、繁殖、抗应激等方面已取得了重要进展。李艳华通过基因组测序结合系谱信息、DHI 记录等发现DDIT3、RPL23A 等4 个基因共35 个SNPs 和3 个Indels,同时单标记关联分析表明以上标记均与产奶性状显著相关[30]。Bohlouli 等注意到乳脂肪酸含量与奶牛对气候变化适应相关,利用全基因组关联分析,结合SNP 标记、系谱和基因组信息,鉴定出与奶牛抗病相关基因,并且发现乳脂肪酸生成与奶牛热应激遗传机制有重要相关性[31]。王梦琦等对奶牛LF 基因的两个多态位点检测,并利用多因素方差分析法等方法进行关联分析,发现两个位点分别于体细胞评分(somatic cell score,SCS)、乳脂率和日产奶量相关[32]。Bo Han 等通过RNA 测序分析,以及GO 和KEGG 富集分析发现LPIN1 基因与奶牛产奶性状相关,存在7 个SNP位点,关联分析结果表明与乳脂率、乳蛋白率等性状相关[33]。Penagaricano 利用全基因组关联分析了1755头公牛的公畜受孕率和牛基因组涵盖的38650 个单核苷酸多态性(SNP),使用混合线性模型关联分析,发现存在8 个SNP 与公畜受孕率显著相关,其中有SNP 处于雄性繁殖性能相关基因附近,包括精子顶体反应、精子发生过程中的染色质重塑以及男性生殖细胞成熟过程中的减数分裂过程[34]。其中一些SNP 表现出显著的优势效应,这为提高奶牛繁殖性能提供了更多参考。除了以上研究,不育是奶牛淘汰和经济损失的主要原因。信号转导和转录激活因子(STAT)蛋白是在生育力和早期胚胎发育以及许多其他功能中发挥重要作用的转录因子,STAT1 和STAT3 基因是该途径的成员。Khatib 等根据第7 天的囊胚数量计算胚胎早期成活率,利用单SNP 分析发现STAT3 基因存在两个SNP 为SNP 25402 和SNP(SNP19069/SNP254 02)与卵母细胞受精率相关,其次,两个SNP 位点之间存在相互作用,对胚胎存活率有显著影响[35]。
我国具有丰富的黄牛种质资源,并且具有多种品种优势,具有丰富的遗传多样性、较强的环境适应能力和抗病性、肉品质好、风味佳等特点。长期以来,通过引进国外优秀肉牛品种与我国本地黄牛品种杂交,选育出了不同用途(肉用、乳用)的品种。但是我国牛肉市场需求巨大,杂交管理体系不健全,部分品种杂交较为盲目和混乱,使得我国本土黄牛资源受到了威胁,牛肉供应严重不足,导致我国牛肉非常依赖进口。分子标记具有准确、高效选育的优点,在此基础上基因芯片在选择范围和效率上具有更好的表现,基于基因组学的全基因组选择更是作为目前最新的育种技术将育种精确度和品种改良速度提高到了新的水平。分子育种是提高我国黄牛品种生长、生产和繁殖性能的重要手段,通过将分子育种技术与其他饲养管理技术相结合“保持本土品种独有的特性,改善固有的缺陷”,扬长补短,是目前我国黄牛育种,乃至农业反刍动物种质资源工作的重要内容。