肉牛生长性状和肉质性状全基因组关联分析的研究进展

2022-12-07 05:33王晓薇史远刚侯鹏霞
现代畜牧兽医 2022年1期
关键词:胴体肉牛染色体

王晓薇,樊 毅,杨 阳,史远刚,施 安,侯鹏霞*

(1.宁夏大学农学院,宁夏 银川 750021;2.宁夏农林科学院动物科学研究所,宁夏 银川750002;3.银川产业技术研究院,宁夏 银川 750002;4.宁夏农垦贺兰山奶业有限公司,宁夏 银川 750205)

全基因组关联分析(genome-wide association studies,GWAS)指在全基因组水平上,对大样本群体开展数以百万计的分子遗传标记检测并进行对照分析或相关性分析,通过比较发现影响复杂性状基因变异的一种新策略。通过对大规模的试验群体DNA样本进行全基因组高密度遗传标记,如单核苷酸多态性(single nucleotide polymorphism,SNP)或拷贝数变异(copy number variation,CNV)等,通过统计学方法、遗传学知识和生物信息学软件关联分析大量的分子标记数据与表型性状,筛选得到与目标性状相关联的候选基因[1]。Risch等[2]通过研究人类复杂疾病遗传学提出GWAS的概念,全基因组关联分析比连锁分析具有更高的基因变异检测效力,可不受预先设定候选基因的限制。Klein 等[3]首次利用GWAS 发现了补体因子H基因与视网膜黄斑病呈显著相关。随着基因分型技术逐步成熟,牛全基因组测序和参考基因组均已完成,大量与肉牛生长发育、胴体以及肉质性状显著相关的SNP位点被鉴定。本文综述GWAS 的概念、原理及现阶段国内外GWAS 在肉牛生长、肉质性状方面的主要分析方法、研究进展,并对GWAS 的研究应用进行展望,以期为今后利用GWAS开展肉牛经济性状遗传基础研究提供参考。

1 GWAS的原理和研究方法

1.1 GWAS的原理

目前,GWAS分析采用的主要分子标记是SNP标记[4]。GWAS的原理为依赖连锁不平衡(LD)研究所关注群体的遗传变异与性状之间的关联,借助全基因组范围的分子标记进行总体关联分析,通过统计基因型和表型的关联性,筛选得到显著相关性最大的遗传变异。GWAS 通过分析遗传变异与表型变异的关联性,定位影响表型性状的重要候选基因和数量性状位点(quantitative trait loci,QTL),进而揭示其遗传机制[5]。

1.2 GWAS的试验分析流程

GWAS 的一般试验分析流程为:样品采集、基因分型和表型数据记录、分析处理(一般多为数量性状数据),原始数据处理(识别样本中的SNP 位点)、基因型过滤、群体结构分层分析、亲缘关系分析、关联性分析、SNP注释和候选基因筛选、连锁不平衡分析和单倍型分析以及后续的验证试验[5]。

1.3 GWAS的研究方法

根据群体家系存在与否,研究方法主要可分为基于无关个体的关联分析和基于家系的关联分析。对于不存在家系的试验群体,研究人员通常采用基于无关个体关联分析的方法,该方法又为随机群体关联分析和病例对照分析法。基于随机群体关联的分析方法通常采用方差分析、协方差分析和回归分析的统计方法关联分析数量性状。病例对照分析法主要采用卡方检验比较全基因组范围内试验组和对照组等位基因频率的差异,常应用于疾病等质量性状的研究。若试验组和对照组有显著差异,则提示该遗传变异可能与疾病相关。

基于家系的关联分析充分考虑试验样本的群体混杂和群体分层现象,可在一定程度上避免这些因素对分析结果产生的影响。当研究群体家系信息完整时,可利用传递或不平衡检验关联分析遗传标记和性状。样本数量和系谱信息完整性存在限制。因此,针对畜禽各类性状的GWAS设计通常基于无关个体。

按照研究策略,研究方法可分为单阶段法、两阶段法和多阶段法[6]。单阶段法需要一次性选择样本量足够大的群体,在此群体中对每个样本的目标SNP 进行基因分型,分析每个SNP 与目标性状的关联,统计分析关联强度和OR值。此法设计简单,但成本过大。因此,在实际操作中主要采用两阶段法或多阶段法[7]。第一阶段先在较小样本群体中进行覆盖全基因组范围的SNP基因分型,统计分析后筛选得到少数的目标阳性SNP,进行后续第二阶段或多阶段中更大容量样本群体的基因分型研究;结合两阶段或多阶段的结果进行分析,确定有效的遗传变异[8]。此设计应保证第一阶段筛选出的与目标性状相关SNP 的特异性和敏感性,减少分析的假阳性,在第二阶段采用大样本量群体进行基因分型验证。

2 肉牛生长发育及肉质相关性状的GWAS研究

生长发育性状和胴体性状是肉牛生产中最重要的经济性状,可占胴体价格影响因素的60%~70%[9]。相关研究人员和养殖者的主要目标是改善肉牛的生长和胴体性状[9-11]。体尺性状是育肥期监测家畜生长情况的重要工具[12],可通过提高饲料利用率和管理效率控制家畜的生长发育,从而得到更高的利润[13]。肉质是一个复杂的多表型性状,包括多个感官特征,如肉色、多汁性和嫩度,是牛肉产品定价和消费者接受度的主要决定因素[14]。多重因素(如基因与环境)共同调节肉牛的体尺、胴体和肉质性状,对家畜的优良生产性状进行基因分型和基因检测可显著提高其遗传效率[15]。

2.1 肉牛生长发育性状的GWAS研究

实际生产中,常用的生长性状包括定期测定不同生长阶段的体重、体尺以及依据体重和体尺计算得出的生长速度等。生长速度通常以体重变化表示,如一段时间内的平均日增重、增重总量或是特定时间点的生长速率等。肉牛达到成年前体重和体尺的变化可反映生长速度。体尺可反映家畜体躯容量的大小及品种特征。青年牛阶段大部分体尺测量结果与同阶段体重数据存在强相关性。在实际生产中,体尺较体重更易测量。因此,在牛场中定期测定的体尺数据较体重更为准确、详细。

肉牛的生长性状受到众多基因的调控,但其主效基因的鉴定尚不明确。早期研究多采用候选基因法筛选鉴定主效基因,候选基因法覆盖面小、无偏性差、数量有限,难以在全基因组范围内对主效基因进行鉴定并对复杂性状进行解释。随着分子生物学技术发展,全基因组关联分析已成为在复杂性状候选基因的筛选研究中更有效的方法。目前,常利用牛基因芯片等分析肉牛经济性状,筛选得到许多与生长性状相关的基因组区域。

An等[16]利用Illumina牛HD 770K SNP分型芯片,鉴定463 头日本和牛的身体测量性状候选基因,检测到5 个和1个与体高和体长相关的SNPs;这些SNP总共位于11个基因之内或附近,其中5个为与体重测量性状相关的新候选基因。An 等[12]利用Illumina 牛770k 芯片,结合LONGGWAS、单性状GWAS 和多性状GWAS,研究不同生长阶段的西门塔尔牛肉牛的心脏大小、腹围、身高、体长、尻高和管围的变化,结果表明,3 个模型共检测到58 个显著的SNPs,与中国黄牛体尺相关的21 个基因相匹配。张文刚[17]利用重测序技术研究筛选西门塔尔牛生长发育、胴体品质相关基因,通过全基因组关联分析找到4个候选区间和18个候选基因;利用多策略全基因组关联分析进一步探索肉牛日增重性状遗传机制。结果显示,3 种全基因关联分析同时定位到NCAPG-DCAF16 区段,且该显著区段富集许多与细胞增殖分化相关转录因子的结合位点,经一系列验证得出NCAPG基因表达量变化可能是日增重变异的致因因素。陈付英等[18]采用测序技术和全基因组关联分析,筛选郏县红牛生长性状相关的候选基因,结果显示,筛选得到3个相关SNP位点;在每个SNP周围1 Mb区域内筛选相关基因进行GO 分析,发现rs210024569 位点所在的C6orf106基因可作为6 月龄体高性状的候选基因,rs449748996 位点所在的LOC100337124基因可作为18 月龄体高性状的候选基因。吕世杰等[19]采用SLAF-seq测序技术对71 头南阳母牛的血液DNA 进行测序,对每头牛的初生重及不同月龄(6、12、18、24、36)的体重、体尺及6个月体增重等生长性状进行全基因组关联分析。结果显示,与12月龄体重、12月龄胸围和12~18月龄体增重等生长性状显著相关的5个基因组区域通过基因功能注释,共筛选得11号染色体上8个与骨生长、肌肉发育和生长调控有关的基因。苗健[20]对1 225头西门塔尔牛进行Illumina 770K高密度芯片基因分型和复合策略GWAS模型的分析,共找到10 个与骨重显著关联的基因和6 个与胴体重显著关联的基因。Zhuang 等[21]利用GWAS 鉴定与中国西门塔尔牛出生重、周岁重、出生至周岁体重和18 月龄体重相关的SNP和基因,发现66个基因组窗口,这些窗口和相应基因解释了1.01~20.15%性状的遗传变异。

Buzanskas 等[22]应用广义线性模型对坎奇姆牛进行GWAS 研究,发现C 型凝集素结构域家族3 成员B(CLEC3B)和二肽基肽酶6(DPP6)等基因对骨骼系统和脑组织的发育具有重要作用。GQLS 技术揭示了与体重、断奶重和周岁重相关的染色体区域,还发现一些与增重和特定生理功能性状相关的新区域。Utsunomiya 等[23]研究表明,全基因组范围内最显著的SNP 位于BTA14:25376827区段,该区段跨越多个与初生重、性成熟体重、胴体重、体高和断奶前平均日增重相关的QTL。Martinez 等[24]采用GWAS定位1 562头哥伦比亚婆罗门牛生长性状相关的区域,发现了与初生重、断奶重和周岁重显著相关的多种基因。Edea 等[25]采用混合线性模型对韩牛胴体重进行GWAS研究,鉴定得到主要分布在第4号染色体上的16个与胴体重相关的SNP;4 号染色体上有21 Mb 的区域对43.45 kg 时的胴体重具有等位基因替代效应,该区域包括可能参与调控脂肪生成、生长性状、脂肪组织分化、骨骼肌再生和代谢7 个候选基因。Akanno 等[26]研究与肉牛胴体和生长性状相关的基因组区域或SNPs,发现7个与出生体重、断奶前日增重、周岁重和大理石纹评分相关的SNPs。

上述SNPs 分别在牛染色体1、3、4、6 和21 上检测到,并与U6atac、bta-mir-2888-1、REPIN1、AGBL4、ICA1和NXPH等16 个推测候选基因相对应。这些基因的生理功能与碳水化合物、脂类和脂肪组织的代谢有关。Zhang等[27]利用3 种GWAS 方法筛选出影响西门塔尔牛平均日增重的28 个共同SNP 和候选基因区段DCAFl6-NCAPG,并在转录水平得以验证;外显子测序发现,影响西门塔尔牛胸围和体长的稀有变异,GO 富集分析和KEGG 通路分析将注释到的基因均富集到生长发育相关通路。

2.2 肉牛肉质性状的GWAS研究

肉的品质特性主要涉及感官特性、加工性能、营养价值、卫生和食品安全评定[28]。肉质性状指标包括色泽、嫩度、气味、pH值、系水力、风味、硬度、肌内脂肪含量和脂肪酸组成等,这些性状受包括牛的品种、年龄、性别和基因型等遗传因素以及饲养管理和屠宰工艺等环境因素的共同影响[29]。众多学者利用GWAS 对影响肉质的各个因素进行研究,通过对控制牛肉品质性状相关遗传变异的鉴定,试图发现更多控制肉质性状的基因[30]。已有研究结果可帮助育种学家设计最佳育种计划,更好地选育改良肉牛,使优良的肉质特性稳定遗传,以实现经济目标。

提高肉制品质量是增强肉牛企业盈利能力和竞争力的最佳途径。牛肉中的脂肪含量与肉质、口感、风味密切相关。Chen 等[31]利用Illumina Bovine SNP50 分型芯片对不同性别的1 366 头杂交肉牛群体进行基因分型,对测定的81 个皮下脂肪和83 个背最长肌的脂肪酸性状进行GWAS分析,利用基因组最佳线性无偏估计法和贝叶斯法评估预测脂肪酸组成的基因组的准确性。结果显示,在显著相关的位点中找到效应较大的标记位于脂肪酸合酶(FASN)和硬脂酰-辅酶A去饱和酶(SCD)等基因附近。

牛肉脂肪酸组成受少数主效应基因和许多效应较小基因的影响。Xia 等[32]对1 141 头西门塔尔牛肉的脂肪颜色、肉色、大理石纹、眼肌面积和剪切力等肉质性状相关候选基因和基因组区域进行GWAS 分析研究,结果确定20 个与肉品质性状相关的SNP,其中与脂肪颜色相关的5 个重要SNP 位于13 号染色体上的一个单倍型模块;在7 号染色体上发现19 个与剪切力和眼肌面积等性状相关的SNP。Lu 等[33]利 用Illumina BovineSNP50 芯 片 检 测747 头杂种肉牛肉质相关的SNP,运用GWAS 寻找可能与肉牛胴体质量潜在相关的染色体区域,发现8个与胴体重显著相关的SNP,其中7个位于6号染色体上;发现53个与肋骨百分比相关的SNP,其中12 个SNP 位于20 号染色体上。研究表明,29 号染色体上CAPN1基因是影响牛肉嫩度最显著的基因,该位点等位基因G的存在与杂交肉牛剪切力测量值有关[34]。Allais 等[35]对3 个法国肉牛品种的3 225 头个体进行肌内脂肪基因互作和通路的研究,发现候 选 基 因,如CAPN6 STC2、MAP2K4、EYA1、COPS5、XKR4、NR2E1、ATF1、ASPH、TGS1和TTPA,均参与调节肉牛和肉质性状。有研究发现,标记在3 号染色体上的calpastatin和calpain1基因可影响布朗德·安奎坦牛的嫩度[36],且存在1 组与嫩度和其他肉质性状相关的相互关联的基因。Xia 等[37]在中国西门塔尔牛的3号染色体上发现3 个与肉pH 值相关的基因,基于全基因组的关联分析,检测得到1个位于3号染色体上的S100A10基因。有研究认为,大部分检测到的SNPs 均通过单核苷酸多态性分析和基因关联分析发现,这些基因在动物体内参与多种生物学途径,如胎牛生长发育、胴体重和脂质沉积[38]。

肌内脂肪是牛肉的风味和营养价值的重要影响因素。有研究在内洛尔牛中发现23个与肌内脂肪沉积和脂肪酸组成相关的区域[39-40]。通过对安格斯牛肉中脂肪酸组成的GWAS 分析,在第19、26 和29 号染色体发现相应区域;这3条染色体含有硬脂酰CoA去饱和酶、脂肪酸合酶和甲状腺激素基因,说明脂肪酸组成的遗传变异比例很高[41-42]。

通过混合模型和回归分析对日本黑牛基因型与脂肪酸组成进行相关性研究,发现19 号染色体中存在30 个显著的脂肪酸SNP,且检测到突变对脂肪酸性状无明显影响的FASN基因;此区域也检测到FASN基因,该基因的突变对脂肪酸性状无明显影响[43]。采用GWAS 对韩牛肉质性状的QTL标记进行分析,共鉴定得到52个SNPs,其中3个SNP对肉品质有显著影响:AX-26742891和AX-26703353分别定位于6 号染色体的101、110 Mb 处,影响嫩度、多汁性和适口性;AX-18624743定位于10 号染色体的3MB 区域,仅影响嫩度和适口性[44]。

3 GWAS的优势及局限

与传统的基因研究策略不同,GWAS在突变区域定位更精确,可直接利用基因内部或个体水平(无系谱特异性)的SNP/LD 鉴定得到新的单基因和寡源疾病基因,发现新的生物机制,提供对复杂性状种族变异的洞察力;提高通量分析、统计效力,节约时间并降低测序的各项成本;数据可通过网络共享,公共数据有助于新发现,还可应用于基因识别之外的多种应用[5,45]。

GWAS虽具有上述优点,但也存在一定局限:(1)研究群体遗传背景的不一致将出现分层现象;进行全基因组关联分析时须考虑群体结构的影响因素,可利用优化基因组控制、主成分分析、结构关联分析等统计手段进行分层控制;否则可能将群体结构导致的虚假关联误当作试验结果,增加假阳性,影响试验结果的可靠度[30]。

(2)基于SNP 标记的GWAS 分析检测得到的显著位点,仅能解释表型中部分(2%~15%)遗传变异,其他基因组变异形式如CNV 等也需高度关注,GWAS 数据中还存在大量的剩余遗传信息有待挖掘[4,46]。

(3)不同群体所得研究结果重复性不强,SNP 作用的群体异质性增加GWAS重复检验的难度,不同课题对同一研究对象的同一表型性状检测结果很少一致[47-48]。

(4)GWAS 采用基因组逐点扫描的方法进行检测,无法同时利用控制性状的多基因间网络调控信息,中等或低效应(遗传力小于21%)的QTL难以验出,数量性状多遵循“微效多基因”的遗传基础,可决定GWAS定位策略的检验功效。

(5)GWAS仅利用DNA水平的遗传标记信息,对标记潜在的生物学信息难以利用(如标记所在染色体区域的进化和保守性信息、标记所处非编码的基因表达调控功能区域等的信息)。

4 结论

GWAS 在畜禽复杂性状的遗传机制探究上取得显著成绩,仍是1种在全基因组范围内寻找家畜重要经济性状显著相关SNP 位点和复杂QTL 的重要方法。高通量测序技术的飞速进步使得全基因组测序全方位渗透入生物研究的各个领域,动物育种相关研究陆续进入后基因组时代。对传统GWAS无法挖掘到遗传信息的部分进行研究,人们开始尝试在多组学水平上进行联合分析,继续进行深度挖掘。最新的GWAS 包括以代谢物为表型的代谢组GWAS、基于表达谱数据的基因表达GWAS以及基于单倍型的单倍型GWAS。当前GWAS 研究中主要利用荟萃分析,对多个独立领域的研究结果进行结构和系统的定性或定量分析,克服了小样本研究检验效力低的问题,减少假阳性,提高结果可靠度。此外,大部分GWAS 研究并未考虑遗传位点与环境之间的互作,导致无法有效检测一些稀有变异。未来更多的研究方向会集中在多位点分析、非加性效应以及互作效应对GWAS 的影响。随着基因组测序等技术的更新发展以及统计方法的不断完善,GWAS将会更高效地应用于肉牛重要性状的基因筛选鉴定,在推动中国肉牛育种事业的发展中持续贡献力量。

猜你喜欢
胴体肉牛染色体
冬季肉牛咋喂精料
猪胴体冷却降温特性及耗能分析
冬春如何提高肉牛采食量
老挝肉牛输华实现突破
肉牛口炎咋防治
饲粮铁水平对肉仔鸡生长性能、胴体性能及肉品质的影响
多一条X染色体,寿命会更长
为什么男性要有一条X染色体?
真假三体的遗传题题型探析
能忍的人寿命长