1西南民族大学动物科学国家民委重点实验室,成都 610041;2西南民族大学青藏高原动物遗传资源保护与利用教育部重点实验室,成都 610041

【目的】对产羔数不同的山羊进行全基因组重测序分析,挖掘参与调控川中黑山羊产羔数性状关键调控基因,为解析山羊产羔数性状遗传机制及分子遗传改良提供理论依据。【方法】选择6只产4—6羔的川中黑山羊为高繁组(high fecundity, HF)和6只产单羔的川中黑山羊为低繁组(low fecundity, LF),采集颈静脉血液样本提取基因组DNA,构建350 bp双末端测序文库,利用Illumina HiSeq PE150平台对12个文库进行全基因组重测序。测序产出的净数据经BWA软件比对至山羊参考基因组ARS1,所获得的高质量SNPs通过两种全基因组扫描分析方法(、)的综合分析确定候选区域,候选区域的注释基因分别利用g:Profiler和KOBAS在线数据库进行GO分析与KEGG通路分析,以筛选调节川中黑山羊产羔数性状候选基因。为了进一步鉴定调节山羊产羔数目的关键遗传标记,根据基因组重测序变异分析,对繁殖候选基因的同义与非同义SNPs进行定位筛选,后续将12个山羊样本的扩增产物进行Sanger测序以验证重测序结果。【结果】12只山羊共获得431.50 Gb 净数据,经变异检测与注释发现,HF组山羊共发现7 771 417个单核苷酸多态性(single nucleotide polymorphism, SNPs),LF组山羊检测到8 935 907个SNPs,且LF组各类SNPs 均多于HF组。设置同时达到top 5%最大值和top 5%最小值的窗口为候选区域,在低杂合性、高遗传分化的区域共注释130个强选择信号,其中HF组、LF组以及共享窗口的注释基因分别为84、59和13个,经GO富集与KEGG通路分析发现,19个候选基因参与川中黑山羊的繁殖、繁殖过程和胚胎发育等调控,包括11个HF组特异性候选基因(和),5个LF组特异性候选基因(、、、和)和3个HF组与LF组共享窗口基因(、和)。同时,大多数GO分析,如G蛋白偶联受体活性、激素反应和神经肽信号通路等,都包含这19个候选基因。此外,14个HF候选基因有9个显著富集在代谢途径、神经活性配体-受体相互作用、糖胺聚糖-硫酸乙酰肝素/肝素的生物合成、钙离子信号通路、cAMP信号通路和叶酸生物合成等KEGG通路中(<0.05)。19个繁殖候选基因中共有2个同义突变(,10 A4662G)与2个非同义突变(G529A,),且仅定位于HF候选基因中。Sanger测序发现,、和突变位点均可检测到多态性,与基因组重测序结果一致,其中G529A多态性导致第177位丙氨酸突变为苏氨酸,多态性导致翻译提前终止。【结论】本研究共发现11个HF组特异性候选基因,推测是川中黑山羊多羔性状的关键调控基因,外显子G529A与外显子A281T突变可能是调控山羊多羔性状的关键遗传标记,在改良山羊繁殖性能方面具有较大的应用价值。


0 引言

【研究意义】产羔性状是山羊的重要经济性状,提高窝产羔数不仅可以提高出栏率,提高经济效益,而且还可以提高选择强度,加快山羊育种进程。产羔数是一个低遗传力(0.08—0.18)的限性性状,难以用常规育种方法进行快速改良,但适合用标记辅助选择(marker-assisted selection, MAS)等分子育种技术来改良[1]。实现MAS的先决条件是找到与数量性状基因座相连锁的分子遗传标记,而要找到辅助选择的分子标记,则需要解析山羊高繁殖力的分子遗传基础和形成原因。【前人研究进展】在过去20多年里,在一些绵羊品种的突变体中已成功分离鉴定出控制卵泡发育和排卵数的多胎基因,主要包括骨形态发生蛋白受体-1B(BMP receptor-1B,)基因的1个突变(FecB)[2]、骨形态发生蛋白-15(bone morphogenetic protein-15,)基因的6个突变(FecXFecXFecXFecXFecXFecX)[3-4]和生长分化因子-9(growth and differentiation factor-9,)基因的2个突变(FecG和)[5-6],这些突变与绵羊的多羔性状密切相关。但是,迄今为止,在已开展过检测的印度[7]、伊朗[8]、泰国[9]和我国[10-11]的30多个山羊品种(类群)中均未检测到这些突变,排除了这些突变作为山羊品种多羔性状主基因的可能性,山羊多羔性状的遗传机制有待研究。山羊全基因组测序技术的发展与完善,为发掘参与调控川中黑山羊产羔数性状关键调控基因提供了全新的视角[12]。对崂山奶山羊高、低繁殖力的两个极端种群进行基因组重测序,发现细胞周期蛋白B2(cyclin B2,2)雄激素受体(androgen receptor,)腺苷酸环化酶1(adenylate cyclase 1,)SMAD家庭成员2(SMAD family member 2,)等基因在高繁殖力群体中被特异性选择[13]。丝氨酸/苏氨酸激酶3(serine/threonine kinase 3,)蛋白磷酸酶3催化亚基α (protein phosphatase 3 catalytic subunit alpha,)等96个候选基因与大足黑山羊产羔数性状显著相关[14],其中也与阿尔巴斯绒山羊产羔数性状相关[15]。进一步分析67个单核苷酸多态性(SNP)与大足黑山羊产羔数的关联,发现半胱氨酰转运RNA合成酶2(cysteinyl-tRNA synthetase 2,)Ⅰ型血小板结合蛋白基序的解聚蛋白样金属蛋白酶(ADAM metallopeptidase with thrombospondin type 1 motif 14,)和甲基转移酶 25(methyltransferase like 25,)基因编码区SNP与头胎产羔数目显著相关[16]。对头胎产单羔、双羔、三羔的三组济宁青山羊进行全基因组扫描,结果在双羔和三羔群体中发现酪氨酸激酶受体(KIT proto-oncogene, receptor tyrosine kinase,)、P21-活化激酶1P21-activated kinases 1,腺苷活化蛋白激酶α1亚基(protein kinase AMP-activated catalytic subunit alpha 1,)等多个产羔数调节基因[17]。WANG等[18]在相同饲养管理条件下,对在5个连续分娩记录中表现出稳定的产羔数差异的12只山羊进行基因组重测序,结果发现细胞分裂周期蛋白25同源蛋白C(cell division cycle 25C,)、核酸内切酶G(endonuclease G,)和Nanos同源基因3(nanos C2HC-type zinc finger 3,)的变异与产羔数性状显著相关,螺旋卷曲过程对生殖能力有潜在的调控作用。这些候选基因的发现拓展了人们对繁殖力遗传基础的认知,为山羊产羔数性状的遗传机制的解析提供重要线索。【本研究切入点】川中黑山羊是我国优良地方山羊品种,具有生长速度快,产肉性能高,产羔率高等优良特性[19-20]。我们在川中黑山羊和的前期研究中未检测到与绵羊多羔性状相关突变的存在,但高繁川中黑山羊与单胎藏山羊之间检测到5个新的碱基突变,其中4个导致氨基酸改变,有2个碱基突变,其中1个导致氨基酸突变,两个品种的15核苷酸序列则完全一致[21]。说明山羊和中氨基酸改变的突变与绵羊中不同,这些突变是否与山羊产羔数相关尚有待进一步研究。从卵巢转录组和miRNA水平也不能完全解析川中黑山羊多羔性状的分子遗传机制[22-23]。【拟解决的关键问题】本研究选择高、低繁殖力的川中黑山羊为研究对象,利用基因组重测序技术扫描其低杂合性、高遗传分化区域,挖掘高、低繁殖力山羊关键基因遗传变异,并对候选靶基因进行GO富集与KEGG通路分析,以期筛选调节川中黑山羊产羔数的关键候选基因,为山羊产羔数性状遗传机制的阐释及后续山羊分子育种工作提供理论基础。

1 材料与方法

1.1 样品的采集

本研究根据第一、二胎产羔记录,于2019年9月选择饲养于四川省乐至县天龙育种场,胎产羔数差异显著的高繁殖力(high fecundity,HF)和低繁殖力(low fecundity,LF)三岁龄川中黑山羊各6只,其中HF组山羊连续两胎胎产羔数4—6只,LF组连续两胎胎产羔数1只(表1)。每只山羊采集其颈静脉血液2 mL于EDTA-K2抗凝管中,试剂盒提取基因组DNA后用于基因组重测序研究。

1.2 山羊血液基因组DNA的提取及质量检测

使用1%琼脂糖凝胶电泳与紫外分光光度计分别鉴定山羊基因组DNA的完整性、浓度和纯度,12管质检合格的HF组和LF组DNA样品各抽取1.5 μg分别建库。利用Agilent 2100检测文库中插入片段的长度,片段符合预期后,送至Illumina HiSeq PE150平台进行双端测序,整个流程委托北京诺禾致源生物信息科技有限公司完成。

表1 12只川中黑山羊的胎产羔数信息


The symbols from HF1 to HF6 were high fecundity goats, and the symbols from LF1 to LF6 were low fecundity goats

1.3 测序数据的变异检测与注释

原始数据经初步质控处理,将接头序列、未测出碱基超过10%和低质量碱基数超过50%的paired reads去除,获得净数据。利用BWA[24]软件将clean reads比对至山羊参考基因组ARS1[25],比对结果经SAMTOOLS软件去除重复[26]。利用GATKv3.2-2进行SNP鉴定与分型[27],过滤后获得的高质量SNPs用ANNOVAR[28]软件工具进行功能注释。

1.4 群体选择分析

利用滑动窗口法(sliding windows)对HF、LF组川中黑山羊进行全基因组扫描,按照窗口内SNPs个数不超过20,确定选择消除窗口大小(100 kb)。计算每个窗口的固定系数(Fst)值并转换为值,选择top 5% 最大t值窗口为选择区域。通过计算窗口内SNPs位点的杂合性(Hp),进而对Selective sweep进行评估。分别计算窗口的Hp值并转化为值,选择top 5%最小值窗口作为选择区域。在计算得到每个窗口Hp和Fst值的基础上,选择最小值和最大值均达到Top 5%的区域为候选区域,并对该区域进行基因注释。

1.5 候选基因的功能注释

基于Bio-Mart在线数据库获得山羊候选区域内的基因注释信息(基因类型和ENSEMBL号)后,利用g:Profiler网站将山羊基因符号ID转换为小鼠同源基因。利用g:Profiler[29]网站和KOBAS[30]在线数据库分别进行Gene ontology(GO)富集分析和Kyoto Encyclopedia of Genes and Genomes(KEGG)通路分析。

1.6 SNP位点的验证

为进一步鉴定调节山羊产羔数目的关键遗传标记,据重测序变异分析报告对19个繁殖候选基因的同义与非同义SNPs进行定位筛选。候选位点经Primer Premier 5.0 软件设计引物(表2),12个山羊样本的扩增产物送至成都擎科生物有限公司进行Sanger测序。

2 结果

2.1 高、低繁殖力组山羊基因组测序数据质控

分别完成12只山羊血液样本基因组重测序工作,共获得431.50 Gb 净数据,错误分布率均为0.03%,测序质量较高(Q20≥96.9%,Q30≥91.69%),所有样本比对率在99.61%—99.73%之间,平均测序深度10.70×,1×覆盖度在94.91%—95.32%之间,4×覆盖度在88.70%—93.13%之间。所有原始序列数据已上传至国家基因组数据中心基因组序列档案库(https://bigd.big.ac.cn/gsa.),注册号为CRA003846。

表2 SNP位点验证引物

2.2 变异检测与注释

基于严格的阈值,两组山羊共检测到16 707 324个高质量SNPs位点,其中LF组8 935 907个SNPs位点,HF组7 771 417个SNPs位点,且LF组的各类SNPs 均多于HF组(表3)。在这些SNPs中,HF组和LF组山羊外显子SNPs平均各有53 425(0.68%)和60 588(0.69%)个,基因上游1 kb区域分别有44 949个和50 798个,基因下游1 kb区域分别分布44 201个和50 349个,两组基因间区SNPs占比最多,分别占总SNPs的70.01%和70.09%;其次是分布在内含子区域SNPs,HF和LF组分别含有2 145 836个和2 473 891个;位于剪切位点的SNPs数目最少。在编码区SNPs 中,同义突变和错义突变分别占外显子总SNPs的58.66%和40.77%,且两组相差不大。此外,HF组和LF组在终止密码子处分别检测到300和323个SNPs,在剪切位点处分别检测到214个和237个SNPs,这些位点可能会影响转录剪接,从而影响蛋白质产物及功能。

表3 川中黑山羊SNPs检测及注释结果统计

2.3 群体选择分析

经不同大小窗口调试发现,窗口大小为100 kb时,SNPs数目小于20个并逐渐趋于稳定,因此,选择100 kb作为选择信号检测最佳窗口长度,使用50%的重叠区为滑动尺,计算川中黑山羊HF组与LF组之间的Fst值,并标准化作图,选取LF和HF之间的阈值为1.9,共筛选到579个窗口,注释623个基因(图1)。

分别计算川中黑山羊HF组与LF组染色体窗口内SNP位点的值,Z转换后并标准化作图,选择top 5%最小值为阈值,HF群体的阈值为-2.05,筛选到579个窗口(图2),共注释617个候选基因。 LF群体的阈值为-2.08,筛选到579个窗口(图3),注释到610个基因。

图1 高繁组和低繁组川中黑山羊1-29号常染色体平均固定系数ZFst的分布

图2 高繁组川中黑山羊1-29号常染色体平均杂合度ZHp的分布

为进一步筛选川中黑山羊产羔性状关键调控基因,本研究初步扫描了具有低杂合性、高遗传分化的区域,即候选窗口值均达到top 5%最大值和top 5%最小值标准。其中HF组中鉴定65个候选窗口,共注释84个候选基因(图4-A),LF组山羊共鉴定了42个候选窗口,注释了59个候选基因(图4-B)。因两组候选基因中存在、等13个交集基因,所以HF组和LF组共注释了130个差异候选基因。

2.4 高、低繁殖力山羊候选基因基因GO富集分析

进一步揭示与产羔数性状的候选靶基因功能,本研究对两群体差异表达基因(130个)进行生物功能分析,-value经Bonferroni校正后,设置corrected-value ≤0.05为阈值,选择候选靶基因中显著富集的GO terms。

图3 低繁组川中黑山羊1-29号常染色体平均杂合度ZHp的分布

图4 川中黑山羊高繁组(A)与低繁组(B)受选择区域


值得注意的是,19个基因与繁殖紧密相关,如繁殖、繁殖过程、胚胎发育和生殖过程调控(表4)。其中HF组特异性强选择性基因为11个,包含腺苷酸环化酶10(adenylate cyclase 10,)、多巴胺受体D1(dopamine receptor D1,)、硫酸肝素6-邻磺酸转移酶1(heparan sulfate 6-O-sulfotransferase 1,)、胰岛素样生长因子结合蛋白7(insulin like growth factor binding protein 7,)、促黑激素同源框2(msh homeobox 2,)、头蛋白(noggin,)、肾单位肾痨4(nephronophthisis 4 (juvenile) homolog,)、妊娠相关血浆蛋白A(pregnancy- associated plasma protein-A,、睾丸发育相关蛋白(testis development-Related Protein,)、木糖转移酶1(xylosyltransferase 1,)和催乳素释放激素受体(prolactin releasing hormone receptor,),HF和LF组共享窗口基因3个,如醛酮还原酶家族成员B3(aldo-keto reductase family 1,member B3,)、组蛋白脱乙酰酶4(histone deacetylase 4,)和mu阿片受体(opioid receptor mu 1,),以及LF组特异性候选基因5个,如膜联蛋白5(annexin A5,)、内皮素A型受体(endothelin receptor type A,)、FA核心复合体连接酶(FA complementation group L,)、胰岛素样生长因子1(insulin-like growth factor1,)和速激肽前体1(tachykinin precursor 1,)。同时,大多数GO术语,如G蛋白偶联受体活性、激素反应和神经肽信号通路等,都包含这19个候选基因。

表4 川中黑山羊繁殖相关GO条目

2.5 高、低繁殖力山羊候选基因KEGG分析

KEGG通路分析结果显示,川中黑山羊差异候选基因集共富集112条代通路,选择前20条显著的代谢通路作为展示(图5)。KEGG代谢通路结果表明,14个HF山羊候选基因中,9个基因显著富集在代谢途径(、)、糖胺聚糖-硫酸乙酰肝素/肝素的生物合成(、)、神经活性配体-受体相互作用()、钙离子信号通路()、cAMP信号通路()和叶酸生物合成()通路(corrected-value ≤0.05)中,这些通路可能在山羊产羔数性状的调控中极具关键作用。

2.6 SNP位点的验证


3 讨论


图5 川中黑山羊选择信号KEGG通路分析

本研究对高产山羊品种川中黑山羊不同产羔数群体进行了全基因组测序,获得了大量遗传变异,为山羊高繁殖力遗传机制解析提供了重要的遗传资料。为阐明川中黑山羊产羔性状的选择特征,设置top 5%为阈值[13-14],在川中黑山羊群体的低杂合性、高遗传分化的区域共注释130个候选基因。



LF组差异表达基因(和)在川中黑山羊排卵、植入后胚胎发育等生殖过程可能呈现负调控作用。研究表明,可抑制应激条件引发的牛卵丘细胞的凋亡[55],对牛卵母细胞发育可能具有增益作用。其5′侧翼区杂合SNPs虽不影响其在卵巢中的表达,但对山羊的多产性具有显著影响[56],且编码区同义突变还可通过调控基因表达影响与受体结合的亲和力[57],进一步影响动物繁殖。因此,后续拟定分析部分SNPs是否与山羊排卵率相关,对于解析川中黑山羊产羔性状遗传基础可能具有理论指导意义。启动子区域内的SNPs可下调其基因的表达[58],进而导致胎盘介导的妊娠并发症及女性的反复流产[59-60]。EDNRA作为一种内皮素受体,不仅参与山羊毛色调控[61],还在肥胖引起的小鼠排卵缺失过程中发挥重要作用[62]。突变可破坏DNA损伤修复过程,可能是引发人类卵巢早衰的潜在病因[63-64],具体的生殖功能调控机制还有待探索。基因编码速激肽家族成员P(SP)和神经激肽A(Neurokinin A,NKA)[65],参与调控哺乳动物生殖激素分泌[66]。速激肽信号对排卵前促黄体素分泌激增具有促进作用,也被认为是调节排卵的一个负面因素,其功能障碍导致雌鼠排卵障碍[67]。此外,川中黑山羊LF组次优选择基因与美姑山羊的繁殖性状相关[68]。这些发现均为产羔数调控网络解析提供了新视角。





4 结论


Screening of Key Regulatory Genes for Litter Size Trait Based on Whole Genome Re-Sequencing in Goats ()

LI Heng1, ZI XiangDong1, WANG Hui2, XIONG Yan1, LÜ MingJie1,LIU Yu1, JIANG XuDong1

1Key Laboratory of Animal Science of National Ethnic Affairs Commission, Southwest Minzu University, Chengdu 610041;2Key Laboratory of Qinghai-Tibetan Plateau Animal Genetic Resource Reservation and Utilization of Ministry of Education, Southwest Minzu University, Chengdu 610041

【Objective】The purpose of this study was to analyze the genome of different fecundity populations of goats (s) and to explore the key regulatory genes involved in the regulation of litter size traits of Chuanzhong black goats (CBGs), and to provide the theoretical reference for analyzing the genetic mechanism of litter size traits and molecular genetic improvement of fecundity in goats. 【Method】The high fecundity (HF) CBG does (= 6) that produced 4-6 kids per doe kidding and low fecundity (LF) does (= 6) that produced only one kid per doe kidding were chosen in this study. The jugular blood samples were collected to extract genomic DNA. The 350 bp double-terminal sequencing library was constructed, and then 12 whole genome libraries were resequenced by IlluminaHiSeqPE150 platform. The clean data from sequencing were mapped to goat reference genome ARS1 by using BWA software, and two whole-genome scanning analysis methods (and) were used to comprehensively analyze the high-quality SNPs obtained to identify candidate regions. GO analysis and KEGG pathway analysis were performed on the G:Profiler and KOBAS online databases, respectively, to screen candidate genes for regulating the number of kids in CBGs. To further identify the key genetic markers that regulate the number of kids, the synonymous and non-synonymous single nucleotide polymorphisms (SNPs) of reproductive candidate genes were mapped and screened according to the variation analysis report of genome resequencing. The amplified products of 12 goat samples were sequenced by Sanger sequencing to verify the resequencing results.【Result】A total of 431.50 Gb clean data were obtained from the genome resequencing study of 12 CBGs. Through mutation detection and annotation, 7 771 417 SNPs were detected in HF group and 8 935 907 SNPs were detected in LF group, and all types of the LF group SNPs were more than those in HF group. The windows that reach the maximumvalue of top 5% and the minimumvalue of top 5% were set as candidate regions. A total of 130 strong selection signals were annotated in the regions with low heterozygosity and high genetic differentiation, of which 84, 59 and 13 genes were annotated in HF group, LF group and shared window, respectively. GO enrichment analysis and KEGG pathway showed that 19 candidate genes were involved in the regulation of reproduction, reproduction and embryonic development of CBG, including 11 HF group-specific candidate genes (,,,,,,,,,, and), and five strong selection signal genes (,,,, and) in LF group, and three window genes (,and) in HF group shared with LF group. The most GO terms, such as G-protein-coupled receptor activity, hormone response and neuropeptide signal pathway, contained these 19 candidate genes. In addition, nine of the 14 HF candidate genes were significantly enriched in metabolic pathway, neuroactive ligand-receptor interaction, glycosaminoglycan-heparan sulfate/heparin biosynthesis, calcium signal pathway, cAMP signal pathway and folate biosynthesis KEGG pathways (<0.05). Among the 19 reproductive candidate genes, there were two synonymous mutations (G771T,G529,,andgene mutations could be detected, and this result was consistent with the results of genome resequencing, in whichG529A polymorphism led to alanine mutation to threonine, and【Conclusion】A total of 11 HF group-specific candidate genes were found in this study, which were speculated to be the key regulatory genes for fecundity trait. The mutations ofgene exon G529A andexon A281T might be the key genetic markers for regulating prolificacy traits in goats, which had great application value in improving reproductive performance of goats.

Chuanzhong black goat; genome resequencing; fecundity; candidate genes





李恒,E-mail:lih199501 @sina.com。通信作者字向东,E-mail:zixd@sina.com

