金四华,杨 磊,何婷婷,范心凤,蔺和太,刘 平,耿照玉*
(1. 安徽农业大学动物科技学院,安徽合肥 230036;2. 青阳县平云牧业开发有限公司,安徽池州 242800)
鸡是第1个完成全基因组测序的农业经济动物[1],随后鸭[2]、鹅[3]、火鸡[4]、鸽子[5]等禽类的参考基因组拼接和组装工作相继完成,高质量的基因组序列信息促进了家禽功能基因组和结构基因组的发展与完善,进一步丰富了家禽基因组信息,大量遗传变异的挖掘和鉴定为解析家禽表型多样性、基因组进化以及抗病育种奠定了坚实的基础。
基因组遗传变异是生物体的基本特征,根据其存在形式主要分为4种类型,包括单核苷酸多态性(Single Nucleotide Polymorphism,SNP)、2~50 bp的小片段的插入或缺失(Insertion or Deletion,InDel)、50 bp以上的拷贝数变异(Copy Number Variations,CNVs)以及由位置变化引起的易位或倒位(Translocation or Inversion)[6]。这些数量众多、形式多样的遗传变异造成畜禽外貌特征、生产性能、经济用途以及抗病性等的差异。
SNP由于数量最多、分布广泛、遗传稳定且容易分型等多种优点,成为研究畜禽外貌特征、生产性能以及疾病抗性与易感性的重要分子标记。但基因组中存在一些稀有SNP、上位效应和连锁关系等,限制了SNP的精细定位及育种应用。与SNP相比,CNVs为大片段的结构变异,能够影响畜禽基因组中较大的区域,甚至引起特定基因序列和表达的变化。目前,CNVs已经在人[7]、果蝇[8]、小鼠[9]、牛[10]、鸡[11]等动物中得到广泛地关注和研究。
本文对CNVs研究历程及检测方法进行综述,重点讨论存在问题及CNVs对家禽表型的影响,并对CNVs在家禽抗病育种中的应用进行展望。
1.1 CNVs研究历程 早在1936年,Bridges等[12]研究果蝇榜眼时发现染色体上片段发生重复,棒眼显性突变Bar基因2个或多个串联重复会引起突变体果蝇单眼数变少,导致复眼的形成,但在当时并未引起足够的重视。2004年,Iafrate等[13]和Sebat等[14]对正常人群基因组变异进行大规模筛查,发现人类基因组中广泛存在大小从1 kb到Mb范围内的拷贝数变异现象,包括DNA片段的插入、缺失、重复以及衍生出的染色体微结构变异,从此揭开CNVs研究的序幕和热潮。
CNVs具有4个主要特征:首先,CNVs覆盖度高。CNVs数量虽然少,但大部分CNVs长度较长,基因组中覆盖碱基数比SNP多[15]。其次,CNVs在基因组中分布不均匀。CNVs在基因组中存在其突变热点区域,CNVs主要分布于着丝粒、亚端粒区和异染色质等进化不稳定的区域。第三,CNVs多态可能影响基因表达水平,最终对基因外显率产生影响。最后,CNVs具有较高突变率[16]。人类基因组中,CNVs每个世代的突变率为 1.7×10-6~1.0×10-4,远高于 SNP 突变率。随着测序技术快速发展以及生物信息分析方法的精细化,McDonald等[6]将CNVs定义为与参考序列相比,基因组中长度大于50 bp DNA片段的插入、缺失或重复等。另外,CNVs在人类和很多模式生物中得到广泛和深入地研究,并鉴定很多有功能的CNVs[17]。因此,CNVs作为畜禽基因组中一种重要遗传变异,将有助于更好地解析表型发生、疾病抗性与易感性及其进化的遗传机制,最终应用于畜禽的分子育种中。
1.2 CNVs检测方法 随着高通量测序技术和分子生物学技术的发展,解析畜禽表型形成和疾病发生的分子遗传机制成为动物分子育种的关键,如何快速、准确、高效地在畜禽基因组中鉴定和验证具有功能性的CNVs成为研究者关注的焦点。
目前全基因组范围内检测CNVs的方法主要包括比较基因组杂交技术(Array-Based Comparative Genome Hybridization,aCGH)、SNP芯片技术和全基因组重测序技术。aCGH芯片技术是检测CNVs常用的方法,具有准确性高、灵敏、分辨率高、成本低等特点,但是其分辨率受限于固化在芯片上探针的长度和数目[18]。SNP芯片是另外一种广泛使用且高效的CNVs检测平台,该方法通量高、操作简单便捷、成本低,同时不需要参考样本及实验群体的杂交,能够进行不同组间的比较[19],但该方法信噪比较低,容易出现假阳性,同时对于基因组比较复杂的区域以及高度重复区域难以设计理想的探针,目前一般采用aCGH和SNP芯片技术混合使用,以提高检测效率[20]。目前,高通量测序技术检测CNVs成为研究的热点和有效方法,该方法理论上能够检测基因组中所有CNVs变异类型,分辨率高、检测速度快、准确性高[21-22],但该方法受限于参考基因组组装完整性及分析平台的数据负荷。随着测序技术的飞速发展,该方法对检测基因组中CNVs具有广阔的发展前景。
对于已发现的CNVs需要进一步筛选、鉴定和验证,以找到引起畜禽表型差异的靶标CNVs。目前验证方法主要包括定量PCR和基于杂交的荧光原位杂交技术(Fluorescencein situHybridization,FISH)[23]。其中,定量PCR因操作简单、速度快、重复性好、灵敏度高等优点得到广泛应用。
家禽不仅是一种重要的农业经济动物,也是分子遗传学和基础生物学的重要模式生物,对其基因组CNVs进行深入挖掘和验证,有助于将其作为一种廉价高效的分子遗传标记应用于未来家禽的选育和育种规划中。
迄今为止,科研人员已经在家禽基因组中挖掘和鉴定出一些与家禽表型变异密切相关的CNVs。Griffin等[24]通过染色体涂染和aCGH芯片技术构建鸡和火鸡精细的比较细胞遗传学图谱,获得16个品种间的CNVs,并通过分析发现禽类的基因组在进化过程相对保守。鸡的快慢羽是家禽特有的一种重要特征,是雏禽雌雄自别的一种重要手段,其由性染色体Z上的K基因所决定,在家禽生产中具有重要的实用价值。Elferink等[25]在研究快慢羽产生机制时发现,慢羽性状是由K基因座上一段含有PRLR和SPEF2基因的串联重复序列引起的,慢羽表型与该CNVs显著关联。鸡的豆冠是鸡品种中一种重要的外貌特征,其由显性基因控制。豆冠表型引起鸡冠和肉垂大大减少,可以减少鸡热量的损失并降低冻伤的易感性。Wright等[26]研究报道,鸡的豆冠是由SOX5基因第1内含子内一段保守的非编码序列拷贝数的增加引起的,该表型是鸡在寒冷环境下的一种适应性性状。Skinner等[27]采用荧光原位杂交技术对鸡和北京鸭进行比较基因组分析,结果表明北京鸭基因组中存在32个潜在的CNVs,其中5个CNVs共存在于火鸡与鸡的CNVs热点区域。Wang等[28]对白来航、洛岛红鸡和科尼什肉鸡等品种CNVs进行研究,发现96个CNVs,且该片段包含锌指蛋白基因和醛糖还原酶基因。丝羽乌骨鸡的乌皮乌骨表型主要是由真皮黑色素过度沉积引起。Dorshorst等[29]报道,鸡20号染色体上2个CNVs区域形成1个重组结构,第1个CNVs区域的EDN3基因被锁定为引起黑色素沉积的目标基因。Gunnarsson等[30]研究表明,SOX10基因转录起始位点上游8.3 kb的片段缺失引起鸡深棕色羽色的发生。Jia等[11]采用高密度SNP芯片筛选白来航蛋鸡和矮小褐壳蛋鸡的CNVs,发现209个CNVRs,覆盖1.42%基因组,为鸡CNVs进一步研究奠定坚实基础。Yi等[21]采用全基因组重测序技术对12只不同类型的鸡进行CNVs分析,发现8 840个CNVRs,总长度为98.2 Mb,占基因组的9.4%,并采用aCGH芯片验证测序结果[20];进一步研究发现,SOCS2基因的CNVs可能与斗鸡骨密度密切相关[31]。
前期研究表明,CNVs可通过改变基因剂量或干扰基因活性影响基因表达与表型差异[32-33],进而引起疾病发生。近年来,研究者对CNVs与家禽疾病的易感性或抗病性进行了相关研究。Luo等[34]首次在全基因组范围内检测到2个高度近交的抗病系和易感系中马立克氏病易感性与CNVs的关联性,发现2个与马立克氏病抗性显著相关的CNVs。Yan等[35]采用全基因组重测序技术对马立克氏病抗性相差较大的2个品系进行研究,抗性和易感系分别检测到1 546个和1 866个特异性CNVRs,进一步研究发现67个品系特有的CNVRs以及62个马立克氏病易感性关联的基因。该报道为深入研究马立克氏病提供新的遗传标记和新的视角。Xu等[36]采用600 K高密度SNP芯片对63系、72系以及近交重组系RCS进行CNVs分析,发现393个CNVs区域,其中12个CNVs是易感品系72特有的,并且2个缺失型CNVs影响临近基因的表达。上述研究结果表明,CNVs与家禽表型特征和疾病相关的性状密切相关,进一步研究CNVs的形成机理、作用机制以及在家禽分子育种中的应用具有重要的意义。
目前畜禽CNVs处于快速发展阶段,多种畜禽的CNVs图谱已经构建并取得初步进展,但仍然存在一些问题。
家禽功能基因组学的核心问题是阐述家禽表型和疾病产生的致因突变及遗传机制[37]。因此,进行畜禽遗传改良的前提是寻找并验证基因组中重要的遗传变异,CNVs作为基因组中广泛存在的遗传变异类型,准确、高效地鉴定基因组中CNVs是研究者和育种者亟待解决的热点问题。但是,前期多项研究表明CNVs检测的准确性和重复性不高,因此需要进一步完善家禽参考基因组组装,CNVs检测方法完善和研究策略开发也至关重要。目前检测CNVs的方法主要有SNP芯片和基因组重测序技术。SNP芯片检测一方面受到探针密度的影响,同时基因组中一些较为复杂结构区域或片段高度重复区域,设计探针较困难因而CNVs的检测数量有限。另外,一些较短的CNVs以及CNVs的绝对拷贝数检测不到[20]。基因组重测序技术可以克服SNP芯片检测存在的问题,但目前测序成本较高,不利于在大规模群体中开展研究。
近年来,新开发的第3代测序技术得到快速发展,其测序读长较长,并且对基因组中复杂结构或区域具有较高的分辨率,可以提高检测的准确性和灵敏度[38]。随着测序技术的快速发展以及测序成本大幅度降低,基因组更多CNVs将被挖掘和验证。同时,分析软件和算法的进一步完善,也将有助于提高CNVs检测效率和准确度[39]。另外,检测基因组已知CNVs区域的变异类型、芯片技术更具有优势,将有助于育种企业的应用。此外,目前多数研究主要集中于找到基因组中存在CNVs,而对CNVs的形成机理、作用机制以及功能的研究不够深入,CNVs与畜禽表型多样性以及复杂疾病的形成机理还有待进一步研究。
疾病是限制现代家禽生产发展的一个重要因素,虽然目前采用疫苗接种和药物进行预防,但是未能从根本上阻断疾病的发生和流行。对家禽抗病性状的研究和育种实践表明,采用遗传策略从本质上改善家禽对疾病的抗性,提高其免疫机能,进行分子抗病育种具有重要的意义。
家禽遗传抗性研究一直以来是家禽研究者和育种者关注的重点和难点。传统的育种一般为表型选育,根据表型挑选抗病力强的个体留为种用,这种选择方法周期较长、成本高、选育效率低下,育种效率低,难于取得预期的效果[40]。分子育种具有周期短、不受环境和性别及年龄等限制、准确性高、效率高、能够进行早期选择等优点[41],受到研究者和生产者的广泛关注。家禽抗病育种工作的核心任务就是对家禽进行选育与改良,寻找和挖掘影响家禽抗病性并能够稳定遗传的分子辅助标记[42]。CNVs作为家禽基因组中一种广泛存在的遗传变异,揭示其与疾病抗性和易感性的密切联系,将为家禽抗病育种提供有效的遗传标记信息。例如,可以采用qPCR或SNP芯片检测对照组和处理组在基因组中CNVs差异,将差异的CNVs与疾病进行进一步关联分析,最终将该CNVs作为该疾病的潜在分子标记。同时,遗传选育时可以鉴定能够用于区分疾病抗性或易感性的特定基因型或单倍型,从而达到培育适应性强、抗病的家禽品种或品系。另外,我国地方家禽遗传资源丰富,适应性好、抗病力强,根据这些特征和优势,开发具有自主知识产权的SNP芯片(如由中国农业大学、中国农业科学院北京畜牧兽医研究所和北京康普森生物技术有限公司联合研发的蛋鸡55 K SNP芯片和肉鸡55 K SNP芯片),将有助于挖掘和鉴定相关性状的功能CNVs,可进一步丰富我国家禽遗传变异信息。此外,CNVs为研究疾病的致病机理、预防疾病的发生以及药物的研发提供新思路和途径。
近年来,基因组编辑技术得到快速发展,特别是以CRISPR/Cas9系统为核心的第3代基因组编辑技术,近年来经过人工改造后成为一种操作简单、高效和适用范围广的基因打靶技术,能够在基因组水平上对变异类型进行精确修饰[43]。该技术在基因组编辑中,未引入新的基因,安全性较高,目前在家禽育种已经得到应用[44]。另外,随着基因组测序技术和新算法的开发,多种与家禽疾病抗性和易感性相关的CNVs被发现和验证。同时,家禽基因编辑技术与测序技术联合使用将会促进家禽抗病育种的快速发展和不断完善,提供更多高效而且安全的标记应用于家禽抗病育种中。综上可知,未来家禽抗病育种将集现代分子标记技术之大成,CNVs将作为一种重要的遗传标记或遗传信息应用于家禽的分子抗病育种之中。
随着具有自主知识产权的基因芯片的研发,高通量测序技术以及基因组编辑技术的快速发展,家禽基因组内大量的CNVs将被挖掘,并筛选和验证出一些与家禽表型特征、重要经济性状以及疾病抗性密切相关的CNVs。因此,CNVs作为一种重要的遗传变异,为家禽遗传资源的保护和开发、完善和优化家禽育种策略以及加快遗传进展等方面奠定了坚实的基础,为从全基因组范围内挑选适应性强、生产性能优秀、抗性强(耐寒、抗热或抗病)的种用家禽,以及进行家禽相关性状的早期选择和分子抗病育种提供新的思路和途径,未来将作为一种重要且有效的分子遗传标记应用于家禽的选育与育种工作中。与此同时,将新挖掘和验证的CNVs与SNP进行整合和利用,将为揭示家禽重要经济性状的遗传机理、家禽基因组进化机制以及复杂疾病的致病机理提供有效的方法。因此,CNVs将广泛应用于家禽选育与分子抗病育种工作之中,并具有重要的研究意义和广阔的应用前景。
参考文献:
[1] International Chicken Genome Sequencing C. Sequence and comparative analysis of the chicken genome provide unique perspectives on vertebrate evolution[J]. Nature, 2004,432(7018): 695-716.
[2] Huang Y, Li Y, Burt D W,et al. The duck genome and transcriptome provide insight into an avian influenza virus reservoir species[J]. Nat Genet, 2013, 45(7): 776-783.
[3] Lu L, Chen Y, Wang Z,et al. The goose genome sequence leads to insights into the evolution of waterfowl and susceptibility to fatty liver[J]. Genome Biol, 2015, 16(1): 89.
[4] Dalloul R A, Long J A, Zimin A V,et al. Multi-platform nextgeneration sequencing of the domestic turkey (Meleagris gallopavo): genome assembly and analysis[J]. PLoS Biol, 2010,8(9):1000475.
[5] Shapiro M D, Kronenberg Z, Li C,et al. Genomic diversity and evolution of the head crest in the rock pigeon[J]. Science, 2013,339(6123): 1063-1067.
[6] MacDonald J R, Ziman R, Yuen R K,et al. The Database of Genomic Variants: a curated collection of structural variation in the human genome[J]. Nucleic Acids Res, 2014, 42(Database issue): D986-D992.
[7] Prunier J, Caron S, Lamothe M,et al. Gene copy number variations in adaptive evolution: The genomic distribution of gene copy number variations revealed by genetic mapping and their adaptive role in an undomesticated species, white spruce(Picea glauca)[J]. Mol Ecol, 2017, 26(21): 5989-6001.
[8] Emerson J J, Cardoso-Moreira M, Borevitz J O,et al. Natural selection shapes genome-wide patterns of copy-number polymorphism in Drosophila melanogaster[J]. Science, 2008,320(5883): 1629-1631.
[9] Graubert T A, Cahan P, Edwin D,et al. A high-resolution map of segmental DNA copy number variation in the mouse genome[J]. PLoS Genet, 2007, 3(1): e3.
[10] Letaief R, Rebours E, Grohs C,et al. Identification of copy number variation in French dairy and beef breeds using nextgeneration sequencing[J]. Genet Sel Evol, 2017, 49(1): 77.
[11] Jia X, Chen S, Zhou H,et al. Copy number variations identi fi ed in the chicken using a 60K SNP BeadChip[J]. Anim Genet,2013, 44(3): 276-284.
[12] Bridges C B. The Bar “GENE” a duplication[J]. Science, 1936,83(2148): 210-211.
[13] Iafrate A J, Feuk L, Rivera M N,et al. Detection of large-scale variation in the human genome[J]. Nat Genet, 2004, 36(9): 949-951.
[14] Sebat J, Lakshmi B, Troge J,et al. Large-scale copy number polymorphism in the human genome[J]. Science, 2004,305(5683): 525-528.
[15] Alkan C, Coe B P, Eichler E E. Genome structural variation discovery and genotyping[J]. Nat Rev Genet, 2011, 12(5): 363-376.
[16] Zhang F, Gu W, Hurles M E,et al. Copy number variation in human health, disease, and evolution[J]. Annu Rev Genomics Hum Genet, 2009, 10(1): 451-481.
[17] Weischenfeldt J, Dubash T, Drainas A P,et al. Pan-cancer analysis of somatic copy-number alterations implicates IRS4 and IGF2 in enhancer hijacking[J]. Nat Genet, 2017, 49(1): 65-74.
[18] Carvalho B, Ouwerkerk E, Meijer G A,et al. High resolution microarray comparative genomic hybridisation analysis using spotted oligonucleotides[J]. J Clin Pathol, 2004, 57(6): 644-646.
[19] Ionita-Laza I, Rogers A J, Lange C,et al. Genetic association analysis of copy-number variation (CNV) in human disease pathogenesis[J]. Genomics, 2009, 93(1): 22-26.
[20] Yi G, Qu L, Chen S,et al. Genome-wide copy number pro fi ling using high-density SNP array in chickens[J]. Anim Genet,2015, 46(2): 148-157.
[21] Yi G, Qu L, Liu J,et al. Genome-wide patterns of copy number variation in the diversified chicken genomes using nextgeneration sequencing[J]. BMC Genomics, 2014, 15(1): 962.
[22] Xu Y, Jiang Y, Shi T,et al. Whole-genome sequencing reveals mutational landscape underlying phenotypic differences between two widespread Chinese cattle breeds[J]. PLoS One,2017, 12(8): e0183921.
[23] Lee C, Iafrate A J, Brothman A R. Copy number variations and clinical cytogenetic diagnosis of constitutional disorders[J]. Nat Genet, 2007, 39(7 Suppl): S48-S54.
[24] Griffin D K, Robertson L B, Tempest H G,et al. Whole genome comparative studies between chicken and turkey and their implications for avian genome evolution[J]. BMC Genomics,2008, 9(1): 168.
[25] Elferink M G, Vallee A A, Jungerius A P,et al. Partial duplication of the PRLR and SPEF2 genes at the late feathering locus in chicken[J]. BMC Genomics, 2008, 99(1): 391.
[26] Wright D, Boije H, Meadows J R,et al. Copy number variation in intron 1 of SOX5 causes the Pea-comb phenotype in chickens[J]. PLoS Genet, 2009, 5(6): e1000512.
[27] Skinner B M, Robertson L B, Tempest H G,et al. Comparative genomics in chicken and Pekin duck using FISH mapping and microarray analysis[J]. BMC Genomics, 2009, 10(1): 357.
[28] Wang X, Nahashon S, Feaster T K,et al. An initial map of chromosomal segmental copy number variations in the chicken[J]. BMC Genomics, 2010, 11(1): 351.
[29] Dorshorst B, Molin A M, Rubin C J,et al. A complex genomic rearrangement involving the endothelin 3 locus causes dermal hyperpigmentation in the chicken[J]. PLoS Genet, 2011, 7(12):e1002412.
[30] Gunnarsson U, Kerje S, Bed'hom B,et al. The Dark brown plumage color in chickens is caused by an 8.3-kb deletion upstream of SOX10[J]. Pigment Cell Melanoma Res, 2011,24(2): 268-274.
[31] Bi H, Yi G, Yang N. Increased copy number of SOCS2 gene in Chinese gamecocks[J]. Poult Sci, 2017, 96(5): 1041-1044.
[32] Beckmann J S, Estivill X, Antonarakis S E. Copy number variants and genetic traits: closer to the resolution of phenotypic to genotypic variability[J]. Nat Rev Genet, 2007, 8(8): 639-646.
[33] Stranger B E, Forrest M S, Dunning M,et al. Relative impact of nucleotide and copy number variation on gene expression phenotypes[J]. Science, 2007, 315(5813): 848-853.
[34] Luo J, Yu Y, Mitra A,et al. Genome-wide copy number variant analysis in inbred chickens lines with different susceptibility to Marek's disease[J]. G3 (Bethesda), 2013, 3(2): 217-223.
[35] Yan Y, Yang N, Cheng H H,et al. Genome-wide identification of copy number variations between two chicken lines that differ in genetic resistance to Marek's disease[J]. BMC Genomics,2015, 16(1): 843.
[36] Xu L, He Y, Ding Y,et al. Characterization of copy number variation's potential role in Marek's disease[J]. Int J Mol Sci,2017, 18(5): 1020.
[37] 程红, 姜雨. 家养动物基因拷贝数变异研究进展及其育种应用展望[J]. 生物技术通讯, 2015, 31(11): 35-42.
[38] Betz-Stablein B D, Topfer A, Littlejohn M,et al. Singlemolecule sequencing reveals complex genome variation of hepatitis B virus during 15 years of chronic infection following liver transplantation[J]. J Virol, 2016, 90(16): 7171-7183.
[39] Tzeng J Y, Magnusson P K, Sullivan P F,et al. A new method for detecting associations with rare copy-number variants[J]. PLoS Genet, 2015, 11(10): e1005403.
[40] Stuber C W, Polacco M, Senoir M L. Synergy of empirical breeding, marker-assisted selection, and genomics to increase crop yield potential[J]. Crop Sci, 1999, 39(6): 1571-1583.
[41] Moose S P, Mumm R H. Molecular plant breeding as the foundation for 21st century crop improvement[J]. Plant Physiol,2008, 147(3): 969-977.
[42] 易国强. 利用二代测序挖掘鸡拷贝数变异及影响饲料效率的候选基因[D]. 北京: 中国农业大学, 2015: 8-9.
[43] Jiang W, Bikard D, Cox D,et al. RNA-guided editing of bacterial genomes using CRISPR-Cas systems[J]. Nat Biotechnol, 2013, 31(3): 233-239.
[44] Zuo Q, Wang Y, Cheng S,et al. Site-directed genome knockout in chicken cell line and embryos can use CRISPR/Cas gene editing technology[J]. G3 (Bethesda), 2016, 6(6): 1787-1792.