绵羊基因组测序及应用研究进展

2020-12-18 22:05熊和丽和晓明彭超超刘兴能朱俊红邓卫东
家畜生态学报 2020年6期
关键词:组学绵羊山羊

熊和丽,和晓明,李 静,3,彭超超,刘兴能,岳 丹,朱俊红,邓卫东*

(1.云南农业大学 动物科技学院,云南 昆明 650201;2.云南省畜牧兽医科学院,云南 昆明 650224;3.公安部昆明警犬基地,云南 昆明 650201)

2001年,由美国国家人类基因组研究中心联合国际合作机构发起的人类基因组计划发表人类基因组草图[1], 并于2003年完成了人类基因组计划的测序工作,这个计划绘制出人类基因组30亿对碱基,受此计划的引领和启示,各国先后启动了动物基因组计划。随着测序技术的发展及测序成本的降低,目前已有数百种动植物完成了参考基因组序列测定。绵羊作为人类重要的经济动物,其基因组序列的破译使得在基因组水平进行重要性状功能基因的鉴定成为可能,这不仅有益于深入认识复杂性状的遗传学机制,更有助于后期的分子育种实践。

1 绵羊基因组从头测序

基因组denovo测序指在不依赖参考基因组的情况下对某物种进行基因组测序,利用生物信息学方法进行拼接、组装,绘制出该物种的全基因组序列图谱[2],为该物种提供参考基因组,将大大推进这个物种后续的研究。

2010年,国际绵羊基因组协会利用Roche 454 FLX对6只不同品种的雌性绵羊进行全基因组测序并参考牛基因组进行组装,组装版本为Ovis_aries_1.0,测序深度3×, Scaffold N50 为34 Mb,Contig N50 685 bp,Gap数为1.66 Gb,基因组覆盖度42%。研究人员在此基因组的基础上开发出DNA芯片,并为来自全世界的74个品种近3 000只绵羊进行SNP 分型,并成功鉴定造成特赛尔绵羊小眼畸形、软骨发育不全、派伦代尔绵羊黄脂以及造成无角的基因[3]。

2014年,由欧盟第七框架计划( the EU 7th Framework programme)组织的NextGen project提交了对一只雌性摩弗伦绵羊进行全基因组测序及组装的序列,版本号为Oori1,基因组组装到Scaffold水平,测序深度达95×,Scaffold N50 为2 Mb,Contig N50 为39 kb,Gap数为159 Mb,基因组覆盖度94%,相较于Ovis_aries_1.0,基因组覆盖度大大提高,但是Scaffold N50很低。

2014年,由中国科学院昆明动物所领衔的绵羊基因组计划公布了组装到染色体水平的绵羊全基因组序列,此计划于2009年启动,其中中国科学院昆明动物研究所与深圳华大基因联合测序1头雌性特克塞尔绵羊,而英国罗斯林研究所测序1头雄性特克塞尔绵羊,以及其他单位合作组装分析,历时5年完成了绵羊基因组的测序、组装及分析工作[4],版本号为Oar_v4.0,这一版本为Oar v3.1的升级版,此次测序在原二代的基础上增加三代测序方法(Illumina GAII; 454; PacBio RSII)进行测序和组装,测序深度达166×, Scaffold N50 为100 Mb,Contig N50为150 kb,组装后形成2.61 Gb基因组,注释到25 197个基因,其中20 921个是蛋白编码基因。组装后经质量验证,超过99.3%的测序个体的mRNA可以映射到Oar v3.1 上(平均水平为98.4%),说明组装质量达到较理想的水平。绵羊高质量全基因组的问世,通过将绵羊和山羊与哺乳动物保守的4 850个单拷贝同源基因序列聚类分析并推断出山羊和绵羊的分化时间约在430万年前,正是新第三纪后期C4草增多的时期;研究人员在绵羊的EDC区域中首次鉴别到两种在反刍动物中发生特异蛋白结构改变,且仅在瘤胃中特异高表达的结构蛋白,这两个结构蛋白发挥瘤胃表面基板的作用,通过转谷氨酰胺酶介导交联瘤胃表达的角蛋白,从而构成瘤胃壁黏膜层坚韧的角质化表面,参与瘤胃表层角蛋白角质化形成;研究人员还发现,除了肝脏,反刍动物的皮肤也是重要的脂类代谢器官。绵羊皮肤的转录组数据表明,MOGAT2和MOGAT3发生了高表达,绵羊皮肤中MOGAT代谢通路降低了甘油三酯合成和磷脂酸合成、皮肤屏障脂质合成和囊泡发育调控的耦合,有利于羊毛的生长。高质量的绵羊基因组和转录组序列图谱的绘制揭示了反刍动物瘤胃进化以及羊绒脂类代谢相关遗传学机制,为推动绵羊重要经济性状关联基因的鉴定研究奠定遗传基础[5]。

随着测序技术和组装技术的不断发展和成熟,2017年贝勒医学院人类基因组测序中心完成对1只雌性Rambouillet绵羊从头测序,获得仅有约380 kb 空白序列的高质量绵羊基因组精细图谱(Oar_rambouillet_v1.0),Scaffold N50达到109 Mb,Contig N50达到2.5 Mb,基因组大小为2.87 Gb,包括线粒体基因组。注释到33 125个基因,42 391个蛋白。高质量的绵羊基因组序列图谱和功能注释的完成,为绵羊基因组学研究提供了高质量的参考标准,为解析绵羊复杂性状的遗传机制奠定了基础[6],将进一步推进绵羊分子育种的研究及应用。

2 全基因组重测序

全基因组重测序是对已有参考基因组的物种进行不同个体的全基因组测序,通过将测序个体的序列与参考基因组进行比对,获得测序个体的单核苷酸多态性位点(SNP)、插入缺失位点(InDel)、结构变异位点(SV)和拷贝数变异位点(CNV)[7-9],获得个体或群体分子遗传特征,进行动物重要经济性状候选基因预测及遗传进化分析[10]。

近年来,全基因组重测序在检测遗传变异、群体进化与适应性研究、功能基因定位及遗传图谱构建等方面的研究在动植物上得到广泛应用并取得了重要成果。Lan等[11]通过对6头金川牦牛进行重测序鉴定出7 693 689个SNP,结合考古数据推测金川牛的驯化起源于6 000年前,通过选择清除分析发现金川牦牛有339个显著受到正向选择的基因,其中一些与生理适应,组蛋白和与品种优良生产特性有关,研究为金川牛的进化、分子起源和独特性状提供了基础。Gou等[12]通过对6个品种的60只犬进行全基因组重测序,平均每个样品15×测序深度,运用选择分析的方法在不同海拔犬类的基因组中鉴定到了EPAS1基因与藏獒的高原低氧适应性有关。Benjelloun等[13]对摩洛哥本地山羊多样性及选择信号的研究,研究通过对摩洛哥本地表型及地理分布上具有代表性的3个品种44只山羊进行全基因组重测序,进行选择分析发现与适应当地气候条件相关的选择基因,3个山羊品种具有丰富的遗传资源,为当地品种保护提供遗传基础。Li等[14]对来自内蒙古及辽宁的两个优秀绒用山羊品种的70只山羊进行全基因组重测序,通过选择分析鉴定到与羊毛纤维相关的基因如FGF5,SGK3,IGFBP7,OXTR及ROCK1,研究结果为绒用山羊及其他山羊品种的育种提供了分子基础。

目前,将全基因组重测序应用于绵羊群体进化及适应性的研究取得了重要成果。Yang等[15]对绵羊处于极端环境的适应性进行研究,通过对来自中国的21个品种的77只绵羊进行全基因组重测序,对中国地方品种绵羊的群体结构和种群历史动态进行了研究,群体遗传结构分析表明中国绵羊起源于北方,可分为3个遗传群体:青海西藏群,云贵高原群,东北群;同时将这些绵羊分为来自高原和平原、干旱沙漠和湿润、高海拔和低海拔的3个比较群体,通过选择清除分析,筛选到了112个和75个分别与高原和沙漠极端环境适应性相关的基因,并对这些基因进行了GO功能类别和信号通路分析,结果表明在高原环境下受选择基因与高原低氧环境的耐受反应有关;在沙漠环境下受选择基因则与水分的重吸收有关,同时能量代谢和体型大小的变异也与绵羊适应高原、沙漠等极端环境有关。这项研究发现了绵羊为快速适应极端环境而引起的基因变化,为今后应对气候变化的育种研究提供了分子基础。Naval-Sanchez等[16]运用全基因组重测序分析绵羊驯化过程中受到选择的基因,通过选用来自世界6个地理分布,具有不同表型的43个绵羊品种的67只家养绵羊及其野生祖先摩弗伦羊17只进行全基因组重测序,测序深度达11.82×,通过选择清除分析发现与野生绵羊相比,家养绵羊具有较低的核酸多样性及各品种间存在较大差异,同时筛选到众多绵羊驯化过程中受到选择的基因,如与体重和奶产量相关的SOCS2,与毛色相关的ITCH-ASIP,与繁殖相关的VEGFA基因;通过GO功能富集分析发现因驯化及人工选择而形成的生物学变化表现在体型大小的改变,脂肪代谢的变化,以及性成熟时间等。同样也是驯化研究, Alberto等[17]对驯化中心的亚洲摩弗伦野绵羊、Bezoar ibex野山羊以及家养绵羊和山羊进行全基因组重测序,通过选择分析发现绵羊和山羊在驯化以及人工选择的过程中受到选择的基因区域分别为46个和44个,其中20个区域在绵羊和山羊是相同的,而且山羊和绵羊呈现不同的选择模式,提示在驯化的过程中具有共同的驯化以及人工选择目的,不同的选择方法在相近的物种中产生相似的表型特征。王维民[18]通过全基因组重测序比较分析亚洲摩弗伦野羊与5个具有代表性的中国地方绵羊品种(阿勒泰羊、多浪羊、湖羊、蒙古羊和藏羊)在全基因组水平的差异,由此构建了5个地方绵羊品种的高分辨率遗传变异图谱,并鉴定了在驯化过程中共享的和品种特异的选择区域及相应基因,发现了与视力、神经发育、繁殖和适应性等重要生理表型和经济性状相关的基因。

随着测序成本的降低,越来越多的研究人员开始利用全基因组重测序进行绵羊重要性状相关功能基因的鉴定。智达夫[19]通过对呼伦贝尔短尾羊及与其外形相近,但尾型不同的巴尔虎羊作为对照进行全基因组重测序,利用群体杂合度(Hp)和遗传分化系数(Fst)分析法进行选择分析,发现与脊椎发育相关的T基因,且后续分析证明其存在新型的 c.G334T 突变,而且该突变在短尾表型的形成过程中起到关键作用。滑留帅等[20]利用混池重测序鉴定萨福克绵羊超数排卵关键调控基因,结果筛选到11个关键调控基因。达赖等[21]基于全基因组重测序研究蒙古羊尾长性状的相关基因及可能的突变位点,研究确定了与尾椎数相关的受选择区域,并推测蒙古绵羊不同尾椎数的形成可能由基因非编码区域的1个或者多个突变造成。

3 简化基因组测序

简化基因组测序(Reduced Representation Genome Sequencing)是指利用限制性内切酶对基因组DNA进行酶切,并对酶切片段进行高通量测序的技术。简化基因组测序只对酶切片段测序,测序成本低,而且可极大降低基因组的复杂度,并且不受参考基因组的限制,无参考基因组的物种也可以进行分子标记鉴定与开发[22],因此广泛应用于分子标记开发、群体遗传分析等。曹愉夏等[23]通过RAD-seq简化基因组测序获得高密度SNP信息,以准确度量狼山鸡保种群体的近交统计量,并比较不同算法在近交统计量度量中的可靠性。刘宏祥等[24-25]利用简化基因组测序方法ddRAD鉴定高邮鸭、太湖鹅的SNP标记,比较分析遗传多样性差异,以评价高邮鸭、太湖鹅原种场的保种效果。马丽娜等[26]运用基于酶切的简化基因组测序技术对滩羊、蒙古羊、湖羊3个绵羊品种进行进化关系的研究,结果表明滩羊、湖羊、蒙古羊的SNP位点平均数分别为24 008个、23906个、23 306个,利用PCA主成分分析表明,蒙古羊和湖羊聚成一支,滩羊单独为一分支,通过群体结构聚类分析表明,3个绵羊品种互有基因交流,说明3个绵羊品种差异不大,符合3 个绵羊品种外貌体型相似的特点。简化基因组测序的优点在于测序成本低,测序周期短,还可以用于无参考基因组物种,但因其仅对酶切片段进行测序,相对于全基因组重测序,获得的SNP相对较少,在进行GWAS分析或解析复杂性状的遗传机制时可能达不到理想效果。

4 结语与展望

目前绵羊高质量的参考基因组来自两个品种,世界上绵羊品种超过1400种,虽来自于相同的驯化中心[27],但在自然及人工选择的作用下形成适应各种不同环境以及为人类所需的品种,如绒用、肉用、奶用,因此各个品种都具有独特的基因组成部分。全基因组重测序分析都是通过与参考基因组进行比对,只有比对上的基因才能得以分析,比对不上的部分很可能是各品种特有的基因[28],这部分基因对品种的研究非常重要,因此更多绵羊品种的全基因组denovo测序成为必要。随着第三代测序技术的发展以及成本的降低,未来更多更高质量的绵羊品种的全基因组denovo测序将成为可能。

全基因组测序通过各种分析方法筛选出大量的候选基因,如何找到主效基因,并明确其功能是难点。随着后基因组时代的发展,各种组学应运而生,如转录组学、蛋白质组学以及代谢组学,这些组学的发展为深入挖掘主效基因、认识复杂性状的分子机理和遗传基础提供了更多的切入点。目前各种组学联合应用较多的是基因组学与转录组学,如宋伸[29]利用全基因组测序、外显子测序及转录组测序研究揭示山羊高海拔适应性及产绒性状分子机制。其他组学的联合应用,如汤继顺利用单细胞转录组测序,RNA-Seq 以及蛋白质组学分析策略筛选与绵羊多羔性状相关的差异基因和差异蛋白[30]。随着各种组学的发展,多组学的联合应用在解析动植物复杂性状遗传机制方面将成为主要趋势。

猜你喜欢
组学绵羊山羊
冬末春初 注意防治绵羊痘病
影像组学在肾上腺肿瘤中的研究进展
在雨中“躲雨”的绵羊
夏季如何让山羊增膘
东莨菪碱中毒大鼠的代谢组学
影像组学在核医学影像中的应用进展
蛋白质组学技术在胃癌研究中的应用
绵羊和小鸟
山羊受骗
聪明的山羊