杨 红,郭徵力,叶 丽,王天松,沈 杰,郭 勇,杨远青,曾姗姗,袁 建,王智伟
(1.毕节市畜牧站,贵州 毕节 551700;2.贵州大学动物科学学院∕高原山地动物遗传育种与繁殖教育部重点实验室,贵阳 550025;3.铜仁职业技术学院农学院,贵州 铜仁 554300)
当同物种的任何两个基因组进行比较时,99.9%是相同的。然而,动物拥有上亿个碱基对的基因组,每个个体二倍体基因组中都有上百万个差异。大多数差异是由于单碱基替代所形成的多态性,俗称单核苷酸多态性(Single nucleotide polymorphism,SNP)。虽然大多数SNP没有生物学意义,但一小部分处于功能基因上的替换则具有各种不同的功能意义,是遗传多样性的基础[1]。在经济动物的遗传育种过程中,科研工作者们致力于使用一些可靠的遗传标记来提高选择效率与效能,提高经济效益,而SNP所表现的多态性只涉及到单个碱基的变异,这种变异可由单个碱基的转换或颠换所引起,也可由碱基的插入或缺失所致,但通常所说的SNP并不包括后两种情况[2],因此SNP可作为遗传标记,用来追踪染色体区域代代相传的遗传模式。且SNP在基因组中分布广泛,平均每数百个碱基对就存在一个SNP[3],对此,有必要开发高通量检测多个样本的基因型方法,来进一步进行性状关联分析,从而针对某一性状进行改良。
鹅的品种有很多,但只有优良的品种才有遗传下去的必要性。而在众多的优良品种中,我国是拥有品种最多的三大国家之一。在鹅的品种分类中,将其分为两类,第一类为伊犁鹅,其余的统称为中国鹅。在中国的传统文化中,将鹅称作鸿雁,这是最古老的品种。在国内的鹅,通常具有同样的特征,但是也有例外的情况,例如伊犁鹅。由于中国地理面积广阔,每个地方的生态环境有着很大的差距,同样都是中国鹅,经过长时间的生存和演变,进行了生态演变和人工选择,形成了不同的地方品种,形成了多样化的特征。在不同地方生长起来的中国鹅,差距十分悬殊,表现在体型外貌、生产性能等多个方面[4]。地方品种的鹅汇聚在一起,大约有30几个种类,列入《中国畜禽遗传资源志——家禽志》中,是一座鹅的天然“基因库”[5]。中国鹅的种类之多,生存和演变的历史悠久是任何国家都不能与之相比的,为鹅的优秀品种遗传提供了坚实的基础。鹅的营养价值较高,鹅肉自身具有超高的营养价值和保健作用。鹅是一种食草的家禽,发展养鹅业符合我国畜牧业结构调整要求。面对如此大的市场,只要对鹅某一个重要性状进行改良就可能带来巨大的经济效益。
近年来,人们对SNP的研究力度、范围都在逐渐扩大,SNP自身所具备的一些优良特性使得其在遗传分析中成为一类能够广泛应用的遗传标记,能够更加清晰地剖分研究复杂的数量性状。
无论是基因的编码区还是非编码区,都可能存在大量的SNP,即DNA 序列中任意一个核苷酸都有可能发生变异。据统计,人类基因组中每1 000个核苷酸就有一个SNP,其遗传距离为2~3 cM,密度比微卫星更高,这么高密度的分布,使得可以在待测基因的附近或内部提供一系列的标记[6]。
位于基因组内部的某些SNP位点可能会对蛋白质结构和表达水平产生直接的影响,从而引起机体的一系列变化。例如R.Kambadur 等[7]的研究发现,皮尔蒙特牛在MSTN 基因的第三外显子上发生了G→A 的单碱基突变,导致了保守的半胱氨酸替换为酪氨酸,从而导致了双肌隐性表型的显示。毛海光[8]也发现鸽DGAT2、ADSL、FABP1和FABP3基因上一些单碱基的突变显著影响了鸽屠体和肉质性状。
SNP标记的检测方式在传统的简单标记方式基础上进行了技术的提升。在传统的标记方法下,SNP基因标记需要消耗大量的时间,具有纷繁复杂的电泳步骤,消耗大量的金钱。而在新的标记技术下,实现了自动化检测,只需要简单的人工辅助,就可以大大地提升检出率。SNP的基因组成比较简单,通常是由两部分组成,是等位基因的两个组成部分[9-10]。由于结构简单,而在分析的过程中,仅需要判断是这部分还是那部分就可以,非此即彼。在整体片段的分析过程中,无需对长度进行分析,减少了人工检测的步骤,有利于自动化基因检测和SNP基因筛选。
碱基C和T之间具有多个SNP键,而且具有固定的比例,通常为1∶2。SNP 具有甲基化过程,该过程发生在生物基因组中,CpG二核苷酸的胞嘧啶极易自发地脱去氨基从而形成胸腺嘧啶,在生物基因组中发生率较高[11]。SNP 与其他分子标记不同,其他分子基因标记为多核突变,而SNP基因标记是一种单核酸突变,由于突变发生很难,而突变率也十分低。该基因突变没有任何的症状,与遗传学的关系微乎其微,没有不良性状相关联。因此,SNP标记属于遗传稳定性高的遗传变异。
在动植物群体中,SNP标记可能由2个、3个或4 个等位基因构成,但实际上后2 种情况出现的概率异常少见,常被忽略,故SNP标记一般只有两种等位型的碱基组成,又由于具有等位基因性,所以在任何种群中其等位基因的频率都便于估计[12]。
SNP的开发和利用是学者们研究的重点,而在开发之前,需要发现它并进行检测。随着科技的发展,SNP的检测方法也在逐步完善。最初,主要是采用生物信息学的方法,只有了解已知位点,才能够进一步检测。而通常人们都是通过对DNA数据库搜索和文献查找的方式进行的,如文献和NCBI 查找等,这种方式虽然简单直接,但是不够精准。有很多未知的SNP位点只有经过试验检测才能够找到。通过试验研究可以得知,目前的SNP的基因分型方法有多种,被人们采用的至少有20种,而不同的方法具有各自的特点和优缺点[13],大致可以分成以凝胶电泳为基础的传统方法和以高通量自动化为鲜明特点的新方法两类。
限制性片段长度多态性(Restriction fragment length polymorphism,RFLP)是一种查找方式,通过内切酶的体内反应,进行限制性的切定。限制性内切酶是一种具有特殊序列的酶,当遇到反应物时,可以对DNA 上特殊位点的序列进行切割。当DNA 上有碱基突变时,会对限制性内切酶产生一定的反作用,甚至停止活动,因此突变和未突变个体间就会产生长度的多态性。对DNA 进行酶切后,立即进行电泳,DNA 就可以进行转移,转移的过程中形成一定的支持物。这种支持物较多,常见的为尼龙膜。在转移的过程中,进行特意标记性检测,是一种杂交检测,即可检测到该限制酶位点上不同的等位基因[2]。
而基于聚合酶链式反应(Polymorase chain reac⁃tion,PCR)技术的出现,将PCR 与RFLP 联用,又称切割扩增多肽序列(Cleaved amplified polymor⁃phic sequence,CAPS),此法可仅对酶切产物进行电泳便可以对不同的等位基因进行区分。但是这个方法只能检测到位于酶切位点处的SNP 位点,无法实现高通量检测,具有一定的局限性。
单链构象多态性(Single strand conformation polymorphism,SSCP),该方法是一种热度变性法,当温度升高至95 ℃双链DNA 进行变性解散,形成单链结构。在这种结构下,单链会形成二级结构,碱基序列会发生转变,导致结构不同。正是由于这种结构的不同,可以通过对其在非变形聚丙酰胺凝胶中的迁移速度不同被检测出来。最初的探针标记方法被称作SSCP 法,这种方法需要酶切或探针标记。这种方式相对比较繁琐。通过科技的改变,后来进行了技术升级。1989 年M.Orita等[14]将PCR 应用到SSCP 中,获得了一种新的检测方式。这种检测方式需要不同的信号,通常为单链信号,在单链信号下可以进行凝胶电泳分析。除了此方法之外,还可以自己对引物进行设计,设计完引物后,能够在模具中进行PCR 扩增,对扩增后的片段进行简易分析。据估计,此技术对于小于200 个碱基对的DNA 片段上碱基变异的检出率为100%。当要检测的DNA片段较长是,检出率会降低。SSCP 与PCR-SSCP 的优越性在于不需要测序就可以快速检出碱基突变,但缺陷是无法确定基因型[15]。
通过DNA 直接测序法,不同于其他检测方式,这种方法相对比较直接,通过序列的检测能够直接检测到突变的类型。通过直接测序能够对其位点进行分型检测,检测后能够立即得到SNP位点。当检测出来不同的基因片段后,能对不同的片段对比,当发现相同基因后,会对其基因进行产物扩增,通常为PCR 扩增方式。在新的基因序列中,通过碱基检测,能够找到所有序列中的突变基因,然后进行检测。在目前,所有方法中,这种方式是一种相对比较可靠的方式,检出率可达100%。这种方式是一种扩增后进行纯化的方式,先将其纯化回收,然后对其进行连接,连接的方式相对比较稳定,连接的载体更可纯化回收。除此之外,也可以采用直接的方式对产物进行直接检测或者测序。对不同的纯合子,检测的时候能对其进行测序检测,但其对杂合体不易分型[16]。
基因芯片(Genechip)又称DNA 芯片,是一种基因微生物分析系统。该系统需要碱基互补配对,是一种互补,也是一种微型生物分析。这是对DNA片段的集成分析,将片段集成到硅芯片或玻璃芯片表面。该技术是一种探针技术,将不同的DNA 片段进行连接,连接上荧光标记,在特殊技术的检测中,能够查看到芯片杂交和技术。如果当DNA 片段中具有碱基突变,则不能与探针结合,但是能够通过弱荧光来检测到杂交的信号。与传统方法相比,基因芯片的准确率高,而且质量相对上乘,一次查找可以对成千上万个SNP位点进行筛查,可以通过网络技术进行自动化分析,但是相对的开发成本很高[17]。
高分辨率熔解曲线(High resolution melting,HRM)是一种检测SNP位点新手段。目前,HRM是一种应用广泛的技术,是检测SNP技术中的一种先进方式。主要是一种物理的检测熔解方式,当荧光染色与双联DNA 结合,能够产生减色效应,尤其是当温度升高的时候减色效率提高。在检测熔解过程中,通过检测的系统软件能够释放和查看出特征熔解曲线。在对其熔解曲线进行分析的时候,进而实现SNP 的检测[18]。SNP 位点上的碱基类型和数目不同,则曲线的类型不同,呈现出来的峰值也不同。HRM 技术具有快速、灵敏、高效、高通量、低成本等特点,较适用于基因型相对不多但样品量极大的研究。
SNP是指在基因组上由单个核苷酸变异引起的DNA 序列多态性,DNA 序列直接影响氨基酸密码子的转录,从而影响分子水平上蛋白质的翻译。目前,可以通过数量性状基因座(Quantitative trait locus,QTL)作图对基因进行性状连锁分析,还可以对候选基因利用各种方法与单核苷酸变异的位点进行关联分析。如果找到了与目的性状有关的SNP位点,便可通过芯片筛选个体,并进行优缺点分析,最后通过杂交、回交等改良品种[9]。
近10 年来,相当多的学者利用该方法在鹅的育种工作上进行努力。2010 年,张高娜等[20]运用PCR-SSCP 法在扬州鹅的PRL 基因1 号外显子+11处发现了一处G→T 突变,研究发现该突变产生的基因型对产蛋量及开产日龄影响极显著。2011年,徐晶等[21]运用同种方法发现吉林白鹅的半净膛重、肝脏重、腿肉重与其IGFⅡ基因外显子3 上的一处A→T 突变所产生的基因型差异显著。同年,赵兴涛等[22]对五龙鹅FSHβ、PRL 基因和GnRH 基因进行研究,在FSHβ 基因外显子3 上发现一个C→T突变,但与生长性状并无相关;GnRH基因的5'调控区发现了T→A 突变,同样与生长性能无关;在PRL基因内含子2第38∕39位上发现了GA缺失,并发现其产生的基因型与产蛋总量显著相关[22-24]。袁树楷等[25]运用PCR-SSCP 在PRL 基因的研究中发现,四川白鹅与朗德鹅在1号外显子均有一处突变,但四川白鹅为65位的C→T突变,而朗德鹅为141 位的T 缺失,分析其原因为品种差异。赵文明等[26]在2012年对三种鹅种的GH基因进行研究,均在第二与第四外显子发现两处突变,且第二外显子突变的基因型效应与周龄体重有极显著相关。2014年,张蕊等[27]利用直接测序法对朗德鹅的CYP2C45 基因进行研究,在第五与第七外显子分别发现2个突变,发现第五外显子上的突变所产生的基因型与屠体重差异显著相关。2016 年,刘杰等[28]利用朗德鹅、狮头鹅、皖西白鹅、浙东白鹅四个鹅种的DNA 构建DNA 池,并用直接测序法寻找四个鹅种MLPH基因的潜在SNP,最终在外显子11 上发现两个突变,但并未与性状进行关联分析。同年,胡彦竞科等[29]同样构建四川白鹅、籽鹅的DNA 池,用以研究GnIH 基因的SNP 与产蛋量的关系,在内含子1及外显子3上发现两处碱基突变,并且外显子3的突变所产生的基因型与产蛋量具有显著相关。2017 年,与张蕊同团队的王倩继续了CYP2C45 基因的研究,不同的是她运用的是PCRSSCP 法,且只研究了启动子区域,结果发现在5'上游-93 bp处发现一处C→T突变,该突变产生的基因型同样与屠体重差异显著相关[30]。2019年,王猛等[31]用直接测序法探究了IGFBP5 基因与鹅肥肝的关系,发现了启动子上游的三个SNPs,其中两个与鹅肝重,差异显著相关。
综上所述,目前在鹅的SNP研究中,PCR-SS⁃CP 法与测序法是目前主流的检测方法。目前的研究着重于生长指标与繁殖性能的研究,很多学者都为其提供极有价值的辅助遗传标记。鹅绒也是特别重要的一项经济性状,但目前对于鹅绒的研究还较少。SNP作为一种分子标记、在鹅的育种方面有着极大的辅助作用,可依据该法检测出的突变位点作为鹅选育的辅助遗传标记、表型筛选,加快选育过程,指导育种实践,从而获得理想的经济性状。
近年,随着我国的科技不断发展,DNA 分子标记技术也不断发展,在实际生产中,分子标记辅助育种是一种新的育种方式,在社会发展过程中起着越来越重要的作用。该方法主要是利用分子标记密切相关,除此之外,与目标形状也有着直接的联系。在传统的形态学中,在检测中标记的数目少,受到环境的影响较大,而该方式克服了这些问题,及时在形态学标记数目少的时候也能够进行精准地检测。且可以在育种早期实施性状鉴定,大大缩短育种周期,降低育种成本。
SNP 作为新一代分子标记技术,因其数量丰富、遗传稳定性高、易于自动化分型等诸多优点,引发了广大研究者的浓厚兴趣,新的高通量检测方法也不断被开发出来,SNP分型检测的方法也在不断进步。未来,SNP的分型检测方法可能会向以下趋势发展:1)操作简便,可实现自动化;2)通量大且灵活,可根据需要加以选择;3)分析速度快,数据便于处理;4)适应性强,对不纯样品也可进行可靠分析;5)结果可靠,费用适中;6)高可信度和大数据量的数据库的建立。然而,目前的检测方法都有其优点,也都存在着缺点,还不能完全满足以上要求。
目前,SNP发展已经相对比较稳定,但是并没有大规模地应用,目前发展过程中还存在着一定的挑战:在遗传育种检测中,同一个性状往往不是由一个基因所决定的,而是由多个基因共同决定,所以要通过进一步确定相关位点之间的关系,最终决定其相关性与显著性,从而获得理想的经济性状;在动物品种鉴定及产品溯源方面,由于各研究样本群体遗传背景不同,不同群体间位点的适用性还有待进一步考察,要想获得理想的普遍适合的标记组合,还需通过不断完善标记的筛选策略及扩大代表性群体的数量来实现。不过,随着研究的不断深入、相关领域数据库的逐步建立,SNP 分型检测方法不断取得新的突破,SNP 的研究应用领域也将持续向深度和广度推进,SNP 的研究应用终将逐步走向成熟。