基于高通量测序技术分析3种羊肉混合基因组序列的短片段重复序列

2020-10-16 06:36罗瑞明王丽娟宋亚倩
中国食品学报 2020年9期
关键词:滩羊小尾寒羊核苷酸

耿 多 罗瑞明* 王丽娟 高 爽 宋亚倩

(1 宁夏大学农学院 银川750021 2 宁夏医科大学基础医学院 银川750021)

我国是世界第一大羊肉生产和消费国,近年来,羊肉市场需求一直处于增长状态[1],羊肉产业早已发展成为高效农业重要组成部分[2-4]。研究易混淆绵羊种质的遗传多样性与亲缘关系,对于促进绵羊种质的利用、绵羊产业的发展和维护消费者权益具有重要意义。滩羊是我国宁夏优势特色畜种,是一种极其珍贵的动物资源,属国家重点保护羊种。本研究通过对宁夏盐池县、同心县、中宁县、西吉县、贺兰县、银川市等6 处滩羊市场调查,发现部分经销商自宁夏采购小尾寒羊和滩寒杂交羊肉冒充滩羊肉在我国其它地区售卖。滩羊、小尾寒羊和滩寒杂交羊在活体时,可通过形态学分类方法进行区分鉴别,然而屠宰后的分割肉形态特征相似,常规形态学方法难以区分,严重影响了消费者权益和滩羊产业的可持续健康发展,是目前宁夏滩羊产业品牌建立与发展急需解决的关键问题。

滩羊、小尾寒羊和滩寒杂交羊的亲缘关系非常接近,属同属亚种范畴[5],通过对差异基因序列的研究,可实现对3种绵羊综合种质资源挖掘与物种甄别。微卫星DNA(Microsatellite,也称简单重复序列Simple sequence repeat/SSR)是通过共显性分子标记方法标记一段具有多态性DNA 功能域(通常为1~6 bp)的短片段,能够对于种质资源进行挖掘并甄别不同品种畜肉[6]。目前,SSR 技术方法已被应用于种质遗传多样性分析[7-8]、亲权分析[9-10]、遗传图谱构建[11-12]和群体遗传学研究[13-14],而采用SSR 技术方法对不同品种绵羊混合样品进行DNA 分子鉴定,尚未见报道。

本研究采用高通量测序技术对滩羊、小尾寒羊和滩寒杂交羊的基因组进行高通量测序,确定3 个绵羊品种混合的全基因序列并开发SSR 分子标记,围绕混合绵羊样品种质SSR 分布特征、遗传多样性和分子标记展开研究,为挖掘绵羊种质资源与滩羊、小尾寒羊和滩寒杂交羊的基原鉴定提供新的理论,为进一步应用于生产实践奠定基础。

1 材料与方法

1.1 材料与试剂

供试羊肉样品来自滩羊繁育中心(盐池)。采用典型集群的简单随机抽样方法在宁夏盐池产地采样,采样时注意避免采集杂交群体及外源性污染。其中滩羊108 只、小尾寒羊106 只、滩寒杂交羊106 只,分别取其不同部位肌肉组织。将320 只绵羊样本各取25 g 样品混合均匀,形成1 份混合样本。对混合样本提取的DNA 测序分析;分别提取滩羊、小尾寒羊和滩寒杂交羊的DNA 为标准样品。

1.2 仪器与设备

台式高速低温离心机(Thermo Scientific Sorvall Legend Micro 21R),美国Thermo 公司;荧光计核酸定量仪(QubitR2.0),美国Life Technologies公司;3730XL 测序列分析仪,美国ABI 公司。

1.3 方法

1.3.1 混合样品DNA 提取 采用动物基因组DNA 快速抽提试剂盒(上海生工)完成DNA 提取,具体方法详见该试剂盒说明书。

1.3.2 DNA 测序文库构建 使用Covaris 仪器将3种绵羊混合样品的DNA 片段化。使最后打断的DNA 片段大小集中在300~500 bp 范围内。DNA片段末端修复(末端补平和3' 端加A 尾),连接接头后采用磁珠分选纯化连接产物,将对纯化后的接头连接产物进行PCR 扩增富集,检测文库质量。

1.3.3 SSR 位点检索及可视化分析 在获取拼接基因组序列后,使用MISA 对序列中的SSR 进行检测,参数设置:SSR 最小间距为200 bp,SSR 选取标准为单核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸、六核苷酸重复序列个数最小分别为10,6,5,5,5 和5。使用FastQC 对SSR 位点分析结果进行可视化;使用BLAST+对通过质控的数据进行污染检测;使用MISA 检测拼接基因组中的SSR 序列。

1.3.4 SSR 位点多态性检测 使用Primer3 对开发SSR 位点的DNA 序列设计荧光标记引物,进行多态性检测。PCR 反应体系为:Taq Plus Master Mix 25 μL,体系中加入荧光标记引物,上下游引物(10 μmol/L)各0.5 μL,DNA 模板1 μL,dNTP 10 mmol/L 0.5 μL,25 mmol/L MgCl22.0 μL,Taq酶(5 U/μL),0.2 μL,ddH2O 添加17.8 μL。PCR 反应条件为:95 ℃预变性3 min;95 ℃变性30 s,60℃退火30 s,72 ℃延伸30 s,共30 个循环;72 ℃延伸7 min。反应结束后,观察PCR 产物经过1%琼脂糖凝胶,150 V,100 mA,20 min 检测的电泳图像多态性。SSR 位点的多态信息含量PIC(Polymorphism information content)根据式(1)计算:

式中:Pi——第i 个等位位点出现的基因频率[8,15]。

1.3.5 PCR 扩增产物聚类分析 分别提取滩羊、小尾寒羊、滩寒杂交羊和以上3种绵羊混合后的样本各6 个,共计24 个样本组织DNA,进行凝胶电泳检测,依据SSR 标记扩增产物在电泳凝胶电泳图像上的相对位置,构建“0/1”二元矩阵,建立原始数据阵后利用GENE 软件进行遗传相似系数和遗传距离计算,选用最远邻元素聚类分析法构建unrooted 系统进化树。

1.3.6 STR 矩阵散点分析 采用46 对SSR 荧光引物分别对滩羊、小尾寒羊和滩寒杂交羊肉提取的基因组DNA 进行扩增,随后,进行毛细管电泳检测STR 分型。分别将3种绵羊的46 对引物峰值整合,将3种绵羊的纯合与杂合位点峰值分别进行矩阵分析,置信区间95%。

1.3.7 SSR 分子图谱构建 根据矩阵图谱位点差异,将46 对引物在滩羊、小尾寒羊和滩寒杂交羊品种中检测的指纹图谱信息,即基因位点按片段大小(即扩增到的带型信息)升序排列、依次编号,将带型编号依次串联,即得到由多位数字构成的SSR 分子身份证,利用SSR 分子身份证生成分子二维码信息。

2 结果与分析

2.1 全基因组测序结果

对3种绵羊肉品混合样本进行宏基因组物种多样性分析,如表1 获得6.1 GB 有效序列,42 211 072 条序列,该结果与单一品种绵羊测序结果5.0 GB 相比较大,表明该测序结果涵盖滩羊、小尾寒羊、滩寒杂交羊的部分基因。该测序结果中序列长度平均长度150 bp,GC 含量45.67%。使用Blast+,随机从通过QC(Quality control,即质量控制/质控)的2 147 483 条有效序列中抽取1 000 条序列进行BLAST 比对,比对数据库为NCBI NT 数据库,取evalue≤1×10-1并且相似度>90%,coverage>80%的比对结果,计算其物种分布。划分为45 个类别,典型类别如图1所示。根据种属划分和分类地位鉴定结果,可以获得样本在各分类水平的具体组成。使用NCBI 选取的绵羊属动物的序列与样本中所有序列进行对比分析发现,1000 条序列并非可以与NCBI 数据库中序列一一对应,只有部分可以归属到对应种属中,其中有118 条序列为绵羊属序列,包括大角羊、白大角羊、西藏盘羊、盘羊、小尾寒羊等。绵羊属序列占有效序列总含量数目远大于微生物序列,可以看出绵羊属动物平均丰度最大,属于优势类群,而其它源性遗传物质未被发现大面积存在。

表1 测序结果信息Table 1 Results of sequence information

图1 物种分布图Fig.1 Distribution of species

2.2 SSR 信息分布及可视化结果

使用MISA 检测序列中的SSR 位点,Fast QC可视化SSR 位点分析结果。共计78 122 个有效SSR 位点序列,长度为150~3 628 bp 不等,其中单核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸、六核苷酸和复合SSR 重复序列个数分别为18 260(占23.37%),13 735(占17.58%),11 429(占14.63%),1 462(占1.87%),2 504(占3.21%),76(占9.73×10-4%)和30 656(占39.24%)。由图2气泡图和箱线图可以清晰看出SSR 的数目、分布和分布密度情况。发现c 和c*类型,即复合SSR,占比及分布明显高于其它核苷酸重复类型。

分析基因组中存在的30 656种复合重复基元。复合SSR 具有更大的SSR 长度,而单位长度越大的SSR 有更大的总体长度的可能性越大。发现复合重复基元种类丰富,要远远高于非复合SSR,而且核苷酸重复基元组合差异明显,包含(AAA)6(AA)9*(A)18*,(AGCAGC)7(AGC)14*,(T)10(TTG)5*,(TGTG)8(TG)17*(TGTGTG)5*tgt(GAGA)7(GAGAGA)5*(AG)14*等,其中核苷酸重复基元数目比值3/2/1、2/1 和1/3 模式较多,占复合重复类型的87.35%。

2.3 引物多态性检测结果

通过多态性检测,78 122 条有效序列均设计出SSR 引物,随机挑选上述78 122 条序列中设计出的SSR 引物100 对(挑选标准:有效序列大小范围100~300 bp,末端可修饰),有46 对荧光标记引物(表2)在挑选的100 对荧光引物中表现出多态性,有46 对荧光标记引物(表2)在挑选的100 对荧光引物中表现出多态性,46 对荧光标记引物共扩增出115 条等位基因条带,每对引物平均扩增出2.5 条,得到PIC 值范围为0.004~0.679,平均值为0.358。其中标记名称为6854322_432 的荧光引物PIC 值最高,为0.679。表明挑选出的46 对荧光引物扩增产物的多态率处于中等水平且稳定,适合多态分析,可作为区分滩羊、小尾寒羊和滩寒杂交羊品种差异的引物。

图2 SSR 信息分布图Fig2 Distribution of SSR information

表2 46 对荧光标记引物Table 2 46 pairs of fluorescent labeled primers

(续表2)

图3 PIC 值分布图Fig.3 Distribution of PIC

2.4 扩增产物的聚类分析结果

由软件MEGA5.1 进行聚类分析,得到24 个样本的系统进化图(图4)。分析表明,依据SSR 扩增产物性状构建的聚类分析图,24 个绵羊资源(24 个样品)被分为4类,S11,S9,S7,S12,S8,S10等6 份羊肉样本构成第1类,其余的18 份被聚为第2类。在遗传距离0.53 处,分为第2 大类和第3 大类分别包括S13,S15,S17,S18,S16,S14等在内的6份资源和包括S19,S21,S23,S22,S20,S24,S5,S1,S3,S6,S2,S4等在内的12 份资源。在遗传距离0.23 处,第3 大类又分为2 小类,分别包 括S19,S21,S23,S22,S20,S24等6份资源和S5,S1,S3,S6,S2,S4等6 份资源。这与24 份绵羊样本在供试前前做好的标记相一致。其中S1~6 为滩羊肉样本,S7~12 为小尾寒羊肉样本,S13~18 为滩寒杂交羊肉样本,S19~24 为3种绵羊混合的肉样本。这表明绵羊属3种羊肉以及3种绵羊属混合羊肉样本分别聚为一类,聚成4 个集群,呈单系性。因此,4 份样本分别归为4 个不同的集群。研究发现3种绵羊混合样本与小尾寒羊的遗传距离较近,与滩羊、滩寒杂交羊样本的遗传距离较远,但不影响混合样本与小尾寒羊的区分。滩羊、小尾寒羊、滩寒杂交羊和3种绵羊混合样本在SSR 序列遗传关系具有较大差异,表明46 对SSR 引物可以完全区分3种绵羊品种。

图4 3种绵羊遗传距离Fig.4 Genetic distance of 3 of breeds sheep

2.5 STR-SSR 片段多态性对于绵羊群体的甄别结果

利用46 对SSR 引物对滩羊、小尾寒羊和滩寒杂交羊肉提取的基因组DNA 进行扩增,并进行毛细管电泳检测。按表2 中46 对荧光引物顺序,分别将3种绵羊的46 对引物峰值整合,建立滩羊、小尾寒羊和滩寒杂交羊品种SSR 散点矩阵图谱,如图5所示。图5 中横向与纵向序号T1T2,H1H2,Z12 表示参试的滩羊、小尾寒羊和滩寒杂交羊的纯合与杂合基因位点(置信区间95%),曲线圈出部分表明二者比较后,能够辨别二者的基因位点。纵向比较发现,46 对引物检测到的等位基因可作为参试样品的特异性位点。该部分均与表3 中的指纹数据及分子身份证相对应。

2.5.1 滩羊的甄别 比对T1 行H1 列、T1 行Z1列矩阵结果,T1 与H1、Z1 比较中显示滩羊与小尾寒羊、滩寒杂交羊的标志性基因位点差异显著,曲线圈出标注范围大,在43 个大小不同片段上检测到二者的差异位点。比对T2 与H2、Z2 杂合基因位点,发现在178,198,201,278 和115 bp 上的等位基因位点上的差别显著,可用于区分滩羊与其它二者。这表明在比较滩羊与小尾寒羊时,可以通过标志性基因位点与等位基因位点将滩羊与小尾寒羊品种区分开来。

2.5.2 小尾寒羊的甄别 比对H1 行、T1 列、H1行Z1 列矩阵结果,其中T1 与H1、Z1 比较中,显示小尾寒羊与滩羊、滩寒杂交羊标志性基因位点差异显著,在38 个大小不同片段上检测到二者的差异位点。比对H2 与T2、Z2 杂合基因位点,发现在115,120,137,208 bp 上的等位基因位点上的差别显著,可用于显著性区分二者的分子标记,同时采取其它基因位点辅助标记,可准确将小尾寒羊与滩羊、滩寒杂交羊区分开来。

2.5.3 滩寒杂交羊的甄别 其中Z1 行T1 列中,Z1 与H1 比较中显示,滩寒杂交羊与滩羊、滩寒杂交羊与小尾寒羊的标志性基因位点差异显著,在26 个大小不同片段上检测到二者的差异位点。比对T2 与H2 杂合基因位点,发现在162,109,206,120 和113 bp 上的等位基因位点上的差别显著,可用于区分二者。这表明在比较滩羊与小尾寒羊时,可以通过标志性基因位点与等位基因位点将滩羊与小尾寒羊品种区分开来。

纵观图5 中的滩羊、小尾寒羊和滩寒杂交羊的所有两两比较基因位点结果,均具有可区分滩羊、小尾寒羊和滩寒杂交羊的标志性基因位点。综上,通过该散点矩阵图分析可知,46 对SSR 引物对滩羊、小尾寒羊和滩寒杂交羊的甄别能力较强,根据矩阵图谱呈现出的SSR 片段多态性,可快速在核酸序列差异性方面实现绵羊品种的区分鉴定。

图5 3种绵羊矩阵散点图Fig.5 Matrices scatter diagram of three kinds of breeds sheep

2.5.4 3种绵羊SSR 分子身份证的构建结果 根据矩阵图谱位点差异,按表2 中46 对荧光引物顺序,将46 对引物在滩羊、小尾寒羊和滩寒杂交羊品种中检测的指纹图谱信息,即基因位点按片段大小(即扩增到的带型信息)升序排列、依次编号,将带型编号依次串联,即得到由46 位数字构成的SSR 分子身份证[16-17]。基于以上对3种羊肉混合基因组序列的SSR 研究比对分析,本文开发标记的46 对SSR 位点可以达到对同属亚种的动物进行鉴别,实现滩羊、小尾寒羊和滩寒杂交羊的甄别。

表3 3种绵羊的SSR 分子身份证Table 3 SSR information molecular identity of 3 of breeds sheep

图6 3种绵羊的SSR 分子身份证二维码Fig.6 QR code of SSR information molecular identity of 3 of breeds sheep

3 讨论

3.1 混合样本基因组数据库的建立

绵羊品种多样,种质资源丰富,种质差异极大影响肉品品质[18-20]。本研究中高通量测序结果的分析表明,获得的序列总大小约6 GB,42 211 072 条序列,GC 含量为45.67%。节肢动物[21]、羊蝇[22]基因组GC 分布范围为13.28%~39.64%;牛科动物[23]平均GC 含量为44.27%;鱼类[24]GC 含量54.6%;蛭类[25]GC 含量为36.94%。Hamada等[26]也发现了脊椎动物基因组中GC 含量与不同物种之间具有显著关联性。所以GC 含量不仅可以反映DNA 双链的稳定性,还可以从侧面反映样本有无污染,可见该混合样本全基因组文库质量较好。通过Blast+比对NCBI 数据库中该混合样本序列,根据种属划分和分类地位鉴定结果,获得了样本在各分类水平的具体组成。随机抽取的1 000 条序列被划分为了45 个类别,发现1 000 条序列中只有118 条序列可以归类到对应种属中,绵羊属序列占有效序列总含量数目远大于微生物序列,可以看出绵羊属动物平均丰度最大,属于优势类群,而其它源性遗传物质未被发现大面积存在。但是占比要低于猪(Sus scrofa)、牛(Bos taurus)、牦牛(Bos mutus)、水牛(Bubalus bubalis)、绵羊(Ovis aries)、山羊(Capra hircus)和藏羚羊(Pantholops hodgsonii)等[16-20]。单一物种的微卫星数目,即本样本的GC 含量区别于其它物种,又保持稳定状态。这表明成功建立了3种绵羊混合样本全基因组序列数据库。

3.2 SSR 序列特征

利用生物信息学方法搜索、统计、分析了混合绵羊样本全基因组SSR 数量、分布特征。混合样本全基因组中SSR 总数为78 122,占全基因组序列总数的0.185%。可见,混合样本全基因组微卫星数目虽然丰富,但是在全基因组中的含量占比要低于单一物种,这表明,混合样本开发SSR 位点虽然提升了效率、降低了成本,但是并不能将某个单一物种的全基因组的SSR 位点全部开发出来,只

能获取一部分,这可能与物种遗传距离较近有关,测序过程中碱基偏好性、组装偏差等都会导致相似度较高的SSR 序列未被分析[27],还可能是混合样本DNA 序列总数基数要远远大于单一样本,虽然微卫星含量丰富,但仍然占总序列比例较低。对3种混合羊肉基因组中的SSR 信息分析表明,绵羊混合样本的主要重复类型是复合核苷酸重复,其次为单核苷酸重复。3种绵羊混合样本全基因组SSR 丰富度分布模式为复合核苷酸SSR(39.24%)>单核苷酸SSR(23.37%)>二核苷酸SSR(17.58%)>三核苷酸SSR(14.63%)>五核苷酸SSR(3.21%)>四核苷酸SSR(1.87%)>六核苷酸SSR(9.73e4%),该结果与戚文华[23]研究的绵羊全基因组中重复优势类型丰富度分布结果相同。复合SSR 重复序列占比及分布明显高于其它核苷酸重复类型,基元数目比值3/2/1、2/1 和1/3 模式较多,占复合重复类型的87.35%。这表明多态性有很大可能出现于基元数目比值为3/2/1、2/1 和1/3的重复序列中。验证随机选择的100 对不同重复单元的SSR 引物,46 对(46%)引物能扩增出预期PCR 产物,说明3种绵羊混合基因组SSR 标记引物扩增效率处于中等水平。引物扩增失败可能是由于存在大的内含子,在启动位点引起SNPS/In-Del 变异,进而阻碍引物与目标DNA 的结合,也可能是由组装错误引起[26],本研究中46 对多态引物的平均PIC 值为0.34,最低值发生在SSR位点中重复序列最短序列的 9 对引物6799476401(PIC 值0.004),6799634401(PIC 值0.072),6812030407(PIC 值0.033),6875226447(PIC 值 0.035),6877088449(PIC 值 0.055),6882436454(PIC 值0.041),6883598455(PIC 值0.012),6901326473(PIC 值0.066),6968389708(PIC 值0.023),其余37 对引物表现出相对较高PIC 值。有研究表明,SSR 标记的多态性与SSR位点中重复序列的长短相关,重复序列愈长,多态性的可能性越高[23-28],当SSR 重复序列≥20 bp时,出现多态性的比例高;重复序列长度在12~19 bp 范围出现多态性的可能性明显下降,而低于12 bp 的多态性极低[28-30]。本研究中46 对多态性引物有9 对来自于重复序列长度< 20 bp,其余37对均来自于≥20 bp 的重复序列。由此可见,在复合SSR 重复序列模式为3/2/1,2/1 和1/3 的复合重复序列上标记开发SSR,获得多态性的可能性更高。

3.3 易混淆绵羊品种的SSR 遗传多样性及3种绵羊的区分

通过聚类分析可以看出滩羊样本、小尾寒羊样本、滩寒杂交羊样本、3种绵羊混合样本各自聚为一支,聚成4 个集群,呈单系性。滩羊、滩寒杂交羊和3种绵羊混合样本进一步聚成一支,表明三者亲缘关系更近,这与预设试验条件相符。结合SSR 序列多态性与遗传距离综合分析可知,滩羊、小尾寒羊、滩寒杂交羊的种内遗传多样性水平适中,种群具有较低的种内遗传变异,可能包含一些有价值的特性,深度挖掘混合基因组中潜在的功能性SSR 序列,结合坐标和功能基因组信息,将有利于种质资源的保护。区分滩羊与滩寒杂交羊遗传物质差异是区分易混淆绵羊品种的关键技术问题,也是珍贵地方品种滩羊种质资源得以保护的必要条件。随着DNA 分子标记技术的快速发展,SSR 指纹图谱身份证及二维码将得到广泛应用,发展成为一种重要的种质鉴定手段,其在SSR 指纹图谱基础上将品种的基因型特征数字化,使每个品种具有唯一的数字代码,更加简单明了地进行品种区分鉴定。陈亮等[31]利用7 对SSR 引物构建了吉林省大豆品种的SSR 分子身份证,具有唯一性,完善了大豆品种指纹图谱身份证技术体系。赵雅楠等[17]表示SSR 指纹识别完全可以应用于品种区分。史君洁等[32]等通过SSR 技术实现4种鲤鱼的种质鉴定与区分。在本研究中,100 对微卫星标记筛选出46 对特异标记,筛选成功率为46%,鉴定效率达到100%,说明可利用微卫星分子标记对绵羊进行分子水平种质与种源鉴定。

通过这46 个SSR 分子标记开发出特异性标记,达到精准鉴定易混淆绵羊肉品种的目的。

4 结论

本研究采用高通量测序技术对3种羊肉混合样本的基因组进行测序,主要对测序后的序列结果和SSR 位点信息进行分析,确定了混合样品经过高通量测序后完全可以进行SSR 位点标记与开发,开发标记的SSR 位点可对同属亚种的动物肉品进行鉴别,实现混合样本和单一样本的鉴定,可以运用到滩羊和绵羊种质资源的保护和DNA 分子鉴定中,对绵羊易混淆品种肉品鉴定、溯源管理及原产地保护具有重要意义。该研究结果不仅为近缘混合物种肉样品的SSR 位点开发提供了理论与实践基础,而且可以应用到同属亚种的肉源物种鉴别及掺假羊肉的基源鉴定。

猜你喜欢
滩羊小尾寒羊核苷酸
单核苷酸多态性与中医证候相关性研究进展
徐长风:核苷酸类似物的副作用
滩羊打边炉
小尾寒羊养殖管理技术
N-氨甲酰谷氨酸对滩羊乏情期诱导同期发情效果的影响
小尾寒羊什么季节配种最好
Acknowledgment to reviewers—November 2018 to September 2019
日粮核苷酸对动物肠道健康和免疫功能的影响及其在养猪生产中的应用
吃太阳
无角陶赛特羊与小尾寒羊杂交繁育生产性能分析