田阳阳,轩贝贝,王正旭,刘 魁,郭建华,牟文君,戴华鑫,杨继周,宋纪真,胡利伟*
(1.红塔烟草(集团)有限责任公司,云南 玉溪 653100;2.中国烟草总公司 郑州烟草研究院,河南 郑州 450001)
我国烟草种质资源丰富,至2018年,我国全国烟草品种审定委员会共审(认、鉴)定了145个烟草新品种,其中审(认、鉴)定的烤烟品种达82个[1]。 目前我国烤烟种植主要集中于西南、华南、华北、东北等地区,主要植烟省份有云南、河南、贵州、山东等18个省(市、区)[2-4]。经过多年的发展,我国烟叶生产逐渐趋于稳定,并形成了相对稳定的烟叶产供格局。近3年,种植面积较大的烤烟品种主要有云烟87、K326、红花大金元、云烟85、云烟97、中烟100等[5,6]。主栽烤烟品种的亲本比较集中,亲缘关系较近,如云烟87与云烟85为姊妹系,亲本相同,均是以K326和云烟2号为亲本杂交选育出来的;云烟97和云烟99的母本均为云烟85;云烟100的母本为云烟87,其形态学特征差异不明显。多数研究表明我国烤烟遗传背景狭窄,遗传多样性较低,利用传统手段对烤后烟叶进行品种鉴定存在一定的难度[7]。
SSR荧光标记检测技术是直接将荧光染料标记到SSR引物的5’端或引物内部的某个碱基上,然后进行PCR扩增,使每一个扩增产物都带有荧光染料,荧光标记DNA片段在通过毛细管正极受到激光扫描时发射出特定波长的荧光,扫描仪获取荧光强度,同时记录激发时间,通过出峰时间计算出DNA片段大小,根据峰值高度计算出PCR产物的量[8-10]。 该检测体系可以一次检测多个不同PCR扩增产物,根据PCR产物携带的荧光颜色的不同分离出不同SSR位点的PCR产物[10,11]。拥有高通量、高准确率的ABI3730XL自动测序仪有96道毛细管,一次电泳能够测定96个样品,自动化流程较高[9]。再利用计算机软件进行数据收集和分析,可以精确计算出各扩增核酸片段的大小,其分辨率可以达到1 bp,为分析主栽烤烟品种间的遗传差异提供了较为可靠的技术手段,目前已被广泛应用于基因型鉴定、遗传多样性分析、遗传图谱的构建等方面[12]。Bindler等[13]于2011年开发并报道了1张烟草SSR标记的高密度遗传图谱;国内童志军[11]、陈雅琼[14]、尹国英[15]、陈杰[16]、王慧颖[17]等对烟草的SSR标记进行了进一步开发和应用,使得SSR标记在烤烟上的应用已日趋成熟。黄莉莎等[7]利用SSR标记构建了烟草主栽品种的遗传图谱,为烤烟的遗传多样性分析提供了有效的SSR引物。陈芳等[18]筛选出了8对重复性好、多态性高的SSR引物,可将32份烟草种质资源分为4个大类。众多的研究[19-21]充分表明了SSR标记在烟草品种的遗传多样性分析中有着良好的应用潜力。本研究在前期研究的基础上筛选SSR引物,利用毛细管电泳检测技术进行SSR分型,对主栽烤烟品种进行了遗传多样性分析,以期为烤烟主栽品种鉴定提供有效的方法和理论依据。
供试材料为红花大金元、云烟87、中烟100、云烟97、翠碧1号、K326、KRK26和NC297等8个主栽烤烟品种的烤后烟叶DNA。烤后烟叶样品除NC297取自云南玉溪峨山产区外,其他品种样品均取自玉溪世界烟草品种园。对烤后烟叶样品进行紫外线照射20 min,以去除叶面DNA污染,并用液氮研磨,置于-80 ℃冰箱保存备用。
实验仪器有PCR仪(Applied Biosystems)、电泳仪及电泳槽(北京六一仪器厂)、凝胶成像系统(Bio-Rad公司)、PCR仪(Bio-Rad公司)、3730XL DNA序列分析仪(美国ABI公司)等。实验试剂有Taq PCR Mix预混液、λDNA/EcoRI+HindIII Marker、SSR引物。
通过查阅文献以及前期实验,委托上海生物工程有限公司进行引物合成与荧光标记,实验中用到的引物及标记位点见表1。
表1 供试SSR引物对的序列信息
PCR反应总体积为25 μL,含有模板DNA 1 μL、正反向引物各1 μL、Taq PCR Mix 12.5 μL、无菌水9.5 μL。扩增程序为:94 ℃热处理变性 5 min;接着进行两轮的Touchdown PCR;94 ℃ 30 s、60 ℃ 30 s、72 ℃ 30 s,设置循环10次;接着将退火温度降低至55 ℃,94 ℃ 30 s、55 ℃ 30 s、72 ℃ 30 s,循环20次;72 ℃延伸10 min。在反应结束后将PCR管置于-80 ℃冰箱保存。
吸取稀释后的PCR产物作为样品,将其加入到96孔板,做好标记,将96孔板用封板膜密封,以5000 r/min短暂离心。将10 μL内标LIZ500 (35~500 bp)和990 μL HIDI溶液充分混匀后,接着分装入96孔反应板中,以5000 r/min离心数秒。将96孔板置于PCR仪上,变性程序设置为98 ℃变性5 min,完成后立即将96孔板置于冰上迅速冷却,以10000 r/min 短暂离心。使用ABI 3730XL DNA序列分析仪进行毛细管电泳,检测目的产物的片段大小。
采用Genemapper 4.0软件对毛细管电泳结束后DataCollection 软件收集的原始数据进行分析,比较目标峰与分子内标Genescan500-LIZ 的位置,确定不同样品SSR扩增片段的精确长度(计量单位为bp)。对每个样品进行独立的3 次独立重复实验,取3 次重复的平均值,并四舍五入作为该样品在该位点扩增片段的大小。通过统计毛细管电泳的检测结果,将得到的离散数据按照相同位置峰图的有无以“0”、“1”进行编码,建立“0”与“1”二元数据矩阵。利用NTsys 2.10e软件[22]对SSR的多样性指标进行统计;基于SHAN算法进行UPGMA聚类分析[23];通过Tree plot模块绘制遗传聚类图。
将SSR实验中已扩增的PCR产物混合后进行纯化,采用3%琼脂糖凝胶进行电泳检测,检测合格后对PCR产物进行纯化,接着使用文库制备试剂盒(NEB公司,英国)构建文库,采用Qubit®2.0进行文库浓度测定。建库流程如下:在每个样品中加入末端连接酶、末端修复反应缓冲液和DNA样品,进行末端补平和3’末端加PolyA尾巴。修复完成后保存于4 ℃。等上一步修复结束后,采用Agencourt AMPure XP磁珠纯化试剂盒去除dNTP、引物、引物二聚体等其他杂质,于-20 ℃保存。对纯化后的接头连接产物进行PCR富集扩增,然后使用Agencourt AMPure XP磁珠纯化试剂盒进行纯化,于-20 ℃保存。对PCR产物的检测采用Illumina Miseq测序平台,读长为150 bp,进行双端测序。
采用Cutadapt软件对正向测序的数据进行切割,切除上下游固定引物序列,仅保留中间部分序列,数据格式为 fastq;采用 Prinseq-lite 软件进行质量控制[24];根据高通量测序结果,对大量测序数据进行排序分类,创建包含序列长度和频率的输出文件,并以毛细管电泳检测数据为期望值,以NGS测序数据为观察值,利用简单重复序列识别工具SSRIT识别SSR基因座的结构组成。
为了研究上样量对检测信号输出的影响,本实验对不同浓度的PCR产物进行毛细管电泳检测,将PT20213、PT20306、PT30028等引物对的PCR扩增产物稀释成25、50、100、200、300、600 ng/μL 6个浓度梯度,进行毛细管电泳检测,确定合适的上样浓度,结果如图1所示。PT201213的PCR产物在25、50、100、200 ng/μL浓度下都有荧光信号,在300、600 ng/μL浓度下则没有荧光信号;PT20306的PCR产物在25、50、100 ng/μL浓度下都有荧光信号,而在200 ng/μL及以上浓度下则无信号;PT30028的PCR产物在25 ng/μL浓度下没有荧光信号,在50~600 ng/μL范围内都有荧光信号。因此,在本实验中,当PCR产物浓度为50~100 ng/μL时,在绝大多数SSR位点的毛细管电泳能够检测到荧光信号。
图1 不同PCR产物浓度对毛细管电泳检测结果的影响
利用83对SSR引物对8个烤烟品种进行PCR扩增,根据3.0%琼脂糖凝胶电泳检测结果,对其中的33对SSR引物随机进行荧光标记,并利用毛细管电泳检测其扩增片段长度,确定NTGS66288、PT30250、PT30213、PT52573、PT30170等5对SSR引物为本研究的核心引物,这5对引物在8个烤烟品种中的毛细管电泳检测结果如图3所示,NTGS66288、PT30250、PT30170的PCR产物带型单一,滑移峰较少,而PT30213、PT52573的PCR产物具有较多的滑移峰,但是主峰依然明显,可以用于进一步分析。从毛细管电泳检测的图谱中可以看出,在5对SSR引物中,多数SSR引物对8个烤烟品种的扩增结果为单条带,如引物NTGS66288;少部分的扩增结果为双条带,如引物PT52573。
图2 荧光SSR引物扩增产物的毛细管电泳检测结果
对带型清晰、差异明显的5对SSR进行多态性分析,5对SSR引物在8个烤烟品种材料中共扩增出13个条带,都为多态性条带,其片段大小处于104~203 bp,其在8个烤烟品种中PCR产物的片段长度差异在6~14 bp,平均每个SSR引物的多态性条带数为2.6个,详见表2。这5对引物的多态性良好,8个烤烟品种的0、1编码矩阵如表3,能够有效地将8个烤烟品种进行区分。
表2 SSR引物在8个烤烟品种的扩增产物及其片段长度 bp
表3 基于5对引物扩增的8个烤烟品种的0、1编码矩阵
通过对8个烤烟品种的SSR标记数据进行统计,采用UPGMA算法计算8个烤烟品种间的遗传相似系数并绘制遗传聚类图(图3)。8个烤烟品种间遗传相似系数分布在0.30~0.86,平均值为0.52(表4)。由8个烤烟品种遗传相似系数获得的聚类图表明,当遗传相似系数为0.761时,可将8个烤烟品种分为4个类群。云烟87与NC297首先聚在一起,说明两者遗传背景较近,遗传相似系数为0.86;遗传相似系数最小为0.24,出现在翠碧1号和中烟100这两个品种间;中烟100、云烟97、NC297和云烟87聚为一类;K326、KRK26聚为另外一类;红花大金元、翠碧1号与这两个类群之间的遗传距离相对较远。
图3 8个烤烟品种的SSR标记聚类图
表4 8个烤烟品种间的遗传相似系数
通过分析PCR产物的测序结果,利用简单重复序列识别工具SSRIT识别SSR基因座的结构组成,NTGS66288、PT30250、PT30213、PT52573、PT30170等5个SSR位点的序列信息如表5所示。检测结果显示NTGS66288、PT30250、PT30213、PT52573、PT30170等5个SSR位点基因座的核心重复单元多为简单二碱基重复和三碱基重复,其中二碱基重复以(AT)n和(TA)n为主,三碱基重复以(ATA)n、(TCT)n和(TAG)n为主。其基序重复次数在3~28次,基序长度介于9~84 bp。
表5 SSR位点的结构组成分析结果
对8个烤烟品种NTGS66288、PT30250、PT30213、PT52573、PT30170等5个SSR位点序列进行序列比对和分析,结果表明,在这5个SSR位点上,8个品种之间的差异仅为核心重复单元数量不同,其他区域序列完全一致,不存在SNP或者插入、颠换等差异,具体序列比对结果见图4。
图4 8个烤烟品种在5个SSR位点的序列信息
基于SSR标记在烤后烟叶中较高的重复性、可靠性以及特异性,SSR标记可以作为主栽烤烟品种遗传多样性分析的首选,筛选重复性好、稳定性高和多态性丰富的优质SSR标记是提高品种鉴定效率的关键。本研究从83对引物中筛选出5对SSR引物,结合毛细管电泳检测技术对8个主栽烤烟品种进行遗传多样性分析,发现:5对SSR引物在8个烤烟品种中共获得13个条带,都为多态性条带,其片段大小处于104~203 bp;烤烟品种间遗传基础相对狭窄,8个品种间的遗传相似系数在0.30~0.86。因此,8个烤烟品种间遗传相似性较高,遗传背景接近,这与薛怀裕[25]、刘林等[26]的研究结果类似。
由于能分辨亲缘关系极近的品种,SSR得到了越来越多的应用,但是其也存在着“复制滑移”现象,这种“复制滑移”现象可能与引物序列重复单元的构成有一定关系。在本实验中,NTGS66288、PT30250、PT30170等引物对的PCR产物带型单一,滑移峰较少,而PT30213、PT52573的PCR产物具有较多的滑移峰,但是主峰依然明显,可以用于进一步分析。SSR位点复制滑移的发生频率受很多因素的影响,变异很大,但有一个共同的特征,即发生概率较小,如果不加以控制,足以在群体中产生差异。本研究使用的部分SSR引物在经过PCR优化之后,依然会存在较多的滑移峰,如SSR引物PT30213和PT52573。因此,在遇到此类引物时,需要引起重视,首先应该进行重复实验,多次优化PCR条件,或者采用其他扩增体系进行重复验证,检查内标或Ladder分型是否正确。
基于高通量测序技术的基因分型给物种分类及品种鉴定提供了更高的分辨率,但后期测序数据拼接繁琐,对具有重复序列的SSR等位基因难以进行准确的测序分析,主要是因为在全基因组测序过程中,SSR的核心重复序列因基序的多次重复会导致测序出现大量碱基空缺[27,28]。因此,通过全基因组测序获得完整的SSR位点的序列信息存在困难,而通过单管PCR扩增,并对PCR扩增产物进行高通量测序,对于获得SSR位点的序列信息变得相对容易。本研究基于Hiseq测序平台,对8个烤烟品种的SSR位点进行测序,探索了不同SSR位点的结构与序列差异,期望将长度序列多态性进阶为DNA序列多态性。测序结果表明SSR位点的深度测序确实可以提供更详细的烤烟遗传多样性信息,获得更多的等位基因,提高遗传标记的应用潜力。但是由于本实验的测序位点较少,而且大部分SSR基因座间的序列信息差异属于常规的简单重复次数的差异,因此若要获得更多碱基水平的SSR序列多态性则需要更多的SSR引物和大量的群体。此外在利用深度测序检测SSR基因座的低频突变中,测序提供了足够的覆盖率,但由于建库过程不同,SSR引物存在模板偏好性,因此测序结果依然存在突变与测序错误的不可区分性。今后可以从SSR位点的序列差异入手,利用SSR标记的稳定性和下一代测序技术的高通量以及高分辨率,扩大特异引物的测序规模,寻找更多可稳定遗传的序列突变,明确每一个品种的特征序列,为烤后烟叶品种的批量、快速鉴定奠定基础。
本实验确定的5对SSR引物(NTGS66288、PT30250、PT30213、PT52573、PT30170)可有效区分云烟87、云烟97、翠碧1号、红花大金元、中烟100、K326、KRK26、NC297等8个烤烟品种,且8个品种之间的差异仅为简单二碱基和三碱基核心重复单元数量不同,其中二碱基重复以(AT)n和(TA)n为主,三碱基重复以(ATA)n、(TCT)n和(TAG)n为主。