望春玉兰基因组SSR 引物开发与应用初探*

2023-11-05 12:59徐正康戴晓港陈赢男
林业科学 2023年10期
关键词:玉兰核苷酸指纹

徐正康 戴晓港 陈赢男

(林木遗传育种国家重点实验室 现代南方林业协同创新中心 林木遗传与生物技术教育部重点实验室 江苏省林木遗传和高效培育重点实验室 南京林业大学 南京 210037)

玉兰属(Yulania)树种,即原木兰科(Magnoliaceae)木兰属(Magnolia)玉兰亚属(subgen. Yulania)植物(傅大立,2001),是中国最具传统特色的观赏花木之一,其花形多姿、花色多变、芳香典雅,被广泛应用于园林景观和园林绿化。此外,玉兰属树种也是重要的药用及香料植物,其干燥花蕾既可入药(统称“辛夷”)又可作为名贵香料原料,具有较高的经济价值。近年来玉兰产业不断发展,种植规模、经济产值和从业人员逐年提高,以“中国玉兰之乡”河南省南召县为例,2014 年南召县玉兰种植面积达1.79 万hm2;产值达到18.7 亿元(周虎等,2015)。在玉兰产业蓬勃的同时,也出现了品种繁多名称混乱、缺乏科学管理等问题。确保花木优良品种种苗的真实性,是玉兰产业健康稳定发展的基础,建立一套便捷、快速、可靠的玉兰良种鉴定技术,对于监督种苗生产、新品种认定,以及保护育种工作者知识产权具有重要意义。

传统的特异性、一致性和稳定性(distinctness,uniformity and stability,DUS)测试是建立在观察和测量部分植物表型基础上,虽然受环境影响小、测试条件简单可靠、适宜描述质量性状,但周期长、效率低、质量难控制等问题。分子标记技术及构建DNA 指纹图谱为DUS 测试提供强有力的辅助工具,并已成为一套完整的植物新品种保护测试技术体系不可或缺的一部分(李晓辉等,2003)。微卫星(simple sequence repeat, SSR)标记技术,因其具有操作简单、稳定、灵敏、检测多态性强等优点,成为品种一致性和特异性检验以及植物新品种测试中应用最广泛的标记技术(钟海丰等,2017)。目前,我国对玉兰属植物的研究主要集中在传统分类学、化学成分分析(傅大立等,2005)以及繁育等方面(王艺等,2019),仍缺少丰富的分子标记资源和准确的DNA 指纹图谱信息。

望春玉兰(Magnolia biondii)是玉兰属中优良的早春观花树种,也是辛夷植物中栽培面积最大和药用质量最好的树种(傅大立等,2003),具有观赏、药用、香料和用材等用途,是珍贵的多功能经济树种。中国科学院仙湖植物园研究团队首次发布了高质量的望春玉兰基因组信息(Donget al., 2021),为挖掘和开发SSR 标记提供了宝贵的序列信息。基于已公布的望春玉兰全基因组序列,本研究对其微卫星位点进行搜索,分析了微卫星的序列特征、分布和组成等信息,在此基础上设计和开发SSR 特异性引物,并构建了26分玉兰商业品种的DNA 指纹图谱,为玉兰属植物的分子遗传学研究提供标记资源,也为玉兰优良品种的真实性鉴定提供科学依据。

1 材料与方法

1.1 试验材料

在河南省南召县内6 个不同地点选取6 株望春玉兰自然单株(编号NZ1—NZ6);此外,在南召县林业局收集的玉兰种质资源库中选取26 个不同商业品种的玉兰植株(编号1—26,表1)。2022 年9 月,分别采集上述玉兰植株的幼嫩叶片经低温保鲜运送,贮存于-80 ℃冰箱,待用。6 份自然单株和26 份商业品种分别用于筛选SSR 引物及构建SSR 指纹图谱。

表1 26 份玉兰商业品种信息Tab. 1 Information of 26 commercial Magnolia cultivars

1.2 基因组DNA 提取

称取100 mg 叶片样品,采用TIANGEN 公司的DNA 提取试剂盒(DNAsecure Plant Kit,DP320)提取基因组DNA。利用1%琼脂糖凝胶电泳和NanoDrop-2000 分光光度仪分别对DNA 的质量及浓度进行检测,并将每份DNA 样品稀释至30 ng·µL-1,置于-20 ℃冰箱保存,待用。

1.3 望春玉兰基因组SSR 特征分析

利用已公布的望春玉兰基因组序列信息(https://datadryad.org/stash/dataset/doi:10.5061/dryad.s4mw6m947),采用MISA 软件(http://www.pgrc.ipkgaters leben.de/misa)进行全基因组微卫星序列查找。微卫星查找参数设置为:单核苷酸重复≥12 bp;二核苷酸和三核苷酸重复次数最少分别为6 次和4 次;四核苷酸和五核苷酸重复次数最少为3 次;六核苷酸重复最少为2 次;如果SSR 位点之间的距离≤100 bp,则定义为复合型SSR。

1.4 SSR 引物设计、筛选与指纹图谱构建

根据望春玉兰基因组SSR 位点分析结果,除去复合型SSR 和单核苷酸重复 SSR,利用Primer Premier 5.0 软件批量设计SSR 引物。引物设计参数设置为:引物长度18~28 bp,GC 含量在40%~60%之间,扩增产物大小为100~300 bp,退火温度(Tm 值)在50~60 ℃之间。针对二~六核苷酸重复的SSR 位点,选取203对引物交由生工生物工程(上海)股份有限公司合成。

利用合成的203 对引物对样品NZ1—NZ6 的基因组DNA 进行PCR 扩增,用12%的聚丙烯酰胺凝胶电泳对SSR 引物进行筛选,选择电泳条带清晰、容易判读、多态性信息含量高的引物组合。PCR 反应体系为10 µL,包括基因组DNA 1 µL、上下游引物各1 µL、10×PCR Buffer(Mg2+plus)1 µL、dNTP Mixture 0.4 µL、TaKaRa TaqTM聚合酶0.1 µL 和ddH2O 5.5 µL。PCR 反应程序为:94 ℃预变性5 min,95 ℃变性30 s,55 ℃退火30 s,72 ℃延伸30 s,循环30 次,最后72 ℃延伸7 min。聚丙烯酰胺凝胶电泳条件为电压180 V,电流200 mA 电泳90 min,电泳缓冲液为0.5×TBE。电泳结束后采用银染法染色,去离子水漂洗2 次后,置灯箱上拍照。

进一步根据引物的多态信息量(polymorphism information content, PIC)指数筛选出多态性较高的SSR 引物用于指纹图谱构建。在扩增26 份玉兰商业品种基因组DNA时,每个PCR 反应体系中加入1 µL稀释100 倍的荧光dUTP(Thermol),将扩增产物在ABI-3730XL 测序仪进行毛细管电泳,利用Gene Mapper 基因型分析软件对获得的电泳谱带进行分析。

1.5 数据分析

引物PIC 指数用下列公式进行计算:PIC=1-式中:n为某一对SSR 引物扩增的等位基因数,Pi为该位点第i个等位基因的频率(Keimet al., 1992)。引物的鉴别力(discrimination power, DP)即一对引物所能区别的最大品种数(Brownet al., 1996;许鲲等,2008)。使用GenAIEx 软件计算等位基因数、基因型数。

2 结果与分析

2.1 望春玉兰长基因组SSR 位点特征

利用 MISA 软件对已公布的望春玉兰基因组序列(~2.22 Gb)进行搜索,在19 条染色体中发现符合条件的SSR 位点总计2 820 303 个。望春玉兰基因组SSR 的长度分布在12~701 bp 之间,其中长度在12~16 bp 之间的有2 293 738 个,占总数的81.33%;长度在 17~21 bp 之间的有270 830 个,占总数的9.6%;长度在21 bp 以上的有255 735 个,占总数的9.07%(图1)。

图1 望春玉兰SSR 长度与分布频率Fig. 1 The length distribution and frequency of SSRs in M. biondii

在搜索到的望春玉兰基因组SSR 位点中,单核苷酸、二核苷酸、四核苷酸和六核苷酸重复类型出现的频率占优势,所占比例分别为9.98%、12.02%、7.63%和62.13%;三核苷酸和五核苷酸重复类型出现频率不高,分别占比5.43%和2.80%(表2)。SSR 重复单元的重复次数分布在 2~701 次之间,其中2~11 次重复的SSR 位点有2 385 718 个,占比84.59%;12~25 次重复的SSR 位点有353 970 个,占比12.55%;25 次重复以上的SSR 位点有80 615 个,占比2.86%(表2)。从SSR 的重复次数来看,单核苷酸主要分布在12~25 次,占单核苷酸总数的90.40%;二核苷酸主要分布在6~11 次,占二核苷酸总数的55.73%;三核苷酸主要分布在4~9 次,占三核苷酸总数的96%;四核苷酸、五核苷酸主要分布在3~6 次,分别占其总数99.41%和99.51%;六核苷酸主要分布在2~5 次,占六核苷酸总数的99.92%(表2)。

表2 望春玉兰基因组SSR 的种类、数量及比例Tab. 2 Type, number and ratio of SSRs in the genome of M. biondii

从核苷酸重复基序的类型来看,望春玉兰基因组2 820 303 个SSR 位点共包含501 种重复基序,二核苷酸至六核苷酸重复基序分别有4、10、33、102 和352 种。二核苷酸重复基序中AG/CT(166 489 个)、AT/AT(130 648 个)和AC/GT(41 152 个)的出现频率较高,分别占二核苷酸重复总数的49.1%、38.53%和12.14%。三核苷酸中出现最多的重复基序是AAT/ATT(50 530 个)和AAG/CTT(47 939 个),分别占三核苷酸总数的33.02%和31.33%,其次是ATC/ATG(22 407 个),占三核苷酸总数的14.64%;最少的是CCG/CGG(255 个),只占三核苷酸总数的0.17%。四核苷酸中出现最多的重复基序是AAAT/ATTT(70 162 个)占四核苷酸总数的32.58%,其次是AAAG/CTTT(28 531 个)占四核苷酸总数的13.25%。五核苷酸中以AAAAT/ATTTT(21 301 个)和AAAAG/CTTTT(11 687个)出现频率最高,分别占五核苷酸总数的26.96%和14.79%。六核苷酸中出现频率最高的是 AAACCT/AGGTTT(464 338 个),占六核苷酸总数的26.50%,其次是AAAAAT/ATTTTT(86 617 个)、AACCTT/AAGGTT(464 338 个)和AAAAAG/CTTTTT(56 652 个),分别占六核苷酸总数的4.94%、4.24%和3.23%(附表1)。

2.2 望春玉兰基因组SSR 引物的筛选与多态性分析

利用随机选取的203 对SSR 引物对望春玉兰样品NZ1—NZ6 的基因组DNA 进行PCR 扩增,有94 对引物能够得到预期产物,引物扩增有效率为46.31%;有25 对引物在不同样品间呈现多态性,占有效引物的26.6%。这25 对多态性引物扩增望春玉兰基因组产生的条带数在2~5 之间(附表2),不同样品间条带呈现多态性(图2)。

图2 多态性引物扩增6 份望春玉兰样品的部分代表性结果Fig. 2 Representative results of the six M. biondii samples amplified with polymorphic primers

2.3 玉兰商业品种的SSR 标记多态性及指纹图谱构建

在上述25 对多态性引物中,选择PIC 值最高的前10 对引物,对26 份玉兰商业品种进行扩增。由于聚丙烯酰胺凝胶电泳只能根据DNA Marker 判断谱带的相对大小,不够精确,因此在分析玉兰商业品种扩增结果时,采用了毛细管电泳对扩增谱带进行判读。每一对引物都可以对供试样品产生清晰谱带,表明筛选出的SSR 引物在不同玉兰品种间表现出良好的通用性。10 对引物共扩增出85 个等位位点,最多的为18 个(Chr19-6),最少的为3 个(Chr08-5),平均每对引物检测到8.5 个;基因型数最多的为19 个(Chr06-10),最少的为4 个(Chr08-5),平均每对引物检测到8.4 个;PIC 指数在0.420~0.882 之间,平均为0.759(表3)。以引物Chr02-1 为例,该对引物扩增产生6 种不同基因型谱带(图3)。

图3 引物Chr02-1 在26 份玉兰商业品种中扩增出的6 种基因型Fig. 3 Six genotypes generated by the primer Chr02-1 amplified among 26 commercial cultivars

表3 10 对SSR 引物多态性及鉴别力分析Tab. 3 Polymorphic and discrimination power analysis of the 10 pairs of primers

某些玉兰品种仅需一对引物即可与其他品种相互区分,例如引物Chr02-1 和Chr10-7 分别是‘日出’和‘玉玲珑’的特异引物。但多数品种需要利用不同的引物组合才能实现与其他品种的区分。一对引物所能区分的最大品种数可以用于评价引物鉴别力。按照引物鉴别力大小排列,只需利用3 对引物(Chr06-10、Chr09-2、Chr19-6)作为首选引物组合即可将本研究中涉及26 份玉兰商业品种一一区分,但是为了能够更准确地反映某一品种的遗传真实性,避免品种识别误差,扩大指纹图谱的适用范围,本研究整合汇总了10对SSR 引物对每一个品种的扩增结果,每一对引物的扩增带型按照大小进行编码处理,得到每一个玉兰品种对应A-F 引物的10 个编号,按固定的顺序将10 个编号串联形成字符串,由此得到以字符串表示的26份玉兰商业品种的DNA 指纹代码,并进一步利用二维码生成器将指纹图谱代码信息转换为便于市场流通和栽培管理的二维码(表4)。

表4 26 个玉兰品种的指纹代码Tab. 4 Fingerprints of 26 Magnolia cultivars

3 讨论

木兰类(Magnoliids)植物在被子植物演化系统中占有特殊地位,是探究被子植物起源与进化的代表性植物(Chenet al., 2019)。目前,完成全基因组测序的木兰类植物仅有6 个物种,包括:鹅掌楸(Liriodendron chinense)(Chenet al., 2019)、牛油果(Persea americana)(Rendón-Anayaet al., 2019)、黑胡椒(Piper nigrum)(Huet al., 2019)、刺果番荔枝(Annona muricata)(Strijket al., 2021)、牛樟(Cinnamomum kanehirae)(Chawetal., 2019)和望春玉兰(Donget al., 2021),其中望春玉兰基因组(~2.2 GB)是迄今报道的木兰类植物中最大的。这些基因组序列的公布不仅为研究木兰类植物在被子植物演化历史中的系统位置提供了关键信息,也为充分开发分子标记资源提供了丰富的序列。本研究根据望春玉兰全基因组的SSR 位点序列信息,筛选出10 对扩增谱带清晰的SSR 引物,在扩增不同玉兰品种基因组DNA 时表现出良好的稳定性和重复性,这些引物扩增的等位基因数≥3,PIC 值均大于0.65(除Chr08-5 外),显示出较高的多态信息。此外,最终筛选出的10 对SSR 引物分散在10 条不同染色体上,能够充分反映不同玉兰品种之间的遗传差异,提高鉴定结果的可靠性,可以作为玉兰品种鉴定的核心引物。利用这些引物首次构建了26 个玉兰商业品种的DNA 指纹图谱,其中包括12 个国家林业草原局授权植物新品种。由于玉兰属植物极佳的观赏性和较高的经济价值性,栽培范围广泛,自然杂交现象较多,部分品种间性状变异幅度小、交叉多,仅凭叶形、花型、果实等形态特征难以对相似品种的遗传真实性进行准确判断。通过比对玉兰DNA 指纹图,结果显示本研究所涉及的26 个玉兰商业不存在同种异名或异种同名现象。

中国是玉兰属植物起源中心,也是玉兰属植物资源最为丰富的国家(田国行等,2006),仅望春玉兰就包括6 个品种群和24 个品种(孙军等,2008)。近年来,国外新优品种不断被引入,国内自主培育的新品种也不断涌现,为望春玉兰良种选育和推广应用提供了丰富种质资源,但由于栽培历史悠久、来源复杂、品种繁多,为优良品种的纯度和真实性鉴定,充分保障育种知识产权提出了更高的要求。本研究开发的SSR引物具有多态性高、稳定好等特点,在少量玉兰商业品种中的应用和初探,证明了SSR 标记用于玉兰种质资源DNA 指纹图谱构建和品种鉴别的可行性。在后续研究工作中,广泛收集和系统整理玉兰品种资源,构建包含更多玉兰品种的SSR 指纹图谱数据库具有重要意义。建立和完善玉兰品种指纹图谱数据库,进一步实现指纹图的查询和比对功能,不仅可以为玉兰品种快速和准确鉴别提供遗传信息,也为玉兰新品种的审定和登记提供一个基础平台。此外,玉兰属植物系统分类和亲缘关系研究存在较大争议(傅大立,2001)。以形态学特征为基础,以分子标记等多种遗传标记技术为辅助,综合形态特征和基因型数据,将有利于系统梳理玉兰属植物复杂的分类关系。本研究开发的SSR 引物也为玉兰属植物的系统分类和遗传背景分析提供了分子标记资源。

4 结论

本研究通过对望春玉兰全基因组微卫星序列进行查找和分析,共获得重复单元长度为1~6 碱基的微卫星位点2 820 303 个,其中六核苷酸重复基序AAACCT/AGGTTT 数量最多(464 338 个),占六核苷酸重复总数的26.50%。在此基础上,设计开发和筛选出谱带清晰、易于判读、多态性高的SSR 引物25 对,平均每对引物产生1.28 个多态性条带,PIC 值在0.24~0.72。进一步利用PIC 值最高的前10 对引物构建了玉兰商业品种的DNA 指纹图谱,结果表明这10对引物在不同品种中具有良好通用性,可以准确鉴别26 个商业品种。本研究不仅为玉兰属植物群体遗传结构和遗传多样性研究提供了丰富的分子标记资源,也为玉兰优良品种的遗传真实性鉴别和品种保护工作提供了技术支撑和科学依据。

附表 1 望春玉兰基因组SSR 各重复基序类型及数量Appendix Tab. 1 The type and number of SSR repeat motifs in the M. biondii genome

附表 2 望春玉兰25 对多态性SSR 引物信息Appendix Tab. 2 Information of 25 polymorphic primers developed from M. biondii

猜你喜欢
玉兰核苷酸指纹
单核苷酸多态性与中医证候相关性研究进展
徐长风:核苷酸类似物的副作用
像侦探一样提取指纹
为什么每个人的指纹都不一样
Acknowledgment to reviewers—November 2018 to September 2019
Analysis the Development of Digital Marketing and Social Media Marketing Strategy
基于自适应稀疏变换的指纹图像压缩
可疑的指纹
广东人群8q24rs1530300单核苷酸多态性与非综合征性唇腭裂的相关性研究
用拔河绳上好耐久跑