郝晓燕,张跃进,郭宏波,柯卫东
(1.西北农林科技大学生命科学学院,陕西杨凌,712100;2.国家种质武汉水生蔬菜资源圃,武汉市蔬菜科学研究所)
水生蔬菜是在淡水中生长、可供食用的特色蔬菜,在我国主要有莲藕、芋头、茭白、慈姑、荸荠、水芹、芡实、菱角、莼菜、蒲菜等12种类型。因多数水生蔬菜含膳食纤维,医学及食品科学研究结果均表明膳食纤维对高血脂、高血压等心血管系统疾病,以及便秘、肠癌等消化系统疾病具有良好的调理和辅助治疗功能[1]。目前莲藕、菱白、慈姑、芡实、荸荠、菱角等品种的加工产品均已销售到国外市场,出口量呈逐年增长趋势,国际市场需求量也很大。随着海外需求量的不断增长以及消费需求的多样化,借助日益更新的分子技术培育优质、抗病性强和适合加工的品种将是水生蔬菜今后育种的方向。
随着分子生物学和生物技术的迅猛发展,分子标记技术日新月异。单核苷酸多态性 (single nucleotide polymorphism-SNP)是继第一代分子标记限制性片断长度 多态性 (restricted fragments length polymorphism-RFLP)和第二代分子标记微卫星DNA之后第三代分子标记技术。因其具有在基因组中数量多、分布密度高,在基因分型过程中不需要根据片段大小将DNA分带,即可实现大规模、高度自动化,从而更适合于大样本量的检测分析,因此SNP被认为是很有应用前景的分子标记技术[2]。分子标记是物种表现型在分子水平上遗传多态性的直接映射,分子水平的遗传多态性表现为DNA核苷酸序列的差异,因此检测手段更直接、精确。随着人类、拟南芥及水稻基因组测序的完成,越来越多的生物基因组计划正在被阐明。目前利用SNP标记已发现与人类一些重要疾病(哮喘病、糖尿病、精神分裂症、癌症、镰状细胞贫血、血友病等)紧密连锁的标记基因[3]。同样,SNP在植物多样性、群体遗传、系统进化和功能基因组学等领域亦已显示出广泛的应用价值[4]。基于水生蔬菜在我国的特殊性和重要性,以及SNP技术的广泛应用前景,本文对单核苷酸多态性特点、检测技术及其在其他作物上的应用进行了综述,并对其在水生蔬菜遗传育种上的借鉴作用进行了探讨。
单核苷酸多态性主要是指在基因组水平上由单个核苷酸变异所引起的DNA序列多态性,在群体中发生频率不小于1%。它是人类可遗传变异中最常见的一种,所表现的多态性只涉及到单个碱基的变异,这种变异可由单个碱基转换或颠换所引起,也可由碱基插入或缺失所致,但通常所说SNP并不包含后两种情况[5]。所谓转换是指同型碱基之间的转换,如嘌呤与嘌呤(GA)、嘧啶与嘧啶(T-C)间的替换;所谓颠换是指发生在嘌呤与嘧啶(A-T、A-C、C-G、G-T)之间的替换。 研究发现,在变异中转换发生频率较高,而且以C-T转换为主,其原因是CpG的C是甲基化的,容易自发脱氨基形成胸腺嘧啶T,CpG也因此变为突变热点[6~7]。Kanazin等[8]对5个大麦品系的54个基因分别进行测序时,发现3个基因的SNP共有112种多态性。Tenaillon等[9]测算出玉米1号染色体上平均每104 bp中就有一个SNP多态位点。基因研究中心根据其完成的92%籼稻(Oryza sativaL.ssp.indica)基因组草图,估算出其SNP丰度为0.43%,即170万个左右[10]。由此可见,作物中SNP多态性非常丰富,且数量明显高于其他分子标记。
在基因组DNA中,任何碱基均有可能发生变异,所以SNP几乎遍布于整个基因组中。研究表明,编码区内SNP(coding SNP,cSNP)比较少,这主要是由于外显子内碱基变异率仅有周围序列的1/5[11~12],但它在研究遗传性疾病时具有重要意义,因此cSNP的研究备受关注。在遗传学分析中SNP作为一类遗传标记得以广泛应用,主要因其具有以下几个特点:①标记遗传稳定性高。SNP是基于单核苷酸的突变,所以其突变率低;②分布密度高。在人类基因组中平均每1 900个碱基对出现1个SNP,在玉米一号染色体中平均每104个碱基就出现1个SNP位点,几乎可以在任何待测基因内部或附近提供一系列标记;③易于自动化分析。SNP与传统分子标记方法存在明显不同,不再以DNA长度差异作为检测手段,而是直接检测序列变化,从而摆脱凝胶电泳的瓶颈限制,实现高效检测[13]。
原则上任何能检测单个碱基突变或多态的技术均可用于发现和识别SNP。近年来随着生物技术的快速发展,SNP检测技术日趋成熟,新的方法不断涌现,按研究对象不同主要分为两类:①对未知SNP位点的检测。传统方法包括如单链构象多态性(SSCP)、温度梯度凝胶电泳(TGGE)、变性梯度凝胶电泳(DGGE)、限制性片段长度多态性(RFLP)、随机扩增多态性 DNA(RAPD)等,这些方法只能检测SNP位点的有或无,不能确知突变位置和碱基类别,且不能用于SNP的发掘。而SNP的发掘需要伴随着测序工作的进行,所以对SNP进一步研究则需对含SNP的DNA链进行测序。由于这些方法都需通过电泳进行检测,因而难以实现高效、快速、自动化的检测目标。
②对已知SNP位点的检测。查找已知SNP的方法包括:以杂交为基础的等位基因特异寡核苷酸片段分析(ASO)、突变错配扩增检验 (MAMA)、基因芯片技术(gene chips)等。
目前兴起的一些高通量、自动化检测SNP的方法,包括Taq Man探针技术、芯片技术阵列分析、变性高效液相色谱(DHPLC)、动态等位基因特异的杂交、基质辅助激光解析/电离-飞行时间质谱 (MALDI-TOF MS)技术、毛细管电泳(CE)等[14],这些技术的出现使SNP位点的基因分型更易于实现。但是使用成本较高。其中最直接的检测SNP位点的方法是通过对已定位的序列标签位点 (sequence tagged sites,STS) 和表达序列标签(expressed sequence tag,EST)进行再测序发现植物基因组SNP,其优点是EST包含有许多表达基因的序列资料,其中一些可能会涉及作物的重要农艺性状,对其进行关联分析可以实现辅助遗传育种,或者通过设计特异的PCR引物扩增某个特定区域的DNA片段,通过测序和遗传特征的比较来鉴定该DNA片段是否可以作为SNP标记,但缺点是误差较大。综上所述,每种方法都有其优缺点,试验者可根据自身需求及试验设备等条件选择适合自己的SNP检测方法。
分子标记已被广泛用于人类、动物和植物(或作物)的遗传图谱构建、遗传资源分类与系统进化和功能基因组学等研究中。SNP以其特有的优势在人类遗传学研究中已得到广泛应用,而其在作物中的应用才刚刚起步,国内外报道相对较少,从而显示出其在作物应用研究中具有广阔前景。目前,在玉米、大豆、小麦中已有SNP报道,并表现出高度的种内核苷酸多态性,但在功能基因组中的应用尚处于起步阶段[15]。而SNP在水生蔬菜的相关研究中尚未见报道。
随着SNP标记的发现和定位功能的提高,作物遗传连锁图谱标记密度日益升高,这为作物育种提供了前所未有的便利。随着标记密度的逐渐加大,基因组扫描就能将数量性状基因位点(QTL)定位于染色体更细微的区域内,从而为新的主基因的发现和定位克隆打下良好的基础;高密度SNP遗传图谱的出现可使我们更精确地进行标记辅助选择(MAS)和标记辅助导入(MAI),降低或消除目的基因之外的遗传背景对这些技术带来的不良影响。Nasu等[16]建立了213个共显性,遍布于整个水稻基因组的SNP分子标记,并将94个SNP整合到已有的遗传图谱中。Davis等[17]用SNP进行EST作图成功获得高分辨率的玉米B73×Mo17随机交配4代后的群体遗传图谱。SNP作为一类遗传标记用于遗传图谱构建,以此来定位和识别具有重要功能的基因。建立起完整的高密度分子图谱,就可以定位相应的基因,这将为水生蔬菜中农艺性状和重要经济性状的基因定位,培育高产、抗逆性和抗病性强的品种,提供了重要的技术支撑。
生物体在漫长的进化过程中形成了自身特有的DNA碱基序列,比较物种间SNP差异,可以了解物种间亲缘关系和进化的生物学信息,从而对物种进行精细鉴定和分类。
Wang等尝试采用玉米中称为“进化位点”的tb1基因的SNP数据来回答栽培玉米的起源问题。他们从17个玉米基因型大约2.9 kb序列搜寻SNP,发现其中12个基因型属于玉米的祖先,野生玉米在编码tb1蛋白的基因部分序列仅有3%变异,而在启动子区域的变异却非常高,但所有栽培玉米在该启动子区域的变异却非常低,由此他们认为玉米在长期栽培过程中,影响启动子区域的选择要比影响编码区多得多,这些选择导致了玉米表现型的变化[18]。Germano等[19]用核酸和叶绿体的2种特异性SNP标记成功地对亲缘关系较近、形态相似的云杉属红云杉和白云杉以及黑云杉进行了区分,其中有2个SNP可将黑云杉与红云杉和白云杉分开。比如,第410碱基位置存在SNP,在黑云杉中它编码异亮氨酸,而在红云杉和白云杉中却编码亮氨酸;有5个SNP将白云杉与红云杉和黑云杉分开。Yamanaka等[20]对不同来源的糯稻品种进行SNP分析,结果表明Waxy基因位点上两个复等位基因Wxa和Wxb差别在于Wx基因中第一个内含子的一个酶切位点单碱基发生替代 (由AGGT变为AGTT)导致酶切位点改变而产生多态性,从而使Wx基因在该位点形成复等位基因Wxa和Wxb,同时在353个糯稻中发现11个是AGGT,由于认为粳稻Wx基因都AGTT,因此他们认为糯稻来源于粳稻。
单个碱基的差异可能决定一个基因功能的改变,SNP用于研究基因功能具有重要意义。利用SNP探索作物基因功能组学的研究在小麦、水稻中报道较多。
水稻抗稻瘟病基因Pi-ta与等位感病基因的区别在于基因编码区存在7个碱基替换,造成氨基酸链中有5个氨基酸差异,通过表型分析发现,造成抗病基因与感病基因功能差异的关键因素是等位基因编码的氨基酸链中第918个氨基酸的差异,抗病基因编码丙氨酸,而感病基因则编码为丝氨酸[21]。水稻淀粉酶IIa(SSIIa)基因位点存在5个SNP,其中一个SNP引起了氨基酸编码的改变,并认为靠近C末端的两个SNP引起氨基酸的变化,可能是引起淀粉酶Ⅱa基因活性和淀粉粒群丛改变的关键因素[22]。水稻半矮秆基因sd21等位基因中大多数是由于基因组中编码一种赤霉素氧化酶(GA20-ox)的基因编码区一段核苷酸缺失造成GA20-ox基因功能丧失;另一种情况是在GA20-ox基因编码区内第798个碱基由C变为T,从而使氨基酸链第266个氨基酸由亮氨酸变为丙基丙氨酸,而亮氨酸在GA20-ox的氨基酸链中是高度保守的,由于单碱基的取代使基因编码的氨基酸改变,导致了GA20-ox功能的丧失,使水稻由高秆突变为矮秆[23]。Wang等[24]在研究了6个野生稻品种谷子中淀粉结构和理化特性后发现,与栽培稻的长链淀粉相比,野生稻谷子具有更高的膨胀力、水溶性、较低的β-淀粉分解限制和粘性,并认为因野生稻中直链淀粉含量和支链淀粉结构的差异会造成加工以及品质上的差异。在水稻中,直链淀粉的含量常常是决定烹调和米食加工质量的一个重要指标,直链淀粉含量低的品质优。研究发现,所有直链淀粉含量低于18%的品种其序列都是AATTATA,而直链淀粉含量在中等水平以上的26个品种在该位置的序列都是AAGTATA,这种TG转换与直链淀粉含量的相关性在育种实践中很有价值[25]。
SNP具有多态性丰富,在作物基因组中分布密度大等优点,在人类和重要作物上已显示出其特有的优势和广泛应用前景,它在遗传图谱构建、资源分类和遗传进化,以及功能基因组学方面的特长将为其他经济作物提供良好的技术支撑。水生蔬菜是我国乃至世界蔬菜的特色种类,对其育种、遗传学和基因组学方面的研究尚处于初级阶段,尽快吸纳新技术加速我国特色蔬菜的研究是当务之急。
我国水生蔬菜资源丰富,其中以莲藕资源最为丰富。尽管过去在形态学分类[26~27]、分子标记技术[28]和品质方面[29]做了一些工作,但无论是基础研究还是应用研究,都仍有许多工作需要开展。基础研究方面包括:美洲黄莲作为中国莲亚种的直接分子证据;中国莲3种类型的进化机理及其时间次序;藕莲不开花或少开花的分子调控机理;藕莲和子莲产量和品质的调控机理;花莲不同花型、花色的进化与分子杂交机制;应用研究包括:藕莲和子莲高产品种的选育;藕莲加工品种的选育;花莲品种各花色和花型形的选育。而其他水生蔬菜种类与莲藕相比,则还有更多的工作需要开展。
[1]Tungland B C,Meyer D.Non digestible oligo-and Polysaccharides(dietary fiber):their physiology and role in human health and food [J].Comprehensive Reviews in Food Science and Food Safety,2002,3:73-92.
[2]刘传光,张桂权.水稻单核苷酸多态性及其应用[J].遗传,2006,28(6):737-744.
[3]Risch N,Merikangas K.The future of genetic studies of complex human diseases [J].Science,1996,273:1 516-1 517.
[4]杜春芳,刘惠民,李润植,等.单核苷酸多态性在作物遗传及改良中的应用[J].遗传,2003,25(6):735-739.
[5]杜玮南,孙红霞,方福德.单核苷酸多态性的研究进展[J].中国医学科学院学报,2000,8(22):392-394.
[6]Johnson G C L,Told J A.Strategies in complex disease mapping [J].Current Opinion Genetics&Development,2000,10(3):330-334.
[7]Mullikin J C,Hunt S E,Cole C G,et al.A single-nu-cleotide polymorphisms map of human chromosome 22[J].Nature,2000,407(6803):516-520.
[8]Kanazin V,Talbert H,See D,et al.Discovery and assay of single-nucleotide polymorphisms in barley (Hordeum vulgare)[J].Plant Molecular Biology,2002,48(5):529-537.
[9]Maud I,Tenaillon,Mark C,et al.Patterns of DNA sequence polymorphism along chromosom-e 1 of maize (Zea mays ssp.maysL.)[J].PNAS,2001,98(16):9 161-9 166.
[10]Yu J,Hu S N,Wang J,et al.A draft sequence of the rice genome (Oryza sativaL.ssp.indica)[J].Science,2002,296(13):79-92.
[11]Li W,Sadler L A.Low nucleotide diversity in Man[J].Genetics,1991,129:513-523.
[12]Nickerson D A,Taylor S L,Weiss K M,et al.DNA sequence diversity in a 917 kb region of the human lipoprotein lipase gene[J].Nature Genetics,1998,19:233-240.
[13]Mochida K,Yamazaki Y,Ogihara Y.Discrimination of homoelogous gene expression in hexaploid wheat by SNP analysis of contigs grouped from A large number of expressed sequence tags [J].Molecular Genetics and Genomics,2004,270:371-377.
[14]汪维鹏,倪坤仪,周国华.单核苷酸多态性检测方法研究进展[J].遗传,2006,28(1):117-126.
[15]Rafalski A.Applications of Single Nucleotide Polymorphisms in Crop Genetics[J].Current Opinion in Plant Biology,2002(5):94-100.
[16]Nasu S,Suzuki J,Ohta R,et al.Search for and analysis of single nucleotide polymorphisms (SNPs)in rice(Oryza sativa,Oryza rufipogon)and establishment of SNP markers[J].DNA Research,2002,9(5):163-171.
[17]Davis G,Long M J,Lee M,et al.The Intermated B73 x Mo17 Genetic Map:a Community Resource 2001,(http://www.agron.missouri.edu)[EB//OL].
[18]Wang R L,Syeca A,Hey J,et al.The limits of selection during maize domestication[J].Nature,1999,398:236-239.
[19]Germano J,Klein A S.Species-specific nuclear and chloroplast single nucleotide polymorphisms to distinguish Picea glauca,P.mariana and P.rubens [J].Theoretical and Applied Genetics,1999,99:37-49.
[20]Yamanaka S,Nakamura I,Watanabe K N,et al.Identification of SNPs in the waxy gene among glutinous rice cultivars and their evolutionary significance during the domestication process of rice [J].Theoretical and Applied Genetics,2004,108(7):1 200-1 204.
[21]Bryan G T,Wu K S,Farrall L,et al.A single amino acid difference distinguishes resistant and susceptible alleles of the rice blast resistance genePi-ta [J].Plant Cell,2000,12(11):2 033-2 046.
[22]Umemoto T,Aoki N.Single-nucleotide polymorphisms in rice starch synthaseⅡa that alter starch gelatinisation and starch association of the enzyme [J].Functional Plant Biology,2005,32(9):763-768.
[23]Spielmeyer M,Ellis M H,Chandler P M.Semidwarf(sd21), “Green Revolution” Rice,contains a defective gibberellin 20-oxidase gene[J].Proceeding of the National Academy of Sciences of the United States of America,2002,99(13):9 043-9 048.
[24]Wang L F,Wang Y J,Porter R.Structure and physicochemical properties of six wild rice starch [J].Journal of Agricultural and Food Chemistry,2002,50:2 695-2 699.
[25]Ayres N M,McClung A M,Larkin P D,et al.Microsatellites and a single-nucleotide polymorphism in an extended pedigree of US rice germplasm [J].Theoretical and Applied Genetics,1997,94:773-781.
[26]倪学明.中国莲 [M].北京:科学出版社,1987:1-163.
[27]王其超,张行言,胡春根.荷花分类新系统[J].武汉植物学研究,1997,15(1):19-26.
[28]Guo H B,Li S M,Peng J,et al.Genetic diversity of Nelumbo accessions revealed by RAPD [J].Genetic Resources and Crop Evolution,2007,54:741-748.
[29]柯卫东,黄新芳,傅新发.莲藕主要营养品质和农艺性状的遗传分析[J].武汉植物学研究,2000,18(6):519-522.