赵海红 ,郭泰,王志新,郑伟,李灿东,徐杰飞,张振宇,赵星棋,王士强
(1黑龙江省农业科学院佳木斯分院,黑龙江佳木斯 154007;2黑龙江八一农垦大学农学院,黑龙江大庆 163319)
大豆是目前全世界种植面积相对比较大的作物之一,大豆作为重要的食品、饲料和工业原料,在人类的生产和生活中发挥着重要的作用。2017 年中国大豆播种面积为819.4万hm2,较上年增加13.8%,全国大豆平均单产为1817 kg/hm2,较上年增加1.2%[1],这些大豆主要用于国民食用。然而,据估计,中国国内饲料用粮需求在3.8亿~4.0亿t,而目前饲料用粮仅为2.7亿t,饲料粮缺口较大[2],可见,中国对大豆的需求急需解决。2017 年中国大豆进口量就约为9553 万t[3],而且多年来,中国大豆市场供给高度依赖进口,且进口渠道较为集中,美国作为中国大豆第二大进口国,2018年以来,却与中国的贸易摩擦不断升级[4]。振兴中国大豆产业势在必行。因此,必须通过大豆品种改良、机械化生产、规模化种植等多种途径,持续提高中国大豆单产及品质,为改善中国大豆种植提供技术保障。那么,研究大豆在特定条件下的基因表达模式,对于开发和利用大豆种质资源也就十分必要,全基因组重测序工作对大豆育种及相关分子生物学研究意义重大。
2010年,大豆基因序列的揭示[5],对于开展大豆靶向性分子育种、聚合育种,高效精准地培育大豆新品种及创制新种质具有极大的促进作用,基因测序为了解大豆基因组的结构和进化提供了宝贵资源[6],有利于大豆的农艺性状的分析,利用基因测序研究成果可选育出高抗病、抗多种病害、抗除草剂、高品质、高产量的新品种[7-8],极大丰富大豆品种类型,大大缩短育种周期的同时,为基于测序技术的大豆分子育种打好坚实基础,使农民增产增收增效的同时,增强中国大豆生产在国际市场上的地位。
基因测序技术在分子生物学和基础医学领域应用广泛,已经从第一代发展到第四代[9]。
1977年Maxam和Gibert[10]报道了通过化学降解测定DNA序列的方法,由于该方法程序复杂、操作繁琐,后来逐渐被Sanger 法取代。随后,在Sanger技术的基础上,发展起来的荧光自动测序技术是应用最为广泛的第一代测序技术[9]。该测序技术测序精确,但通量较低,成本高,后来逐渐被二代测序技术取代。
2004 年,随着Roche 公司首次推出以高通量低成本为主要特点的测序平台,生物学研究正式进入了以二代测序为核心测序手段的时代[11]。第二代测序技术采用的策略是边合成边测序,依照Sanger 测序原理,捕捉末端荧光标记来确定DNA 序列[12]。其最显著的特征是高通量、低成本、自动化程度高,能在很短的时间内完成上百亿个碱基对的测序,一次能对几十万到几百万条DNA 分子进行序列测序,满足极短时间内对基因组进行高分辨率检测的要求[13]。
鉴于一代和二代测序存在依赖于模板扩增以及产生的序列较短等缺点,在需要进行组装,比对以及注释等生物信息学分析时存在着很大的困难[14],为了补充和进一步完善测序技术,近几年研发出第三代的测序方法—单分子测序技术(Single-molecule Sequencing),主要包括生物科学公司的Heli Scope单分子测序仪[15]、太平洋生物科学公司的单分子实时DNA 测序技术(Single-molecule Real-time,SMRT) 和 Oxford Nanopore 公司的单分子纳米孔测序技术(The Singlemolecule Nanopore DNA Sequencing)[16]等。现阶段大多数的研究还采用第二代和第三代测序数据的结合使用,这能够有效的解决由二代测序本身局限所导致的研究难题。
英国牛津纳米公司研发的MinION测序仪是基于纳米孔单分子测序技术的第四代测序技术,其体积比普通U盘稍大,携带十分方便,MinION默认运行时间为48 h,其标准识别速度为一秒钟识别250 个碱基(250 bps)[17],运行2 min产生的数据就可以用于相关分析,平均读长可以达到13~20 kb[18],通过提高测序深度,MinION测序可以达到98%的准确率[19]。但是生物纳米孔使用的脂基质,其机械稳定性较弱,反复洗涤会降低测序芯片的使用寿命[20]。
近年来基因组重测序也越来越广泛地应用于物种进化研究和育种研究领域[21,26-31]。2002 年水稻全基因组计划率先宣布完成[22]。在随后几年里,科学家们先后完成了包括黄瓜[23]、玉米[24]、高粱[25]、大豆[5]等物种的全基因组测序,而后,通过基因组重测序从更多的角度来研究作物育种学,比如发现突变位点[26-27],揭示进化关系[28]、挖掘功能基因[29-30]、分子辅助选择育种[31]等,这加快了优质新品种的培育进程。全基因组重测序技术逐渐成为重要的育种手段。
在大豆育种研究中,开发诱变群体、获得有感兴趣的变异表型的突变株之后,传统的正向遗传学方法往往是通过构建F2分离群体、重组自交系等方法定位与表型相关的基因,要连续选育多代,工作量大而且周期较长。通过全基因组重测序等反向遗传学手段,可以快速发现与表型相关的基因位点,加快育种进程。
大豆基因序列的揭示[5]后,2010 年Lam 等[32]对31份大豆包括野生种和栽培种进行全基因组重测序,共获得205614个SNP位点,并发现在野生大豆中等位基因多态性水平要明显高于栽培大豆。
2012 年李泽锋[33]利用二代测序技术,对来自中国江南的一个野生大豆基因组(‘兰溪1 号’,Lanxi1)进行了深度测序(>50X),发现‘兰溪1号’相对其他北方野生大豆来说,与栽培大豆亲缘关系更远,这有可能暗示出大豆是从中国北方开始驯化的。
2015 年Zhou 等[34]人通过对302株野生大豆、地方品种和驯化品种大豆进行大于11X 深度的高通量测序,发现979万个SNPs,87.68万个Indels,还有1614个CNVs和6388个大片段缺失。发现230个受选择区域和162个拷贝数变异。全基因组关联分析表明10个受选择区域和9个驯化性状相关联,发现13个被注释为与油脂、株高等农艺性状相关的位点。与之前QTL定位结果比较分析发现,230 个受选择区域中96 个与调控油脂的QTL相关,21个区间内包含脂肪合成关键基因。
2016年张彦威[6]等对大豆品种‘齐黄34’进行全基因组重测序,共检测到1519494个SNP位点,357549个小片段InDel位点,4506个结构变异,为分子标记辅助选择提供了重要的标记资源。同年,33份栽培品种和68 份野生大豆品种这两个基因的序列被分析[35],显示野生型大豆中大豆孢囊线虫抗性等位基因缺失,大豆孢囊线虫抗性基因可能是在大豆驯化过程中人工选育出来的。
2017年周航[36]对细胞分裂素信号转导具有反向调节作用的GmAP1.2基因在大豆中的功能进行了研究,探讨了其与GmARR10 的差别,为大豆抗逆和开花基因的发掘应用以及大豆分子育种提供了理论依据。
2018年葛逢勇[37]通过表型鉴定在大豆孢囊线虫表现广谱抗性的PI437654突变群体中,获得对大豆孢囊线虫4 号生理小种侵染表型发生变化的序列初步分析,以期后续研究最终鉴定出大豆抗大豆孢囊线虫4号生理小种基因。同年,张峰阁[38]研究表明,突变体ZK1917 和‘黑农35’在Dt2 和GmSOC1CDS 区未发生变异,通过对Dt1/Dt2/GmSOC1表达量的监控,发现目的基因可能在V2 期生长点通过影响GmSOC1 与Dt1的结合作用,从而释放Dt1 的表达,进而影响结荚习性。
此外,通过全基因组重测序技术,对大豆矮杆基因[39]、大豆根中磷酸盐缺乏的响应基因[40]、对黑豆抗胞囊线虫基因[41]等进行了相关研究,为大豆分子育种提供了理论依据。
随着第三代、第四代测序技术的不断完善和发展,将来测序成本会大幅度降低,测序的通量和准确性也会不断提高,高通量测序技术将成为一项常规的实验方法,通过这一方法,转基因技术在应用中遇到的一些问题将迎刃而解,比如大豆的许多经济性状是数量性状,受微效多基因控制,而且基因数量庞大,分离目的基因困难;外源DNA 直接导入,一般导入的是总DNA,缺乏标记基因,鉴定难度大;转化后表达基因的调控、标记基因的去除等,这些目前研究热点问题将会得到有效地解决。随着分子生物学的快速发展,全基因组重测序技术必将会在大豆育种中大显身手。最终人类将会突破了自然资源的限制,按照需要选择基因,更进一步的改造大豆的遗传物质,赋予其新的性状,大幅度提高了大豆的产量和品质,使大豆可能同时具有高产、优质、抗病虫、抗寒、抗旱、抗除草剂等多重优点。大豆育种已进入了新的时期。