甘蓝型油菜BnGS3和BnGhd7的同源克隆及其与油菜产量相关性状的关系

2018-03-01 08:45薛志飞李付鹏马朝芝
作物学报 2018年2期
关键词:甘蓝型同源结构域

薛志飞 王 夏 李付鹏 马朝芝

华中农业大学植物科学技术学院 / 作物遗传改良国家重点实验室 / 国家油菜工程技术研究中心, 湖北武汉 430070

油菜是世界上最主要的油料作物之一, 提高产量始终是油菜育种的一个重要目标。研究产量相关性状、发展分子标记进行辅助选择将是提高产量的有效途径。现已完成甘蓝型冬油菜品种 Tapidor全基因组测序, 预测有101 040个基因, 在测序植物中基因数目最多[1]。甘蓝型油菜(Brassica napus, AACC=38)是由白菜(Brassica rapa,AA=20)和甘蓝(Brassica oleracea, CC=18)自然杂交、加倍而成的异源四倍体[2], A/C基因组在进化过程中发生了大量的重组和突变, 增加了基因组结构的复杂性, 导致甘蓝型油菜功能基因组研究难度加大。油菜与水稻(Oryza sativa)基因组虽然差异大, 但仍然具有共线性[3]。作为高等模式生物, 水稻的大量功能基因已被克隆, 利用水稻基因序列克隆油菜同源基因, 很可能是研究油菜基因功能的有效手段。

无论水稻还是油菜, 生育期、千粒重和籽粒大小都是重要的产量相关性状, 控制这些性状的很多基因或 QTL已在水稻中被克隆。其中, GS3是控制粒长与千粒重的主效QTL, 同时也是粒宽和粒厚相关的微效QTL[4]; Ghd7同时影响株高、穗粒数和抽穗期等多个性状, 是一个控制水稻产量的多效基因[5]。GS3全长5363 bp, 其编码蛋白包含4个保守结构域, 分别是磷脂酞乙醇胺结合蛋白区域(phosphatidylethanolamine-binding protein, PEBP-like)、跨膜区域、生长因子受体家族富半胱氨酸同源区域(tumour necrosis factor receptor, TNFR或nerve growth factor receptor, NGFR)和 von Willebrand因子 C型结构域(von Willebrand factor type C, VWFC)[6]。Ghd7编码 257个氨基酸残基, 其蛋白 C端具有一个明显的 CCT (constans,constans-like, TOCl)结构域, 对控制植物花期的重要基因CO发挥核心功能, Ghd7缺少位于CO基因N端的另一个重要的B-BOX结构域[7]。甘蓝型油菜是否有GS3和Ghd7的同源基因, 其同源基因是否与生育期和千粒重等产量性状有关, 目前还未见相关的研究报道。

本研究根据水稻GS3和Ghd7基因序列, 通过比较基因组学方法, 克隆甘蓝型油菜的同源基因, 并对候选基因进行比较测序, 分析其与产量性状的相关性, 目的在于探究利用模式植物水稻功能基因信息研究油菜相关基因的可行性。

1 材料与方法

1.1 植物材料

选用58份甘蓝型油菜自交系和由Tapidor × Ningyou 7创建而来具有202个DH系(double haploid)的TN群体[8]。58份材料中, 自交不亲和系 SI-1300用于同源基因克隆,57份自交亲和系用于表型性状的相关分析, TN群体用于连锁图谱分析和基因定位。

1.2 表型调查与分析

2009年10月上旬, 将57份自交亲和系分别在湖北武汉和黄冈两地种植, 均采用随机区组设计, 3行区, 行距0.27 m, 行长3.50 m, 小区面积2.84 m2, 定苗后每行20株、每小区60株。记录初花期(小区内50%植株开第1朵花)和终花期日期, 分别计算播种–初花期、初花期–终花期的天数。成熟后随机连续取 10株, 考察株高、一次有效分枝数、单株角果总数、角果粒数、单株产量、千粒重和小区产量。

利用 SAS 9.4软件进行方差分析(ANOVA)以及表型与基因型的简单相关分析(simple correlation analysis)。

1.3 引物设计及同源基因克隆

使用天根公司植物基因组 DNA提取试剂盒(OSRM301)提取油菜苗期幼嫩叶片总DNA。

使用软件Oligo v. 7设计同源克隆引物。根据水稻GS3的 DNA序列(GenBank登录号为 AB743898.1)设计引物bngs-1-1、bngs-1-2和bngs-1-3 (见附表1), 但是该3对引物在甘蓝型油菜中没有特异扩增, 因此利用 GS3蛋白序列重新进行同源搜索, 获得同源的拟南芥NP_680175.2蛋白序列, 利用其对应的基因序列信息在NCBI中再次进行同源比对, 获得白菜型油菜的同源序列 AC189411.2。根据拟南芥NP_680175.2基因序列设计引物gs3-1和gs3-4,根据白菜型油菜AC189411.2的基因序列设计了3对引物,分别是gs3-2、gs3-3和gs3-5 (见附表1)。

水稻 Ghd7具有保守的 CCT结构域, CCT结构域是CO基因家族编码蛋白的核心功能域。同源比对发现Ghd7与甘蓝型油菜AY280868.2序列和拟南芥CO基因具有相似的同源性。根据水稻 Ghd7 (GenBank登录号为JF926542.1)、甘蓝型油菜AY280868.2的序列信息设计12对引物(见附表1)。

PCR体系使用1×扩增缓冲液配制, 加入2 mmol L–1的 MgCl2、0.1 mmol L–1的 dNTP、左右引物各 0.2 μmol L–1、0.5 U Taq酶、50 ng模板DNA, ddH2O定容至20 μL。PCR反应程序为94°C运行2 min, 94°C运行1 min, 55°C运行30 s, 72°C 运行 45 s, 35 个循环; 72°C 运行 5 min; 于 4°C保存产物。

1.4 候选基因及其编码产物的序列分析

用SSCP (single-strand conformation polymorphism)技术可以有效检测InDel和SNP所造成的序列差异, 但PCR产物需要经高温变性后才能检测到单链折叠的构象差异,已经被用来开发甘蓝型油菜分子标记[9]。考虑到SSCP对检测片段大小有严格要求, 在 8%聚丙烯酰胺凝胶的基础上, 又配制了3.5%和6%非变性聚丙烯酰胺凝胶, 分别检测>800 bp和400~500 bp的片段。使用天根公司纯化回收试剂盒(DP214)回收 PCR产物, 使用 pMD18-T Vector(TaKaRa)进行T-A克隆, 挑选转化的大肠杆菌感受态(K12菌株制备)阳性单克隆送北京擎科新业生物技术公司测序,使用软件SeqMan Pro (http://www.dnastar.com/)分析测序结果。

通过数据库 NCBI (https://www.ncbi.nlm.nih.gov/)分别对GS3、Ghd7的序列进行同源比对。用ClustalW完成多序列对位排列分析[10]; 利用在线软件 Softberry (http://www.softberry.com/)[11]和Genscan (http://genes.mit.edu/GENSCAN.html)预测基因结构, 用在线软件 InterProScan(http://www.ebi.ac.uk/interpro/search/sequence-search)[12-13]和 Conserved Domain Database (https://www.ncbi.nlm.nih.gov/cdd/)预测同源蛋白结构域。

1.5 基因型分析

参照 MapMaker/Exp 3.0[14-15]的方法记载分子标记的基因型。

2 结果与分析

2.1 GS3在甘蓝型油菜中的同源克隆

2.1.1 GS3在甘蓝型油菜中的同源克隆 根据水稻GS3基因序列设计的引物bngs-1-1、bngs-1-2和bngs-1-3,在甘蓝型油菜 SI-1300中为非特异扩增(图 1-A), 说明直接利用水稻序列设计引物不能在油菜上得到有效扩增。而根据白菜型油菜AC189411.2序列设计的3对引物则可检测到特异扩增产物(图 1-B)。扩增片段的测序结果与白菜型油菜AC189411.2序列一致, 拼接产生3040 bp的DNA片段。预测基因BnGS3位于拼接片段的1271~2965 bp处,有 6个外显子, 开放阅读框(ORF)全长 666 bp, 编码 222个氨基酸(图2)。

图1 根据同源序列设计引物的扩增结果Fig. 1 Amplification results of primers designed according to homologous sequences

图2 BnGS3基因结构预测Fig. 2 Prediction of BnGS3 gene construction by FGENSH 2.0

根据 BnGS3序列信息进行同源搜索, 发现与甘蓝型油菜EST序列DY004631同源性较高, 而BnGS3蛋白与GS3蛋白的序列同源性较低。借助预测蛋白的保守序列进行高级结构分析, 发现 BnGS3蛋白缺少跨膜区域、TNFR/NGFR和 PEBP-like的功能结构域, 只具有属于VWF结构域中的VWFA型的Iso_dh super family结构, 而GS3为VWFC型。甘蓝型油菜BnGS3与水稻GS3有一定的同源性, 但序列差异大。

2.1.2 Ghd7在甘蓝型油菜中的同源克隆 以甘蓝型油菜AY280868.2为模板设计的引物ghd7-2、ghd7-5、ghd7-6、ghd7-7和ghd7-9 (见附表1), 在甘蓝型油菜SI-1300中均有一条清晰扩增带(图3)。

图3 引物ghd7-2、ghd7-5、ghd7-6、ghd7-7和ghd7-9在甘蓝型油菜SI-1300中的扩增Fig. 3 Amplification of primers ghd7-2, ghd7-5, ghd7-6,ghd7-7, and ghd7-9 in B. napus SI-1300

扩增片段长度为 2725 bp, 测序结果与甘蓝型油菜AY280868.2一致。通过结构预测发现在714~2700 bp处存在一个候选基因 BnGhd7, 含有 1个外显子,ORF全长1014 bp, 编码337个氨基酸(图4)。

图4 BnGhd7基因结构预测Fig. 4 Prediction of BnGhd7 gene construction by FGENSH 2.0

根据BnGhd7的ORF序列进行同源搜索, 发现了多个高度同源的甘蓝型油菜EST序列。使用InterProScan软件对预测蛋白 BnGhd7进行结构分析, 发现了 2个重要的结构域,其中N端存在1个B-Box结构域, C端存在1个CCT结构域, 与水稻Ghd7有高度同源性, 属于典型的CO基因家族。

2.2 甘蓝型油菜BnGS3和BnGhd7基因的变异位点检测

2.2.1 BnGS3基因的变异位点检测 在 TN群体中随机选取15份材料, 通过引物gs3-2、gs3-3和gs3-5发现疑似变异位点, 但甘蓝型油菜作为异源四倍体存在基因多拷贝现象, 直接测序不能有效发现变异位点。根据测序结果重新设计了18对引物(编号brgs-1至brgs-18), 扩增范围介于400~1500 bp, 与引物gs3-2、gs3-3和gs3-5共同覆盖BnGS3的全长并形成有效重叠(见附表2)。通过SSCP技术在 57份材料中发现多个突变位点, 筛选突变频率大于5的位点, 绘制BnGS3的比较测序结果(图5)。

图5 BnGS3比较测序结果示意图Fig. 5 Schematic diagram of BnGS3 comparative sequencing

引物brgs-16扩增片段长851 bp, 具有突变频率最高的多态性位点, 位于BnGS3第4个外显子区域的1010 bp到1050 bp处, 属于缺失突变位点(图6)。brgs-16扩增片段完全包含在引物gs3-5的扩增区域内, 且测序结果一致,证明结果可靠。

图6 引物brgs-16扩增片段序列比较Fig. 6 Sequence alignment of amplified fragments in accessions by primer brgs-16

2.2.2 BnGhd7基因的变异位点检测 设计可以有效覆盖目标区段的 10对引物 ghd7-2、ghd7-5~ghd7-7、ghd7-9、brghd-1~brghd-3、brghd-7和 brghd-8 (见附表 2), 在 15份材料进行扩增。扩增片段测序, 仅有 2个有效突变位点,引物ghd7-7扩增片段在BnGhd7编码区下游有1个300 bp的缺失突变位点, 引物 brghd-3扩增片段在 BnGhd7起始位点上游700 bp处有1个突变位点(图7)。

图7 BnGhd7比较测序结果示意图Fig. 7 Schematic diagram of BnGhd7 comparative sequencing

引物ghd7-7扩增片段长 1578 bp, 该缺失位点介于 BnGhd7下游非编码区的 1488~1783 bp处。引物brghd-3位于 BnGhd7起始位点上游 700 bp处, 引物ghd7-2与brghd-3的重叠范围序列一致, 证明结果可靠(图 8)。

图8 不同材料中brghd-3测序结果的比较Fig. 8 Alignment of the sequencing results of brghd-3

表1 57份甘蓝型油菜自交系9个产量相关性状的变异Table 1 Variations of nine yield-related traits in 57 B. napus inbred lines

2.3 变异位点与产量相关性状的相关性分析

在武汉和黄冈两地, 分别对 57份甘蓝型油菜自交系进行产量相关性状的表型鉴定, 除武汉点播种至初花期天数外, 各性状的变异系数都超过5% (表1)。材料之间差异明显, 能够用来进行相关性分析。

分别将 3个标记brgs-16、ghd7-7和brghd-3与黄冈测得的表型数据进行相关性分析。BnGS3的标记brgs-16与表型数据不存在相关性。BnGhd7的标记brghd-3与千粒重显著相关, ghd7-7与花期显著负相关, 与株高极显著相关(表 2)。

表2 标记与产量等相关性状之间的相关分析结果(黄冈)Table 2 Correlation coefficients between markers and traits (site: Huanggang)

以 TN群体作为定位群体, 引物 brgs-15和引物ghd7-7在两亲本间具有多态性扩增产物。brgs-15是1个SSCP标记, 定位于A2连锁群(见附图1); ghd7-7是1个显性标记, 定位于A10连锁群(见附图2)。因而BnGS3和BnGhd7被分别定位于油菜A2和A10连锁群。

3 讨论

作为第1个基因组被完整测序的植物, 拟南芥成为遗传学、分子生物学等领域的典型研究对象[16]。对模式生物拟南芥的深入解析曾加速了水稻等一些更高等植物的研究[17]。近年来水稻作为高等模式生物成为新的研究热点并在基因组和功能基因的研究中取得了巨大成果[18]。禾本科作物水稻和十字花科芸薹属甘蓝型油菜在进化上亲缘关系较远, 在基因组结构和组成上存在很大差异, 缺乏利用水稻基因信息在甘蓝型油菜中克隆同源基因的报道, 但比较基因组学研究结果表明, 两种作物基因组仍然具有共线性。本研究利用水稻GS3和Ghd7的序列设计引物扩增油菜基因组 DNA, 没有扩增产物或无特异扩增。因而,尝试将拟南芥作为同源克隆的媒介, 首先通过 GS3的序列信息分别在拟南芥和白菜中发现了同源序列 NP_680175.2和AC189411.2, 分别设计引物, 但是, 只有依据白菜AC189411.2设计引物gs3-2、gs3-3和gs3-5在甘蓝型油菜 SI-1300中能有效扩增。同样地, 根据与 Ghd7同源的甘蓝型油菜AY280868.2序列设计引物, 在SI-1300有特异扩增带。说明利用远缘物种如水稻的功能基因进行油菜基因功能研究时, 借助拟南芥为媒介, 搜索油菜或其两个祖先种甘蓝和白菜序列的同源片段, 设计引物进行同源克隆, 是一种有效的途径。

本研究克隆到油菜基因BnGS3和BnGhd7, 比较基因变异位点得到BnGS3的多态性标记brgs-16、Bghd7的多态性标记brghd-3和brgs-16。BnGS3有6个外显子, ORF全长666 bp, 编码222个氨基酸。水稻GS3全长5363 bp,包含4个内含子和5个外显子, 阅读框长699 bp。GS3编码的蛋白由 232个氨基酸组成, 包含 4个保守的结构域,分别为磷脂酞乙醇胺结合蛋白区域(PEBP-like)、跨膜区域、生长因子受体家族富半胱氨酸同源区域(TNFR)/(NGFR)和von Willebrand因子C型结构域(VWFC)[19-20]。BnGS3虽然只具有水稻 GS3四个保守结构域中的 von Willebrand factor(VWF)结构, 且属于 A型(水稻为 C型),但该结构域已被发现存在于许多胞外蛋白中, 参与调节生长因子信号传导[21-22]。BnGS3的标记brgs-16与产量性状不存在相关性。因而甘蓝型油菜BnGS3与水稻GS3有一定的同源性, 但基因功能上的相似性需要进一步验证。

BnGhd7含有1个外显子, ORF全长1014 bp, 编码337个氨基酸。BnGhd7蛋白具有N端的B-Box和C端的CCT两个重要的结构域, 据此认为属于CO基因家族, 与水稻Ghd7有高度同源性, 植物中 CO基因家族在调控开花期上发挥重要功能[23-24]。相关性分析发现BnGhd7不仅与花期相关, 也与株高和千粒重相关, BnGhd7很可能与水稻Ghd7具有相似的功能。

BnGS3和BnGhd7被分别定位在油菜A2连锁群、A10连锁群。A2连锁群存在大量产量及相关性状的 QTL, 包括花期、株高、全株角果数、角果粒数、千粒重、种子产量等[25]。由于 brgs-15标记位于连锁群末端, 与 A2连锁群包含的产量性状相关性低, 因而BnGS3的标记brgs-16与产量性状不存在相关性。ghd7-7被定位到A10连锁群,该区域同样存在大量产量及相关性状QTL, 包括产量、花期、成熟期、株高、全株角果数、千粒重和种子产量等性状[26-27]。A10连锁群上与花期相关的QTL区间与拟南芥第5染色体顶端的区间具有共线性, 在该区域具有拟南芥开花基因CO、FY和FLC等, 而ghd7-7也被定位于该区间内。

[1]Chalhoub B, Denoeud F, Liu S, Parkin I A, Tang H, Wang X,Chiquet J, Belcram H, Tong C, Samans B, Corréa M. Early allopolyploid evolution in the post-neolithic Brassica napus oilseed genome. Science, 2014, 345: 950–953

[2]Nagaharu U. Genome analysis in Brassica with special reference to the experimental formation of B. napus and peculiar mode of fertilization. Jpn J Bot, 1935, 7: 389–452

[3]Devos K M, Gale M D. Genome relationships: the grass model in current research. Plant Cell, 2000, 12: 637–646

[4]Fan C, Xing Y, Mao H, Lu T, Han B, Xu C, Li X, Zhang Q. GS3,a major QTL for grain length and weight and minor QTL for grain width and thickness in rice, encodes a putative transmembrane protein. Theor Appl Genet, 2006, 112: 1164–1171

[5]Xue W, Xing Y, Weng X, Zhao Y, Tang W, Wang L, Zhou H, Yu S,Xu C, Li X, Zhang Q. Natural variation in Ghd7 is an important regulator of heading date and yield potential in rice. Nat Genet,2008, 40: 761–767

[6]Mao H, Sun S, Yao J, Wang C, Yu S, Xu C, Li X, Zhang Q.Linking differential domain functions of the GS3 protein to natural variation of grain size in rice. Proc Natl Acad Sci USA, 2010,107: 19579–19584

[7]Wang C, Chen S, Yu S. Functional markers developed from multiple loci in GS3 for fine marker-assisted selection of grain length in rice. Theor Appl Genet, 2011, 122: 905–913

[8]Trick M, Long Y, Meng J, Bancroft I. Single nucleotide polymorphism (SNP) discovery in the polyploid Brassica napus using Solexa transcriptome sequencing. Plant Biotechnol J, 2009, 7:334–346

[9]李媛媛, 陈庆芳, 傅廷栋, 马朝芝. 利用 SSCP技术分析甘蓝型油菜10个功能基因序列差异. 作物学报, 2012, 38: 43–49 Li Y Y, Chen Q F, Fu T D, Ma C Z. Polymorphism analysis of ten functional genes in Brassica napus using SSCP method. Acta Agron Sin, 2012, 38: 43–49 (in Chinese with English abstract)

[10]Thompson J D, Gibson T, Higgins D G. Multiple sequence alignment using ClustalW and ClustalX. In: Current Protocols in Bioinformatics, John Wiley and Sons, 2002. pp 2–3

[11]Shahmuradov I A, Gammerman A J, Hancock J M, Bramley P M,Solovyev V V. PlantProm: a database of plant promoter sequences. Nucl Acids Res, 2003, 31: 114–117

[12]Zdobnov E M, Apweiler R. InterProScan: an integration platform for the signature-recognition methods in InterPro. Bioinformatics,2001, 17: 847–848

[13]Quevillon E, Silventoinen V, Pillai S, Harte N, Mulder N, Apweiler R, Lopez R. InterProScan: protein domains identifier. Nucleic Acids Res, 2005, 33: W116–W120

[14]Lander E S, Green P, Abrahamson J, Barlow A, Daly M J, Lincoln S E, Newburg L. MAPMAKER: an interactive computer package for constructing primary genetic linkage maps of experimental and natural populations. Genomics, 1987, 1:174–181

[15]Lincoln S E, Daly M J, Lander E S. Constructing genetic linkage maps with MAPMAKER/EXP Version 3.0: a tutorial and reference manual. In: A Whitehead Institute for Biomedical Research Technical Report, 1993. pp 78–79

[16]Arabidopsis Genome Initiative. Analysis of the genome sequence of the flowering plant Arabidopsis thaliana. Nature, 2000,408:796

[17]Meyerowitz E M. Prehistory and history of Arabidopsis research.Plant Physiol, 2001, 125: 15–19

[18]Zhang Q, Li J, Xue Y, Han B, Deng X W. Rice 2020: a call for an international coordinated effort in rice functional genomics. Mol Plant, 2008, 1: 715–719

[19]Mao H, Sun S, Yao J, Wang C, Yu S, Xu C, Li X, Zhang Q.Linking differential domain functions of the GS3 protein to natural variation of grain size in rice. Proc Natl Acad Sci USA, 2010,107: 19579–19584

[20]Wang C, Chen S, Yu S. Functional markers developed from multiple loci in GS3 for fine marker-assisted selection of grain length in rice. Theor Appl Genet, 2011, 122: 905–913

[21]Abreu J G, Coffinier C, Larraın J, Oelgeschläger M, De Robertis E M. Chordin-like CR domains and the regulation of evolutionarily conserved extracellular signaling systems. Gene, 2002, 287:39–47

[22]O’Leary J M, Hamilton J M, Deane C M, Valeyev N V, Sandell L J, Downing A K. Solution structure and dynamics of a prototypical chordin-like cysteine-rich repeat (von Willebrand Factor type C module) from collagen IIA. J Biol Chem, 2004, 279:53857–53866

[23]Nemoto Y, Kisaka M, Fuse T, Yano M, Ogihara Y. Characterization and functional analysis of three wheat genes with homology to the CONSTANS flowering time gene in transgenic rice. Plant J, 2003, 36: 82–93

[24]Miller T A, Muslin E H, Dorweiler J E. A maize CONSTANS-like gene, conz1, exhibits distinct diurnal expression patterns in varied photoperiods. Planta, 2008, 227: 1377–1388

[25]Li Y, Shen J, Wang T, Chen Q, Zhang X, Fu T, Meng J, Tu J, Ma C. QTL analysis of yield-related traits and their association with functional markers in Brassica napus L. Aust J Agric Res, 2007,58: 759–766

[26]Shi J, Li R, Qiu D, Jiang C, Long Y, Morgan C, Bancroft I, Zhao J, Meng J. Unraveling the complex trait of crop yield with quantitative trait loci mapping in Brassica napus. Genetics, 2009, 182:851–861

[27]Qiu D, Morgan C, Shi J, Long Y, Liu J, Li R, Zhuang X, Wang Y,Tan X, Dietrich E, Weihmann T. A comparative linkage map of oilseed rape and its use for QTL analysis of seed oil and erucic acid content. Theor Appl Genet, 2006, 114: 67–80

猜你喜欢
甘蓝型同源结构域
Bna-miR171g提高甘蓝型油菜耐渗透胁迫能力的功能鉴定
基于“乙癸同源”理论辨治股骨头缺血性坏死
细菌四类胞外感觉结构域的概述
拟南芥START 结构域亚家族生物信息学分析及功能
甘蓝型油菜白花基因InDel连锁标记开发
以同源词看《诗经》的训释三则
UBR5突变与淋巴瘤B细胞成熟
以六倍体(AnAnCnCnCoCo)为桥梁创制抗旱新型甘蓝型油菜(AnArCnCo)
“铤”有“直”义的词源学解释——兼说/直/义的同源词族
同源宾语的三大类型与七项注意