刘蕾+宋佳+王辉
摘要:以拟南芥中控制硫苷生物合成相关基因家族FMOGS-OX位点基因全长编码区及蛋白为参考序列,在甘蓝(Brassica oleraceae L.)基因组数据库中进行Blastn和Blastp检索,得到具备Score≥100、E值≤10-10、coverage ≥70%条件的甘蓝注释基因作为候选拟南芥FMOGS-OX的同源基因,并进一步进行同源性比较、基因结构比较及序列聚类分析。结果显示,在甘蓝中发现3个旁系同源基因Bol010993、Bol029100、Bol031350。甘蓝和拟南芥FMOGS-OX同源基因之间在核酸水平上的相似性为69.4%~83.0%;甘蓝3个FMOGS-OX旁系同源基因间的相似性保持在70.0%~840%。甘蓝Bol010993与拟南芥FMOGS-OX1~FMOGS-OX4的结构较为相似,而Bol029100、Bol031350与拟南芥FMOGS-OX5的结构较相似。系统进化分析及共线性分析初步确定,甘蓝中分别存在1个FMOGS-OX2(Bol010993)和2个FMOGS-OX5(Bol029100、Bol031350)基因。
关键词:十字花科;甘蓝;硫代葡萄糖苷;FMOGS-OX基因
中图分类号: S635.03文献标志码: A文章编号:1002-1302(2017)11-0022-04
人们对甘蓝的重视主要源于甘蓝中含有一种重要的植物次生代谢产物——硫代葡萄糖苷,它影响着十字花科植物的风味,同时在医学上具有一定的保健功能,还有生物防御功能。硫代葡萄糖苷(简称硫苷),又叫芥子油苷,甘蓝等十字花科植物中含有硫代葡萄糖苷,硫代葡萄糖苷的基本结构为1个β-D-葡萄糖,连接1个磺酸盐醛肟基团和1个来源于氨基酸的侧链[4]。目前已经有很多科学家研究植物中的硫代葡萄糖苷,而且对硫代葡萄糖苷作了进一步分析。已有120多种不同的硫代葡萄糖苷被发现[5-6],它们主要分布在白菜、甘蓝、油菜、芥菜、花椰菜、芜菁、萝卜等十字花科植物中,并且几乎所有的十字花科植物都能合成硫苷[6-7]。硫代葡萄糖苷存在于这些植物的根、茎、叶、种子中,在种子中含量最多。人们从芥菜中分离出的第一种硫苷是丙烯基硫苷(singapore)[8]。这些结果引起了人们的广泛关注。
拟南芥中FMOGS-OX基因在十字花科中存在一个独特的亚家族FMOGS-OX1 ~ FMOGS-OX5,并且FMOGS-OX1 ~ FMOGS-OX5各突变体均使磺酰硫苷占总硫苷的比例大大降低[9-11]。另外,酶学试验证实,不同的FMOGS-OX对侧链长度存在特异性[9-10]。十字花科蔬菜中具有的抗癌物质磺酰脂肪族硫苷是FMOGS-OX基因的直接催化产物,因此,研究FMOGS-OX基因具有深远的生物技术前景[12]。本研究在甘蓝基因组测序大背景下,利用生物信息分析为主要技术手段,充分挖掘甘蓝基因组数据库,并对甘蓝FMOGS-OXS候选基因进行预测及分析。本研究将为甘蓝FMOGS-OXS基因的克隆、甘蓝硫苷积累的分子机理的探索及富含有益硫苷甘蓝新品种的选育提供理论基础。
1材料与方法
1.1试验材料
拟南芥FMOGS-OX家族所包含的5个基因(At1g65860、At1g62540、At1g62560、At1g62570、At1g12140)均来源于TAIR数据库(www.arabidopsis.org);甘蓝基因组及基因注释数据库来源于NCBI(www.ncbi.nlm.nih.gov);白菜BrFMOGS-OX基因来源于BRAD(http://Brassicadb.org),并参考Wang等的研究结果[13];系统进化树构建所涉及蛋白序列均来源于UniProt(www.uniprot.org)、TAIR(www.arabidopsis.org)和BRAD(http://Brassicadb.org)。
1.2试验方法
利用拟南芥FMOGS-OX1 ~ FMOGS-OX5基因的全长编码区序列在甘蓝基因组及注释基因数据库中进行Blastn、Blastp检索,得到具备Score ≥100、E值 ≤10-10、coverage ≥70%的甘蓝基因组注释基因作为候选拟南芥FMOGS-OX基因的同源基因。采用MEGA软件进行多序列比对及聚类分析[14]。序列相似性分析和点阵图制作分别采用EMBOSS软件包的Needle程序和polydot程序(emboss.sourceforge.net)。
2结果与分析
2.1甘蓝FMOGS-OX位点基因的预测
在甘蓝基因组和44 940个注释基因 (来源于http://brassicadb.org/brad) 的基础上,针对拟南芥FMOGS-OX家族中5个硫苷生物合成基因(FMOGS-OX1、FMOGS-OX2、FMOGS-OX3、FMOGS-OX4、FMOGS-OX5)采用Blastn、Blastp程序对甘蓝中FMOGS-OX家族相关基因进行检索分析。对应5个拟南芥FMOGS-OX基因,在甘蓝中共找到了3个同源基因(Bol010993、Bol029100、Bol031350)。
拟南芥中FMOGS-OX基因在脂肪族硫苷侧链修饰途径中起着重要作用,其所编码的黄素单加氧酶具有使侧链上的硫发生氧化的作用[7]。拟南芥中该家族存在5个旁系同源基因FMOGS-OX1、FMOGS-OX2、FMOGS-OX3、FMOGS-OX4、FMOGS-OX5,均位于擬南芥第1号染色体上,其中FMOGS-OX2(At1g62540)、FMOGS-OX3(At1g62560)、FMOGS-OX4(At1g62570)为tandem基因。甘蓝中预测的3个FMOGS-OX基因中的Bol029100、Bol031350均分布在第8号染色体上,而Bol010993存在于Scaffold000215,目前该scaffold尚未定位到相应的染色体上。
2.2甘蓝FMOGS-OX基因与拟南芥FMOGS-OX基因的同源比较
由表2可知,拟南芥和甘蓝FMOGS-OX基因在外显子数目、外显子大小及编码区长度等方面较为类似。拟南芥
FMOGS-OX1~FMOGS-OX4均含有7个外显子,并且不同旁系同源基因间各相应外显子的长度非常接近,仅有FMOGS-OX3在外显子1中多3 bp,另外,FMOGS-OX1~FMOGS-OX4的外显子7稍有差别(分别为216、210、222、222 bp)。尽管拟南芥FMOGS-OX5与FMOGS-OX1~FMOGS-OX4相比缺少2个外显子,但有趣的是 FMOGS-OX5外显子4的长度为219 bp,等于FMOGS-OX1~FMOGS-OX4各基因的外显子4与外显子5的长度之和(83 bp+136 bp=219 bp);同样地,FMOGS-OX5的外显子5长度为 390 bp,等于FMOGS-OX1的外显子6与外显子7的长度之和(174 bp+216 bp=390 bp),并且与另外3个旁系同源基因FMOGS-OX2~FMOGS-OX4的外显子6与外显子7的长度之和(384 bp、396 bp、396 bp)非常接近。拟南芥中5个旁系同源基因在全基因长度、编码区长度、编码区所占全基因的比例均较为相似。甘蓝FMOGS-OX的3个旁系同源基因中Bol010993存在7个外显子,而Bol029100、Bol031350均含5个外显子。另外,甘蓝FMOGS-OX基因在全基因长度方面差异较大,Bol010993最长,为5 853 bp,Bol031350最短,仅为1 795 bp。甘蓝FMOGS-OX的3个旁系同源基因的编码区长度差别不大,其长度分别为1 386、1 347、1 380 bp。对甘蓝和拟南芥FMOGS-OX基因各外显子区比对后发现,各同源基因外显子1~外显子3长度较为相似;甘蓝Bol010993与拟南芥FMOGS-OX1~FMOGS-OX4非常类似,尤其与FMOGS-OX4在外显子数目及大小方面完全相同;而甘蓝Bol029100、Bol031350则与拟南芥FMOGS-OX5较为类似,均含有5个外显子,特别是外显子4与FMOGS-OX5的外显子4长度相同,均为219 bp。拟南芥和甘蓝FMOGS-OX基因编码区所占全基因的比例显示5个拟南芥FMOGS-OX基因的编码区所占全基因的比例均在40%左右,其中FMOGS-OX2最小,为35.02%,FMOGS-OX3最大,为4913%;而甘蓝中3个旁系同源基因的编码区所占全基因的比例差异明显,分别为23.68%、70.30%、76.88%。表2拟南芥和甘蓝FMOGS-OX位点基因外显子数目、大小及所占基因比例等2.4主要十字花科植物FMOGS-OX位点基因的系统进化分析
对拟南芥(AT)、白菜(CC)、甘蓝3个已有参考基因组物种的FMOGS-OX位点蛋白序列进行系统聚类分析。由图2可知,拟南芥FMOGS-OX1~FMOGS-OX4基因之间亲缘关系较近,而它们与FMOGS-OX5基因的距离相对较远。参考甘蓝基因组与拟南芥基因组、甘蓝基因组与白菜基因组间的共线性,初步确定甘蓝中分别存在1个FMOGS-OX2(Bol010993)和2个FMOGS-OX5(Bol029100、Bol031350)基因。同时发现,Bol010993与白菜FMOGS-OX2(Bra027035)聚在同一分支,Bol029100、Bol031350分别与白菜FMOGS-OX5(Bra016787、Bra026988、C5H9Q6)距离较近,这与甘蓝、白菜(均为芸薹属)的亲缘关系较近。
3小结与讨论
本研究借助生物信息分析手段和技术,在甘蓝中预测到3个FMOGS-OX旁系同源候选基因(Bol010993、Bol029100、Bol031350)。甘蓝和拟南芥FMOGS-OX同源基因间在核酸水平上的相似性为69.4%~83.3%;甘蓝3个FMOGS-OX旁系同源基因间的相似性保持在70.0%~84.0%。甘蓝Bol010993与拟南芥FMOGS-OX1~FMOGS-OX4基因结构较为相似,而Bol029100、Bol031350与拟南芥FMOGS-OX5基因的结构更为类似。系统进化分析及共线性分析初步确定,甘蓝中存在1个FMOGS-OX2(Bol010993)和2个FMOGS-OX5基因(Bol029100、Bol031350)。
拟南芥、甘蓝、白菜基因组大小分别为157、520、485 Mb[4,15-16],而且有研究表明,白菜和甘蓝基因组存在多倍化事件[13]。与多倍化事件理论上伴随的同源基因多拷贝现象相悖,在拟南芥中存在5个FMOGS-OX旁系同源基因,与Wang等在白菜中的研究结果[16]类似,甘蓝中也发现3个旁系同源基因,这也暗示在拟南芥进化途径中,出现过FMOGS-OX基因的复制、转座、重组等现象,其中FMOGS-OX2~FMOGS-OX4为tandem基因,FMOGS-OX5中存在外显子融合等现象也从侧面印证了这一推测[12]。
拟南芥FMOGS-OX基因家族包含FMOGS-OX1~FMOGS-OX5 5个基因,FMOGS-OX1~FMOGS-OX5各突变体均大大降低磺酰脂肪族硫苷的数量,并且FMOGS-OX各基因还对脂肪族硫苷侧链存在特异性[9-10,13]。有研究认为,甘蓝中4-甲基亚磺酰-3-丁烯硫苷(gucoraphanin,GRA)的含量較高,也是公认的抗癌蔬菜紫甘蓝和青花菜(均为甘蓝类蔬菜)的主要抗癌活性成分[11],因此,FMOGS-OX基因具有广泛的生物技术应用前景[17]。由于拟南芥中存在5个FMOGS-OX旁系同源基因,这样使得拟南芥中硫苷的遗传变异更为复杂;而在甘蓝中仅发现了3个FMOGS-OX旁系同源基因(Bol010993为FMOGS-OX2,Bol029100、Bol031350均为FMOGS-OX5),这有利于进一步人为操纵甘蓝中磺酰硫苷的结构和数量。
参考文献:
[1]董静,王利国. 甘蓝发酵过程中亚硝酸盐含量的变化规律及降低方法[J]. 江苏农业学报,2015,31(5):1161-1165.
[2]顾闽峰,王乃顶,王伟义,等. NaCl胁迫对结球甘蓝幼苗生长及体内离子分布的影响[J]. 江苏农业学报,2015,31(3):638-644.
[3]Ishida M,Hara M,Fukino N,et al. Glucosinolate metabolism,functionality and breeding for the improvement of Brassicaceae vegetables[J]. Breeding Science,2014,64(1):48-59.
[4]李蔚,刘莉莎,李仁,等. 十字花科蔬菜基因组含量的测定与分析[J]. 植物遗传资源学报,2011,12(1):103-106.
[5]Grubb C D,Abel S. Glucosinolate metabolism and its control[J]. Trends in Plant Science,2006,11(2):89-100.
[6]Halkier B A,Gershenzon J. Biology and biochemistry of glucosinolates[J]. Annual Review of Plant Biology,2006,57:303-333.
[7]廖小軍,胡小松,辛力. 食品和饲料中硫代葡萄糖苷及其降解产物[J]. 食品科学,1999,20(12):19-21.
[8]何榕,姜子涛,李荣. 硫代葡萄糖苷的定量分析研究进展[J]. 食品研究与开发,2006(7):206-209.
[9]Hansen B G,Kliebenstein D J,Halkier B A. Identification of a flavin-monooxygenase as the S-oxygenating enzyme in aliphatic glucosinolate biosynthesis in Arabidopsis[J]. Plant Journal,2007,50(5):902-910.
[10]Li J,Hansen B G,Ober J A,et al. Subclade of flavin-monooxygenases involved in aliphatic glucosinolate biosynthesis[J]. Plant Physiology,2008,148(3):1721-33.
[11]Schlaich N L. Flavin-containing monooxygenases in plants:looking beyond detox[J]. Trends in Plant Science,2007,12(9):412-418.
[12]Juge N,Mithen R F,Traka M. Molecular basis for chemoprevention by sulforaphane:a comprehensive review[J]. Cellular & Molecular Life Sciences,2007,64(9):1105-1127.
[13]Wang X W,Wang H Z,Wang J,et al. The genome of the mesopolyploid crop species Brassica rapa[J]. Nature Genetics,2011,43(10):1035-1039.
[14]Tamura K,Dudley J,Nei M,et al. MEGA4:molecular evolutionary genetics analysis (MEGA) software version 4.0[J]. Molecular Biology & Evolution,2007,24(24):1596-1599.
[15]Johnston J S,Pepper A E,Hall A E,et al. Evolution of genome size in Brassicaceae[J]. Annals of Botany,2005,95(1):229-235.
[16]Wang H,Wu J,Sun S,et al. Glucosinolate biosynthetic genes in Brassica rapa[J]. Gene,2011,487(2):135-142.
[17]董莉,任雪松,李成琼,等. 甘蓝硫甙组分和含量分析[J]. 西南大学学报(自然科学版),2012,34(12):34-38.焦翠翠,郭妍妍,吴均章,等. 水稻Ds标记的曲穗突变体的分子鉴定[J]. 江苏农业科学,2017,45(11):26-29.