宋佳 王珏 刘蕾 王辉
摘要:以拟南芥中控制硫苷生物合成相关基因家族GS-Elong的全长CDS及蛋白序列为参考序列,在甘蓝(Brassica oleracea L.)基因组数据库中进行BLASTN和BLASTP检索,得到具备Score≥100、E-value≤10-10。和Coverage I>70%条件的甘蓝注释基因作为拟南芥GS-Elong位点基因的候选同源基因,并进一步对其进行同源性和基因结构比较及聚类分析。结果显示,在甘蓝GS-Elong位点发现4个旁系同源基因(Bo1020647、Bo1017070、B01037823和B01017071)。甘蓝和拟南芥GS-Elong位点同源基因在核酸水平上的一致性为66.1%~84.3%;甘蓝4个旁系同源基因问的一致性在62.0%~83.7%之间。甘蓝和拟南芥GS-Elong位点基因在外显子数目、大小方面高度一致,但B01017071和B01037823分别较拟南芥GS-Elong位点基因少3个和1个外显子。系统进化及共线性分析初步确定,甘蓝中存在2个BoMAM1(B01017070和B01020647)和2个BoMAM3(B01017071和B01037823)。
关键词:十字花科植物;甘蓝;硫代葡萄糖苷;GS-Elong
中图分类号:S635:Q781 文献标识号:A 文章编号:1001—4942(2016)03—0005—04
甘蓝(BrCLssica oleracea L.)为十字花科芸薹属植物,源于地中海至北海沿岸,是世界上广泛种植培育的一种蔬菜,具有较高的经济和食用价值。随着生活水平的提高,人们对蔬菜作物的营养品质及保健作用要求也逐渐提高。甘蓝类蔬菜作物是人们公认的抗癌蔬菜之一,其抗癌活性主要来源于包括异硫氰酸盐在内的硫代葡萄糖苷。硫代葡萄糖苷(Glucosinolate)简称硫苷,又叫芥子油苷(Mustard oil glucoside),是植物中一种富含硫和氮的次生代谢产物。目前已明确结构的硫苷至少有120种,其中大多数分布于十字花科植物中,它们作为风味物质存在于十字花科蔬菜和调味类作物中而被人类社会认识已久。在近几十年中人们渐渐发现,这种含氮和硫的植物次生代谢物质具有抗癌、生物杀菌和保护植物作用,其重要性越来越受到人们的重视和关注。例如,保健蔬菜西兰花中的抗癌活性物质萝卜硫素(Sulforaphane)就是4-甲基亚磺酰丁基硫苷(Glucoraphanin,GRA)的降解产物。
通过对拟南芥中控制脂肪族硫苷侧链长度的GS-Elong QTL位点的克隆,人们发现了三个基因MAM1、MAM2和MAM3。研究发现,MAM1在侧链延伸的前3个循环中具有催化作用,MAM2仅对第1个循环起作用,而MAM3负责前6个循环。基因敲除显示,MAM2只对参与1次侧链延伸的脂肪族硫苷生成具有重要作用,MAMl主要控制参与2次侧链延伸循环的脂肪族硫苷的合成,MAM3则可以生成所有长度的脂肪族硫苷,但特别容易生成发生1次、5次和6次循环的硫苷。在所有的拟南芥基因型中,仅有1个(Sorbo)同时存在MAMl和MAM2,其它的只含有MAMl和MAM2中的1个。MAM位点的多态性导致了硫苷结构的多样性,这可能是为了更好地适应生态环境的挑战。
CS-Elong位点负责拟南芥和芸薹属植物中占主导地位的3或4碳脂肪族硫苷的产生,在Streptanthus中,GS-Elong位点也负责5碳硫苷的生成,在其它物种中甚至负责更长碳链硫苷的合成,这可能是由位点的进化引起的。GS-Elong位点基因编码MAM酶家族,该酶家族既直接影响硫苷侧链长度,也通过控制GS-PRO位点进一步影响硫苷侧链不同基团的形成。
CS-Elong的功能在拟南芥中研究得比较透彻,但在甘蓝中的研究很少。本研究主要以生物信息学分析为主要技术手段,充分详细地挖掘甘蓝EST数据库,并对甘蓝GS-Elong候选基因进行预测分析和讨论,为甘蓝GS-Elong基因的克隆以及硫苷甘蓝新品种的选育提供理论基础。
1材料与方法
1.1试验材料
拟南芥GS-Elong位点基因(At5g23010、At5g23020和AJ486899)均来源于TAIR(www.ar-abidopsis.org)和NCBI数据库(www.ncbi.nlm.nih.gov);甘蓝基因组及基因注释数据库来源于NCBI(http:∥Brassicadb.org);白菜GS-Elong基因来源于BRAD(http:∥Brassieadb.org),并且参考Wang等的研究;系统进化树构建所涉及蛋白序列均来源于UniProt(WWW.uniprot.org)、TAIR(www.arabidopsis.org)和BRAD(http:∥Brassi-cadb.org)。
1.2试验方法
利用拟南芥GS-Elong基因的全长CDS及蛋白序列在NCBI(www.ncbi.nlm.nih.gov)中对甘蓝基因组及注释基因数据库进行BLASTN及BLASTP检索,得到具备Score≥100、E-value≤1010。和Coverage≥70%条件的甘蓝注释基因作为拟南芥GS-Elong位点基因的候选同源基因。多序列比对及聚类分析采用Mega软件。序列一致性分析和点阵图分别采用EMBOSS软件包的Needle程序和Polydot程序(emboss.source-forge.net)。
2结果与分析
2.1甘蓝GS-Elong位点基因的预测
针对拟南芥GS-Elong位点中3个硫苷生物合成基因(MAM1、MAM2和MAM3),采用BLASTN和BLASTP程序对甘蓝基因组和44 940个注释基因(http:∥brassicadb.org/brad/)进行检索分析,共发现4个同源基因(B01020647、B01017070、B01037823和Bol017071)。
GS-Elong位点基因是脂肪族硫苷侧链延伸的直接作用基因,拟南芥中该位点存在的3个旁系同源基因MAM1、MAM2和MAM3均位于第5号染色体,并且MAM1(At5g23010)与MAM3(At5g23020)为tandem基因。甘蓝中该位点预测的4个基因中的2个tandem基因B01017070和B01017071位于第6号染色体,另外2个基因B01020647和B01037823分别位于第3号和第4号染色体。
2.2甘蓝与拟南芥GS—Elong位点基因的同源比较
经在核酸水平上的一致性比较发现,甘蓝和拟南芥GS-Elong位点基因高度同源(表1),拟南芥3个旁系同源基因问的一致性在82.7%~97.2%之间,其中MAM1和MAM2间的一致性高达97.2%。甘蓝4个旁系同源基因与拟南芥同源基因的一致性维持在66.1%~84.3%之间;其中B01017070、B01020647与拟南芥同源基因问的一致性较高,均在80%以上;B01037823与拟南芥同源基因问一致性次之,在72.5%以上;B01017071与拟南芥同源基因问的一致性最低,维持在66%左右。甘蓝4个旁系同源基因问的一致性保持在62.0%~83.7%之间,其中B01017071与甘蓝中其他同源基因存在62.0%~67.3%的一致性,其他3个同源基因间的一致性则维持在比较高的水平(73.8%~83.7%)。
2.3拟南芥和甘蓝GS-Elong位点基因结构比较
拟南芥与甘蓝GS-Elong位点同源基因结构比较如图1所示,6个基因整体结构较为类似,尤其是外显子数目和大小高度一致,只有B01017071和B01037823分别较拟南芥GS-Elong位点基因少3个和1个外显子,内含子的大小是导致各GS-Elong位点基因全长存在较大差异的主要原因。
拟南芥和甘蓝GS-Elong位点在基因外显子数目、大小及所占基因比例等方面的比较如表2所示,拟南芥MAM1和MAM3均包含10个外显子,并且其全基因长度、CDS长度、CDS所占全基因的比例均较为一致,仅在Exon10上MAM1较MAM3多9个碱基。甘蓝GS-Elong位点的4个基因在全基因长度方面差异较大,B01037823最长,为4258 bp;B01017070最短,为2795 bp。拟南芥和甘蓝GS-Elong位点CDS长度差别不大,B01017070最长,为1 527 bp;B01017071最短,为1236 bp。B01017070、B01017071、B01020647和B01037823分别含有10、7、10和9个外显子。B01017070的Exonl~Exon8与拟南芥GS-Elong位点基因大小一致,仅在Exon9和Exon10中稍有差别;B01017071缺少Exon7、Exon8和Exon10,另外Exonl和Exon9较拟南芥GS-Elong位点基因分别少15和3个碱基;B01020647的Exon2~Ex-on9与拟南芥GS-Elong位点基因大小一致,而Exonl少12个碱基,Exon10稍长于拟南芥GS-Elong位点基因;B01037823在Exon2、Exon3、Ex-or6~Exon9与拟南芥GS-Elong位点基因保持一致,但缺少Exon4,另外,Exonl和Exonl0较短。拟南芥和甘蓝GS-Elong位点基因CDS所占全基因的比例在各基因间存在较大差别,其中拟南芥MAM1和MAM3所占比例相差较小,分别为40.00%和40.66%;而甘蓝4个基因的比例范围相差较大,为30.58%~54.63%,其中B01037823最小,B01017070最大。
2.4 GS-Elong位点基因的系统进化分析
对拟南芥(AT)、白菜(CC)和甘蓝(B0)3个已有参考基因组物种的GS-Elong位点蛋白序列进行系统聚类分析,结果(图2)显示,拟南芥MAM1与MAM2亲缘关系较近,与MAM3亲缘关系相对较远。参考甘蓝和拟南芥基因组、甘蓝和白菜基因组间的共线性,初步确定甘蓝中分别存在2个BoMAM1(Bo1017070和Bo1020647)和2个BoMAM3(Bo1017071和Bo1037823)。
3小结与讨论
本研究借助生物信息学分析技术,在甘蓝GS-Elong位点预测到4个旁系同源候选基因(Bol020647、Bol017070、Bol037823和Bol017071)。甘蓝和拟南芥GS-Elong位点同源基因间在核酸水平上的一致性为66.1%~84.3%;甘蓝GS-Elong位点4个旁系同源问的一致性保持在62.0%~83.7%之间。甘蓝和拟南芥GS-Elong位点基因在外显子数目、大小方面高度一致,但其中2个甘蓝GS-Elong位点基因Bol017071和B01037823分别较拟南芥GS-Elong位点基因少3个和1个外显子。系统进化及共线性分析初步确定,甘蓝中分别存在2个BoMAM1(Bol017070和Bol020647)和2个BoMAM3(Bol017071和Bol037823)。
拟南芥、甘蓝和白菜基因组大小分别为157、520 Mb和485 Mb。有研究表明白菜和甘蓝基因组存在多倍化事件,与多倍化事件理论上伴随的同源基因多拷贝现象相呼应,在拟南芥中存在3个MAM旁系同源基因(其中MAM2仅在拟南芥1个生态型中出现),在白菜中发现了7个旁系同源基因(http:∥Brassicadb.org),本研究在甘蓝中发现4个旁系同源基因。本研究结果为利用生物技术手段人为操纵甘蓝中有益硫苷的结构和数量、创制甘蓝新品种及今后甘蓝基因组学的研究奠定基础。