张滨烁,赵婉婷,张嘉嘉,李青峰,张璐璐,梁雪玉,苏安玉,于振海,李松竹,武小霞,赵莹**
(1.东北农业大学农学院,哈尔滨 150030;2.黑龙江省依安县农业技术推广中心,黑龙江 齐齐哈尔 161500;3.黑龙江省萝北县农业技术推广中心,黑龙江 鹤岗 154100)
大豆作为植物蛋白、食用油脂和蛋白饲料,在全世界范围内广泛种植[1]。随着人们生活水平提高和养殖业迅速发展,我国豆油和饲料需求量逐年攀升,亟需提高大豆产量满足需求。传统育种方法耗时长、改良效果不确定,难以满足实际生产需求[2]。转基因生物育种技术可缩短育种年限,实现大豆定向改良,为大豆产量提高提供了新思路[3]。
Sharma 等[4]研究表明,植物再生通过一系列定向细胞的分裂和细胞壁扩张完成。不同大豆品种再生能力与其细胞壁扩张能力和细胞分裂分化密切相关。因此,深入探究大豆再生分子机制,对实现大豆转基因有效应用和大豆定向育种改良,提高大豆产量具有重要意义。
植物细胞壁为动态网状结构,可为植物提供机械支撑、维持细胞形状,还可控制细胞扩增[5]。纤维素伸展方向决定细胞形状和生长方向[6]。Roudier 等[7]研究发现COBRA 基因在纤维素生物合成中发挥重要作用,可影响细胞扩展方向。COBRA 基因家族通过编码糖基磷脂酰肌醇(GPI)锚定蛋白参与细胞定向生长和纤维素生物合成[8]。作为GPI 锚定蛋白,COBRA 蛋白除包含CCVS 结构域、N-末端信号肽和纤维素结合位点外,还含有关键疏水C-末端GPI 锚定位点ω[9]。当GPI 修饰位点被修饰后,GPI 锚定蛋白被分泌至高尔基体囊泡中,后在质膜上调节纤维素链的组装及合成[5],一些GPI 锚定蛋白通过蛋白水解酶水解最后被释放于细胞膜外[10]。
近期研究发现,COBRA 家族基因的多个成员参与细胞壁纤维素生物合成,在多种细胞生长发育过程中起重要调节作用。如COBRA 基因参与根的伸长和根毛生长,参与花粉管伸长等过程[11-12]。在玉米中,COBRA 基因参与次级细胞壁生物合成,其缺失可影响细胞壁中纤维素合成,对bk2-Mu7突变体的研究表明,该基因突变可影响纤维素在细胞壁中的沉积,从而影响玉米茎的强度[13]。在水稻中,Bc1 和纤维素合成酶在纤维素合成不同生物过程中均发挥作用,Bc1 与纤维素合成酶相互作用,共同影响纤维素结晶度,从而影响纤维素组装过程[14]。在棉花中,GhCOBL8A 可促进细胞伸长和细胞壁增厚[15]。此外,在番茄中,过表达COBRA 基因可增强果实厚度并延长保鲜期[16]。在杨树的芽尖器官中发现COBRA 基因高度表达,表明其可能参与植物细胞扩增[17]。以上研究表明COBRA 基因在不同植物生长发育过程中具有多种不同功能,为深入研究其作用机制提供了新思路。
最新研究表明,COBRA 基因在植物生长发育及再生过程中发挥重要作用。目前已在拟南芥[9]、水稻[18]、玉米[19]等植物中鉴定出一定数量的COBRA 家族基因成员,但对大豆COBRA 家族成员的研究报道较少。本文利用生物信息学方法对大豆COBRA 家族基因(GmCOBRAs)进行全基因组水平鉴定,对COBRA 家族基因成员理化性质、基因结构、系统进化、保守结构、种内共线性及组织表达量等进行分析,以期为深入探究COBRA 基因在大豆生长发育和再生过程中的作用机制奠定理论基础。
1.1.1 植物材料
大豆东农50、Keburi 和烟草(本氏烟草(Nicotiana benthamiana))均由东北农业大学大豆遗传育种实验室提供。
1.1.2 培养基
(1)丛生芽诱导培养基(SIM):3.21 g B5 盐+0.6 g MES + 30 g 蔗糖,pH 5.6 灭菌后加入0.321 g/L B5 维生素和1.67 mg/L 6-BA;(2)丛生芽伸长培养基(SEM):4.33 g MS + 0.6 g MES + 30 g 蔗糖,pH 5.6灭菌后加入0.321 g/L B5 维生素、0.1 g/L IAA、0.1 g/L GA3、0.1 g/L Glu 和0.1 g/L Asp。
1.1.3 仪器材料
试剂盒(OMEGAPlantRNAKit(50),R6827-01),上海索莱宝科技有限公司; 超微核酸分析仪(Nanodrop 2000),美国赛默飞世尔科技有限公司;诺唯赞HiScript R II Q RT SuperMix for qPCR(+ gDNA wiper)试剂盒(R223-01),南京诺唯赞生物科技有限公司;罗氏LightCycler480 实时荧光定量PCR 仪,美国罗氏制药有限公司;诺唯赞ChamQ Universal SYBR qPCR Master Mix 荧光定量试剂盒(Q711-02),南京诺唯赞生物科技有限公司; KOD One 酶(KMM-101),上海根生生物科技有限公司。
1.1.4 其他材料
试验中的氨基酸序列、基因组注释文件和基因组序列分别来自以下网站:大豆基因组数据库(www.soybase.org);植物基因组学数据库(Phytozome(doe.gov)); NCBI 数据库(https://www.ncbi.nlm.nih .gov);蛋白质数据库(SIB Swiss Institute of Bioinformatics|Expasy);CELLO2.5(www.csbio.sjtu.edu.cn);Williams 82。
1.2.1 大豆COBRA 基因家族成员鉴定
(1)以已发表的拟南芥COBRA 基因氨基酸序列为查询目标在植物基因组学数据库(Phytozome(doe.gov))和NCBI 数据库(https://www.ncbi.nlm.nih.gov)进行BLAST 比对。下载具有高度一致性(>90%)和最低值(e<10-10)的大豆COBRA 基因氨基酸序列。(2)进一步确认大豆COBRA 基因家族成员。检索PFAM 数据库中COBRA 结构域的存在[20],按照大豆COBRA 家族基因在大豆染色体组上从小到大的位置进行排序。(3)从大豆基因组数据库(www.soybase.org)收集大豆COBRA 基因家族成员所有遗传信息,包括染色体位置、CDS 长度、蛋白质长度。(4)使用蛋白质数据库(SIB Swiss Institute of Bioinformatics|Expasy)分析大豆COBRA 基因家族成员分子量和等电点大小。(5)采用CELLO2.5(www.csbio.sjtu.edu.cn)对大豆COBRA 蛋白亚细胞位置进行预测。
1.2.2 大豆、水稻、拟南芥和玉米COBRA 基因家族进化树分析
从植物基因组学数据库(Phytozome(doe.gov))下载大豆、水稻、拟南芥和玉米的COBRA 基因家族氨基酸序列,采用Clustal W 进行氨基酸序列多重比对[21]。采用MEGA5.0 软件将比对数据进行1 000 次重复构建无根进化树,通过iTOL(https://itol.embl.de/)网站进行进化树美化和保守结构域分布可视化处理。
1.2.3 大豆COBRA 基因家族基因结构、蛋白质保守基序分析
从植物基因组学数据库(Phytozome(doe.gov))下载大豆基因组.gff3 注释文件,通过基因结构显示服务器对大豆COBRA 外显子-内含子结构进行分析,使用TBtools 软件对大豆COBRA 基因家族进行基因结构可视化处理[22]。采用MEME 在线网站对大豆COBRA 基因家族成员蛋白质保守基序进行分析(参数为maximum number of motifs = 10,optimum width = 6~100)[23],使用TBtools 对其进行可视化处理[22]。
1.2.4 大豆COBRA 基因家族组织表达量分析
从植物基因组学网站(Phytozome(doe.gov))下载大豆COBRA 基因家族成员的根、茎、叶、花、种子和荚的转录组数据,使用Excel 表格进行处理。表达量数据使用Log2进行均一化处理,采用TBtools 热图软件进行数据可视化处理[22]。
1.2.5 大豆COBRA 基因家族实时荧光定量PCR
以再生能力强的东农50 和再生能力弱的Keburi丛生芽诱导第0、3、14 d(SIM-0、SIM-3、SIM-14)和丛生芽伸长第3、5、14 d(SEM-3、SEM-5、SEM-14)为材料,选取6 个在种子中表达量较高的基因进行qRT-PCR 分析。
使用试剂盒(OMEGA Plant RNA Kit(50),R6827-01)进行组织部位RNA 提取,使用超微核酸分析仪(Nanodrop 2000)对提取的RNA 进行浓度和纯度测定。对提取的RNA 利用诺唯赞HiScriptRII Q RT SuperMix for qPCR(+gDNA wiper)试剂盒(R223-01)反转录成cDNA 单链。使用Primer 3 Plus(Primer3Plus-Pick Primers)中的Primer-BLAST 工具对大豆COBRA 基因进行特异性引物筛选,随后使用BLAST 工具验证序列。采用罗氏LightCycler480实时荧光定量PCR 仪和诺唯赞ChamQ Universal SYBR qPCR Master Mix 荧光定量试剂盒(Q711-02)对不同时期大豆组织部位COBRA 基因表达水平作相对定量分析。以ACTIN4 为内参基因,每个样品3 次重复,以丛生芽诱导第0 d 为对照,采用2-ΔΔCT方法[24]分析qRT-PCR 结果。所用引物见表1。
表1 目的基因扩增及实时荧光定量PCR 引物
1.2.6 大豆COBRA 基因家族共线性及染色体位置分析
在大豆基因组网站(Phytozome(doe.gov))获得大豆全基因组序列文件,使用TBtools 对其进行共线性分析,采用TBtools 进行可视化处理[22]。在Williams 82 大豆参考基因组数据库中确定24 个大豆COBRA 基因在染色体上的位置,采用TBtools进行可视化处理[22]。
1.2.7 GmCOBRA21 基因扩增及烟草亚细胞定位
利用Snapgene 软件确定EcoRⅠ和BamHⅠ这2 个酶切位点,将目的基因CDS 片段完全连接至Fu28 载体上。去掉目的基因CDS 终止密码子后利用诺唯赞同源重组网站(入门克隆(vazyme.com))设计引物(见表1)。以东农50 种子cDNA 为模板,使用KOD One 酶(TOYOBO,上海)进行扩增(PCR反应条件见表2)。对扩增产物胶回收后同源重组连接至Fu28 线性化入门载体上,使用大肠杆菌DH5α 进行转化反应,菌落PCR 鉴定后选取阳性菌落提取质粒。将阳性质粒经LR 反应连接至pSOYⅠ表达载体上,经菌落PCR 鉴定将阳性质粒转化入农杆菌EHA105 中,将构建好的载体命名为pSOYⅠ-GmCOBRA21。
表2 KOD One PCR 反应条件
利用农杆菌介导法将构建好的表达载体pSOYⅠ-GmCOBRA21 转入本氏烟草(Nicotiana benthamiana)进行蛋白表达。在培养箱中对本氏烟草培养2 d后,在激光共聚焦显微镜下观察蛋白表达情况[25]。
1.2.8 数据处理
使用T 检验进行显著性分析,其中“**”代表P<0.01,“*”代表P<0.05,I-0 时期为试验对照。
利用拟南芥COBRA 蛋白氨基酸序列在大豆基因组数据库中进行BLAST 比对,删除重复序列后进行Pfam 分析,最终获得24 个大豆COBRA 基因家族成员。
按照其在染色体上位置从小到大顺序分别命名为GmCOBRA1-24(见表3)。
表3 大豆COBRA 基因家族蛋白质信息及亚细胞定位预测
24 个GmCOBRAs 序列长度为630~2 016 bp ,编码氨基酸个数为210~672,分子质量大小为22.7~74.7 ku,蛋白理论等电点为5.56~9.64。其中等电点大于7 的为19 个,等电点小于7 为5 个,表明GmCOBRAs 酸性氨基酸家族成员数量低于碱性氨基酸家族成员数量,该基因家族具有多样性。亚细胞定位预测表明,24 个GmCOBRAs 均定位于细胞膜。
由图1 可知,COBRA 基因家族的24 个成员不均等地分布在14 条染色体上,分别为Gm01、Gm02、Gm04、Gm05、Gm06、Gm07、Gm08、Gm09、Gm11、Gm12、Gm13、Gm17、Gm18 和Gm19。其中Gm04、Gm05、Gm06、Gm09、Gm11、Gm17 和Gm19 号染色体上的COBRA 基因位于染色体前端,Gm01、Gm07、Gm12、Gm13、Gm18 号染色体上的COBRA 基因位于染色体尾端。Gm18 号染色体上的GmCOBRA20、GmCOBRA21和GmCOBRA22 位置接近;Gm08 号染色体上的GmCOBRA11 和GmCOBRA12 位置接近;Gm06 号染色体上的GmCOBRA8 和GmCOBRA9 位置接近。
由图2 可知,利用大豆基因组.gff3 文件在大豆中鉴定出的COBRA 基因多数具有Cys-Cys-Val-Ser保守结构域(CCVS),这一结构域在COBRA 家族蛋白中起关键作用。仅GmCOBRA6 基因无CCVS 结构域,这表明该基因可能与COBRA 基因家族中其他成员功能不同。此外,除GmCOBRA2 外,大豆COBRA 基因含有N 末端信号肽,这表明由这些基因编码的蛋白质可能从内质网进入分泌途径,或者定位于质膜。
图2 大豆COBRA 基因家族氨基酸多序列比对
由图3 可知,根据系统发育分析,大豆COBRA蛋白可分为与拟南芥、玉米和水稻的COBRA 家族基因相同的2 个亚家族[11,14,26]。第Ⅰ亚家族(CLUSTERⅠ)共有7 个GmCOBRA 基因,第Ⅱ亚家族(CLUSYER Ⅱ)共有17 个GmCOBRA 基因。其中,第Ⅰ亚家族与AtCOBRA8、AtCOBRA5、AtCOBRA10、AtCOBRA7 和AtCOBRA4 相似度较高; 第Ⅱ亚家族与AtCOBRA9、AtCOBRA11、AtCOBRA2、AtCOBRA6、AtCOBRA12、AtCOBRA1和AtCOBRA3 相似度较高。结果表明,大豆COBRA家族基因数目约为拟南芥COBRA 基因的2 倍。
图3 大豆、拟南芥、玉米和水稻COBRA 蛋白系统进化树
为深入了解大豆COBRA 基因家族结构多样性与系统发育之间关系,研究采用TBtools 工具绘制GmCOBRAs 基因内含子和外显子模型(见图4)。由图4 可知,GmCOBRAs 亚族的外显子和内含子大小和数量不同。第Ⅱ亚族外显子平均长度较长,且包含6 个外显子;第Ⅰ亚族外显子较短,数量较少,为2~3 个。同时,同一亚族成员均具有相似外显子-内含子结构,这种高度保守基因结构影响其系统发育关系。结果表明,COBRA 基因家族在大豆中具有较高的结构多样性和进化分化,说明这些基因在大豆中具有重要的生物学功能。
图4 大豆COBRA 基因家族基因结构分析
由图5 可知,大豆COBRA 家族基因包含10 个保守基序,分别为Motif 1-10。24 个大豆COBRA家族基因均包含Motif 2 和Motif 6,其中Motif 2保守基序中含有一个高度保守的CCVS 氨基酸序列。
图5 大豆COBRA 基因家族蛋白质保守基序分析
结果表明,大豆COBRA 基因家族多样性与保守基序分布及结构有关。
在植物进化过程中,基因复制和现存基因保留使得植物基因组不断扩大。由图6 可知,在20 条大豆染色体上,大豆COBRA 家族基因共发生23 次复制事件。由基因位置分析可知,GmCOBRA21 是由串联复制产生的,其中GmCOBRA2 基因未发生基因复制事件,表明在大豆COBRA 基因扩增中,片段复制比例大于串联复制比例。
图6 大豆COBRA 基因家族共线性分析
由图7 可知,GmCOBRAs 具有不同表达模式。例如GmCOBRA7 和GmCOBRA24 在根、茎、叶、花、种子和荚这6 个器官和组织中均有表达。GmCOBRA20、GmCOBRA18 和GmCOBRA10在所分析的组织中表达水平较低。GmCOBRA4、GmCOBRA6 和GmCOBRA13 在种子中高度表达,表明其在种子发育中具有重要作用。GmCOBRA14、GmCOBRA1 、GmCOBRA13 、GmCOBRA18 、GmCOBRA7 、GmCOBRA22 、GmCOBRA19 、GmCOBRA2、GmCOBRA16 和GmCOBRA23 在根中高度表达,表明其在根的伸长和根毛生长过程中发挥作用。GmCOBRA12、GmCOBRA22 和GmCOBRA14 在所分析的组织中表达水平较高,表明这些基因在大豆整个发育过程中均发挥重要作用。结果表明,24 个GmCOBRAs 至少在一个组织中表达,表明COBRA 基因家族在不同大豆组织和器官中均发挥功能。
图7 大豆COBRA 基因家族表达模式分析
基因调控对植物再生起关键作用。东农50 器官发生丛生芽诱导和丛生芽伸长表型图如图8 所示。由图9 可知,6 个GmCOBRAs 在丛生芽诱导和伸长不同时期存在表达差异,其中GmCOBRA9、GmCOBRA13 、GmCOBRA4 、GmCOBRA20 和GmCOBRA6 在丛生芽伸长阶段的表达量较高,GmCOBRA21 在丛生芽诱导和丛生芽伸长阶段显著表达。在丛生芽诱导第14 d 和丛生芽伸长第14 d时,GmCOBRA21 表达量显著上调。结果表明,大豆COBRA 基因在大豆再生过程中发挥作用。
图8 东农50 器官发生丛生芽诱导和丛生芽伸长表型图
图9 大豆COBRA 家族基因丛生芽诱导和丛生芽伸长qRT-PCR 结果
通过qRT-PCR 分析发现,GmCOBRA21 基因在丛生芽诱导和伸长阶段的表达量显著上升,因此选择该基因进行功能验证。通过对东农50 种子cDNA进行克隆,成功获得预期大小条带(见图10(a)),将回收产物连接至Fu28 入门载体中,再转入大肠杆菌感受态细胞DH5α(见图10(b))。采用序列比对过滤出比对正确质粒,通过LR 反应构建pSOYⅠ-GmCOBRA21 表达载体,最终将pSOYⅠ-GmCOBRA21 重组质粒转入农杆菌EHA105 中(见图10(c))。
图10 GmCOBRA21 基因克隆与PCR 检测
pSOYⅠ-GmCOBRA21 载体如图11(a)所示。随后,在本氏烟草中瞬时表达该载体。通过亚细胞定位发现,GmCOBRA21 定位于植物细胞膜(见图11(c)),与预测结果一致。
图11 pSOYⅠ-GmCOBRA21 载体构建及GmCOBRA21 蛋白亚细胞定位
COBRA 基因是细胞扩增和纤维素合成的关键基因,也是植物特有基因家族[27]。前人已对拟南芥、玉米和水稻等作物中的COBRA 基因家族进行深入研究,但在大豆中的研究较少。本研究中,系统发育进化关系将GmCOBRA 家族基因分为2个亚族,与拟南芥和玉米的COBRA 基因家族分类相似。GmCOBRA 家族基因第Ⅰ亚族成员为7 个,第Ⅱ亚族成员为17 个,类似于拟南芥COBRA 基因家族,说明COBRA 基因在不同作物中的进化相似。第Ⅰ亚族COBRA 基因与第Ⅱ亚族COBRA 基因在进化上不同,其在N 末端增加了170 个氨基酸。在基因结构上,第Ⅰ亚族外显子数量少于第Ⅱ亚族,结果与拟南芥相似[9]。本研究中大豆COBRA基因数量约为拟南芥COBRA 基因的2 倍(见图3),该基因在大豆基因组的扩增源于片段复制。在已鉴定的24 个大豆COBRA 基因中,11 个大豆COBRA基因为片段性重复,这一结果与之前发现大豆基因组的复制主要为片段性重复一致[28-29]。
目前对于大豆再生基因报道较少,因此筛选提高大豆再生能力基因对丰富大豆再生基因网络具有重要意义。COBRA 基因编码糖基磷脂酰肌醇锚定蛋白,在细胞壁扩张和纤维素沉积中发挥作用。作为模式植物,拟南芥COBRA 家族基因可广泛调节花、叶片和种子的形态建成。相关研究表明,AtCOBRA10 基因突变导致花粉管变短,证实COBL10 对花粉管的定向生长具有关键调节作用。本研究中,GmCOBRA13 在种子各发育时期均高度表达,且GmCOBRA13 与AtCOBRA10 在进化上高度同源,这也说明GmCOBRA13 可能与AtCOBRA10具有相似功能。在大豆胚胎发育过程中,纤维素对细胞扩张起关键作用[30]。本研究中,大豆COBRA基因在种子中表达,表明其在大豆胚胎发育过程中可能发挥功能。Roudier 等[31]研究发现在拟南芥中COBRA 家族基因通过参与纤维素的纤维取向对细胞扩增产生重要影响,是植物发育过程中发生异性膨胀的重要因素之一。在拟南芥中,蛋白突变体植株表现为植株矮小、芽变小和根变粗现象[25]。COBRA 基因突变导致拟南芥纵向细胞伸长和细胞分裂缺陷症状[32],而植物再生主要与芽和根的生长有关。以上现象印证了本试验中qRT-PCR 结果,即COBRA 基因在丛生芽诱导和丛生芽伸长时发挥作用,在大豆发育过程中COBRA 基因可能通过促进根和芽的生长影响大豆再生功能。
综上所述,在大豆基因组中共发现24 个COBRA 基因,这些基因不均等地分布在大豆的14 条染色体上,其中23 个GmCOBRA 基因由片段复制产生,GmCOBRA21 由串联复制产生,表明在GmCOBRA 家族基因扩增中,片段复制比例大于串联复制比例。通过对24 个GmCOBRA 基因的大豆基因转录组数据分析可知,GmCOBRA 家族基因在植物生长发育的各个阶段均可表达并发挥功能。通过大豆在丛生芽诱导和丛生芽伸长阶段的qRT-PCR 分析表明,大豆COBRA 家族基因可能参与植物再生调控网络,其中GmCOBRA21 可能为该过程中的核心基因发挥关键作用。通过亚细胞定位表明GmCOBRA21 定位于细胞膜。