刘艳阳,武 轲,梅鸿献,杜振伟,崔承齐,江晓林,郑永战
(河南省农业科学院 芝麻研究中心,河南 郑州 450002)
芝麻(SesamumindicumL.)是我国重要的优质油料作物和特色农产品[1]。近年来,我国食用油供需矛盾十分突出,采取各种措施不断增加产量、提高生产效率是芝麻研究的重大课题。但芝麻种植手段落后,从播种到收获以人工操作为主,原始的种植方式导致芝麻生产投入劳动力过多、劳动强度大,生产效率低[2]。因此,降低生产成本,尽快推进生产的机械化进程,是芝麻生产发展的必然趋势。目前,我国种植的芝麻品种均为裂蒴型,且为无限生长习性,开花时间长,蒴果成熟时间不一致,成熟时蒴果易开裂落粒,收获不及时产量损失可达50%;气候干燥时,芝麻落粒率达60%~70%;雨后产量损失更多[3]。因此,增强芝麻抗裂蒴能力既可以降低机械化收获造成的落粒损失,提高种子的收获效率,又有利于提高籽粒成熟度,保证芝麻品质。
KANADI (KAN)是植物特有的一个基因家族,在胚胎发生、侧根生长、叶极性和珠被形成等方面发挥着重要作用,该家族成员都含有一个保守的GARP结构域,具有转录因子活性[4-6]。ZHANG等[7]研究发现,SiCL1基因与芝麻卷叶和闭蒴有关,而SiCL1基因属于KAN基因家族。刘艳阳等[8]利用豫芝11号(裂蒴品种)和郑芝InD01(抗裂蒴品种)构建的F2群体,通过Super-BSA分析,将抗裂蒴基因Siind1定位在连锁群LG8上,定位区间仅包含1个基因LOC105167765,属于KAN基因家族。但是LOC105167765基因在裂蒴材料和抗裂蒴材料间蛋白质水平的表达差异尚未见报道。鉴于此,从裂蒴品种豫芝11号和抗裂蒴品种郑芝InD01中分离克隆LOC105167765基因SiIND1,并对其进行生物信息学分析和原核表达分析,为进一步探讨芝麻抗裂蒴性形成与LOC105167765基因之间的内在联系提供理论依据。
1.1.1 试验材料 芝麻品种豫芝11号(裂蒴品种)和郑芝InD01(抗裂蒴品种)均来自河南省农业科学院芝麻研究中心。大肠杆菌菌株DH10B、大肠杆菌表达菌株BL21和表达载体pET30a为河南省农业科学院芝麻研究中心保存。
1.1.2 试剂 RNA提取试剂盒、反转录试剂盒、Taq酶、DNA分子质量标准、DNA凝胶回收试剂盒、pMD18-T载体、质粒提取试剂盒、限制性内切酶EcoRⅠ和HindⅢ均为TaKaRa公司产品;蛋白质分子质量标准、异丙基-β-D-硫代半乳糖苷(IPTG)购自Sigma公司;引物合成和DNA测序分析由生工生物工程(上海)股份有限公司完成。
1.2.1 芝麻SiIND1基因克隆 采用RNA提取试剂盒提取豫芝11号和郑芝InD01蒴果总RNA,cDNA合成参照TaKaRa公司的TaKaRa RNA PCR Kit(AMV) Ver.3.0使用说明书方法。利用NCBI上已公布的芝麻LOC105167765基因cDNA序列,设计引物SiIND1-F:ATGCCCTTAGAAGGGATTTTC和SiIND1-R:TCAGAACTGGACATTACATAGCTC。PCR程序为94 ℃预变性5 min; 94 ℃ 30 s,55 ℃ 1 min,72 ℃ 1 min,35个循环;72 ℃ 5 min。扩增产物在1.0%琼脂糖凝胶中进行电泳,用凝胶成像分析系统进行拍照及分析。扩增产物按照TaKaRa公司的凝胶回收试剂盒使用说明进行回收。将回收目的片段连接到pMD18-T载体,连接产物转化大肠杆菌感受态细胞DH10B并进行阳性克隆筛选。阳性克隆由生工生物工程(上海)股份有限公司进行序列测定。
1.2.2 生物信息学分析 利用NCBI ORF Finder(http://www.ncbi.nlm.nih.gov/gorf/gorf.html)预测开放阅读框(ORF);使用ExPASy-ProtScale软件对基因编码的氨基酸序列进行分析;使用在线分析软件 SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/secpred_sopma.pl)对蛋白质进行二级结构预测;利用NCBI的Conserved Domains Database预测蛋白质的功能结构域;利用在线分析工具ProtScale预测蛋白质的亲疏水性;利用SWISS-MODEL软件在线预测蛋白质的三级结构。
1.2.3 原核表达载体pET30a-SiIND1的构建 合成原核表达载体构建引物SiIND1-F-EcoR Ⅰ:GTTGAATTCATGCCCTTAGAAGGGATTTTC和SiIND1-R-Hind Ⅲ:GTTAAGCTTTCAGAACTGGACATTACATAGCTC,以连接到pMD18-T载体上测序正确的SiIND1质粒为模板进行PCR扩增,回收纯化PCR产物。用EcoR Ⅰ和Hind Ⅲ双酶切,在T4连接酶作用下连接到以相同酶切后回收的pET30a载体上,16 ℃连接过夜。将连接产物转入大肠杆菌DH10B,并利用抗性筛选(载体为Kan抗性)和菌落PCR检测,得到大肠杆菌阳性菌株,菌株携带构建好的pET30a-SiIND1载体。将阳性菌株接种在带有Kan抗性的液体培养基中,置于200 r/min、37 ℃摇床上培养12~14 h,部分样品送生工生物工程(上海)股份有限公司测序,剩余样品提取质粒备用。
1.2.4 融合蛋白诱导表达 将pET30a-SiIND1质粒转化大肠杆菌表达菌株BL21,利用抗性筛选和菌落PCR得到阳性菌株。将阳性菌株接种在带有Kan抗性的液体培养基中,通过2次活化,在处理菌液中加入终浓度达到0.5 mmol/L的IPTG,诱导pET30a-SiIND1融合蛋白表达。对照不加IPTG溶液。离心收集菌液,经过SDS-PAGE凝胶电泳检测目的蛋白条带。
采用引物SiIND1-F和SiIND1-R进行RT-PCR扩增,得到豫芝11号的SiIND1基因cDNA序列全长为1 320 bp,编码439个氨基酸;郑芝InD01的SiIND1基因cDNA序列长度为1 246 bp,与豫芝11号SiIND1的cDNA序列相比缺失一段74 bp的序列,包括1个最大的开放阅读框900 bp,编码299个氨基酸(图1)。
图1 豫芝11号(A)和郑芝InD01(B)SiIND1基因编码的氨基酸序列比对Fig.1 Sequence alignment of amino acids coded by SiIND1 in Yuzhi No.11(A) and Zhengzhi InD01(B)
利用在线分析平台ExPASy(Expert Protein Analysis System)的ProtParam程序对SiIND1基因所编码的氨基酸序列进行蛋白质基本理化性质分析,推测豫芝11号SiIND1蛋白分子质量为50.0 ku,等电点为7.53;郑芝InD01 SiIND1蛋白分子质量为32.9 ku,等电点为8.37。豫芝11号SiIND1含有KAN家族蛋白特有的保守区GARP结构域,但郑芝InD01SiIND1基因GARP结构域发生缺失突变,翻译提前终止。使用SOPMA软件对SiIND1蛋白的二级结构进行预测(图2),发现其主要由α-螺旋、无规则卷曲、延伸链和β-折叠4种常见的蛋白质二级结构组成,其中无规则卷曲所占比例最高,豫芝11号和郑芝InD01分别为68.11%和76.59%,其次是α-螺旋,豫芝11号和郑芝InD01分别为19.59%和11.04%,延伸链所占比例分别为9.34%和9.70%,β-折叠所占比例分别为2.96%和2.68%。利用NCBI的Conserved Domains Database进行结构域预测,结果(图3)表明,豫芝11号SiIND1蛋白包含1个由54个氨基酸(第271—324位氨基酸)组成的SANT结构域,在该结构域C端具有SHAQKYF氨基酸基序,推测其属于编码SHAQKYF类MYB家族的转录因子;郑芝InD01 SiIND1蛋白由于发生缺失突变,不含MYB家族转录因子特有的结构域。通过SWISS-MODEL软件对SiIND1编码的氨基酸序列进行蛋白质三维结构同源建模,获得其氨基酸序列的预测三维结构(图4)。由图4可见,豫芝11号和郑芝InD01 SiIND1蛋白三维结构表现差异较大。
蓝色.α-螺旋;红色.延伸链;绿色.β-折叠,紫色.无规则卷曲 Blue.Alpha helix; Red.Extended strand; Green.Beta-strand;Purple.Random coil
图3 豫芝11号(A)和郑芝InD01(B) SiIND1蛋白的保守结构域分析 Fig.3 Analysis of SiIND1 conservative protein structure domains in Yuzhi No.11(A) and Zhengzhi InD01(B)
图4 豫芝11号(A)和郑芝InD01(B) SiIND1蛋白三维结构预测Fig.4 The prediction of tertiary structure of SiIND1 proteins in Yuzhi No.11(A) and Zhengzhi InD01(B)
提取pMD18T-SiIND1和原核表达载体pET30a的质粒,利用EcoRⅠ和HindⅢ进行双酶切、回收目的片段,连接,获得重组载体pET30a-SiIND1。将重组载体质粒进行EcoRⅠ和HindⅢ双酶切鉴定(图5),由图5可见,可以切出目的条带,且与预期大小一致。将目的条带进行测序,测序结果表明,成功构建了原核表达载体pET30a-SiIND1。然后将鉴定正确的阳性克隆质粒转到大肠杆菌BL21中,进行蛋白质诱导表达。
1.Marker; 2.pET30a双酶切产物; 3.pET30a-SiIND1双酶切产物(豫芝11号); 4.pET30a-SiIND1双酶切产物(郑芝InD01) 1.Marker; 2.pET30a digested by EcoRⅠ and HindⅢ;3.pET30a-SiIND1 digested by EcoRⅠ and HindⅢ(Yuzhi No.11); 4.pET30a-SiIND1 digested by EcoRⅠ and HindⅢ(Zhengzhi InD01)
将pET30a-SiIND1质粒转化感受态细胞BL21,用IPTG诱导重组蛋白表达,进行SDS-PAGE电泳检测(图6)。由图6可见,豫芝11号pET30a-SiIND1菌株经IPTG诱导后在约60 ku处有一条蛋白质条带;郑芝InD01 pET30a-SiIND1菌株经IPTG诱导后在约60 ku处没有获得蛋白质条带,但在42 ku附近获得一条蛋白质条带。去除载体pET30a自身表达的蛋白质大小,结果与预期目的蛋白大小一致。进一步证实了裂蒴品种(豫芝11号)和抗裂蒴品种(郑芝InD01)SiIND1基因在蛋白质表达水平上有差异,郑芝InD01SiIND1基因在翻译过程中发生提前终止。
1.蛋白质Marker; 2.含pET30a-SiIND1未诱导(豫芝11号);3.IPTG诱导pET30a-SiIND1(豫芝11号); 4.含pET30a-SiIND1未诱导(郑芝InD01);5.IPTG诱导pET30a-SiIND1(郑芝InD01)1.Protein marker; 2.pET30a-SiIND1 not induced(Yuzhi No.11); 3.pET30a-SiIND1 induced by IPTG(Yuzhi No.11); 4.pET30a-SiIND1 not induced(Zhengzhi InD01); 5.pET30a-SiIND1 induced by IPTG(Zhengzhi InD01)图6 pET30a-SiIND1重组蛋白在大肠杆菌中的表达Fig.6 Expression of pET30a-SiIND1 recombinant protein in BL21
本研究从芝麻裂蒴品种豫芝11号和抗裂蒴品种郑芝InD01分别克隆得到SiIND1基因cDNA序列,序列分析发现,豫芝11号SiIND1具有KAN蛋白家族特有的保守区GARP结构域,属于MYB类转录因子,含有基序SHAQKYF。众所周知,MYB转录因子是植物中一个大的转录因子家族,几乎涉及植物发育和代谢的各个方面[9-10]。在拟南芥中,KAN家族基因行使维持植物远轴面极性及抑制近轴面极性特征的功能,作为转录阻遏物,对生长素生物合成、转运和信号转导都有影响,KAN家族基因序列的缺陷可导致荚果变形、叶片卷曲[5,11-12]。在水稻中,RL9编码一种GARP蛋白,是拟南芥KAN基因家族的同源基因。YAN等[13]对2个水稻等位基因卷叶突变体进行了鉴定,突变体rl9-1和rl9-2由于GARP结构域缺失突变,导致KAN家族基因功能丧失,表现出叶片卷曲,而且小穗发育不正常。ZHANG等[14]研究发现,SLL1属于KAN家族,在水稻多个发育阶段中产生影响。sll1突变体不仅叶片形态发生改变,其他组织包括种子、花药和根也表现出发育异常;种子内稃和外颖片形状都有缺陷并且不能闭合;种子较小并且外露。本研究中郑芝InD01SiIND1基因的GARP结构域发生缺失突变,表现出抗裂蒴的特性。这些表型差异表明GARP结构域对KAN家族基因功能的重要性,进一步表明SiIND1基因GARP结构域对芝麻裂蒴性状起关键作用。
了解SiIND1在芝麻蒴果发育中的生物学功能,必须在蛋白质水平进行研究。原核表达系统具有产量高、易操作、稳定性好、经济实惠等优点[15-16],为研究SiIND1蛋白的表达和功能提供了一条有效的途径。一般37 ℃、0.5 mmol/L终浓度的IPTG适合绝大多数的蛋白质表达[17-21],本研究采用该条件进行原核表达,所表达出的融合蛋白与目的蛋白分子质量一致。SiIND1所表达出的融合蛋白大小的差异也进一步证实了抗裂蒴材料中SiIND1由于缺失突变导致翻译提前终止。SiIND1基因的克隆与原核表达为芝麻SiIND1基因功能鉴定奠定了基础,并为探讨芝麻抗裂蒴性形成与SiIND1基因之间的关系提供了基础资料。