海岛棉转录因子基因GbTCP44的克隆及特征分析

2021-01-15 04:48石颖颖曲延英赵柯柯陈全家
中国农业大学学报 2021年1期
关键词:海岛棉结构域棉花

石颖颖 郑 凯,2 曲延英 陈 琴 赵柯柯 滕 露 陈全家*

(1.新疆农业大学 农学院/农业生物技术重点实验室,乌鲁木齐 830052;2.新疆农业大学 博士后流动站,乌鲁木齐 830052)

棉花是我国重要的农业经济作物,棉花产业对社会稳定、农民增收、农村经济发展、棉纺业以及国家对外商业贸易有十分重要的战略意义。伴随农产品供给侧结构性改革对棉花产量和品质提出的新要求,使得棉花生产由片面追求高产转向重点提升品质[1]。同时随人们生活水平的提高,对天然纯棉织物的需求不断增加,对品质的要求也愈来愈高。纤维品质是衡量棉花品质的关键指标之一,因此,提高棉纤维品质也成为当前棉花遗传育种的重要目标之一[2]。在棉花栽培种中海岛棉品质优良、纤维细长、富有丝光且强力较高,是高档纺织品和特种棉纺品的重要原料。从遗传学角度考虑,海岛棉体内的优异基因也成为棉花品质改良的研究对象[3]。因此以海岛棉为材料,挖掘与棉纤维品质相关基因的功能,为改善棉花纤维品质具有重要意义。

TCP基因家族是植物特有的一类转录因子家族,因其广泛地参与调控植物的生长发育而备受关注。TCP基因家族的确立源于4个最初被鉴定的蛋白,分别是玉米中的TB1(Teosinte branched 1)蛋白、金鱼草中的CYC(Cycloidea)蛋白、水稻中的PCF1(Proliferating cell factor 1)蛋白和PCF2(Proliferating cell factor 2)蛋白,因此,TCP家族名称由以上4个基因的英文首字母命名而成[4]。该家族TCP保守结构域含有59个氨基酸组成的bHLH结构(basic helix-loop-helix),且该结构域是结合DNA和蛋白互作所必需的[5]。目前,TCP基因参与多种生物学过程,包括细胞增殖、分化及生长[6];花、叶、果实和种子的发育[7]以及病虫害、耐盐碱、生物和非生物胁迫等响应[8],已成为植物生物学领域的一个热点。TCP转录因子在拟南芥(Arabidopsisthaliana)中已经确定有24个成员[9],在雷蒙德氏棉(Gossypiumraimondii)中确定有38个成员[10],在亚洲棉(Gossypiumarboreum)中确定有36个成员[11],在陆地棉(Gossypiumhirsutum)中确定有74个成员[12],在海岛棉(Gossypiumbarbadense)中确定有75个成员[13]。TCP转录因子在棉花纤维发育的研究中,最早是在海岛棉中克隆得到1个GbTCP基因,它在棉纤维伸长期优势表达,沉默该基因导致纤维变短,衣分降低[14]。随后,WANG等[15]从陆地棉中也克隆到1个TCP家族Ⅰ型基因GhTCP14,该基因主要在起始及伸长阶段的纤维细胞中高表达。葛宗鹤等[16]利用2个纤维发育特异启动子FBP7和GbEXPA2分别驱动GbTCP在棉花中超表达,进一步验证该基因在纤维伸长过程中的作用。接着,有研究发现GbTCP5、GbTCP10、GbTCP14、GbTCP15和GbTCP27基因都可能参与棉花纤维以及表皮毛的发育[17-21]。然而,TCP家族庞大且对棉花TCP转录因子的研究甚少,还有许多TCP转录因子的功能尚未见报道。本研究从海岛棉 ‘新海21号’中克隆得到1个TCP家族转录因子,通过生物信息学、亚细胞定位和qRT-PCR技术分析其基本性质和在纤维发育中的表达特性,旨在挖掘对棉花纤维发育起调控作用的TCP家族成员,以期为进一步研究该转录因子生理功能奠定基础。

1 材料和方法

1.1 试验材料

海岛棉品种‘新海21号’和2015—2017年的纤维品质数据(表1)筛选得到的10份不同纤维品质的棉花品种(长纤维品种:‘新海30号’、‘5917’、‘新海33号’、‘SI’、‘C6015’;短纤维品种:‘阿什蒙’、‘Pimas-7’、‘洛赛雅’、‘65-3080-2’、‘65-3049-6’)为试材。于2018年4—10月种植在新疆维吾尔自治区第一师阿拉尔市16团新疆农科院实验站。分别采集以上各棉花品种开花当天(0 d)的胚珠及开花后5、10、15、20、25和 30 d 的棉花纤维,另取‘新海21号’开花当天的花器官的不同部位:花瓣、托叶、花萼、雌蕊和雄蕊。液氮速冻,置于-80 ℃冰箱保存备用。

待大田棉花收获后,取饱满的‘新海21号’的种子用70%的乙醇溶液清洗2~3次,用ddH2O冲洗3遍后放置于无菌发芽盒中进行暗培养8 h,待子叶顶出种壳后,将其移至营养液中继续培养,棉苗长出第1片真叶时取根、茎和叶,液氮速冻,置于-80 ℃冰箱保存备用。

1.2 方法

1.2.1RNA的提取和cDNA第一链的合成

按Trizol试剂盒(Tiangen)说明书操作步骤,提取0、5、10、15、20、25、30和35 d的棉花纤维以及根、茎、叶、花瓣、花托、花萼、雌蕊和雄蕊等组织的总RNA。用RNase-Free DNase I(Tiangen公司)去除基因组DNA污染,经Thermo Scientific(NanoDrop 1000)分光光度计进行浓度和质量检测合格后,采用1.2%琼脂糖凝胶电泳检测RNA的完整性。最后用 First Strand cDNA Synthesis 试剂盒(Thermo公司)将不同时期的棉纤维和不同组织的总RNA反转录合成cDNA第一链,保存于-80 ℃冰箱备用。

表1 2015—2017年11个海岛棉品种纤维品质性状数据Table 1 Data of fiber quality traits of 11 sea-island cotton varieties from 2015 to 2017

1.2.2GbTCP44基因的克隆

根据海岛棉转录组数据库设计1对克隆引物,GbTCP44-F和GbTCP44-R(表2),以海岛棉‘新海21号’开花当天(0 d)胚珠的cDNA第一链为模板,进行PCR扩增。扩增反应体系:5×TransStar KD Plus Buffer 5 μL,2 mmol/L dNTP 4 μL,TransStar KD Plus DNA Polymerase 1 μL,cDNA模板2 μL,正反向引物各2 μL,补充ddH2O至50 μL。反应条件:94 ℃预变性3 min;94 ℃变性30 s,56 ℃退火30 s,72 ℃延伸 5 min,35个循环;经1%琼脂糖凝胶电泳检测扩增产物,使用回收试剂盒(Tiangen公司)纯化回收PCR产物,连接至pMD19-T载体,转化DH5a大肠杆菌感受态,送至北京六合华大基因有限公司测序。

表2 引物序列Table 2 Primer sequence

1.2.3GbTCP44基因的序列分析

根据测序结果,在NCBI(http:∥www.ncbi.nlm.nih.gov/gorf/orfig.cgi)上分析棉花GbTCP44基因序列的开放阅读框并且得到氨基酸序列。使用EXPASY的ProtParam(http:∥web.expasy.org/protparam/)在线程序计算该基因编码蛋白的理化参数。使用SMART软件预测该蛋白的保守功能域(http:∥smart.embl-heidelberg.de/),对推导出的TCP蛋白的功能结构域进行分析。使用PSIPRED(http:∥bioinf.cs.ucl.ac.uk/psipred/)在线工具预测该蛋白质的二级结构。使用SWISS-Model(http:∥swissmodel.expasy.org/)在线程序对该蛋白的三级结构进行预测分析。用NCBI中BLASTP和DNAMAN软件对蛋白序列进行氨基酸同源序列分析和多重序列比对。利用Clustal X和MEGA 5.0软件分析蛋白同源性并构建系统进化树。

1.2.4亚细胞定位分析

根据pCAMBIA1304载体和GbTCP44的ORF序列,设计含有NcoI和BglII的酶切位点的引物,利用无缝克隆技术构建pCAMBIA1304-GbTCP44-GFP瞬时表达载体。通过冻融法将重组质粒转化至农杆菌GV1301菌株中,重悬至OD600为0.8左右,取提前预培养24 h的新鲜洋葱第5层内表皮在该重悬液中浸泡20 min,稍滤干菌液后,转至MS固体培养基中,25 ℃暗培养24 h,再16 h/8 h光周期25 ℃共培养后,取出洋葱内表皮小块,压片法制片,置于荧光倒置显微镜下观察拍照。

1.2.5实时荧光定量PCR

设计GbTCP44基因的实时荧光定量PCR引物,GbTCP44-qRT-F和GbTCP44-qRT-R,内参基因引物为:UBQ7-F和UBQ7-R(表1)。以‘新海21号’和不同纤维品质的棉花品种0、5、10、15、20、25和30 d的纤维及不同组织的cDNA为模板,用TransStart Top Green qPCR SuperMix的荧光定量试剂盒(北京全式金生物技术有限公司)和7500 Fast实时荧光定量PCR(ABI,美国)仪进行扩增,反应体系为:2×Transtart Green qPCR SuperMix 10 μL;Passive Reference Dye 0.4 μL;上下游引物各0.4 μL;cDNA 2 μL;ddH2O补充至20 μL。反应程序设置为:94 ℃ 30 s;94 ℃ 5 s,60 ℃ 30 s,40个循环。每份样品设为3个重复,并采用2-ΔΔCT法分析数据。

2 结果与分析

2.1 GbTCP44克隆与序列分析

以棉花‘新海21号’的0 d的胚珠cDNA为模板,利用引物GbTCP44-F和GbTCP44-R进行PCR扩增,获得大小为1 035 bp的目标序列(图1)。

M, DL 2 000; 1, 扩增产物。M, DL 2 000; 1, The PCR product.图1 棉花GbTCP44基因产物电泳分析Fig.1 Electrophoresis of PCR product of cotton GbTCP44 gene

使用ProtParam得出:该基因编码1条由344个氨基酸组成的蛋白质序列,其中,丝氨酸占12.2%;苏氨酸占9.6%;甘氨酸占7.6%;脯氨酸占7.0%等;该蛋白质pI为8.83,分子量约为37.59 ku,属于偏碱性可溶性蛋白。该蛋白的保守功能域预测得出GbTCP44的蛋白质序列中位于49~103氨基酸处(N端)有1个TCP功能结构域,属于TCP转录因子家族Class I成员。通过PSIPRED预测该蛋白的二级结构发现该蛋白由12个α-螺旋、4个β折叠和无规则卷曲组成(图2)。由SWISS-Model对该蛋白的三级结构进行预测发现该蛋白主要由α-螺旋和β折叠构成(图3),与二级结构预测结果一致。

Strand,β折叠;Helix,α-螺旋;Coil,无规则卷曲Strand,Beta folding;Helix,Alpha helix;Coil,Random coil图2 GbTCP44蛋白二级结构预测Fig.2 Secondary structure prediction of GbTCP44 protein

图3 GbTCP44蛋白的三级结构Fig.3 Tertiary structure prediction of GbTCP44 protein

经NCBI数据库中BLASTP在线程序比对,筛选出11条与GbTCP44蛋白相似性较高的序列,由DNAMAN软件对蛋白氨基酸同源序列进行多重序列比对,发现各物种TCP结构域高度保守(图4),与该蛋白的保守功能域预测结果相同,从49~103氨基酸处(N端)高度保守。

红色方框内标注为TCP结构域,Basic为碱性区域,Helix为螺旋区域,Loop为环形区域。The red box is marked as the TCP domain, Basic is the alkaline region, Helix is the spiral region, Loop is the circular region.海岛棉Gossypium barbadense(GbTCP44);雷蒙德氏棉Gossypium raimondii(GrTCP15-like:XP_012438576.1);亚洲棉Gossypium arboreum(GaTCP15-like:XP_017635494.1);陆地棉Gossypium hirsutum(GhTCP15-like:XP_016705573.1);榴莲Durio zibethinus(DzTCP15-like:XP_022725987.1);可可Theobroma cacao(CcTCP:EOY01975.1));葡萄Vitis vinifera(VvTCP15:XP_019076462.1);橡胶树Hevea brasiliensis(HbTCP15-like:XP_021645160.1);大豆Glycine soja(GsTCP14-like:XP_028230682.1);烟草Nicotiana tabacum(NtTCP14-like:XP_016472329.1);蓖麻Ricinus communis(RcTCP14:XP_002522405.1);胡杨Populus euphratica(PeTCP14-like:XP_011043408.1)。图4 GbTCP44与其他TCP氨基酸序列对比分析Fig.4 Multiple sequence alignment of amino acids of GbTCP44 and TCP proteins from other species

为确定GbTCP44基因和其他物种TCP基因的亲缘关系,利用MEGA 5.0软件将GbTCP44与陆地棉、亚洲棉、雷蒙德氏棉、榴莲和可可等23个物种进行系统进化分析。结果显示,GbTCP44与雷蒙德氏棉的GrTCP亲缘关系最近,聚为一枝,其次与陆地棉GhTCP和亚洲棉GaTCP亲缘关系较近(图5),由此说明,GbTCP44基因在从二倍体进化为四倍体时,氨基酸进化较为保守。从该进化树来看,进化关系较近的还有麻类和可可等物种,说明TCP基因的保守结构域在进化过程中的保守性较高。

图5 GbTCP44蛋白系统进化树分析Fig.5 Phylogenetic analysis of cotton GbTCP44 protein

2.2 亚细胞定位分析

由图6可知,与生物信息学预测结果相符,说明GbTCP44基因定位在细胞核中。

图6 GbTCP44蛋白的亚细胞定位Fig.6 Subcellular localization of the GbTCP44 protein

2.3 海岛棉GbTCP44基因的表达特性分析

由图7可知,GbTCP44基因在花瓣、花托和花萼中表达量较高,相对于在根、茎和叶中的表达量表现为极显著差异;在纤维发育不同时期的表达中,该基因在纤维发育10~20 d的表达量逐渐升高,至 20 d 表达量达到最高,25 d后表达量开始下降(图8),推测GbTCP44基因可能与棉纤维伸长的调控有关。

不同小写字母表示不同材料间在0.05水平存在显著性差异。下同。Different lowercase letters mean significant differences at P<0.05. The same below.图7 GbTCP44基因在棉花‘新海21’不同器官中的相对表达量Fig.7 Relative expression of GbTCP44 gene in different organs of cotton

图8 GbTCP44基因在‘新海 21’开花后0~35 d的相对表达量Fig.8 Relative expression of GbTCP44 gene at 0-35 d after cotton flowering of cotton

由图9和图10可知,在不同棉花材料中,GbTCP44基因在0~30 d均有表达,在纤维发育0~20 d的表达量呈现逐渐升高的趋势,并在纤维发育20 d时表达量最高,说明该基因确实在棉花纤维发育伸长期高表达,推测该基因可能与伸长期的纤维细胞发育有关。从表达特性来看,唯一不同的是在纤维较长的材料中,GbTCP44基因在纤维发育20 d后表达量急剧降低;在纤维较短的材料中,该基因在纤维发育20 d后持续高表达,表达量降低趋势较弱。说明GbTCP44基因在长纤维材料中和在短纤维材料中的表达模式存在差异。

图9 GbTCP44基因在长纤维棉花品种中开花后0~30 d的表达特性Fig.9 Expression characteristics of GbTCP44 gene at 0-30 d after flowering in long-fiber cotton varieties

图10 GbTCP44基因在短纤维棉花品种中开花后0~30 d的表达特性Fig.10 Expression characteristics of GbTCP44 gene at 0-30 d after flowering in short-fiber cotton varieties

3 讨 论

TCP转录因子根据结构域的差异可以分为两大类,分别为ClassⅠ类(PCF或TCP-P)和ClassⅡ类(TCP-C),这两类区别在于,Ⅰ类在结构域相对于Ⅱ类缺失4个氨基酸[22]。本试验中GbTCP44蛋白在N端有1个TCP功能结构域,具有TCP转录因子ClassⅠ亚家族典型特点,属于TCP转录因子家族ClassⅠ成员。通过qRT-PCR分析GbTCP44基因在不同器官组织的表达特性,结果显示,该基因在花器官中高表达,可能参与调控花的生长发育。在前人的研究中,较少发现ClassⅠ类TCP基因与花的生长发育调控有关,在拟南芥中,AtTCP16主要在发育的花粉中表达,参与雄配子发育,对花粉的发育有重要作用[23]。然而,有更多的研究表明ClassⅡ类TCP基因也调控花的生长发育,例如:在拟南芥中CIN类TCP通过抑制细胞增殖调控花器官的形态建成,attcp2-3-4-10-24功能缺失突变株由于其边界区域细胞过多增殖产生波浪状花瓣[24]。AtTCP4异位表达会造成拟南芥植株的花变小并带有融合萼片、抑制花瓣和雄蕊[25]。但也有研究表明,Ⅰ类蛋白和Ⅱ类蛋白可以根据TCP位点的结合情况,协调或竞争性的调节转录,它们之间的序列特异性并不是绝对的,并且允许TCP因子之间存在更多的竞争可能性[26]。从本试验结果来看,可能GbTCP44基因参与调控花的生长发育。

ClassⅠ类在植物生长发育过程中发挥正调控的功能,主要是促进细胞分化,在植物分生组织中发挥作用[27]。棉纤维是受精胚珠单个表皮细胞经伸长和加厚而形成的,已有研究表明ClassⅠ类基因可能参与棉花纤维发育的调控[16,19-20]。GbTCP44基因的qRT-PCR结果表明,该基因在纤维发育伸长期高表达,说明可能在棉花纤维发育伸长期起调控作用。

此外,通过GbTCP44基因在不同棉花品种中的纤维发育不同时期的表达分析发现,该基因均在纤维伸长期优势表达且当棉纤维发育至20 d后,GbTCP44基因在长纤维品种中的表达量显著低于在短纤维品种中的表达量。这一结果进一步证实该基因可能通过参与棉花纤维发育的调控,影响棉花纤维的长度。一方面,因在棉花中有不少基因已被证实与纤维发育调控有关[16-21],且有研究表明,TCP基因家族存在功能冗余性[28],所以推测该基因的表达产物与其他TCP转录因子产物在调控位点上存在竞争性抑制,造成GbTCP44基因在两类品种中纤维发育20 d后的表达量上的显著差异;另一方面,TCP转录因子广泛参与调控植物的生长发育,有时TCP蛋白并不是孤立地行使功能[28],在拟南芥中,AtDELLA蛋白能够结合AtTCP14的DNA结合域,抑制其对细胞周期的调控,通过调控GA信号通路,参与调控植株高度[29];在棉花中,GrTCP蛋白通过调节JA的生物合成促进棉花纤维的伸长和根毛的发育[14]。因此推测该基因可能受纤维发育纤维素合成过程中的酶、植物激素或非TCP蛋白等因子的影响,致使该基因在长纤维品种与短纤维品种中表达量的差异,从而产生对纤维品质的影响,但有关GbTCP44基因调控纤维发育的机制和功能还有待进一步深入研究。

猜你喜欢
海岛棉结构域棉花
棉花是花吗?
棉花
蛋白质结构域划分方法及在线服务综述
转Bt基因海岛棉分子检测及抗虫性鉴定
棉花陆海杂交亲本及子代光合叶绿素荧光参数分析
新疆海岛棉生产现状与发展建议
重组绿豆BBI(6-33)结构域的抗肿瘤作用分析
组蛋白甲基化酶Set2片段调控SET结构域催化活性的探讨
海岛棉染色体片段代换系BC4F4产量及纤维品质主成分分析
泛素结合结构域与泛素化信号的识别