闵凯丽,晁祥保,滕 露,蔡永生,雷慧辰,严中建,郑 凯,2,陈全家
(1.新疆农业大学农学院/农业生物技术重点实验室,乌鲁木齐 830052;2.新疆农业大学博士后流动站,乌鲁木齐 830052 )
【研究意义】中国棉花总产量占全世界的1/4,消费量占全世界的1/3,中国棉花市场供求关系变化直接影响国际棉花市场[1]。棉纺企业强调以较强、较细和纤维更整齐的棉纤维作为纺织原料[2]。新疆具有适合棉花生长的自然条件和资源优势,2016年棉花总产占全国总产的68%[3]。根据2008~2016年我国新体制棉花公正检验质量数据,比较分析全国5大植棉省(区)的棉纤维品质表明,纤维长度以新疆地方的最长,马克隆值最优,断裂比强度则以新疆最低,仅为28 cN/tex,但近几年呈明显升高的趋势[4]。在棉花种植中,陆地棉产量高、适应性广使其占据主要地位,但棉纤维品质较差;海岛棉种植面积约占棉花种植总面积的5%~8%,生产规模较小,但棉纤维具有长、细、强等突出的特点。棉纤维的发育过程是一系列物质共同参与的复杂过程。【前人研究进展】成熟的棉花纤维的细胞壁主要由90%或95%以上纤维素构成,其余为纤维素伴生物和部分未知物。木质素是芳香族杂多聚合物,是苯丙烷代谢途径的重要产物,生物合成途径已经较为清楚[5-7],是纤维素后第2类最丰富的植物生物聚合物,主要沉积在维管植物的次生细胞壁中,是水分运输、机械支持和植物病原防御所必须的[8]。木质素单体的生物合成途径涉及到许多酶的参与,C3H/HCT是发现较晚的2个酶,在从对-香豆酰辅酶A(p-coumaroylCoA)到咖啡酰辅酶A(caffeoylCoA)的羟基化过程中起作用,是控制木质素H-单体与G/S-单体相互转化的关键酶[9]。HCT是一种在木质素单体合成途径中发现的酶,最早是从烟草中分离得到的[10],属于脂肪酰转移酶的大家族,脂肪酰转移酶主要涉及多种次生代谢生物合成过程。HCT不仅可以催化咖啡酰辅酶A与奎尼酸合成绿原酸,还可以逆向催化绿原酸生成咖啡酰辅酶A与奎尼酸,促使更多底物用于木质素的合成[11]。【本研究切入点】HCT能将对香豆酰辅酶A转化成相应的莽草酸/奎尼酸酯,而羟基化的底物来自C3H。莽草酸/奎尼酸酯可通过HCT的逆反应过程转化成相应的辅酶A酯。通过分析拟南芥中C3H基因更加证实了HCT在木质素合成途径中的作用[12]。木质素也是影响纤维素水解的一个重要因素,其存在严重阻碍了纤维生物质能源的利用。改变木质素含量和组分是当前木质素研究的主要热点。HCT基因在调控木质素生物合成中有着重要作用且木质素对棉花不同组织部位都有影响,木质素的生物合成及在成熟纤维中的含量与棉花纤维的品质有一定的关系[13],研究HCT基因在棉纤维发育中的功能。【拟解决的关键问题】从海岛棉新海21号中克隆GbHCT10基因,通过生物信息学方法分析GbHCT10的cDNA序列和氨基酸序列并实时荧光定量PCR技术分析海岛棉GbHCT10基因在棉花纤维发育不同时期中的表达量差异,分析该基因的氨基酸序列和表达模式。
材料海岛棉新海21号种植于新疆沙湾县144团棉花遗传育种基地。以开花当天记作0 d(开花后0 d),分别摘0 d的胚珠和5、10、15、20、25、30、35 d的共8个时期棉花纤维,置于液氮中速冻,-80℃冰箱中保存备用。
1.2.1 植物总RNA的提取和cDNA第一链合成
采用植物多糖多酚RNA提取试剂盒(Quick RNA isolation Kit,北京天根生化科技有限公司),按照说明书操作,提取不同时期棉纤维的总RNA,再经1%琼脂糖凝胶电泳检测RNA的完整性,将质量完好的RNA用于后续试验。使用Thermo Nano Drop2000C核酸蛋白分析仪(北京赛默飞世尔科技有限公司)检测所提RNA的浓度和质量,并置于-80℃冰箱保存备用。使用Thermo反转录试剂盒(德国赛默飞)推荐反应体系合成cDNA第一链,反应体系和程序参照说明书。
1.2.2 海岛棉GbHCT10基因克隆
根据海岛棉转录组数据库设计克隆引物,上游引物:GbHCT10-F:5'ATGGAGATTACTATAAAGGAGTCTG-3'和下游引物:GbHCT10-R:5'-TCACAAGCTCCCATCGTTGA-3'。
选用海岛棉新海21号开花后5 d的棉纤维cDNA为模板,用高保真Taq聚合酶进行PCR扩增。PCR程序为:94℃预变性5 min,94℃变性 30 s,57℃复性 45 s,72℃延伸 1 min 30 s,共 35 个循环;72℃延伸 10 min。采用1%琼脂糖凝胶电泳检测扩增产物,使用紫外凝胶成像仪观察并切下目的片段。按照普通琼脂糖凝胶DNA回收试剂盒(天根试剂公司)说明书步骤纯化回收PCR产物,连接至T5载体,转化入大肠杆菌DH5α感受态细胞(全式金公司)。通过菌液PCR筛选鉴定出阳性克隆,送至深圳华大基因有限公司测序,并对测序结果进行比对分析。
1.2.3 生物信息学分析
利用生物信息学网络平台NCBI网站(http://www.ncbi.nlm.nih.gov/)提供的blastn(http://blast.ncbi.nlm.nih.gov/Blast.cgi)程序对海岛棉GbHCT10基因的cDNA序列进行进行相似性搜索,下载不同物种的HCT基因序列,再经DNAMAN软件分析序列的核苷酸组成以及进行多重序列比较和相似度比对,采用ClustalX2.0比对序列,再利用MEGA7.0软件构建系统发生树。使用ORF Finder(http://www.ncbi.nlm.nih.gov/gorf/or
Fig.cgi)工具分析海岛棉GbHCT10基因序列的开放阅读框。使用Coden Usage Database网站提供的Countcodonprogram(http://www.kazusa.or.jp/codon/countcodon.html)分析海岛棉GbHCT10基因完整ORF序列的密码子使用频率。利用blastp(http://blast.ncbi.nlm.nih.gov/Blast.cgi)程序对海岛棉GbHCT10基因的编码蛋白进行相似性搜索。使用ProtParam(physico-chemical parameters of a protein sequences,http://web.expasy.org/protparam/)在线程序计算海岛棉GbHCT10基因编码蛋白的理化参数。使用BioEdit软件的Kyte&Doolittle方法计算蛋白质序列的疏水性分布。使用SignalP(http://www.cbs.dtu.dk/services/SignalP)在线程序对该蛋白质进行信号肽预测。利用在线程序COILS(http://www.ch.embnet.org/software/COILS_form.html)预测该蛋白的卷曲螺旋结构。该蛋白质的可能跨膜区,用TMHMM(http://www.cbs.dtu.dk/services/TMHMM-2.0)在线程序分析。通过https://web.expasy.org/protparam/在线预测蛋白质分子量及等电点等理化性质。通过在线预测软件SoftBerry ProtComp9.0(http://www.SoftBerry.com)对GbHCT10蛋白进行亚细胞定位,利用http://bioinf.cs.ucl.ac.uk/psipred/在线预测蛋白质二级结构,通过http://swissmodel.expasy.org/在线预测蛋白质三级结构。通过Plant care(http://oberon.fvms.ugent.be:8080/PlantCARE/index.html )网站对GbHCT启动子上游2 000 bp进行顺式作用元件分析。
1.2.4 实时荧光定量PCR
根据已获得的目的基因序列,设计实时荧光定量PCR引物,以UBQ7为内参基因,将海岛棉新海21号不同时期棉纤维的cDNA用ddH2O稀释10倍后作为模板,采用7 500 Fast实时荧光定量PCR仪检测GbHCT10基因在不同时期棉纤维发育时期中的表达情况,用内参基因检测扩增效率一致性。QPCR扩增体系参照说明书。
试验进行3次生物学重复,采用2-ΔΔCT法分析试验数据,数据分析采用Excel软件进行数据统计分析和作图。
通过DNAMAN软件对新海21号GbHCT10与树棉(Gossypiumarboreum),棕色棉(GossypiumhirsutumLinn.),烟草(Nicotianatabacum),拟南芥(Arabidopsisthaliana),毛白杨(Populustomentosa),辐射松(Pinusradiata),蒺藜苜蓿(Medicagotruncatula),蝶豆(ClitoriaternateaL),一串红(Salviasplendens),金银花(LonicerajaponicaThunb.),水稻(OryzasativaL),紫薯(ipomoeabatatas),可可(Theobromacacao),小果咖啡(Coffeaarabica),槿麻(Hibiscuscannabinus),蓖麻(Ricinuscommunis),丹参(SalviamiltiorrhizaBunge),葡萄(VitisviniferaL.),番茄(Solanumlycopersicum)的HCT氨基酸序列进行相似性比对分析。
研究表明,GbHCT10基因编码区长度为1 248 bp,包含一个完整的ORF,编码415个氨基酸,其中GUA密码子的使用频率最高。利用protparam在线预测得出,分子式为C2086H3246N552O603S10,蛋白质分子量为45.13 kD,等电点为6.01,脂肪系数为94.43,总平均亲水性为-0.144。该蛋白大约在200~220位氨基酸之间含有1个典型的亲水性区域,属于亲水性蛋白。跨膜区分析显示该蛋白的1~400个氨基酸位于细胞外,不含有跨膜区,属于非膜受体蛋白。SoftBerry ProtComp9.0在线预测亚细胞定位结果表明,GbHCT蛋白可能定位于线粒体(9.15),卷曲螺旋预测显示,该蛋白含有2个典型的超螺旋结构。蛋白质二级结构分析表明,GbHCT10基因编码的415个氨基酸中,α-螺旋占3.4%,β-折叠占6.4%,无规则卷曲占90.2%。GbHCT10蛋白主要由螺旋卷曲构成,与之前预测结果一致。启动子序列中含有多种必备启动子元件,如含有脱落酸响应元件ABRE、机械损伤响应元件WUN-motif、乙烯响应元件ERE、防御与应激响应元件TC-rich repeats等与逆境胁迫响应的顺势作用元件,GbHCT基因可能在多种逆境胁迫中发挥作用。还包含多个与激素信号转导和其他信号运转相关的顺势作用元件,如TGACG-motif等。图1~6,表1
表1 GbHCT启动子中的顺式作用元件预测Table 1 Cis-regulatory element prediction in GbHCT promoter
研究表明,新海21号GbHCT10与树棉同源性达94.5%,其他依次为棕色棉(59.9%),葡萄(59.1%),槿麻(58.7%),毛白杨(58.4%),小果咖啡(58.2%),可可(58.2%),蓖麻(57.7%),拟南芥(57.4%),金银花(57.2%),蒺藜苜蓿(57.1%),辐射松(57.0%),烟草(56.9%),丹参(56.7%),蝶豆(56.6%),番茄(55.5%),水稻(41.1%),一串红(25.4%)。通过MEGA7.0软件构建系统发生树,新海21号GbHCT10基因与树棉HCT基因在同一分支且亲缘关系性最为相近。图7,图8
研究表明,GbHCT10基因在棉花不同纤维发育时期中均有表达,该基因在开花后第5 d和第10 d表达量高,第25 d表达量最低,呈现出先上升再下降再上升再下降的波动趋势。图9
棉花纤维是由胚珠表皮细胞在受精前后经分化突起、伸长、次生壁增厚和脱水成熟而形成的,各时期具有不同特点但又相互重叠[14]。伸长期是生化反应最活跃的时期,也是影响纤维品质的关键时期[15]。已有研究表明,成熟棉花纤维细胞壁中含有苯丙烷代谢途径的产物木质素[16]。暗示木质素的生物合成及在成熟纤维中的含量与棉花纤维的品质可能有关系。木质素的合成过程会受到不同基因的调控,是一个复杂的过程。当合成过程中某个酶的表达活性降低时,其他酶的表达活性也会受到影响[17-18]。HCT作为调控木质素G/S-单体生物合成及H-单体和G/S-单体生物转换的关键酶,对木质素的单体组成及含量具有重要作用。HCT在高等植物上由一个小的基因家族组成[19-20],到目前为止,已从柠条锦鸡儿[21],杨树[22],红腺忍冬[23],金银花[24],鸭梨[25],野生鸭儿芹[26]等植物中克隆得到HCT基因,但是研究HCT基因在棉纤维发育中的功能报道还比较少有。从海岛棉中克隆了木质素合成途径中的HCT基因全长cDNA,该序列全长1 248 bp,编码415氨基酸。并通过进一步的生物信息学方法分析研究了GbHCT10的cDNA序列和氨基酸序列,对其编码的蛋白进行了结构和功能的预测,使用实时荧光定量PCR技术分析了海岛棉GbHCT10基因在棉花纤维发育不同时期中的表达量差异。发现GbHCT10基因在分化突起期(0~3 d)表达量逐渐上升,纤维迅速伸长期(5~15 d)基因表达量最高,15~25 d纤维生长减缓时期,该基因表达量随之降低,纤维加厚期(25~50 d)的早期表达量高,后期逐渐降低,总体表达呈现波动变化,研究HCT基因在棉纤维发育中的作用,进一步研究该基因的表达对纤维发育过程中木质素含量的影响,对改善棉花纤维品质有着重要研究意义。
克隆了1个海岛棉HCT基因,命名为GbHCT10,该基因具有长度为1 248 bp的开放阅读框,编码了415个氨基酸,预测其蛋白质分子量为45.13 kD,等电点为6.01,并对GbHCT10蛋白的跨膜区,亲水性,亚细胞定位,二级结构和三级结构等序列特征进行了预测。同源序列比对和系统进化树表明GbHCT10基因序列与树棉HCT基因序列相似度最高,通过对海岛棉GbHCT10启动子顺势作用元件分析,发现了ABRE、WUN-motif、MYB、TC-rich repeats等在不同逆境中参与防御和胁迫反应的顺势作用元件,GbHCT10基因可能参与到不同种非生物胁迫响应过程中,通过实时荧光定量PCR技术分析发现海岛棉GbHCT10基因在棉花不同纤维发育时期中均有表达,主要在纤维伸长期和次生壁加厚时期优势表达,该基因可能参与棉花纤维发育进程。