榅桲4CL基因的克隆与生物信息学分析

2021-07-05 01:26车玉红郭春苗木巴热克阿尤普吴津蓉
新疆农业科学 2021年6期
关键词:亲水性木质素果肉

杨 波,车玉红,郭春苗,木巴热克·阿尤普 , 吴津蓉,杜 鹃

(1.新疆农业科学院园艺作物研究所, 乌鲁木齐 830091;2.新疆农业职业技术学院, 新疆昌吉 831100)

0 引 言

【研究意义】榅桲(CydoniaoblongaMill.)是蔷薇科榅桲属植物,具有重要的药用价值和经济价值,新疆主要分布在喀什、阿克苏等地,栽培面积在1 000 hm2以上[1-2]。榅桲果肉高度木质化,作为水果鲜食因木质化的口感而不能被消费者接受[3-4]。【前人研究进展】果肉木质化是木质素在果肉中的沉积过程,与木质素代谢密切相关[5]。在木质素代谢途径中4-香豆酸辅酶A连接酶(4-coumarateCoAligase,4CL)基因是关键酶之一, 是调控苯丙酸途径与木质素前体合成的关键支点和纽带而备受关注[6]。近年来,4CL基因在慈竹[6]、杨树[7]、松树[8]、烟草[9]、非洲菊[10]、芒果[11]、葡萄[12]、枣[13]等多种植物上均已被克隆鉴定出来,对其功能和调控作用进行了系统研究。【本研究切入点】车玉红等已经对榅桲果实中与木质素代谢相关的CAD基因[14]和C4H基因[15]进行了克隆分析,但榅桲4CL基因的序列信息尚不明确。研究榅桲4CL基因的克隆与生物信息学。【拟解决的关键问题】以榅桲果肉为研究对象,研究克隆4CL基因的序列全长,并研究其序列特征,为该基因在榅桲果实发育过程中的作用和功能奠定基础。

1 材料与方法

1.1 材 料

1.1.1 榅 桲

采集地点为新疆喀什地区莎车县伊什库里乡榅桲示范园,供试品种为大果榅桲。采集时间为榅桲落花后40 d(5月21日)的果实。样品采集后迅速用冰块保存送至乌鲁木齐实验室在超低温冰箱-80℃环境下保存备用。

1.1.2 试 剂

大连TaKaRa公司提供实验所需PrimerSTAR DNA聚合酶、M-MLV反转录酶和T4DNA连接酶;QIAGEN公司提供质粒提取试剂盒;北京天根公司提供榅桲果肉总RNA提取所需要的试剂盒和琼脂糖凝胶回收试剂盒;实验采用的其他化学试剂均为国产分析纯试剂。

1.3 方 法

1.3.1 总RNA的提取和cDNA的合成

取榅桲果实果肉组织100 mg用液氮低温研磨,榅桲果实样品的总RNA进行提取按照植物多糖多酚总RNA提取试剂盒说明书中的操作流程进行,提取完成后,在配置1%的琼脂糖凝胶中检测RNA完整性,并用紫外分光光度计测定提取后的RNA浓度,根据琼脂糖凝胶与紫外分光光度计的检测结果,筛选出提取质量较高的RNA样品,将其保存于-80℃的冰箱中。得到的榅桲果实组织的总RNA模板,反转录得到榅桲果实组织的cDNA。

1.3.2 基因克隆

根据GeneBank数据库中已登录的4CL基因序列,选取以下5个物种进行同源性比对,选择近源物种桃(Prunuspersica,XM_007222403.2)、扁桃(Prunusdulcis,XM_034356296.1)、月季(Rosachinensis,XM_024307314.1)、甜樱桃 (Prunusavium,XM_021954558.1)等4个序列,针对高度同源性区域,采用Oligo 6.0软件设计了榅桲4CL基因序列的引物(4CL-senese:ATGGGACGGCGGCAGGGAT;4CL-antisenese:TCAAAGTTCGGAATAAGCAGAG)。以反转录获得的榅桲果实组织的cDNA为模板,利用高保真酶PrimeStar进行榅桲4CL基因全长编码区扩增,反应体系如下:cDNA 2 μL,5×PS buffer 2.5 μL,dNTP (2.5 mmol/L) 2 μL,正反向引物(10 mmol/L)各1 μL,Primer Star酶(2.5 U/μL) 1 μL,ddH2O补充反应体系至25 μL。PCR反应条件为:95℃、3 min,94℃、40 s,58℃、45s,72℃、1.0 min,72℃、5 min,35个循环。利用DNA胶回收试剂盒对PCR产物进行回收,并将其连接至pMD-18T载体(TAKARA)上,最后将连接产物送至上海生物工程技术服务有限公司测序。

1.3.3 序列分析与结构预测

采用ExPASy(http://cn.Expasy.org)的ProtParam和ScanProsite 程序对榅桲4CL基因编码蛋白的氨基酸残基数目及构成,相对分子量、等电点、亲疏水特点等理化参数,进行预测分析;分别采用PredictProtein(https://www.predictprotein.org/getqueries)和Swiss-model(http://swissmodel.expasy.org/)对榅桲4CL基因编码蛋白中二级结构和三级结构进行预测分析;用DNAMAN软件进行同源序列比对;利用MAGA 5.0软件,使用Neighbor-joining法中重复1 000次抽样的方法,对同源比对的所有序列进行系统进化树分析,用MEGA 4软件构建系统进化树。

2 结果与分析

2.1 榅桲4CL基因PCR扩增

研究表明,以榅桲果实cDNA为模板进行PCR扩增,扩增结果为产物条带大小约为1 710 bp,与预期的大小相符。将PCR产物与pMD-19T载体进行连接,转化入感受态细胞后,提取质粒,利用SalI和SmaI双酶切后,获得大小为1 700 bp左右的产物,其与预期的大小一致。图1

注:M为1 kb标记物;1表示4CL基因的PCR扩增产物;2表示4CL基因的酶切产物

2.2 榅桲4CL基因克隆

研究表明,PCR产物经回收、克隆和菌落PCR鉴定后,对其阳性克隆进行测序的结果,结果显示,PCR所得开放阅读框(ORF)的长度为1 710 bp,编码570个氨基酸,以ATG为起始密码子,TGA为终止密码子。图2

图 2 榅桲4CL基因的核苷酸和氨基酸序列Fig. 2 4CL gene nucleotide and amino sequence

2.3 榅桲4CL 基因编码蛋白的生物信息学

2.3.1 榅桲4CL氨基酸组成及理化性质

研究表明,甘氨酸Gly、丙氨酸Ala、亮氨酸Leu、苏氨酸Thr和丝氨酸Ser等氨基酸的使用频率较高,这5种氨基酸在氨基酸总量中的占比依次为8.6%、9.3%、9.9%、7.4%、7.7%。榅桲4CL蛋白的氨基酸总数为570个,分子质量为68.4 kD。表1

表 1 榅桲4CL基因所编码的氨基酸的组成Table 1 The composition of amino acids of 4CL protein

2.3.2 榅桲4CL基因编码蛋白亲水/疏水性

研究表明,在榅桲果实4CL蛋白氨基酸中,第87位与第450位的氨基酸残基的疏水性均最强,分别为4.0和4.12,第370位的氨基酸残基亲水性最强,为-3.311;另外,在该蛋白中,亲水性氨基酸累计有376个,疏水性氨基酸累计有194个,亲水性氨基酸的数目小于疏水性氨基酸的数目,榅桲4CL蛋白为亲水性蛋白。图3

图3 4CL基因编码蛋白亲水/疏水性的预测Fig. 3 Prediction of hydrophobicity and rophilicity of 4CL protein

2.3.3 榅桲4CL基因编码蛋白二级结构和三级结构的预测

研究表明,该蛋白的主要二级结构为β折叠与无规卷曲,其中占比最多的是无规卷曲(Random coil),达到44.27%;α螺旋(Alpha helix)的占比较少,仅为26.43%;β折叠(Extended strand)的占比居中为34.1%。找到同源性最高的模板,模板氨基酸序列的一致性为55.21%,并以第4~570位氨基酸建模,模型覆盖率为92%。图4

图 4 4CL 蛋白三级结构的预测Fig. 4 Prediction of tertiary structure of the 4CL protein

2.3.4 榅桲4CL基因的同源性比对

研究表明,通过DNAMAN,将榅桲4CL基因全长编码区序列与NCBI上公布的其他物种的氨基酸序列进行同源性比对分,榅桲4CL基因序列与水蜜桃(Prunuspersica,XM_007222403.2)、甜杏仁(Prunusdulcis,XM_034356296.1)、梅(Prunusmume,XP_008239280.1)、甜樱桃 (Prunusavium,XM_021954558.1)的4CL基因序列的相似度最高,均接近90%左右,分别为91.99%、90.71%、89.28%、89.48%;与黄梨(PyrusussuriensisxPyruscommunis,XM_009336035.2)、海棠(Malusdomestica,XM_008389654.3)、月季(Rosachinensis,XM_024307314.1)和可可豆(Theobromacacao,XM_007017910.2)的4CL基因序列的相似度均超过70%,分别为76.71%、77.08%、70.38%、70.17%。而与烟草、拟南芥模式植物的同源性较低,仅有55.53%和51.33%的相似性。图5

2.3.5 榅桲4CL蛋白的氨基酸组成及进化树

研究表明,水蜜桃是与榅桲4CL蛋白亲缘关系最近的物种,其次为甜杏仁,三者的4CL蛋白属于同一个分支;而拟南芥、烟草等1年生草本植物的4CL蛋白与作为多年生木本果树的榅桲4CL蛋白的亲缘关系较远,草本植物与木本植物间4CL蛋白存在差异。图6

3 讨 论

榅桲果实生育期虽长达160 d,但在果实发育早期木质素合成快、代谢旺盛。课题组前期通过间苯三酚染色研究发现木质素沉积的关键时期是果实发育前100 d,其中积累速度最快是第40 d左右[14],所以研究中榅桲果实的采样时间选择在榅桲开花后的第40 d采样。榅桲果肉中克隆出的C4H基因与榅桲果实发育中木质素的代谢紧密相关。

研究使用RT-PCR方法克隆获得榅桲组织C4H基因的编码区全序列区,序列全长为1 710 bp,编码570个氨基酸,该蛋白的相对分子质量为68.4 kD;榅桲C4H蛋白中在该蛋白中,亲水性氨基酸的数目大于疏水性氨基酸的数目(376个亲水性氨基酸,有194个疏水性氨基酸),推断为亲水性蛋白质;榅桲4CL蛋白二级结构中无规卷曲(Random coil)、α螺旋(Alpha helix)、β折叠(Extended strand)的占比分别为44.27%、26.43%和34.1%,说明榅桲4CL蛋白以无规卷曲结构为主,这与榅桲C4H蛋白结构特性相似[15];榅桲4CL基因与水蜜桃(Prunuspersica,XM_007222403.2)、甜杏仁(Prunusdulcis,XM_034356296.1)的4CL基因序列的相似度最高,均超过90%,达91.99%和90.71%,这与系统进化树分析榅桲C4H基因与水蜜桃亲缘关系最近,甜杏次之一致。

克隆得到的榅桲果实4CL基因的全长和序列特性与慈竹[6]杨树[7]、松[8]等林木,烟草[9]、非洲菊[10]等草本植物,以及芒果[11]、葡萄[12]、枣[13]等果树的4CL基因均不相同,说明同一基因在不同的物种中的结构、作用和功能间的差异性和多样性。此外,研究只是探明了榅桲果肉木质素代谢途径中关键酶基因中4CL基因的基因序列和基因结构特性,在榅桲果实发育过程中该基因的作用和功能,以及该基因与果肉木质化的关系、调控等问题还有待于进一步的深入研究。

4 结 论

获得了榅桲木质素代谢途径中关键酶基因4CL基因全长编码区序列,其开放阅读框(ORF)序列为1 710 bp,编码570个氨基酸,蛋白分子质量为68.4 kD,进化关系上与水密桃较,榅桲4CL蛋白为亲水性蛋白,二级结构中以无规卷曲(Random coil)为主。

猜你喜欢
亲水性木质素果肉
◎维美德为Mercer Rosenthal公司交付木质素提取生产线
双盐离子液体处理过程中木质素的结构变化
木质素基本结构、热解机理及特性研究进展*
My Favourite Fruit
木质素清洁高效分离研究进展
秋天的礼物
一种亲水性温敏聚合物荧光探针的制备及用于农产品中铝离子的检测
木本油料文冠果APETALA2基因全长cDNA序列与生物信息学分析
城市公共游园中对人亲水性的安全性思考
蒸馏沉淀法制备扑热息痛亲水核—壳分子印迹微球及其吸附性能研究