周义杰,闫希焕,高亭豪,刘 芳,杨明峰,马兰青,3*
(1.北京农学院植物科学技术学院/农业农村部华北都市农业重点实验室,北京 102206;2.生物与资源环境学院/农业农村部华北都市农业重点实验室,北京 102206;3.北京农学院北京林果业生态环境功能提升协同创新中心,北京 102206)
树莓(Raspberry)是蔷薇科(Rusaceae)悬钩子属(RubusL.)小浆果类灌木的统称,又名托盘、山莓、悬钩子等,是世界公认的第三代新兴水果,有“黄金水果”“生命之果”之称。树莓在栽培上主要有空心莓亚属(SubgenusIdeobatus)和实心莓亚属(SubgenusEubatus)两个亚属,其主要区别是空心莓亚属果实成熟时与花托分离而实心莓亚属果实成熟时与花托同落。空心莓亚属有欧洲红树莓(Rubusidaeus)、黑树莓(Rubusoccidentalis)和紫树莓(Rubusneglectus)3个种群,实心莓亚属有黑莓、无刺黑莓、匍匐形黑莓和黑莓杂交种4个种群[1]。树莓果实柔嫩多汁,色泽鲜艳,香气浓郁,风味独特,富含多种对人体有益的活性成分,如超氧化物歧化酶、鞣花酸、黄酮、类黄酮、树莓酮等,具有抗氧化、抗癌、抗菌消炎、抑制肥胖、预防心血管疾病等作用[2-5]。树莓除了果实能够鲜食外,还广泛用于食品、制药、保健品、化妆品生产等行业,发展前景广阔[6]。近年来,中国树莓产业推广速度较快,种植的面积和产量逐渐增加,但树莓果实采收时节气温较高,果实极不耐贮存,容易在运输过程腐烂变质,导致树莓鲜果上市期短,常温下货架期只有1~2 d[7],限制树莓产业的快速发展。
乙烯是一种重要的内源性植物激素,存在于植物的各个器官和组织中,参与调控高等植物的许多生理过程,比如种子萌发,生根,叶片、花器官的衰老、果实成熟和逆境胁迫等[8]。乙烯在植物中合成途径为:腺苷蛋氨酸合成酶催化蛋氨酸与腺苷酸(adenosine monophosphate, AMP)反应生成腺苷蛋氨酸(s-adenosvlmeIhionine, SAM);ACS催化SAM生成1-氨基环丙烷-1-羧酸(1-aminocyclopropane-1-carboxylate, ACC);ACC氧化酶(1-aminocyclopropane-1-carboxylate oxidase, ACO)催化ACC氧化生成乙烯,其中ACS是整个合成途径的限速酶[9]。自1990年从番茄果实的cDNA文库中分离得到第一个ACS基因序列以来[10],研究人员已经在很多植物中分离出ACS基因,所有这些植物中都含有一个以上的ACS基因[11-15],说明ACS是由多基因家族编码的。
电子克隆(insilicocloning)是随着基因组计划和EST(Expressed Sequence Tag)计划发展起来的基因克隆新技术。与传统的图位克隆、转座子标签技术、递减杂交技术等方法相比具有成本低、速度快、操作简单、目的性强的优势[16-18]。利用电子克隆技术进行树莓ACS基因家族成员的克隆,从中寻找与果实成熟相关的ACS基因,可以推进树莓果实成熟衰老机制的研究和应用,改善树莓果实不耐贮藏的特性,对于树莓产业的发展具有重要意义。然而传统的电子克隆技术依赖大量EST序列进行推测、组装和拼接来获得基因的电子序列[19],所以对于EST资料不够丰富的物种无能为力。与一些模式植物和其他蔷薇科经济植物相比,树莓的EST资料远远达不到传统电子克隆技术的要求。本研究使用一种新的电子克隆方案,通过ACS家族蛋白质保守结构域与树莓基因组比对获得基因的电子序列,然后进行基因组PCR验证,最终获得6条ACS基因,并对基因序列和其编码蛋白的理化性质、蛋白结构、同源性等进行预测和分析,为后续研究树莓ACS基因家族成员的差异表达和树莓果实成熟机制奠定基础。
树莓植物材料为本实验室组织培养保存,品种为‘托拉蜜’(Tulameen)。主要试剂有:植物DNA提取试剂盒(Magen,Guangzhou,China),金牌Mix高保真PCR酶(Tsingke,Beijing,China),胶回收试剂盒(Magen,Guangzhou,China),pClone007克隆载体(Tsingke,Beijing,China),DH5-α感受态细胞(Tsingke,Beijing,China),质粒快速提取试剂盒(Magen,Guangzhou,China)。
1.2.1 树莓ACS基因家族成员的电子克隆 以NCBI登录的蔷薇科ACS蛋白序列XP_004306735、XP_024176223、XP_021807957和XP_007219056与已知的拟南芥ACS蛋白家族序列[20]进行比对,得到蔷薇科ACS蛋白的7个保守结构域序列,将之分别与GDR(Genome Database for Rosaceae)数据库(https://www.rosaceae.org/)中树莓基因组进行tblastn比对,得到树莓ACS基因家族成员的电子序列及其所在染色体的位置信息。
1.2.2 树莓ACS基因家族成员的分子克隆及序列分析 根据所得电子序列使用Primer Premier 5.0软件设计引物(表1),由北京瑞博兴科生物技术公司合成。取树莓组培苗叶片200 mg使用植物DNA提取试剂盒提取基因组DNA,然后进行PCR扩增,PCR体系为:金牌mix 45 μL,上游引物(10 μmol/L)2 μL,下游引物(10 μmol/L) 2 μL,模板(100 ng/μL) 1 μL。PCR条件为:98 ℃,2 min;98 ℃ 10 s,Tm (RiACS1-6分别为:54、55、57、52、57、56 ℃) 15 s,72 ℃,45 s,35个循环;72 ℃,5 min。PCR产物经胶回收后连接到pClone007克隆载体并转化大肠杆菌感受态细胞,经过夜培养后挑取单克隆摇菌并进行菌液PCR,使用PCR呈阳性的菌液提取质粒,提取的质粒送北京睿博兴科生物技术有限公司测序。测序所得基因序列使用SnapGene软件分析GC含量,使用Augustus程序(http://bioinf.uni-greifswald.de/augustus/)分析开放阅读框(ORF,Open Reading Frame)和内含子,并获得CDS(Coding Sequences)序列和其所编码的蛋白序列[21],使用DNAMAN软件比较基因序列和蛋白序列之间的相似性。
表1 树莓ACS基因家族成员克隆引物Tab.1 Cloning primers of raspberry ACS family genes
1.2.3 树莓ACS家族蛋白序列的生物信息学分析 使用ExpPASYProtParam程序(https://web.expasy.org/protparam/)分析蛋白的理化性质[22],使用SignalP 4.1 Server程序(http://www.cbs.dtu.dk/services/SignalP/)进行蛋白质信号肽预测[23],使用TMHMMServer 2.0程序(http://www.cbs.dtu.dk/services/TMHMM/)进行蛋白跨膜结构预测[24],使用PSORT程序(http://psort1.hgc.jp/form.html)进行蛋白亚细胞定位预测,使用SOPMA程序(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)进行蛋白二级结构预测[25],使用SWISS-MODEL软件(https://swissmodel.expasy.org/)进行蛋白三维结构同源建模[26],使用DNAMAN软件进行蛋白多序列比对,使用MEGA 7.0软件生成系统进化树[27]。
由蔷薇科ACS蛋白与拟南芥ACS蛋白序列比对,得到7个蔷薇科蛋白保守结构域序列如下:IQMGLAEN、FQDY、FCLADPGDAFL、NPSNPLGT、YSLSKDMG、KMSSFGLVSSQTQ、PGWFRVCFA,将其分别与树莓基因组进行比对后得到6条树莓ACS基因家族成员的电子序列,将其按照染色体顺序命名。根据电子序列设计引物进行基因组PCR(图1),将PCR胶回收产物连接克隆载体测序,得到树莓ACS家族成员的基因序列。所得基因序列已上传至NCBI数据库,序列号为 MK388675、
注:M. Marker;1. RiACS5;2. RiACS4;3. RiACS1;4. RiACS6;5. RiACS2;6. RiACS3。Note: M. Marker;1. RiACS5;2. RiACS4;3. RiACS1;4. RiACS6;5. RiACS2;6. RiACS3.图1 树莓ACS基因家族成员PCR扩增Fig.1 PCR amplification of raspberry ACS family genes
MK388676、MK388677、MK388678、MK388679、MK388680。对其进行序列分析(表2)发现,RiACS1-6的GC含量均小于50%,与全基因组GC含量吻合[28],ORF长度在1 657~2 432 bp之间,除了RiACS1和RiACS2外其余均包含部分5′非翻译区和3′非翻译区序列,RiACS1含有2个内含子而其余均含有3个内含子,内含子的长度不等,最短的仅85 bp而最长的达713 bp,去除内含子后得到的CDS序列长度在1 392~1 608 bp之间。
表2 树莓ACS基因家族成员序列分析Tab.2 Sequence analysis of raspberry ACS family genes
使用DNAMAN软件对所得的基因序列和翻译而成的蛋白序列进行比对,结果显示树莓ACS家族成员之间基因序列相似性为39%~70%,蛋白序列相似性为29%~68%,这一结果与拟南芥中的研究结果一致[20],说明ACS家族成员的序列之间具有较大的差异性。
ExpPASYProtParam的蛋白理化性质分析结果表明,RiACS1-6的理论等电点集中在6.05~8.95;RiACS3和RiACS6正电荷残基数小于负电荷残基数,整体带负电,其余整体带正电;RiACS1-6不稳定系数均大于40,可能不稳定,总平均疏水性均小于0,可能是亲水性蛋白[22]。
SignalP的信号肽预测结果显示树莓ACS家族蛋白均不含有信号肽,为非分泌蛋白。TMHMMServer的跨膜结构预测结果显示RiACS4在第33—57个氨基酸位置具有一个跨膜结构域,预测其为跨膜蛋白,其余蛋白都不含跨膜结构域,为非跨膜蛋白,但RiACS6有部分氨基酸在膜内。PSORT的亚细胞定位预测结果表明RiACS1定位于细胞核的概率最大,为76.0%,RiACS2定位于细胞核的概率最大,为88.0%,RiACS3定位于细胞核的概率最大,为60.0%,RiACS4定位于内质网膜的概率最大,为60.0%,RiACS5定位于细胞质的概率最大,为65.0%,RiACS6定位于高尔基体的概率最大,为90.0%。
SOPMA的蛋白二级结构预测结果(表3)表明树莓ACS家族蛋白的二级结构以α-螺旋和无规则卷曲为主,分别占到36.26%~43.25%和33.76%~39.63%,各蛋白成员之间二级结构组成区别不是很大。
表3 树莓ACS家族蛋白的二级结构预测Tab.3 Secondary structure prediction of raspberry ACS family proteins
将树莓ACS家族蛋白输入SWISS-MODEL在线建模程序,以自动匹配模板方式进行同源建模,结果显示自动匹配到的模板均为ACS蛋白,GMQE值均在0.6~1.0之间,QMEAN值均大于0,覆盖度均较高,说明建模结果较为可靠。ACS蛋白以同源二聚体或异源二聚体的形式行使蛋白功能[29],建模结果预测RiACS1-6蛋白均以同源二聚体的形式存在,符合预期。由三维结构图(图2)可以看出,RiACS1-6蛋白均以α-螺旋和无规则卷曲为主,与二级结构预测结果一致;RiACS1、RiACS2、RiACS4、RiACS6三级结构相近,而RiACS3和RiACS5三级结构相近。
注:A-F RiACS1-6三维结构预测。Note: A-F three-dimensional structure prediction of RiACS1-6.图2 树莓ACS家族蛋白的三维构预测Fig.2 Three-dimession prediction of raspberry ACS family proteins
使用NCBI的blastp工具对树莓ACS家族蛋白进行同源性分析,发现其与其他蔷薇科植物的ACS蛋白序列均具有较高的相似性,其中与月季ACS蛋白序列相似性最高,RiACS1与月季ACS3序列相似性为91%,RiACS2与月季ACS1序列相似性为92%,RiACS5与月季ACS2序列相似性为89%。使用DNAMAN软件对树莓ACS家族蛋白和月季ACS家族蛋白进行多序列比对发现,RiACS1-6均含有ACS蛋白典型的7个保守结构域,而RiACS4和RiACS6在第6个结构域处与其他蛋白成员差异较大,这一结果与拟南芥中ACS10和ACS12的特点类似[20](图3)。
将树莓ACS家族蛋白序列和拟南芥ACS家族蛋白序列导入MEGA软件,进行Clustalw 比对后使用邻接法(NJ)生成系统进化树,bootstrap值设为1000(图4)。拟南芥ACS家族蛋白根据C末端序列差异可以分为三个类型:Type I是ACS1、ACS2和ACS6;Type II是ACS4、ACS5、ACS8和ACS9;Type III是ACS7、ACS11,此外AtACS10和AtACS12执行氨基转移酶功能[12,20,30-31]。从进化树可以看出,树莓ACS家族蛋白可分为3组,RiACS3、RiACS5与AtACS1、AtACS2、AtACS6聚集于同一分支,可能是Type Ⅰ型ACS蛋白;RiACS1、RiACS2与AtACS4、AtACS5、AtACS8、AtACS9聚集于同一分支,可能是Type Ⅱ型ACS蛋白;RiACS4、RiACS6与AtACS10、AtACS12聚集于同一分支,可能执行氨基转移酶功能。
图3 树莓ACS家族蛋白与月季ACS蛋白多序列比对Fig.3 Multiple sequence alignment of raspberry ACS family proteins with rose ACS protein
图4 树莓ACS家族蛋白进化分析Fig.4 Phylogenetic analysis of raspberry ACS family proteins
树莓是一种广受欢迎的新兴水果,具有较高的营养价值和经济价值,然而树莓果实极不耐贮存的特点阻碍了树莓产业的快速发展。乙烯在植物生长发育过程中起重要调控作用,根据成熟衰老过程乙烯释放和呼吸强度变化的不同,果实可分为跃变型和非跃变型两类,树莓果实属于非跃变型。20世纪乙烯被认为在非跃变型果实成熟衰老中发挥的作用非常有限,然而近年来越来越多的研究结果表明,非跃变型果实的成熟衰老过程也受乙烯调控[32-34]。目前有研究表明乙烯参与树莓果实成熟进程[35],然而其分子机理仍不清楚。乙烯合成的关键酶是ACS,因此,进行树莓ACS基因的克隆和分析有助于推进树莓果实成熟机制的研究,为改善树莓果实不耐贮存的特性提供理论基础。
随着基因组计划的进行,越来越多的物种完成了全基因组测序。与此同时,其中很多物种的EST资料却没有大规模的增长。传统的电子克隆利用EST数据库来获取电子序列,在EST资料不够丰富的物种中无法应用。本试验使用蛋白保守结构域序列与基因组数据库比对的方法进行电子克隆,避开EST数据库的限制。试验结果获得6个树莓ACS家族成员的基因序列和其蛋白序列,并进行生物信息学分析。值得一提的是,在电子克隆过程中,发现推测的第7条ACS基因(数据未显示),其特点是基因分为前后两段,两段分别比对都具有ACS基因特征。在基因两端设计特异性引物以基因组DNA为模板进行PCR扩增,得到1条长度远小于原本电子序列的基因片段,使用Augustus程序进行内含子分析发现其不含内含子,翻译后的蛋白序列经同源性分析属于ACS蛋白片段。由此可以推测树莓中存在第7条ACS基因,其电子序列由前后两段ACS基因构成的特点有可能是测序错误导致的。一般意义上的基因全长是指包含5′非翻译区、ORF和3′非翻译区的cDNA序列,现在的生物信息学手段无法通过基因组序列准确预测mRNA的5′非翻译区和3′非翻译区序列,所以虽然从基因组克隆到RiACS3、RiACS4、RiACS5、RiACS6的ORF区两端非翻译区序列,但仍无法确定其是否为基因全长,后续试验可以借助RT-PCR技术和RACE(rapid-amplification of cDNA ends)技术来获取包括第7条ACS基因在内的树莓ACS多基因家族成员的cDNA全长序列。
对本试验获得的树莓ACS家族基因序列和蛋白序列进行相似性比较,发现其成员之间具有较大的序列差异性。此外,尽管属于同家族基因,但其成员之间内含子数目和长度都不尽相同,其中RiACS1包含2个较短的内含子,RiACS3和RiACS5则含有两短一长的3个内含子,而RiACS4和RiACS6含有短-长-短3个内含子,这一发现也从侧面证明ACS多基因家族成员之间的序列差异性。树莓ACS家族蛋白的生物信息学预测和分析表明其均为不稳定的亲水性蛋白,均不含信号肽。RiACS1、RiACS2和RiACS3可能是位于细胞核的非跨膜蛋白,RiACS4可能是位于内质网膜的跨膜蛋白,RiACS5可能是位于细胞质的非跨膜蛋白,RiACS6可能是位于高尔基体的非跨膜蛋白。一般定位于内膜系统的蛋白和跨膜蛋白均含有信号肽,但RiACS4和RiACS6的预测结果却不含信号肽,可能是由于信号肽或亚细胞定位预测软件结果不准确导致的。RiACS1-6的二级结构较为相似,均以α-螺旋和无规则卷曲为主,三级结构均以同源二聚体形式存在,分为RiACS3、RiACS5和RiACS1、RiACS2、RiACS4、RiACS6两组。它们均含有7个ACS蛋白保守结构域,但RiACS4和RiACS6在第6个结构域处与其他蛋白有所差异,并且在系统进化树中,RiACS4和RiACS6与拟南芥ACS10、ACS12聚集于同一分支,而拟南芥ACS10、ACS12是氨基转移酶,所以推测RiACS4和RiACS6有可能是氨基转移酶的一种而不是ACS。
研究表明,植物ACS基因的表达具有组织、器官特异性,时空特异性,且受外界环境的影响[36]。本试验克隆到树莓6条ACS基因家族成员,后续可以开展RT-qPCR等试验来研究不同ACS基因家族成员在树莓中的表达差异性,找到在树莓果实成熟过程中特异性表达的ACS基因,为进一步研究树莓果实成熟机制奠定基础。