中国辣椒BCAT 基因家族鉴定、表达分析及克隆

2022-02-07 02:08谢炳春黄俊霖温松森徐小万徐晓美吴智明
广东农业科学 2022年12期
关键词:基序支链辣椒

谢炳春,黄俊霖,温松森,李 涛,李 颖,徐小万,徐晓美,吴智明,衡 周

(1.仲恺农业工程学院园艺园林学院,广东 广州 510225;2.广东省农业科学院蔬菜研究所/广东省蔬菜新技术研究重点实验室,广东 广州 510640)

【研究意义】辣椒(Capsicumspp.)是茄科(Solanaceae)辣椒属(CapsicumL.)植物,原产于中南美洲,是我国种植面积最大的蔬菜[1]。中国辣椒(Capsicum chinenseJacq.)是辣椒5 个主要栽培种之一,其大多数资源均富含浓郁果香味,具有更丰富的味觉层次,是极好的商品性状,如海南黄灯笼辣椒[2]、广西小黄灯笼辣椒[3]和云南涮辣[4]等。据报道,中国辣椒中果香物质主要为3-甲基丁酸-4-甲基戊酯、2-甲基丁酸-4-甲基戊酯和3-甲基丁酸-4-烯-6-甲基庚酯等支链酯类物质[5]。植物支链酯类主要通过支链氨基酸途径合成。BCAT 催化支链氨基酸生成相应的2-氧代酸[6],经过多步反应后合成支链酯[8]。研究表明,BCAT基因在辣椒支链酯及相关代谢物合成过程中发挥着重要作用,因此开展中国辣椒BCAT基因的克隆和时空表达特征分析,对该基因功能研究和提升华南地区辣椒品质育种具有重要意义[8-9]。【前人研究进展】BCAT 作为催化植物支链酯类物质合成第一步反应的酶,受到许多研究重视。2002 年Diebold 等[10]首次鉴定并克隆出拟南芥中6 个BCAT基因并对其进行基因功能验证,结果显示AtBCAT1、AtBCAT2、AtBCAT3、AtBCAT5和AtBCAT6参与支链氨基酸合成,AtBCAT2、AtBCAT3、AtBCAT5 蛋白定位于叶绿体,AtBCAT1 蛋白位于线粒体。Schuster 等[11]2005 年使用GUS 染色和酶促动力学等方法证明AtBCAT1 参与拟南芥所有组织中支链氨基酸代谢;2006 年发现AtBCAT4 参与蛋氨酸的链延长途 径[12]。2008 年Knill 等[13]推 测AtBCAT3 最有可能催化蛋氨酸链延长过程中的末端步骤,从而产生短链硫代葡萄糖苷。随后又有研究者相继对番茄[14]、水稻[6]和小麦[14-15]中的BCAT基因进行功能验证,相关基因功能与拟南芥的结果一致。2014 年郭道义[16]通过联合改造酵母的亮氨酸、缬氨酸和脂肪酸途径,成功实现支链醇和支链酯的生物合成,目前微生物中BCAT 参与支链醇和支链酯合成已经被研究得比较清楚[17-18]。在乳球菌[19]、甜瓜[20]和香蕉[21]中均有报道显示其表达量与支链酯类含量呈正相关。【本研究切入点】广东省农业科学院蔬菜研究所茄果研究室研发的辣椒品种金田1 号具有浓郁果香,据先前预实验分析得知其挥发性有机物质主要为支链酯,这为中国辣椒支链氨基酸转氨酶研究提供了物质基础,前人研究表明BCAT基因参与支链酯和辣椒素等次生代谢物的生物合成,但在辣椒中还没有BCAT基因家族相关的报道。【拟解决的关键问题】本研究拟通过对中国辣椒BCAT基因家族的生物信息学鉴定、表达模式分析及克隆,明确中国辣椒基因组中BCAT基因的数目及分布,获得其BCAT基因时空表达特征及确切序列。本研究是辣椒BCAT功能研究的基础,可为辣椒支链酯类物质代谢机理研究提供一定的理论支持。

1 材料与方法

1.1 试验材料

供试材料为中国辣椒栽培种金田1 号(图1、图2),由广东省农业科学院蔬菜研究所茄果研究室李颖提供。2021 年7 月将辣椒种子浸泡12 h后于28℃催芽,露白后播种于装有专用育苗基质的32 孔穴盘,待幼苗长至5~6 片真叶,移栽到广东省农业科学院白云试验基地露地栽培,按常规田间栽培管理。开花坐果后分别挂牌,每隔5 d取样1 次,分别取名为F1~F8,设3 个生物学重复,液氮速冻后带回实验室液氮下研磨成粉末保存于–80℃超低温冰箱。

图1 辣椒植株Fig.1 Plant of Capsicum chinense

图2 不同生长时期辣椒果实Fig.2 Different stage of pepper fruit

1.2 试验方法

1.2.1 辣椒BCAT 家族数据获取与鉴定 由NCBI网站(https://www.ncbi.nlm.nih.gov/)下载中国辣椒基因组数据,查询相关文献已经验证过的BCAT基因的序列信息(表1),在Pfam 网站(https://pfam.xfam.org/search/#tabview=tab1)下载BCAT(PF01063)的hmm 文件,使用HMMER(V3.3.1)软件和TB Tools(V1.09876)软件对蛋白质的氨基酸序列进行比对(E-value<1×10-5,其余参数默认)。通过在线BLAST、hmmsearch及hmmbuild 和hummsearch 联用等手段对辣椒BCAT 基因家族成员进行鉴定。

表1 已鉴定的BCAT 基因Table 1 Identified BCAT genes

1.2.2 辣椒BCAT基因家族成员蛋白理化性质、亚细胞定位预测和染色体定位 辣椒BCAT 蛋白的氨基酸数目、分子量大小、等电点、亲水性及亚细胞定位预测分别由在线软件ExPASy-ProtParam(https://web.expasy.org/protparam/)和Plant-mPLoc serve(http://www.csbio.sjtu.edu.cn/bioinf/plant-multi/)完成,染色体分布图绘制在软件MapChart 2.32 上完成。

1.2.3 辣椒BCAT基因家族进化树构建 使用MAGA X(Version 10.2.6)软件对拟南芥、番茄、水稻、小麦和辣椒BCAT 家族成员构建系统进化树(邻接法,1 000 次重复)。

1.2.4 辣椒BCAT基因家族成员内含子外显子分析 使用在线工具GSDS2.0(http://gsds.gao-lab.org/)对辣椒BCAT基因家族成员内含子外显子进行分析。

1.2.5 辣椒BCAT家族基因保守基序分析 使用在线软件MEME(http://memesuite.org/tools/meme)对辣椒BCAT 蛋白进行保守基序(Motif)分析,最大motif 检索数值为20。

1.2.6 辣椒BCAT家族基因蛋白质二级结构、三级结构分析、活性位点和配体预测 分别使用在线软件SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)和数据库Phyre2(http://www.sbg.bio.ic.ac.uk/phyre2/html/page.cgi?id=index)提交所得蛋白序列,经过运算后得到蛋白质二级结构和三级结构。使用蛋白质活性位点预测数据库COACH(https://zhanggroup.org/COACH/)对辣椒BCAT 蛋白进行活性位点及配体预测,提取配体结合度最高的结果,使用软件PyMOL(https://pymol.org/2/)进行修饰,查看BCAT 基因家族成员蛋白的溶剂催化通道。

1.2.7 辣椒BCAT家族基因启动子区域顺式作用元件分析 提取BCAT基因家族成员起始密码子上游2 000 bp 序列,利用在线网站Plant CARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)结合TBtool 软件对BCAT基因家族成员启动子区域的顺式作用元件进行预测分析。

1.2.8 辣椒BCAT基因家族成员时空表达量分析 使用北京全式金生物技术股份有限公司RNA提取试剂盒提取辣椒根、茎、叶、花和各个时期果实的总RNA;反转录试剂盒和荧光定量试剂盒SYBR Premix Ex TaqTM均购自日本TaKaRa 公司,以上所有操作均按照试剂盒说明书进行。反转录体系使用20 μL 体系,荧光定量PCR 采用25 μL体系,扩增程序为95℃ 30 s、95 ℃ 5 s、60℃ 30 s,40 个循环;溶解曲线绘制程序为:65 ℃到95 ℃每0.5℃依次读板,每个样品3 次重复。目标基因相对表达量计算使用2–ΔΔCT法。荧光定量PCR引物信息如表2。

1.2.9CcBCAT1~4 基因克隆 根据CcBCAT1~4基因模板序列于目标基因前后设计带接头特异引物(表2),使用cDNA 进行扩增胶回收后连接pNC-Cam1304-SubN 载体[22]。连接好的载体转入Trans5α,菌液PCR 阳性后送北京擎科生物科技有限公司测序。

表2 引物信息Table 2 Information of the primers

2 结果与分析

2.1 辣椒BCAT 基因家族成员鉴定和进化分析

通过自建隐马尔可夫模型和下载隐马尔可夫模型分别得到7 个BCAT基因,去除重复和保守结构域筛选后鉴定出5 个BCAT基因家族成员,分别命名为CcBCAT1、CcBCAT2、CcBCAT3、CcBCAT4、CcBCAT5。染色体物理位置定位分析显示,辣椒BCAT1~BCAT5 染色体位置分别位于12、4、2、8 和4 号染色体(图3)。这些基因位于4 条染色体末端,其中CcBCAT2和CcBCAT5重复相近地位于4 号染色体上,这两个基因在表达上可能有所联系,其余辣椒BCAT 基因分别位于一条染色体上。

图3 CcBCATs 基因染色体定位图Fig.3 Chromosome location of the CcBCAT genes

系统进化分析显示辣椒BCAT基因的同源性与同为茄科的番茄同源性极高,如SlBCAT1、SlBCAT2和SlBCAT3分别与CcBCAT1、CcBCAT2、CcBCAT3高度同源,可以推测对应蛋白质具有相似的功能;CcBCAT4则呈现独立进化;CcBCAT5与AtBCAT1同源性较高(图4)。

图4 拟南芥、番茄、水稻小麦和中国辣椒中BCAT 蛋白的系统发育树Fig.4 Phylogenetic tree of BCAT proteins in Arabidopsis,tomato,rice,wheat and Capsicum chinense

辣椒BCAT基因家族成员内含子外显子分析结果(图5)表明,BCAT1 和BCAT3 含有9 个内含子,BCAT2、BCAT4 和BCAT5 分别含有8、18、4 个内含子。BCAT1 的内含子序列最长,将近17 kb;BCAT2 的内含子序列最短,仅有2 kb左右。

图5 CcBCATs 基因的结构Fig.5 Structure of CcBCAT genes

2.2 CcBCATs 启动子区域顺式作用元件分析

启动子控制着基因的时空表达,对基因的调控具有重要作用。辣椒BCAT 基因家族成员启动子顺式作用元件如图6 所示,BCAT基因家族成员启动子区域含有14 种启动子,如光响应元件、茉莉酸响应元件、低温响应元件等常见启动子。BCAT1-5 启动子区域均发现MYB 转录因子结合位点。

图6 CcBCAT 基因家族成员启动子区域顺式元件分析Fig.6 Cis-acting elements analysis for the promoter of CcBCAT gene family members

2.3 CcBCATs 基因家族成员理化性质和亚细胞定位预测

CcBCATs 蛋白的理化性质如表3,CcBCATs编码氨基酸序列长度在184 aa(CcBCAT5)至557 aa(CcBCAT4),分子量 在20 289.41 u(CcBCAT5)至89 598.03 u(CcBCAT4),等电点从5.57(CcBCAT5)至8.34(CcBCAT2),疏水性系数均为负值,为亲水性蛋白。亚细胞定位预测显示,CcBCAT1基因编码的蛋白定位在叶绿体和线粒体,其他CcBCAT 家族基因编码的蛋白均定位在叶绿体,这与番茄中BCAT基因定位结果[13]一致。

表3 中国辣椒CcBCAT 基因家族分布及理化性质分析Table 3 Basic information of BCAT family genes in Capsicum chinense

2.4 CcBCATs 基因保守基序分析

在线软件MEME 对CcBCATs 基因保守基序(Motif)分析结果表明,CcBCAT 蛋白中含有8个保守基序,有着相似的保守基序组成的辣椒BCAT 基因家族成员可能有着相似功能。其中基序4 和基序7 共同组成Aminotran_4 结构域(图7),除CcBCAT5基因不含有此结构域,其他辣椒BCAT基因家族成员均含有。对应MEME 预测的辣椒中基序1、基序2、基序4 和基序7 均为4 个基因成员含有,其中CcBCAT4 不含基序1 和基序2、CcBCAT5 不含基序4 和基序7。

图7 CcBCAT 蛋白质Motif 分析Fig.7 Protein motif analysis of CcBCAT protein

2.5 CcBCATs 基因蛋白质二级结构和三级结构分析

CcBCAT基因家族成员蛋白质二级结构分析结果(图8)表明,5 个基因家族成员均有α-螺旋、延伸链、β-转角和无规则卷曲4 种结构元件。CcBCAT4 的α-螺旋占比(34.83%)高于其他4 个基因家族成员;CcBCAT5 延伸链占比高于其他4 个基因家族成员,β-转角则相反;5个基因家族成员蛋白的无规则卷曲数量占比一致(表4)。

图8 CcBCAT 蛋白二级结构预测分析结果Fig.8 Prediction analysis of the secondary structure of CcBCAT protein

表4 CcBCATs 蛋白二级结构元件Table 4 Secondary structure of CcBCATs proteins

CcBCAT基因家族成员蛋白三级结构、活性位点和配体预测如图9 所示,其蛋白质三级结构外型相似,活性位点均在蛋白质腔体内部。配体预测结果显示BCAT1-4 的配体均为4-甲基-2-氧戊酸,BCAT5 则没有合适配体。

图9 CcBCAT 蛋白三级结构预测分析结果Fig.9 Prediction analysis of the tertiary structure of CcBCAT protein

2.6 CcBCAT 基因家族成员时空表达量分析

CcBCAT基因家族成员时空表达量分析如图10 所示,辣椒BCAT基因家族成员在不同组织表达情况分析发现:CcBCAT1在F1 期表达量最高,CcBCAT2在花中的表达量最高,CcBCAT3、CcBCAT4在成熟辣椒中表达量最高,CcBCAT5在根、茎、叶、花和果实中均没有表达。

图10 CcBCAT 基因在不同组织及果实发育中的表达情况Fig.10 Expression of CcBCAT genes in different tissues and developing fruits

对BCAT基因家族成员在辣椒果实成熟过程基因表达量进行分析,结果显示,CcBCAT1表达量在辣椒果实成熟过程中呈现逐步下调的趋势并在成熟果实中达到最低值,CcBCAT2和CcBCAT3的表达量在辣椒发育过程中呈现先下降后升高并在成熟果实中达到峰值,CcBCAT4表达量在辣椒发育成熟过程中逐步提升并在成熟果实中达到最高。

2.7 CcBCAT1~CcBCAT4 基因克隆

根 据CcBCAT1~CcBCAT4的CDS 序列设 计PCR 特异引物,以cDNA 为模板,对目标基因进行PCR 扩增,获得长度约为2 000 bp 大小的片段(图11)。片段胶回收,连载体转入大肠杆菌中,将PCR 阳性菌落送测序,测序序列与目标参考序列进行比对,CcBCAT1、CcBCAT2和CcBCAT4克隆序列与模板序列完全一致;CcBCAT3则显示第18、23、225 和903 处有单个碱基突变,造成CcBCAT3 氨基酸序列第8 处的缬氨酸(V)变成丙氨酸(A)。

图11 CcBCAT1~CcBCAT4 基因扩增结果Fig.11 Amplification result of CcBCAT1~CcBCAT4 genes

3 讨论

BCAT基因家族作为一个小基因家族,最早于拟南芥中开始研究,是生物体内支链氨基酸代谢的重要一环,对辣椒合成相关支链氨基酸衍生物如辣椒素[23]和支链酯[7,24]等应对生物及非生物胁迫具有重要意义,在拟南芥[10-11]、番茄[14]、水稻[6]和小麦[15]中均有报道。本研究从中国辣椒基因组中鉴定出5 个BCAT基因,发现CcBCAT1~CcBCAT3在进化关系上分别与番茄[14]SlBCA-T1-3 高度同源;CcBCAT4虽然在进化树位置上呈现独立进化,但是CcBCAT4的氨基酸序列拥有BCAT 基因的Aminotran_4 结构域,并且配体预测结果与4-甲基-2-氧戊酸[7]底物特异性结合;CcBCAT5则与拟南芥AtBCAT1同源性较高。CcBCAT 亚细胞定位结果显示,除CcBCAT1 定位在叶绿体或线粒体,其他均在叶绿体中,符合支链氨基酸转氨酶亚细胞定位结果[6,14]。因此所鉴定出的5 个CcBCAT基因与经过验证的BCAT[6,10-11,14-15]基因序列特征相似,具有支链氨基酸转氨酶蛋白的主要特征。

启动子是一段位于结构基因5′端上游区的DNA 序列,决定基因的表达与否。对启动子的研究有利于了解CcBCAT基因的调控模式和对外界环境的响应。启动子顺式元件分析显示,辣椒BCAT基因家族成员基因在启动子区域具有多种顺式作用元件,包括调控辣椒素及次生代谢物合成的MYB 转录因子结合区域。MYB 转录因子是植物中第一大类转录因子家族,广泛参与调控植物次生代谢物合成,对植物抵御外界生物胁迫[25-27]和非生物胁迫具有重要意义。例如,2014年Li等[28]发现苹果MYB1 和MYB6 可以与苹果AAT2 启动子区域的MYB 位点结合,增强其转录活性;2019年Zhu 等[29]发现MYB31基因能激活辣椒合成途径相关基因,使辣椒素得以合成积累,2022 年Zhang 等[30]对辣椒素合成途径相关基因启动子区域分析,发现多个功能基因上游均有MYB 结合位点。还有研究发现,苹果中BCAT 参与了苹果支链酯合成[31]。结合本研究结果和已有文献推测,CcBCAT 可能在辣椒素和相关酯类物质合成中起到重要作用。

基因的表达量是影响蛋白表达丰度进而影响相应酶功能的重要因素。对CcBCAT基因的表达分析显示其存在组织特异性表达,且在果实的不同发育时期表达规律也有所差异。CcBCAT5 虽然有完整的开放阅读框、能编码完整的蛋白,但是在所有组织器官中均检测不到表达,这一结果与番茄中SlBCAT5-6 表达模式[32]一致。但CcBCAT5是否是一个假基因还需要进一步验证。CcBCAT4 仅在辣椒花和果实中有表达,并且随着果实的生长表达量不断提高,与辣椒素积累量[33]、辣椒挥发性有机物质积累量呈正相关,推测其参与中国辣椒的辣椒素合成,该结果与Zhang 等[30]、Zhang 等[34]和Kim 等[23]研究结果一致,而番茄果实中BCAT 则一直呈现低水平表达[14]。CcBCAT2 和CcBCAT3 的表达模式相似,辣椒果实发育时两者的表达量变化一致,CcBCAT2 和CcBCAT3 两者之间有可能与拟南芥AtBCAT3-4的关系[12-13]相似,参与蛋氨酸碳链延长步骤中的一环,不过两者的功能和相关性还需要更多实验数据进行支撑。

4 结论

通过生物信息学的方法鉴定出中国辣椒基因组中5 个BCAT 基因,并对其蛋白质理化性质、二级结构、三级结构、活性位点、配体和时空表达特异性等进行分析,克隆出CcBCAT1~CcBCAT4等4 个关键基因。结果表明中国辣椒BCAT 基因家族是一个结构复杂的小基因家族,除CcBCAT5可能是个假基因,其他基因的表达均有特异性,如CcBCAT4在辣椒果实中表达模式与辣椒素和相关挥发性代谢物积累模式一致,有可能参与支链氨基酸衍生物合成。本研究将有利于推进辣椒支链氨基酸代谢研究,为辣椒风味品质提升提供数据支持。

猜你喜欢
基序支链辣椒
带TRS基序突变的新型冠状病毒威胁更大
辣椒也疯狂
芥蓝Aux/IAA家族基因生物信息学与表达分析
鼠伤寒沙门菌小RNA GcvB 靶基因筛选和验证分析
辣椒之争
通过合成生物学可改造非豆科植物进行固氮(2020.8.8 iPlants)
拣辣椒
3UPS-S并联机构单支链驱动奇异分析
基于非瞬时支链位形设计的并联机构内部奇异消除方法研究
基于构型演变和李群理论的2T2R型四自由度并联机构型综合