花生TCP转录因子的全基因组鉴定及组织表达特性分析

2021-05-13 08:50赵孝东甄萍萍陈明娜潘丽娟禹山林迟晓元张建成
作物杂志 2021年2期
关键词:野生种内含子结构域

王 通 赵孝东 甄萍萍 陈 静 陈明娜 陈 娜 潘丽娟 王 冕 许 静 禹山林 迟晓元 张建成

(1山东省花生研究所/农业农村部花生生物学与遗传育种重点实验室,266100,山东青岛;2临沂市农业科学院,276012,山东临沂;3德州市临邑县农业农村局,251500,山东德州)

TCP蛋白是植物特有的转录因子家族,其在各类高等植物的生长发育和胁迫响应过程中都有重要作用[1-2]。TCP的命名源自TB1(teosinte branched1)基因[3]、CYC(cycloidea)基因[4]、PCF1(proliferatingcellfactors1)和PCF2(proliferating cellfactors2)基因[4],该类基因编码产物的N-端均有1个55~59个氨基酸且高度保守的结构域,并形成1个非典型的螺旋-环-螺旋结构(bHLH),其中2个螺旋结构均由保守的亲水氨基酸构成。bHLH的主要功能是参与DNA结合、蛋白-蛋白互作和蛋白定位等[2,5-6]。根据该保守结构域的差异,TCP家族成员可划分为2个亚家族——亚家族Ⅰ(PCF)和亚家族Ⅱ(CYC/CIN)[7],与亚家族Ⅱ相比,亚家族Ⅰ在basic保守结构域缺少4个氨基酸,且亚家族Ⅰ序列同源性较高,而亚家族Ⅱ中各成员差异较大,可进一步划分为2个分支——CYC/TB1和CIN[8],且亚家族Ⅱ的成员均存在1个富含精氨酸基序的R保守结构域,Martín-Trillo等[7]推测该结构域与蛋白质互作有关。

据报道,TCP转录因子参与植物多种生理和生物学过程,主要包括侧枝形成[9]、叶形态建成[10]、花的发育[11]、种子萌发[12]、激素代谢途径[13]、逆境响应[14]和植物昼夜节律的调控[15]等。例如,在拟南芥种子萌发过程中,AtTCP14和AtTCP15既可通过赤霉素信号途径调控胚的发育[12],还能与泛素受体(DA1、DAR1和DAR2)结合来调节叶片形态和节间长度[10]。AtTCP20和AtTCP9通过茉莉酸信号途径调控叶片发育和衰老[16]。而AtTCP16在雄孢子中有显著表达功能,其下调表达可导致50%的花粉发育异常[17]。Zheng等[18]认为亚家族Ⅰ的TCP基因主要促进叶片细胞增殖,进而调控植物生长发育,而亚家族Ⅱ成员作为负调控因子,在细胞分裂过程中起抑制作用,减缓叶片生长和衰老。玉米TB1基因可抑制近腋分生组织生长,而其表达水平的降低可促进侧枝的发生[3]。而拟南芥和番茄的TB1类基因均可抑制腋芽的发生[19-20]。

目前,在拟南芥[16]、水稻[3]、大豆[21]、番茄[22]、高粱[23]、玉米[24]、葡萄[25]和海岛棉[18]等作物和模式植物中关于TCP转录因子的研究已有广泛报道。

花生(ArachishypogaeaL.)是我国重要的经济作物和油料作物,作为地上开花地下结果的豆科作物,其产量和品质会受到更为复杂因素的影响。然而,目前国内外尚未见花生TCP家族转录因子的相关研究报道。随着花生全基因组测序和注释的完成[26-27],其野生种和栽培种基因组数据为遗传育种和相关基因的生物功能鉴定提供重要参考。本研究利用生物信息学方法,在花生基因组数据库中搜索TCP转录因子,对这些基因的序列特征和染色体定位、进化关系和组织表达模式进行分析,不仅有助于鉴定花生TCP基因家族的功能,还为培育高产和品质优良的花生新品种提供理论基础。

1 材料与方法

1.1 花生TCP家族基因的鉴定

从pfam数据库下载TCP转录因子的HMM(hindden markov model,隐马尔科夫模型)文件(登陆号:PF03634),通过HMMER软件检索花生野生种和栽培种的蛋白质序列数据库(E-value=0.001),筛选候选基因。利用SMART(http://smart.emblheidelberg.de/)检测候选蛋白质序列,剔除不含bHLH基序的蛋白序列,最后得到花生野生种和栽培种中编码TCP蛋白的基因序列。

1.2 花生TCP 转录因子家族成员的结构特性分析

利用 GSDS(http://gsds.cbi.pku.edu.cn/index.php)分析TCP家族基因的内含子和外显子等结构信息。利用 Expasy 网站(http://web.expasy.org/protparam/)对花生TCP家族蛋白序列进行蛋白质分子量、等电点和氨基酸大小预测。利用ProtComp(http://www.softberry.com/berry.phtml?topic=protcomppl&group=pr ograms&subgroup=proloc)对TCP家族蛋白质进行亚细胞定位预测分析。

1.3 TCP基因家族系统进化及保守结构域分析

利用MEGA 7.0对筛选出的花生TCP基因家族的蛋白序列与拟南芥TCP家族基因序列进行多重序列比对(使用蛋白序列比对默认值),通过邻接算法(Neighbor-Joining,Boot-strap检验1000次)构建系统发育树。利用seqLogo(R语言包)和ClustalW对TCP保守结构域进行多重比对。

1.4 花生TCP家族的染色体定位分析

根据花生基因组数据库(https://www.peanutba se.org)中TCP家族各基因的位置信息,利用chromPlot(R语言包)生成花生TCP基因在基因组中的分布图。

1.5 花生TCP家族基因表达分析

根据已公布的野生种花生转录组数据(https://www.peanutbase.org/gene_expression),利用FPKM值分析野生种花生TCP家族基因的组织表达情况。利用heatmap2(R3.5.1软件包)对TCP家族基因在花生不同组织器官的表达模式绘制热图。

2 结果与分析

2.1 花生TCP家族基因鉴定及特性分析

利用pfam数据库中TCP家族转录因子保守结构域bHLH(登陆号:PF03634),通过检索野生种和栽培种花生基因库分别鉴定出19个和32个高同源的序列,其中野生种AA基因组有9个,BB基因组有10个(表1)。

对花生TCP家族基因的氨基酸编码区、分子量及等电点等生化属性的分析表明(表1),野生种花生TCP家族的氨基酸长度在84(Du1RN6D)~457(Du6M9JS)个之间,分子量为9.94(Du1RN6D)~47.01kD(Du6M9JS),等电点范围 6.55(DuJ06JT)~10.94(Du1RN6D)。栽培种花生TCP家族的氨基酸长度在131(HyM1TALC.1)~658(HyT0E7SC.1)个之间,分子量为14.16(HyM1TALC.1)~72.68kD(HyT0E7SC.1),等电点范围为4.99(HyQ2VML3.1)~10.53(Hy3CY5UQ.1)。鉴定出的花生TCP蛋白中,有4个成员(Du31JVP、IpH57JT、Hy3CY5UQ.1和HyT0E7SC.1)的N-端第1个氨基酸不是蛋氨酸(Met)。

表1 花生中TCP基因家族基本信息Table 1 The information of TCP family genes in peanut

利用ProtComp进行亚细胞定位分析表明,1个蛋白(RN6D)定位于高尔基体,6个蛋白(3K3P7、6MF1G、Y6QYT、Y5APX、18WYEQ.1和46V6T7.1)定位于叶绿体;1个蛋白(3CY5UQ.1)同时存在于细胞核和细胞质中,其余43个花生TCP家族蛋白均定位于细胞核(表1)。该结果对花生TCP家族蛋白功能的研究有一定的参考价值,但后续还需验证。

2.2 花生TCP基因染色体定位分析

根据PeanutBase信息,绘制染色体定位图谱(图1),TCP基因总体呈不均匀分布,野生种TCP基因分布于11个染色体上,其中包括6个AA染色体和5个BB染色体,而栽培种TCP基因分布于14条染色体上。野生种的A01、A08和B01以及栽培种1、8、13和18号染色体靠近中部的位置各有1个TCP基因,其余染色体上的TCP基因都分布于染色体端部。野生种中,A04和B03染色体上TCP基因分布最多,均为3个,A03、A10、B04和B10号染色体均为2个,其余5个染色体各有1个TCP基因。栽培种中,13号染色体上TCP基因最多,有5个,3号染色体有4个,1、10、18和19号染色体各有3个,4、9和14号染色体各有2个,其余5个染色体各有1个。栽培种花生TCP基因数量明显多于野生种,且栽培种比野生种多的TCP基因多集中在染色体的末端(图1)。

图1 野生种(a)和栽培种(b)花生TCP家族基因的染色体分布Fig.1 Chromosome distribution of TCP family genes in wild (a) and cultivated (b) peanut

2.3 花生TCP家族系统进化及基因结构分析

利用MEGA 7.0对鉴定出的花生TCP家族成员和17个水稻TCP蛋白序列构建系统进化树(图2),将51个花生TCP家族蛋白分为类群Ⅰ和类群Ⅱ,其中类群Ⅰ为PCF,含有17个TCP家族成员;类群Ⅱ进一步分为CIN和CYC/TB1,分别含有18个和16个成员。该聚类结果与高粱、玉米、拟南芥和水稻等植物中已报道的TCP家族基因的进化关系一致,且各亚家族中的TCP基因在染色体上亦是随机均匀分布的。

图2 花生与水稻TCP家族蛋白序列进化关系和亚组分类Fig.2 Phylogenetic relationship and subgroup classification of peanut and rice TCP family proteins

2.4 花生TCP基因结构及其保守结构域分析

用GSDS对序列结构进行分析,结果(图3)显示,花生TCP家族基因中各分支间基因的内含子数量及长度存在较大差异。在CIN中,除了HyU9727D.1无内含子,其余17个基因均含有内含子,其中HyUL2QPJ.1的内含子数最多,为5个,其次是Du.3K3P7和Du.0YU93,均有4个;HyUL2QPJ.2的内含子最长,约3380bp,其次是HyJF9204.1(3355bp)和HyUL2QPJ.1(3087bp)。在CYC/TB1中,HyI9FULJ和HyTU0X8W无内含子,其余14个TCP家族基因均含内含子,Hy3CY5UQ内含子数最多,有5个,同时其内含子也最长(1350bp)。在PCF中,HyXF5UIG内含子最多,有5个,同时其内含子最长(1608bp),HyKNN8RN有3个,HyCX086V有2个,HyQ2VML3和HyM1TALC仅有1个;而PCF其他10个基因均无内含子。

图3 花生TCP家族基因的进化树及基因结构分析Fig.3 Evolutionary tree and gene structure analysis of peanut TCP family genes

为进一步了解花生TCP家族基因的进化关系和结构特性,对鉴定的51个花生TCP转录因子蛋白序列进行保守结构域序列比对表明(图4a),这些成员均含有1个由约60个氨基酸组成的TCP保守结构域(bHLH,basic-helix-loop-helix),其含有2个保守元件:N端的碱性区域(basic region)和C端的α螺旋-环-α螺旋结构域(HLH),其中basic区的保守氨基酸多为碱性氨基酸,而Helix1、Loop和Helix2区的保守氨基酸主要是水溶性氨基酸(图4b)。与类群Ⅱ相比,类群Ⅰ中各成员的结构域保守性较高。在basic区域,类群Ⅰ比类群Ⅱ少4个氨基酸。

图4 花生TCP家族蛋白保守结构域分析Fig.4 Bioinformatics analysis of conserved domains of peanut TCP family proteins

2.5 花生TCP基因在不同组织中的表达分析

为了探究花生TCP基因家族各成员在花生中的具体表达模式,利用花生转录组数据(FPKM值)对19个野生种花生TCP基因在根、茎、叶、花器不同器官、雌蕊柄、荚果及种子发育不同时期等22个组织中的表达模式进行分析,结果(图5)表明,这些基因的组织表达模式分为2类(Ⅰ和Ⅱ),Ⅰ类中含有10个基因,在各组织中的总体表达量相对较高,其中3个基因(Du31JVP、Du6M9JS和IpY5APX)属于PCF,7个基因(Du3K3P7、Ip4Z7UA、IpY6QYT、DuJ06JT、IpZ17TF、Du0YU93和DuPG28A)属于CIN。除了Du31JVP在花中无表达,Du0YU93在雄蕊中无表达以及DuPG28A在根和结瘤根中有较低表达外,其余基因的表达无显著组织特异性。Ⅱ类包括9个基因,在各组织中呈现较低表达或无表达,其中IpX255Z、IpH57JT、Du1RN6D和DuJKM1G在所有组织中均无表达;DuD4D3B和IpLUF2N具有相似的组织表达模式,主要在花中有较高表达,其次为生殖茎尖,在其他组织中几乎无表达;Du6MF1G和IpTU4HL均在生殖茎尖中有相对较高表达,在其他组织中均未呈现出显著表达;IpEDM7N除了在种子发育期10、荚果发育期1、根、根瘤结、果皮发育期5、果皮发育期6和入土果针中无表达外,在其他组织中有少量表达。以上说明花生CYC/TB1中的基因(DuD4D3B、IpLUF2N、Du6MF1G和IpTU4HL)表达具有较显著的组织特异性,与花生的生殖生长有关。

图5 花生TCP家族基因的组织表达模式Fig.5 Tissues expression profiles of peanut TCP family genes

3 讨论

TCP作为植物的特异转录因子家族,在植物生长、发育和抗性反应过程的多个方面起至关重要的作用[6-7,25]。随着大量植物基因组测序的完成,已对很多物种的TCP基因家族进行了全基因组鉴定分析,不同物种中鉴定出的数目不尽相同,在大豆[21]、拟南芥[16]、水稻[3]、番茄[22]、苹果[28]、草莓[29]、西瓜[30]、海岛棉花[31]和梨[30]中分别鉴定出54、24、23、30、30、19、27、72和34个TCP家族基因。本研究对花生TCP 转录因子在全基因组范围内也进行了鉴定,共鉴定出51个TCP基因,其中野生种花生中AA基因组有10个,BB基因组有9个,栽培种花生基因组中有32个,其基因总数与其他物种不尽相同,说明不同物种间该家族的基因数量也存在一定差异。另外,栽培种TCP基因数量明显比野生种多,这可能与基因组的加倍和复制事件有关[32],这说明栽培种花生中TCP可能具有更广泛的作用。研究发现,苹果[28]和棉花[31]基因组在进化过程中发生过多次复制,从而导致其TCP基因数目明显多于其他物种。序列同源分析表明,花生TCP家族基因在分子特性和保守结构域等特征上与其他物种TCP家族基因相似。在系统进化上,与其他物种一样,花生TCP成员分为亚家族Ⅰ(PCF)和亚家族Ⅱ(CYC/CIN)。然而花生TCP基因在亚家族Ⅰ和Ⅱ中的分布比例约为1∶2,与其他物种的比例(约1∶1)存在较大差异,与其他物种相比,花生TCP家族中CIN类基因的比例明显较高[33-35]。说明在进化过程中,不同基因组中TCP家族基因在发生加倍、复制或串联等事件时有不一样的变化。

在家族基因的进化中,那些保守基序、内含子和外显子等结构相似的基因往往具有类似的功能活性[32,35]。本研究中,处在相同亚家族的花生TCP基因大部分具有相似的内含子-外显子结构和保守结构域,其中亚家族Ⅰ各成员内含子数量较少,大部分不含内含子,亚家族Ⅱ(CYC/CIN)各基因的内含子数量较多,基本都有内含子;另外,内含子长度也存在较大差异,CIN亚类中的内含子明显长于CYC亚类。花生TCP家族基因的这些结构差异可能影响其序列进化关系及体内的功能活性。

TCP蛋白作为植物转录因子,在侧枝、叶和花等组织发育过程中具有重要调控作用[10-11,13],尤其CYC/TB1类基因相关功能的报道较多。在玉米TB1突变体中[36],TB1的表达降低,导致顶端优势缺失,分枝数量增多。在拟南芥中,AtTCP18(BRC1,TB1类同源基因)主要在腋芽中表达,其活性缺失可诱导腋芽发育成侧枝[37]。另外,拟南芥TCP12(BRC2)基因(CYC类同源基因)主要在腋芽和花中表达,也参与植物分枝调控[21],其与TCP18均可抑制侧枝生长,但两者调控机制不同[37]。另据报道,CYC类基因主要参与调控花的对称性发育,Luo等[38]发现金鱼草CYC基因在花发育的整个过程中都有表达,与dish基因共同调控花的对称性发育。非洲菊中CYC-like基因的过表达或抑制表达亦可影响花序的对称结构变化[39]。在本研究中,花生中有4个CYC/TB1类基因(DuD4D3B、IpLUF2N、Du6MF1G和IpTU4HL)呈现出显著的组织特异性表达,其中DuD4D3B和IpLUF2N在花中显著特异性表达,是花中表达量最高的TCP家族基因,这两个基因可能属于CYC-like类基因,主要在花的发育中起调控作用。另外,这两个基因在生殖茎尖中也有较高表达,推测其可能与AtTCP12类似,在侧枝和花的发育中都有表达调控功能。而Du6MF1G和IpTU4HL仅在生殖茎尖中有相对较高的特异表达,推测其为TB1类基因,对花生腋芽起抑制作用。然而在总表达量较高的花生TCP基因中,PCF类基因Du31JVP仅在花中无表达,CIN类基因Du0YU93仅在雄蕊中无表达,这些组织特异性基因的功能还需要进一步研究。花生的其他TCP家族基因的表达均无明显组织特异性。总之,花生TCP家族基因表达模式能够为分析其功能提供线索。

4 结论

通过分析花生TCP基因家族的bHLH结构域、进化关系、基因结构和染色体分布等生物信息,较为全面系统地鉴定了花生TCP基因家族。其结构高度保守,参与花生侧枝、花、叶和种子等组织生长发育。而对于花生TCP家族基因的其他功能相关的表达模式还有待更多试验数据支持。

猜你喜欢
野生种内含子结构域
谷子近缘野生种的亲缘关系及其利用研究
烟草野生种eeIIFF44EE11--SS 同源基因的多样性与马铃薯Y病毒抗性分析
线粒体核糖体蛋白基因中内含子序列间匹配特性分析
不同方向内含子对重组CHO细胞中神经生长因子表达的影响
蛋白质结构域划分方法及在线服务综述
更 正
内含子的特异性识别与选择性剪切*
烟属野生种资源黑胫病抗性研究
部分广义菊属野生种染色体制片体系优化与核型分析
重组绿豆BBI(6-33)结构域的抗肿瘤作用分析