曾美娟, 刘建汀, 李祖亮, 陈敏氡, 叶新如, 王 彬, 朱海生, 温庆放
(1.福建省蔬菜遗传育种重点实验室/福建省农业科学院作物研究所/福建省蔬菜工程技术研究中心,福建福州 350013;2.福建省农业科学院农业生物资源研究所,福建福州 350003)
生长素是一种重要的植物激素,是最早被发现的能促进植物生长的激素,其在植物生长过程的多个重要环节中发挥着关键作用。植物体内的生长素在自由态和束缚态2种形式间的转化是体内生长素水平的自我调节功能,对植物生长的调控具有重要意义。在植物生长素响应信号通路中,有3类早期生长素响应基因家族[Aux/IAAs(auxin/indole-3-acetic acids)、GH3s(gretchen hagen 3)、SAURs(small auxin upRNAs)]能快速特异地表达反应。其中,基因家族能够催化游离态的吲哚-3-乙酸(IAA)与多种氨基酸结合,生成IAA-氨基酸复合物,将游离IAA 转化为复合态的IAA,可以参与生长素的稳态调控,进而参与调控植物的多个生理过程,其对整个基因家族的研究具有重要意义。
普通丝瓜[(L.) Roem.]是我国主要的瓜类蔬菜之一,其肉质清香软滑,既富含营养,又具有清热化痰、凉血解毒等保健作用,倍受各地区消费者喜爱。基因对植物的生长发育具有重要的调控作用,但在普通丝瓜中关于基因家族的研究鲜有报道。因此,本研究以普通丝瓜为试验材料,基于普通丝瓜全基因组对基因家族成员进行鉴定、生物信息学分析,并分析其在普通丝瓜长果品种、短果品种中的表达情况,对后续研究普通丝瓜果实发育和果实果长等具有一定的意义。
普通丝瓜的基因组数据从国家基因库生命大数据平台(https://db.cngb.org/)上获取。本研究所用转录组数据为普通丝瓜长果品种(花后 12 d)和短果品种(花后12 d)的转录组数据,丝瓜样品为2021年种植于福建省农业科学院试验基地的试验材料。普通丝瓜长果样品、短果样品分别混合取样,试验设置3个生物学重复,丝瓜样品用液氮速冻后于-80 ℃保存,用于RNA-seq分析。
通过Pfam数据库(http://pfam.xfam.org/)获得GH3保守结构域的HMM模型(PF03321),并用TBtools软件进行simple HMM search,对普通丝瓜的基因组蛋白序列进行搜索,获得初筛蛋白序列。再通过美国国家生物技术信息中心(NCBI)网站进一步验证初筛获得的候选蛋白结构域,获得确定的成员后,根据普通丝瓜的拉丁名(L.) Roem,将普通丝瓜编码上述蛋白的基因定为基因。通过ProtParam在线分析网站分析普通丝瓜LcGH3蛋白的理化性质。
利用NCBI保守结构域在线分析网站和MEME在线分析网站进行普通丝瓜GH3蛋白的保守结构域与基序(Motif)分析,并用TBtools软件绘制示意图。
为探究普通丝瓜基因家族成员蛋白的进化关系,从NCBI网站下载南瓜、黄瓜及拟南芥的GH3蛋白序列与普通丝瓜GH3蛋白序列,进行合并系统进化分析。利用MEGA软件中的邻接法(Neighbor-Joining)对普通丝瓜、黄瓜、南瓜和拟南芥GH3家族蛋白构建系统进化树。用在线工具iTOL对已构建的普通丝瓜、黄瓜、南瓜和拟南芥的GH3家族蛋白系统进化树进行美化处理。
根据笔者所在课题组前期研究得出的普通丝瓜长果品种、短果品种转录组数据中的基因表达值(FPKM),分析普通丝瓜基因家族成员在普通丝瓜长果品种、短果品种中的表达情况,采用TBtools绘制表达量热图。
通过对普通丝瓜基因家族成员进行筛选和鉴定,最终确定14个基因,暂将其命名为~。通过ProtParam在线分析软件获得普通丝瓜LcGH3蛋白氨基酸序列的蛋白序列长度、分子量、蛋白酸碱性和稳定性等基本信息。从表1可以看出,普通丝瓜LcGH3蛋白的蛋白序列长度为515~843 aa,分子量为58.366~96.406 ku;从等电点可以看出,LcGH3.8、LcGH3.14为碱性蛋白,其他普通丝瓜的LcGH3蛋白都为酸性蛋白;LcGH3.1的不稳定系数小于40,表明其是稳定蛋白,其他普通丝瓜LcGH3蛋白的不稳定系数均大于40,为不稳定蛋白。在蛋白质亲水性方面,14个普通丝瓜LcGH3蛋白的平均亲水系数均为负数,表明它们都是亲水蛋白。
表1 普通丝瓜GH3基因家族成员蛋白的理化性质
对普通丝瓜基因家族成员蛋白的保守结构域进行分析,发现14个基因家族成员蛋白均含有单一的GH3结构域,其中LcGH3.1、LcGH3.2和LcGH3.4等11个蛋白含有GH3超家族结构域(图1)。为了进一步研究普通丝瓜基因家族成员蛋白的保守结构域,利用MEME在线分析软件对普通丝瓜GH3蛋白保守基序进行分析。从图2可以看出,普通丝瓜GH3蛋白的基序具有一定的保守性。14个普通丝瓜基因家族成员的蛋白质序列中至少含有10个保守基序,它们分别为Motif 1~Motif 10,并且这些保守基序的排列顺序相同。其中,LcGH3.8蛋白缺少Motif 10、Motif 2,LcGH3.9蛋白缺少Motif 3,LcGH3.10蛋白缺少Motif 8,其他基因家族成员同时含有10个保守基序。此外,这14个普通丝瓜GH3蛋白家族成员中均含有Motif 1、Motif 4、Motif5、Motif6、Motif7和Motif 9。
用MEGA软件构建普通丝瓜GH3家族蛋白(14个)、黄瓜GH3家族蛋白(14个)、南瓜GH3家族蛋白(29个)和拟南芥GH3家族蛋白(30个)的系统进化树。根据系统进化树的进化关系,这87个GH3蛋白可分为3类,分别是GroupⅠ、Group Ⅱ和Group Ⅲ(图3)。其中,南瓜、丝瓜和黄瓜的GH3蛋白属于Group Ⅱ或Group Ⅲ;在普通丝瓜中,LcGH3.3、LcGH3.7、LcGH3.13属于Group Ⅱ,其他11个丝瓜GH3蛋白属于Group Ⅲ;此外,在Group Ⅱ、Group Ⅲ中也有拟南芥的GH3蛋白。值得注意的是,GroupⅠ中都是拟南芥的GH3蛋白。
基于普通丝瓜长果品种、短果品种商品果的转录组数据中14个基因家族成员的基因表达值(FPKM),分析基因家族成员的表达模式,发现在普通丝瓜长果品种、短果品种商品果中共有6个基因家族成员(、、、、和)存在差异表达,其中、、在短果品种中的相对表达量高于长果品种,、、在短果品种中的相对表达量低于长果品种(图4)。
植物的基因是一种典型的植物生长素原初反应基因,广泛存在于植物中。GH3蛋白通过调节植物激素和相关化合物(包括植物激素前体)的活性或可利用性,在信号通路、器官发育、植物结构、增强植物的抗逆性、优化植物的生长和代谢过程中起着重要作用。基因最早在大豆中被鉴定为早期的生长素响应基因。迄今,研究者陆续在许多来自不同植物(如拟南芥、水稻、葡萄、番茄、桃、木瓜、猕猴桃、甘蓝等)的基因家族中发现该基因家族成员。
本研究结果表明,普通丝瓜中的14个LcGH3蛋白主要含10个Motif,且14个LcGH3蛋白均含有Motif 1、Motif 4、Motif5、Motif6、Motif7和Motif 9保守基序,推测这6个保守基序可能在普通丝瓜基因中发挥主要功能。构建基因家族系统发育树来分析同源基因间的进化关系,可为后续基于同源同功假说的分析奠定基础。本研究通过构建普通丝瓜、黄瓜、南瓜和拟南芥基因家族成员蛋白的系统发育树,发现南瓜、丝瓜和黄瓜的GH3蛋白属于Group Ⅱ或Group Ⅲ,而在GroupⅠ中都是拟南芥的GH3蛋白,后续关于丝瓜GH3的功能研究可以借鉴黄瓜、南瓜中已有的相关研究。本研究结果表明,在普通丝瓜长果品种、短果品种商品果中共有6个基因家族成员存在差异表达,推测基因家族与普通丝瓜果实发育相关,且与果长关系密切。对桃、番茄GH3蛋白的相关研究也发现,基因在果实不同发育时期的表达量均存在差异。在研究中,、、在短果品种中表达量高于长果品种,、和在短果品种中的表达量低于长果品种,将为后续研究丝瓜果长提供方向。
本研究基于普通丝瓜全基因组对基因家族进行鉴定,鉴定获得14个基因家族成员,开展生物信息学分析并探析其在普通丝瓜长果品种、短果品种中的表达情况,为后续继续深入研究基因在普通丝瓜果实发育及果长中的作用奠定了基础,并可为培育满足市场多样化优良果长的丝瓜品种提供支撑。