陈丽娟,张 斌
(湖南科技学院化学与生物工程学院,湖南 永州 425199)
大豆[Glycine max(Linn.)Merr.]是豆科大豆属一年生草本植物,种子中富含大豆蛋白、活性肽、脂肪、异黄酮和皂苷等生物活性成分,具有抗高血压、抗氧化、抗癌、降血脂等生理保健功能[1],尤其是大豆皂苷具备降血糖血脂、抗诱变、抗衰老、抗凝血等作用,对癌细胞也有一定的抑制作用[2]。热激蛋白HSP (Heat Shock Proteins)是一类高度保守的蛋白质,具有帮助多肽正确折叠、转运和修复的功能,在植物生 长发育和抗胁迫过程中发挥重要的作用[3]。HSP大 体可分为小分子HSP、HSP10、HSP40、HSP60、HSP70、 HSP90和HSP100这7类[4-5]。其中,小分子HSP的分 子量在15~42 kD之间,通常被称为蛋白错误折叠的第一道防线,也被称为“细胞卫士”[6]。HSP基因转入大豆可以提高其抗逆性[7],但是,目前为止,关于GmHSP20家族基因的研究还非常有限。大豆基因组的成功测序为大豆基因功能研究提供了有力条件,笔者对GmHSP20家族基因进行了鉴定,并对其理化性质、系统进化、启动子原件以及表达模式进行了分析,为探究GmHSP20家族基因的功能打下了一定基础。
GmHSP20家族基因相关数据来自Ensembl数据库;拟南芥HSP20蛋白家族基因相关数据来自拟南芥基因组数据库(TAIR);HSP20蛋白隐马尔可夫模型(pf 00011)来自PFAM数据库。
1.2.1 HSP20蛋白家族基因成员的鉴定首先,从Ensembl数据库下载基因组序列、CDS和蛋白序列,建立本地数据库。第二,以pf 00011为参考序列,设置e值≤1E-20,用HMME软件在本地数据库搜索HSP20结构域,建立GmHSP20的隐马尔可夫模型,搜索GmHSP20序列,e值≤0.001;将GmHSP20序列提交到NCBI进一步确认结构域,去除假阳性。第三,使用MEGA6.0软件邻接法(NJ)构建大豆和拟南芥HSP20蛋白的系统发育树,bootstrap设置值为1000。通过http://web.expasy.org/compute_pi/获得GmHSP20的长度、分子量和等电点。第四,从Phytozome数据库中提取GmHSP20起始密码子上游1500 bp基因组序列,利用PlantCARE预测其顺式作用元件,用TBtools软件绘制启动子顺式元件图。第五,通过CDS找出GmHSP20基因在染色体上的位置,将信息提交到http://gsds.cbi.pku.edu.cn/生成基因结构。
1.2.2 HSP20蛋白家族基因的表达从大豆数据库SoyKB(http://soykb.org/)下载GmHSP20基因表达数 据,利用TBtools软件绘制基因的表达热图。
2.1GmHSP20蛋白家族基因的筛选、鉴定和染色体定位
该研究在大豆基因组数据库中鉴定出56个GmHSP20蛋白家族基因。根据蛋白质分子量的大小命名,相同分子量命名为A、B等,结果(表1)显示, 基因的氨基酸长度不一,分子量和等电点变化范围比较大。GmHSP20的氨基酸长度为136~372(aa),最长的为GmHSP41.8,最短的为GmHSP15.6;GmHSP20 相对分子质量为15.2~41.8 Da,最大的为GmHSP41.8,最小为GmHSP15.2;蛋白质的等电点为4.49~10.28,最高为GmHSP17.8,最低为GmHSP17.5B。大豆全基因组共含有20条染色体,而56个GmHSP20基因分布在18条染色体上(图1)。不同染色体含有不同的GmHSP20基因数目,1、11、12、17和19号只有1个基因,5、9、16号有2个基因;6、10、18、20号有3个基因;其中2、4、7、8、13、14号染色体上有基因成簇存在。
图1 GmHSP20基因的染色体定位
表1 GmHSP20基因家族信息
2.2GmHSP20基因进化树构建
根据HSP20家族基因在银杏中的分组方法,GmHSP20基因可分为11个亚家族,如图2所示,分别是CⅠ、CⅡ、CⅢ(细胞质或细胞核),MⅠ、MⅡ(线粒体),P(质体),Po(过氧化物酶体),ER(内质网)和UN1、UN2、UN3(位置未知)。对比拟南芥系统的进化分析发现,大豆和拟南芥HSP20基因家族成员具有高度的同源性。在各个亚族中,成员数量不一,CI有26个成员,CⅡ有2个,CⅢ有2个,P有7个,ER有6个,MI有4个,MⅡ有2个,Po有3个,未知功能的UN1亚族有2个,UN2有2个,UN3有13个。大多数GmHSP20基因分布在细胞质或细胞核中,少量分布在细胞器内。
图2 GmHSP20基因进化树
2.3GmHSP20基因启动子原件分析
为了研究GmHSP20基因在进化过程中的多样性变化,对基因结构进行分析,结果(图3左)表明,家族基因在结构上较为保守,虽然56个GmHSP20基因长短差异较大,但内含子主要为0~2个。CⅠ和ER亚族基因长度比较短,都只含有1个内含子;UN1亚族含有5个内含子,而且外显子和内含子相对位置高度相似;其余绝大部分基因都只含有2个内含子。值得注意的是,P亚族中GmHSP26.1和UN3亚族中GmHSP26.7比较特殊,基因结构较长,内含子超过了4 kb。
图3 大豆GmHSP20基因结构(左)和启动子原件(右)
对GmHSP20基因的启动子(图3右)进行分析,发现所有GmHSP20基因都含有与植物胁迫相关的元件,例如ARE、LTR、MBS和TC-rich。ARE元件在GmHSP20基因中普遍存在,表现为1~4个重复。
2.4GmHSP20基因表达模式分析
研究对56个GmHSP20基因的表达模式进行了分析,结果如图 4所示。整体上,GmHSP20基因在种子发育第42天表达水平较高,其中GmHSP17.3A、GmHSP17.7A、GmHSP17.9和GmHSP18.5B在种子发育第35天和第42天表达最高。值得注意的是,同一亚族GmHSP18.5A和GmHSP18.5B在大豆不同生长部位和生长发育阶段都有表达,而且表达水平均较高,表现出相似的表达模式。
图4 GmHSP20基因表达模式图
HSP蛋白广泛存在于植物体内,参与植物生长发育、非生物胁迫响应等多种生物学过程[8]。关于HSP20蛋白家族基因的分析报道比较多,拟南芥有19个Hsp20[9],杨树有36个[10],水稻有39个[11],银杏有39个[12],可以分成了不同的亚族,并且在基因数量、亚细胞定位、功能和序列方面体现出多样性。但是,到目前为止,关于GmHSP20基因的研究十分有限。该研究从大豆全基因组中鉴定出56个GmHSP20基因,分为11个亚族,大多数分布在细胞质或细胞核中,少量分布在细胞器内,说明细胞质可能是GmHSP20基因的主要功能区,这与银杏中的研究一致;但是,银杏中只有10个亚族,这可能与银杏和大豆基因组具有不同的系统发育状态有关[12]。GmHSP20蛋白的氨基酸长度不一、分子量和等电点变化范围比较大,推测可能与这些蛋白是在不同亚细胞中发挥作用有关。18条染色体含有不同的GmHSP20基因数目,有的基因成簇存在,这些成簇的基因可能对某一生物学功能有加强作用。GmHSP20基因在在种子发育第42天表达量比较高,暗示这些基因在种子发育过程中发挥了一定的作用,其中GmHSP17.3A、GmHSP17.7A、GmHSP17.9和GmHSP18.5B在种子发育第35天和第42天表达最高,说明这4个基因在种子发育过程中可能发挥重要作用。GmHSP18.5A和GmHSP18.5B在大豆不同生长部位和各生长发育阶段都有表达,表现出相似的表达模式,提示着这2个基因可能具有相同的功能,还需要进一步的研究确定。综上所述,该研究结果为GmHSP20基因在大豆生长发育及非生物胁迫响应过程中的功能研究提供了参考。