潘倚天 黄敏
摘要:COBRA基因编码糖基磷脂酰肌醇锚定的植物特异性蛋白,在初生和次生细胞壁的纤维素生物合成中发挥重要作用。通过生物信息学方法,从玉米基因组中发现了9个COBRA家族基因,并对其基因结构、系统发育和表达模式等进行了分析。结果表明,9个COBRA家族基因都含有CCVS保守结构域,并且均定位于细胞膜上。系统进化分析结果显示,该家族可以分为2个亚族,每个亚族内的基因具有相似的基因结构和理化性质。基因表达分析结果表明,所有COBRA家族成员响应多种非生物胁迫,且当植株受到紫外照射处理时,ZmCOBL1~ZmCOBL3和ZmCOBL7~ZmCOBL9这6个基因均表现出上调应答。
关键词:玉米;COBRA基因家族;纤维素;表达模式;生物信息学
中图分类号:S513 文献标志码:A 文章编号:1001-1463(2022)02-0067-06
doi:10.3969/j.issn.1001-1463.2022.02.017
Genome-wide Identification and Expression Pattern Analysis of COBRA Family Members in Maize
PAN Yitian, HUANG Min
(College of Life Sciences, Yangtze University, Jingzhou Hubei 434025, China)
Abstract:The COBRA gene encodes a glycosyl phosphatidyl inositol-anchored, plant-specific protein that plays an important role in cellulose biosynthesis in primary and secondary cell walls. In this study, 9 COBRA family genes were found from the maize genome by bioinformatics methods, and their gene structures, phylogeny and expression patterns were analyzed. The results showed that the 9 COBRA family genes all contained CCVS conserved domains, and all of them were located on the cell membrane. Phylogenetic analysis showed that COBRA family could be divided into two subfamilies, and the genes in each subgroup had similar gene structure and physicochemical properties. Gene expression analysis showed that all COBRA family members responded to a variety of abiotic stresses, and all six genes, ZmCOBL1~ZmCOBL3 and ZmCOBL7~ZmCOBL9, showed up-regulated responses when plants were exposed to UV irradiation.
Key words:Maize(Zea mays L.);COBRA gene family;Cellulose;Express pattern;Bioinformatics
玉米(Zea mays L.)是全世界最重要的糧食作物之一,在全球范围内分布十分广泛。2018年,我国玉米总产量占到全国粮食总产量的39%以上,播种面积占到全国粮食作物播种面积的36%[1 ],可见玉米的产量高低与我国粮食安全息息相关。我国的玉米产量常受倒伏影响造成不同程度的减产,因此通过筛选玉米与茎秆机械强度相关基因,增强玉米抗倒伏能力,是提升玉米产量和保证国家粮食安全的重要措施。
COBRA家族是由COBRA-Like(COBL)蛋白组成的一类糖基磷脂酰肌醇(Glycosyl phosphatidyl inositol,GPI)锚定蛋白,在初生和次生细胞壁的纤维素生物合成中发挥核心作用[2 ]。COBRA家族首先在拟南芥中被发现,COBRA突变体根异常生 长[3 ]。Brittle Stalk2(BK2)是在玉米中发现的首个COBRA家族成员[4 ],其在纤维素合成中发挥功能,并在成熟后的次生细胞壁发育发挥适当的作用[5 ]。在大多数情况下,COBRA基因家族突变体表现出纤维素含量降低[6 ]。利用生物信息学对玉米COBRA家族基因进行系统分析有助于预测COBRA家族成员的功能,将为后续研究该家族成员的生物学功能和应用于玉米分子育种提供重要依据。
1 材料与方法
1.1 COBRA家族成员的鉴定和染色体定位
根据高粱的10个COBRA基因家族成员的序列[7 ],使用BlastP在玉米全基因组蛋白序列数据库中搜索,得到候选序列。典型的COBRA家族成员含有1个COBL结构域(PF04833)[8 ]。通过BatchCD-search功能和Pfam检验验证序列是否含有保守结构域,并删去重复序列。使用TBtools软件将玉米COBRA家族成员在染色体上的位置可视化[9 ],并根据基因在染色体上的位置进行命名。
使用同样的方法分别鉴定出水稻、高粱和拟南芥的所有COBRA基因家族成员,并根据在染色体上的位置进行命名。
1.2 玉米COBRA家族成员序列分析
使用Expasy网站预测ZmCOBL蛋白的分子量和等电点,使用SignalP-5.0预测N端信号肽,并用big-PI预测C端疏水末端的锚定位点[10 ]。用MEME网站分析蛋白序列中的保守基序,使用Softberry网站预测亚细胞定位。用TBtools分析家族成员的内含子和外显子结构。
1.3 玉米和其他物种的COBRA蛋白系统发育分析及共线性分析
利用MEGA11中的ClustalW功能,对4个物种COBRA蛋白进行多重比对,随后利用最大似然法(MaximumLikelihood)构建系统进化树,Bootstrap值设置为1 000。利用TBtools的One Step MCScanX功能分析玉米与高粱和水稻之间的共线性关系,并用Dual Systeny Plot功能进行可视化。
1.4 玉米COBRA家族成员的表达模式分析
利用MaizeGDB中的qTeller功能下载COBRA家族成员的RNA-Seq数据[11 ],经过均一化处理后使用TBtools进行热图绘制。
2 结果与分析
2.1 玉米COBRA家族成员的鉴定和染色体定位
通过BlsatP比对和重复序列的去除,最终确定玉米全基因组中共含有9个COBRA家族成员。染色体定位结果显示,9个成员在染色体上的分布不均匀,共分布在5条染色体上。其中1号染色体和7号染色体各分布有3个成员,而2号染色体、5号染色体和9号染色体各含有1个。根据其在染色体上的位置,将这些成员分别命名为ZmCOBL1-ZmCOBL9(图1)。
2.2 玉米COBRA家族成员序列分析
对玉米COBRA家族成员进行序列分析,结果见表1。该家族成员的分子质量为25.734 59~75.169 48 kD,平均值为51.999 79 kD。蛋白质等电点为6.03~9.19,其中大于7的有7个成员,小于7的只有2个成员,说明该基因家族成员多为碱性蛋白。在9个成员中,除ZmCOBL2和ZmCOBL7外,其余都含有N端信号位点。C端GPI锚定位点预测结果表明,除ZmCOBL2之外,其余成员均至少含有1个GPI锚定位点。亚细胞定位预测显示,所有的ZmCOBL家族成员均定位在细胞膜上,与其他物种相同[11 ]。基因结构分析显示,有4个ZmCOBL家族成员含有5个内含子和6个外显子(图2),说明基因结构在一定程度上较为保守。对保守基序分析后发现,9个ZmCOBL家族成员均含有motif3(图3),该保守基序含有1个高度保守的序列CCVS(图4)。此外motif2和motif5均存在除ZmCOBL2之外的8个成员上。
2.3 玉米和其他物种的COBRA蛋白系统发育分析及共线性分析
为了分析COBRA蛋白的系统发育关系,将玉米、拟南芥、水稻和高粱等4个物种的COBRA蛋白序列,用最大似然法构建进化树(图5)。根据其聚类结果,将41个基因分为2个亚族。玉米COBRA家族成员在2个亚族内的数量分别是7个(ZmCOBL2、ZmCOBL3、ZmCOBL4、ZmCOBL5、ZmCOBL7、ZmCOBL8、ZmCOBL9)和2个(ZmCOBL6和ZmCOBL1)。高粱和水稻也出現这种分布不均的现象,亚族1有8个成员,亚族2只有3个成员。拟南芥在2个亚族内的分布较为均匀,分别是6个和5个。
为进一步了解COBRA家族的进化机制,选取另外2个禾本科植物和1个模式植物拟南芥,利用MCScanX功能分析COBRA家族基因间的共线性(图6)。结果显示,该基因家族在拟南芥和玉米之间没有共线性(图中未显示)。在禾本科植物中,玉米与水稻、高粱分别有2个和5个共线性基因对,其中ZmCOBL1在高粱基因组内有2个对应基因,SbCOBL3在玉米基因组内也有2个对应基因。
2.4 玉米COBRA家族成员的表达模式分析
根据MaizeGDB公布的RNA-Seq数据,筛选出玉米COBRA基因家族在不同胁迫处理下的表达量数据,除ZmCOBL4和ZmCOBL6之外,其他的7个基因均有相对应的表达量。根据上述数据制作表达量热图(图7)。从图中看出,7个基因在紫外辐射胁迫时,除ZmCOBL5外均表现明显的上调响应,而在面对高温胁迫和盐胁迫时,除ZmCOBL2和ZmCOBL8外均表现出显著的下调响应,说明这些基因在不同程度上都参与了非生物胁迫的调控。值得一提的是,玉米面对4种非生物胁迫时,ZmCOBL5基因均表现出下调应答,而其他基因的响应模式不同。
3 小结与讨论
通过BlastP检索,去重和保守结构域验证,共鉴定到9个玉米COBRA成员,通过其在玉米染色体上的位置分布,分别命名为ZmCOBL1~ZmCOBL9。对基因家族成员的序列分析发现,所有蛋白序列都存在CCVS保守结构域,8个蛋白包含N端信号肽,7个含有GPI锚定位点,这些特征均表明其属于典型的COBRA家族蛋白[12 ]。经过与拟南芥、高粱和水稻3个物种共同构建进化树,发现玉米COBRA蛋白和高粱的同源性最高,其次是水稻,而与双子叶植物拟南芥的同源性最低,说明在单子叶植物中COBRA蛋白更加保守。此外还发现,这些成员可以分为2个亚族,其中ZmCOBL6和ZmCOBL1在第二亚族,其他蛋白聚类在第一亚族。与其他禾本科作物一样,玉米也存在成员分布不均的情况,说明COBRA蛋白序列在单双子叶植物之间存在一定差异,其差异很有可能是在单双子叶植物分化之后才形成。共线性分析表明,ZmCOBL1同时存在于高粱和水稻2个物种的共线性基因对中,表明该基因在单子叶植物内同时存在,但不存在于双子叶植物间,可能是该基因形成于物种分化之后。玉米和高粱内各有1个基因在种间形成2个基因对,说明玉米和高粱具有最大的相似遗传关系,和拟南芥相比,水稻和玉米间的共线性关系也较高。任昂彦等[8 ]发现,通过分析谷子(Setaria italica L.)与玉米、水稻和拟南芥的蛋白进化关系,认为谷子与玉米相似性最高,其次为水稻。这说明禾本科作物之间具有更近的亲缘关系[13 ]。
根据对从公共数据库获得的ZmCOBL家族成员的表达数据分析,可以看出这些基因对非生物胁迫都表现出不同程度的响应。ZmCOBL家族成员是参与植物纤维素合成的重要基因,其表达量的高低直接关系到玉米成熟时的次生细胞壁发育和组织弹性的指标[14 ],因此可推测当玉米受到紫外处理时,其纤维素的相关合成途径会受到促进;而当玉米受到高温、盐害等非生物胁迫时,其木质素含量和次生细胞壁发育会受影响,从而导致玉米茎秆强度下降等现象。
本研究通过对玉米COBRA家族成员进行了鉴定和分析,阐明了该家族成员在序列特征、亚细胞定位、与其他物种的进化关系和应对非生物胁迫时的表达模式,系统的展现了该家族成员的特征,为将来利用分子设计育种手段提高玉米茎秆强度和应对非生物胁迫提供了思路和理论基础[15 ]。
参考文献:
[1] 李方圆. 玉米脆性基因主效位点挖掘及连锁分子标记的开发[D]. 泰安:山东农业大学,2020.doi:10.272 77/d.cnki.gsdnu.2020.000985.
[2] LI P,LIU Y R,TAN W Q,et al. Brittle Culm 1 encodes a COBRA-like protein involved in secondary cell wall cellulose biosynthesis in sorghum[J]. Plant & Cell Physiology,2018,60(4):788-801.
[3] BENFEY P N,LINSTEAD P J,ROBERTS K. Root development in Arabidopsis:fourmutants with dramatically altered root morphogenesis[J]. Development,1993 119(1):57-70.
[4] CHING A,DHUGGA K S,APPENZELLER L,et al. Brittle stalk 2 encodes a putative glycosylphos phatidylinositol-anchored protein that affects mechanical strength of maize tissues by altering the composition and structure of secondary cell walls[J]. Planta,2006,224(5):1174-1184.
[5] SINDHU A,LANGEWISCH T,OLEK A,et al. Maize Brittle stalk2 encodes a COBRA-like protein expressed in early organ development butrequired for tissue flexibility at maturity[J]. Plant Physiology,2007,145(4):1444-1459.
[6] DAI X,YOU C,CHEN G,et al. OsBC1L4 encodes a COBRA-like protein that affects cellulose synthesis in rice[J]. Plant Molecular Biology,2011,75(4):333-345.
[7 ] 元志成,柯余生,吴富进,等. 高粱COBRA基因家族全基因组的鉴定和表达分析[J]. 河南农业科学,2020,49(10):33-41.
[8] 任昂彦,陈环宇,王根平,等. 谷子COBRA家族成员的全基因组鉴定及表达模式分析[J]. 分子植物育种,2021,10(2):1-10.
[9] CHEN C J,CHEN H,ZHANG Y,et al. TBtools:An integrative toolkit developed for interactive analyses of big biological data[J]. Molecular Plant,2020,13(8):1194-1202.
[10] 齊燕妮,李闻娟,王利民,等. 亚麻COBRA基因家族的鉴定与生物信息学分析[J]. 甘肃农业科技,2019(9):33-3