梁文轩 ,王月萍,陈升杰,李敏诗,韩 儒,周玉亮
(广东省植物分子育种重点实验室/华南农业大学 农学院, 广东 广州 510642)
水稻是我国的主要粮食作物,对保障我国粮食安全做出了重要贡献[1]。水稻的生产起始于种子的播种和萌发,结束于种子的成熟和收获。因此,种子的发育和成熟是影响水稻产量和品质形成的关键阶段。近年来,有多项研究利用蛋白质组学技术对水稻种子性状进行了探究,包括种子发育[2-5]、种子萌发[6-7]、种子休眠[8]等。但是,关注种子成熟干燥阶段的蛋白质组学报道较少,对于水稻种子成熟期蛋白水平上的变化规律和调控机制尚需进一步研究。
蛋白质组学是一个快速发展的生物学研究领域,广泛应用于研究作物的生长、发育、生物和非生物胁迫。传统的凝胶双向电泳技术分离的蛋白数量少,近年来逐渐发展出了一些无凝胶的新方法,分为基于标签(Label)和无标签(Label-free)两种类型[9]。Label-free 无需使用同位素标记,而是通过液-质联用技术对酶解肽段进行质谱鉴定,基于肽段的信号强度对肽段对应的蛋白质进行相对定量。4D label-free 是传统无标签技术的升级,具有更好的灵敏度和覆盖深度。
本研究,以授粉后30 d 的水稻成熟种子为材料进行4D label-free 蛋白组学研究,获得了蛋白的表达谱,分析了蛋白的亚细胞定位、结构域、GO 功能注释和KEGG 通路,对揭示水稻种子成熟脱水期的蛋白积累模式和挖掘种子成熟的关键蛋白具有参考意义。
本研究所用的水稻材料是染色体单片段代换系,受体亲本是‘华粳籼7 4’,供体亲本是‘Khazar’,代换片段的分子标记是PSM141--RM436-PSM142--PSM143,“--”表示发生交换的位置。染色体单片段代换系与受体‘华粳籼74’的种子发育和成熟过程相似,但染色体单片段代换系具有更强的休眠特性。在授粉后30 d,收集健康、饱满的成熟种子,去壳后,液氮保存,委托上海中科新生命生物科技有限公司用于4D label-free 蛋白质组学分析(图1)。设置 3 个生物学重复。
图1 不同发育阶段水稻种子的形态Fig. 1 Morphology of rice seeds at different development stages
样品用SDT(40 g·L-1SDS,1 mmol/L DTT,100 mmol/L Tris-HCl, pH7.6)缓冲液提取蛋白质,用BCA 蛋白测定试剂盒(Bio-Rad) 定量蛋白质。每个样品取适量蛋白质用过滤器辅助样品制备法(Filter-aided sample preparation,FASP)进行胰蛋白酶(Promega) 消化蛋白质,采用C18 Cartridge(Sigma) 进行肽段脱盐,冻干后加入体积分数为0.1%的甲酸溶液40 μL 复溶,在280 nm 的紫外光下测定肽段溶液的光密度(Optical density,OD),对肽段进行定量。
每个样品取 20 μg 蛋白质,分别与 5X 上样缓冲液混合后煮沸 5 min,在 125 g·L-1SDS-PAGE 凝胶上进行电泳(恒流 14 mA,90 min),最后通过考马斯亮蓝 R-250 染色观察蛋白质条带。
每份样品采用纳升流速的HPLC 液相系统Easy nLC (Thermo Scientific)进行分离。缓冲液A 液是体积分数为0.1%的甲酸水溶液,B 液是体积分数为0.1%的甲酸乙腈水溶液。色谱柱以95%的A 液平衡,样品由自动进样器进到Acclaim PepMap100上样柱(Thermo Scientific)中,经过EASY column分析柱(Thermo scientific)分离,流速为300 nL/min。色谱分离后的样品用timsTOF Pro 质谱仪(Bruker)进行正离子模式检测。质谱扫描范围m/z设置为100~1 700。数据采集采用平行累积串行碎裂(Parallel accumulation-serial fragmentation,PASEF)模式,一个循环窗口时间为1.17 s。电荷数在0~5范围内的二级谱图,串联质谱扫描的动态排除时间设置为24 s,避免母离子的重复扫描。
对质谱分析的原始数据采用 MaxQuant 软件(版本号 1.6.14)进行查库鉴定及定量分析。可信肽段和可信蛋白质的筛选标准是FDR≤0.01,采用唯一肽段和Razor 肽段的定量强度值进行蛋白质定量,定量方法是LFQ (Label free quantitation)法。
亚细胞定位分析使用CELLO(http://cello.life.nctu.edu.tw/),在网站输入候选蛋白FASTA 格式的氨基酸序列进行预测;蛋白结构域分析使用Pfam 数据库(http://pfam.xfam.org/),通过InterProScan 软件包对目标蛋白序列进行功能表征,以获得结构域注释信息;对目标蛋白质集合利用Blast2GO 进行GO(Gene ontology,http://geneontology.org/)注释,包括序列比对、GO 条目提取、GO 注释和InterProScan 补充注释等4 个步骤;利用KAAS (KEGG automatic annotation server) 软件进行KEGG(Kyoto encyclopedia of genes and genomes,https://www.genome.jp/kegg/)通路注释;采用Fisher 精确检验,比较目标蛋白质集合和总体蛋白质集合中各个GO 分类(或KEGG 通路、或Domain)的分布情况,以进行富集分析。
提取水稻去壳种子的总蛋白后进行SDSPAGE 检测。结果表明,所提取的3 个生物学重复样品的蛋白含量丰富,条带清晰,没有发生降解,蛋白的数量和质量均满足后续试验的要求(图2)。
图2 总蛋白SDS-PAGE 电泳图Fig. 2 SDS-PAGE electrophoresis of total protein
对酶解后的总蛋白进行质谱鉴定,总共鉴定到19 688 个可信度高的肽段,肽段的氨基酸数量主要集中在8~20 个之间,占比89.3%(图3)。上述肽段对应3 484 个蛋白,蛋白数量丰富,蛋白质的相对分子质量主要在0~100 000 之间,占比93.5% (图4)。
图3 肽段的氨基酸数量分布图Fig. 3 Distribution of amino acid numbers in peptide
图4 蛋白相对分子质量分布图Fig. 4 Distribution of protein relative molecular mass
蛋白质定位的亚细胞器是蛋白发挥功能的重要场所,分析蛋白质的亚细胞定位有助于进一步探究蛋白质在细胞中的功能。如图5 所示,水稻成熟种子中的蛋白质几乎存在于细胞内所有的亚细胞器中,其中细胞质、细胞核、叶绿体、线粒体、质膜和胞外是蛋白定位最多的场所,分别有1 381、949、807、571、447 和433 个蛋白。
图5 亚细胞定位分析Fig. 5 Subcellular localization analysis
蛋白质结构域是一个蛋白中可以进行独立折叠和发挥功能的基本单位,预测蛋白的结构域对了解蛋白的生物学功能具有重要意义。对水稻成熟种子中鉴定的蛋白质进行结构域分析,结果发现排名前20 的结构域分别是RNA 识别基序、蛋白激酶结构域、WD 结构域/G-beta 重复、Cupin 结构域、Ras 家族、ATP 酶家族、蛋白酶抑制剂/种子贮藏/LTP 家族、EF-hand 结构域、蛋白酪氨酸激酶、热激蛋白70、钙调磷酸酶样磷酸酯酶、硫氧还蛋白、TCP-1/cpn60 伴侣蛋白家族、蛋白酶体亚基、PCI 结构域、延伸因子Tu GTP 结合域、过氧化物酶、糖基转移酶组1、通用应激蛋白家族、谷胱甘肽S-转移酶N 端结构域(图6)。
图6 蛋白结构域分析Fig. 6 Protein domain analysis
为了全面了解蛋白在水稻种子发育成熟过程中参与的生物学过程、功能和定位,通过基因本体GO 对鉴定到的蛋白质进行注释(图7)。在生物学过程(Biological process)中,共注释到16 个子类,主要参与了细胞过程、代谢过程、定位、生物调节、生物发生、响应刺激、生物过程的调节、发育过程和信号过程等。在分子功能(Molecular function)上,共注释到8 个子类,主要发挥催化活性、结合、结构分子活性、转运活性、分子功能调节剂、营养库活动、抗氧化活性和分子传感器活性。细胞组分(Cellular component)共注释到11 个子类,主要构成了细胞、细胞组分、细胞器、细胞膜和蛋白质复合物等结构。
图7 GO 功能注释Fig. 7 GO function annotation
为了更系统地解析水稻种子成熟的生物学事件,对鉴定到的蛋白进行KEGG 代谢通路和归属关系注释。如图8 所示,排名前20 的代谢通路可以分为8 个大类,其中2 个通路归属于运输和分解代谢,2 个通路归属于翻译,1 个通路归属于转录,1 个通路归属于全局和概览图,2 个通路归属于折叠、分类和降解,2 个通路归属于能量代谢,8 个通路归属于碳水化合物代谢,1 个通路归属于氨基酸代谢。所有通路中,核糖体通路、内质网中的蛋白质加工通路、糖酵解通路和氧化磷酸化通路中注释到的蛋白数量最多,表明这些通路对水稻种子的成熟非常重要。
图8 KEGG 通路注释Fig. 8 KEGG pathway annotation
植物激素和转录因子在种子发育成熟中扮演了重要角色。通过分析水稻成熟种子中的蛋白质,鉴定了十几个植物激素和转录因子相关的蛋白(表1)。在脱落酸途径中,鉴定了2 个脱落酸(A b s c i s i c a c i d,A B A) 受体O s R C A R 1 0 和OsRCAR7 和1 个蛋白激酶OsSAPK7。在生长素途径中,鉴定了2 个吲哚乙酸(Indoleacetic acid ,IAA)-氨基酸水解酶OsILL8 和OsILL1、1 个生长素抑制蛋白OsARP1、1 个生长素氧化双加氧酶DAO。在赤霉素途径中,鉴定了2 个α-淀粉酶OsAmy3E 和OsAmy4A 和1 个β-淀粉酶OsBmy7。转录因子方面则主要鉴定了5 个NAC (NAM、ATAF1/2 和CUC2)家族的转录因子,说明其在水稻种子成熟时发挥重要作用。
表1 成熟水稻种子中的植物激素和转录因子相关蛋白Table 1 Proteins related to plant hormone and transcription factor in mature rice seeds
水稻种子的发育可以划分为胚胎发生、籽粒灌浆和种子成熟3 个阶段,在最后的种子成熟阶段水分大量流失,最终形成干燥、休眠状态的种子[10]。淀粉是水稻产量和品质的主要决定因素,我们发现淀粉合成酶(A0A076FRI5)在所有鉴定的蛋白质中质谱信号最强,高达379 673 333,表明种子成熟时淀粉的合成非常旺盛。另外,有意思的是我们在成熟种子中鉴定了2 个α-淀粉酶OsAmy3E 和OsAmy4A和1 个β-淀粉酶OsBmy7,同时也鉴定了许多的α-淀粉酶抑制剂。有研究表明水稻种子发育阶段的热应激诱导了α-淀粉酶基因的表达,包括Amy1A、Amy1C、Amy3A、Amy3D和Amy3E[11]。但是,一般认为α-淀粉酶是在种子萌发过程中被植物激素赤霉素(Gibberellic acid, GA)诱导产生。本研究的结果证明,种子成熟过程中也存在一定水平的α-淀粉酶积累。在胚胎成熟的早期阶段,α-淀粉酶基因的高水平表达有助于将暂时储存的淀粉转化为糖,并快速满足能量和底物的需求[12]。但是,目前暂不清楚α-淀粉酶在成熟种子中的作用,其产生的原因和作用有待进一步深入研究。
贮藏蛋白也是水稻成熟种子的主要化学组分。结构域注释发现,排名第1 的是RNA 识别基序,含有这类基序的蛋白主要参与RNA 的加工和蛋白的翻译,KEGG 中富集蛋白数量最多的也是参与翻译的核糖体通路和蛋白质加工通路。结构域排名第4 的是主要存在于植物种子贮藏蛋白中的Cupin,质谱信号排名前10 的蛋白中有8 个是Cupin 蛋白。近期的研究还发现,编码Cupin 结构域的种子贮藏蛋白基因与种子活力之间也存在密切的关系[13]。此外,蛋白激酶结构域也广泛存在,暗示蛋白磷酸化是种子成熟期的重要事件。淀粉合成、贮藏蛋白合成和蛋白修饰都要消耗能量,这需要大量的ATP 供应。与此吻合的是,我们注意到在KEGG 通路分析中,有大量关于能量代谢和碳水化合物代谢(呼吸作用)的通路,这可以为种子的成熟提供能量保障。
除了淀粉和蛋白质的合成,种子成熟后期另一个重要事件是脱水干燥。前人的研究表明,LEA 蛋白(Late embryogenesis abundant protein)、热激蛋白(Heat shock protein, HSP)和抗氧化物质的积累与脱水密切相关[14-16],这些蛋白也大量出现在我们的质谱鉴定结果中。ABA 被认为是种子成熟脱水的主要调控因子。ABA 信号的核心通路包括ABA 受体蛋白PYR/PYL/RCAR、PP2C 和SnRK2 三大组件。我们鉴定了OsRCAR10、OsRCAR7 和OsSAPK7等3 个ABA 信号途径的正调控蛋白,说明ABA 信号在水稻种子成熟中发挥重要作用,这与前人的研究结果[17]相吻合。此外,维持一定的ABA 信号强度也有利于种子初级休眠性的建立。生长素IAA 被认为是ABA 之外另一个影响种子成熟的重要植物激素, IAA 的积累会诱导种子的初级休眠[18-19]。我们的研究鉴定了2 个IAA-氨基酸水解酶OsILL8和OsILL1 以及IAA 氧化酶DAO,前者可以提高游离IAA 的浓度,而后者通过氧化作用降低IAA 水平,说明种子成熟过程需要精准调节IAA 的水平。高水平IAA 所在的区域对同化产物具有“拉力”,从而调节贮藏物质在种子不同部位的积累[20]。
综上,水稻种子成熟期蛋白质组学的研究对于理解水稻种子生物学特性和提高水稻产量和品质具有重要意义。本研究利用4D label-free 蛋白组学鉴定了水稻种子在成熟期蛋白的表达谱,获得了高深度、高精度的质谱数据,丰富了水稻种子成熟期的蛋白研究,为深入开展水稻种子成熟调控提供了理论依据。