裴会敏, 王 芬, 木 仁, 李国栋, 喻 佩
(1.黔南民族师范学院生物科学与农学院, 贵州 都匀 558000;2.贵州大学茶学院, 贵阳 550025)
贵州省地处云贵高原,海拔较高,为典型的喀斯特地貌,年均降水量较多,四季温差小,冬暖夏凉,以阴天为主,日照较少,这些独特的气候条件十分适宜种植茶树,使贵州省成为享誉全国的茶产业大省,有着“茶树发源地”和“茶叶经济之乡”的美称[1]。截至2016年,贵州的茶树种植面积达到4.4×105hm2,是茶树种植面积最大的省份[2]。都匀毛尖茶是贵州省的优良品种,是近代中国十大名茶之一,曾在巴拿马食品博览会上荣获优质奖,享有“千年贡茶,百年金奖”的美誉。都匀毛尖茶具有外形条索紧结、卷曲纤细、滋味鲜爽甘甜等诸多特点,是中国高端茶叶中的上等精品,深受消费者的喜欢[3]。因此,开展都匀毛尖本地种茶树茎、叶和根的蛋白质组研究对茶树品质、质量及抗逆相关的遗传改良具有重要意义。
蛋白质组源于蛋白质与基因组学的杂合,意指“一种基因组所表达的全套蛋白质”,即包括一种细胞乃至一种生物所表达的全部蛋白质[4-5]。随着人们对茶树研究的不断深入,茶树在蛋白质组方面的研究也逐步展开。梁猛[6]利用iTRAQ技术对紫娟茶树花青素代谢调控的差异蛋白质组进行了研究,为选育功能成分独具特色的茶树品种奠定基础。李勤[7]对安吉白茶新梢生育期间蛋白质组学进行了研究,发现安吉白茶返白前与复绿后叶片中蛋白质的表达丰度发生了明显改变,为后期培育茶树新品种提供数据支持。庄重光[8]通过蛋白质组学研究了不同水分处理下铁观音茶树的生理机制,为探寻茶树优质高产的灌溉机理提供依据。袁清华[9]采用Lable-free技术研究了茶树“信阳10号”生态休眠不同时期的蛋白质组的变化,结果表明,差异蛋白可能是芽休眠形成的原因,并且类黄酮类生物合成和JA信号途径可能参与了茶树进入生态休眠的过程。郭春芳等[10]利用差异蛋白质组学的方法,分析了铁观音茶树幼苗在聚乙二醇胁迫下叶片蛋白组的变化。林金科等[11]采用蛋白组技术研究了无公害化学诱导因子可使茶树叶片EGCG含量提高20%以上。Label-free蛋白质组学技术是通过液质联用技术对蛋白质酶解肽段进行质谱分析,该技术不需要使用昂贵的稳定同位素标签做内部标准,只需分析大规模鉴定蛋白质时所产生的质谱数据,比较不同样品中相应肽段的信号强度,从而对肽段对应的蛋白质进行相对定量[12-13]。本研究以贵州都匀毛尖茶树茎叶和根为研究材料,利用Label-free蛋白质组技术研究茶树叶、茎和根中的蛋白质表达量并利用STRING 9.1数据库[14]构建蛋白质相互作用网络[15],为都匀毛尖茶树生长发育及良种选育提供理论依据。
茶苗选用种植于黔南民族师范学院后山基地的都匀毛尖茶树扦插苗。选取9株生长环境和管理条件相同、生长发育水平相近且没有病虫害的健康茶苗植株,将茶苗洗净擦干后分为3组,每组3株;在每组的植株上分别取嫩叶5片,3段5 cm茎,适量(5 g)根,每组3个生物学重复,共9个重复,分别放入离心管并迅速放入液氮中。采样时在茶树上剪取相同的部位、发育阶段相似、完整无残缺的叶片、茎和根,随后将9个样本放入实验室的-80 ℃冰箱储存备用。
尿素(Amresco,M 123-1 KG)、四乙基溴化铵TEAB(Sigma-Aldrich,T 7408-100 mL)、二硫苏糖醇(Amresco,M 109-5 G)、碳酸氢铵(Sigma-Aldrich,A 6141-500 G)、甲酸(Sigma-Aldrich,T 79708)、乙腈(J.T.Baker, 34851 MSDS)、碘代乙酰胺(Amresco, M 216-30 G)。
离心机(Eppendorf)、电泳系统(bio-rad)、酶标仪(DR 200 B)、涡旋振荡器(SCILOGEX,型号:MX-S)。
将冷冻的样本研磨成粉末,加入适量裂解液(lysis buffer)(8 mol/L尿素),涡旋混匀超声1 s,停1 s,累计120 s。14 000 r/min离心20 min,取上清液,分装,留取10 μL定量,其余冻入-80 ℃冰箱中。
采用Bradford法测定提取的蛋白质浓度。先将样本用裂解液(lysis buffer)进行一定倍数稀释使其终浓度在标准线范围内,稀释好的样本和标准品各取10 μL分别和300 μL蛋白定量燃料避光反应10 min,用酶标仪同时测定标准品和样本在595 nm下的吸光值,根据标准品每管吸光值和浓度的关系绘制标准曲线,然后计算样本浓度。
每例样本取5 μg进行SDS-PAGE电泳,考马斯亮蓝染色30 min,脱色直至背景清晰。
取出100 μg蛋白,加入终浓度为10 mol/L二硫苏糖醇,37 ℃ 1 h,然后恢复至室温。加入终浓度为40 mol/L的碘代乙酰胺,避光室温45 min。使用碳酸氢铵稀释样本,测量pH=8并按照蛋白和胰酶比例50∶1加入胰酶,37 ℃过夜。次日,加入50 μL 0.1%的甲酸进行终止反应。使用C 18脱盐柱对样本进行脱盐,100%乙腈活化脱盐柱,0.1%甲酸平衡柱子,加载样本到柱子上,随后使用0.1%甲酸洗涤柱子,洗掉杂质,最后使用70%乙腈洗脱,收集流穿液,冻干。
配制流动相A液(100%水、0.1%甲酸)和B液(80%乙腈、0.1%甲酸)。使用10 μL A液溶解冻干粉末,4 ℃下14 000 r/min离心20 min,取上清液1 μg样品进样,液质检测,洗脱梯度:0 min(8%B),5 min(12%B),35 min(30%B),44 min(40%B),45 min(95%B),60 min(95%B),分离流速600 nL/min。使用Orbitrap ExplorisTM480质谱仪进行分析,质谱采用数据依赖型采集模式,质谱全扫描范围为350~1 200 m/z,一级质谱分辨率设为60 000(200 m/z),二级质谱检测采用“Top Speed”模式,生成质谱检测原始数据。
采用Proteome Discoverer 2.4软件进行Uniprot搜库,获得蛋白质和肽段定性和定量的结果。
质谱鉴定到的肽段长度范围为15~36个氨基酸,肽段长度在15~18个之间达到峰值(图1 A)。鉴定到肽段的PSM(二级肽段谱图)数目分布情况,匹配到肽段的PSM数目范围为1~19个(图1 B),平均每个肽段捕获的PSM数目越少,说明质谱能更有效避开重复取样而获得更多的结果,而平均PSM数量越多,则说明单个肽段鉴定的可靠性越高。鉴定到蛋白质的肽段分布中含有1个肽段的蛋白质最多,其次是含有2个肽段的蛋白次多,说明肽段的蛋白质鉴定效率高,蛋白质的数量相对集中在1~20个肽段的范围内(图1 C)。蛋白质的覆盖率越高,对于解释蛋白异构体等越有利。鉴定到蛋白质的覆盖率在2%~6%达到峰值,覆盖率在64%以上的蛋白质数量几乎为零(图1 D)。
图1 Label-free蛋白质组学鉴定的多肽长度、PSM数量、肽段数量和覆盖率分布
对都匀毛尖茶树叶、根、茎的9个样本的蛋白质组进行主成分分析,叶、茎和根的蛋白质基本上可以区分(图2),表明在实验过程中数据的重现性较好。主成分1和主成分2的贡献率分别为63.2%和18.9%,样品累积贡献率为82.1%,说明这两个主成分解释了82.1%的原始变量信息,代表性较好。
图2 叶、茎和根蛋白质定量的主成分分析
2.3.1蛋白质功能注释
对鉴定到的1 963个蛋白质进行GO、KEGG和COG注释,总共有1 766个蛋白质被注释,其中1 573个蛋白质注释到GO数据库,881个蛋白质注释到KEGG数据库,1 228个蛋白质注释到COG数据库。
在GO注释中,187个蛋白质注释到膜的组成部分中,173个蛋白质注释到ATP结合,116个蛋白质注释到金属离子结合,28个蛋白质具有过氧化物酶活性,20个蛋白质参与防御反应, 7个蛋白质与发病原相关,7个蛋白质与毒素活性有关,5个蛋白质参与脱落酸激活的信号通路,5个蛋白质参与脱落酸结合,4个蛋白质参与木质素分解过程,3个蛋白质参与对生物刺激的反应, 2个蛋白质参与对真菌的防御反应,2个蛋白质参与茉莉酸生物合成过程,1个蛋白质参与对细菌的防御反应,1个蛋白质参与脱落酸生物过程的调控(图3)。过氧化物酶和木质素可有效防御病虫害的侵染[16-18],茉莉酸和脱落酸途径参与调控植物防御病虫害的防御反应[19-20],说明以上蛋白质在防御茶树病虫害方面具有重要作用。
图3 蛋白质GO功能注释
在KEGG注释中,有133个蛋白质参与果糖和甘露糖代谢、半乳糖代谢、淀粉和蔗糖代谢、N多糖生物合成、氨基酸糖和核苷酸糖代谢、糖胺聚糖降解等糖类代谢途径。有317个蛋白质参与缬氨酸、亮氨酸、异亮氨酸的降解和生物合成、赖氨酸的降解和生物合成、精氨酸和脯氨酸的代谢等各种氨基酸的代谢途径。有11个蛋白质参与类黄酮、黄酮和黄酮醇等的生物合成(图4)。糖类决定茶的甜味,氨基酸使茶具有鲜爽味,茶多酚使茶具有苦涩味,因此,以上蛋白质经过多种代谢途径形成了茶的滋味的重要组成成分。
2.3.2蛋白质相互作用网络分析
利用Label-free蛋白质组技术对都匀毛尖茶树的叶、茎和根中的蛋白质进行定量分析,共获得1 963个蛋白质,将蛋白质与STRING 9.1数据库进行同源比对获得叶、茎和根中的蛋白质相互作用网络,1 057个节点,15 500个相互作用。利用Cytoscape 3.3.0软件可视化蛋白质相互作用网络,并预测出关键蛋白。对预测出的都匀毛尖茶树蛋白质相互作用网络进行拓扑属性分析,网络聚合系数为0.376,网络直径12,网络半径为1,平均邻居数14.664。网络度分布符合幂律分布的规律(图5 A),度是指网络中的一个蛋白质与其他蛋白质的互作数,度分布P(x)=59.719x-0.597,相关系数0.617,R2=0.531。拓扑系数是一个蛋白质与其他蛋白质共有邻居蛋白质程度的相对度量,P(x)=0.99x-0.424,相关系数0.776,R2=0.648(图5 B)。最短路径是网络中一个蛋白质到其他各个蛋白质的最短边数,最短路径分布(图5 C)可以应用在疾病的治疗方面。蛋白质的邻域连通性定义为某一个蛋白质的所有邻居的平均连通性。邻域连通性分布(图5 D)是具有k个邻居的所有蛋白质的邻域连通性的平均值。以上结果说明网络是一种无标度网络,具有小世界特性。
图4 蛋白质KEGG功能注释
图5 蛋白质相互作用网络的拓扑特性
本研究以贵州都匀地区都匀毛尖茶树的叶茎和根为材料,利用Label-free蛋白质组技术结合液相色谱-串联质谱(LC-MS/MS)技术对茶树叶片、茎和根的蛋白质进行定性定量分析,共鉴定出1 963个蛋白质。对蛋白质进行GO和KEGG注释,并进行蛋白质相互作用网络分析。
图6 氨基酸生物合成与代谢的蛋白质相互作用网络
图7 类黄酮生物合成途径
在GO注释中,5个蛋白质(A 0 A 4 S 4 DNH 8;A 0 A 4 S 4 F 3 B 6;A 0 A 4 S 4 ECK 1;A 0 A 4 S 4 EKT 6;A 0 A 4 S 4 DC 94)参与丝氨酸生物合成过程。4个蛋白质参与芳香族氨基酸生物合成过程(A 0 A 4 S 4 DR 40;A 0 A 4 S 4 DA 65;A 0 A 4 S 4 DLY 2;A 0 A 4 S 4 EW 76)。3个蛋白质参与异亮氨酸生物合成过程(A 0 A 4 S 4 ENQ 7;A 0 A 4 S 4 DEB 8;A 0 A 4 S 4 CWV 2),3个蛋白质参与甲硫氨酸生物合成过程(A 0 A 4 S 4 D 702;A 0 A 4 S 4 CWR 4;A 0 A 4 S 4 DEB 8)。2个蛋白质参与缬氨酸生物合成(A 0 A 4 S 4 ENQ 7;A 0 A 4 S 4 CWV 2)。2个蛋白质参与氨基酸结合(A 0 A 4 S 4 D 6 F 1;A 0 A 4 S 4 E 3 N 5)。1个蛋白质参与脯氨酸生物合成过程(A 0 A 4 V 3 WPG 1)。1个蛋白质参与谷氨酸生物合成过程(A 0 A 4 S 4 DIC 5)。1个蛋白质参与亮氨酸生物合成过程(A 0 A 4 S 4 EQ 52)。1个蛋白质参与蛋氨酸代谢过程(A 0 A 4 V 3 WKL 4)。8个蛋白质参与细胞氨基酸代谢过程(A 0 A 4 V 3 WN 11;A 0 A 4 S 4 E 3 N 5;A 0 A 4 S 4 D 389;A 0 A 4 S 4 DKZ 2;A 0 A 4 V 3 WP 54;A 0 A 4 S 4 E 3 T 5;A 0 A 4 S 4 E 0 B 0;A 0 A 4 S 4 DNP 9)。3个蛋白质参与细胞氨基酸生物合成过程(A 0 A 4 S 4 DXY 0;A 0 A 4 S 4 DMD 9;A 0 A 4 S 4 DXF 9)。从都匀毛尖茶树蛋白质相互作用网络中提取出参与氨基酸生物合成与代谢的蛋白质相互作用网络(图6),共有116个蛋白质,153个相互作用,推测这些参与氨基酸生物合成与代谢的蛋白质相互作用在都匀毛尖茶叶品质形成中具有重要作用。氨基酸是茶叶鲜味的主要来源,也是形成干茶香气的重要底物,在受热条件下,氨基酸与糖类等发生“美拉德”反应,产生令人愉悦的焦糖香气。因此,氨基酸是决定都匀毛尖茶叶品质的重要成分,与刘剑君等[21]、王春波等[22]的研究结果一致。
在KEGG注释中,有10个蛋白质参与类黄酮的生物合成,黄酮类化合物能防治老年高血压、脑溢血、冠心病,具有止咳、抗菌的活性,还具有护肝、解肝毒和抗氧化作用。在类黄酮生物合成途径中(图7),对香豆酰CoA在查耳酮合成酶(CHS)作用下合成柚皮素查耳酮,并在查耳酮异构酶(CHI)作用下环化得到柚皮素。柚皮素在类黄酮3′-羟化酶(F 3′H)、类黄酮3′,5′-羟化酶(F 3′,5′H)作用下得到圣草酚,随后被黄烷酮3-羟化酶(F 3 H)和二氢黄烷醇4-还原酶(DFR)催化还原合成无色花青素。无色花青素可被还原酶(LAR)直接还原得到儿茶素,也可被无色花青素双加氧酶(LDOX)和花青素还原酶(ANR)连续催化得到表型儿茶素。圣草酚在F 3 H的催化下得到二氢槲皮素,接着在F′5′H、DFR和LAR的催化下得到没食子儿茶素,再在LDOX和ANR的作用下得到表没食子儿茶素,与前人研究结果一致[23-25]。儿茶素具有抗肿瘤、抗氧化、抗病菌以及保护心脑器官等多种药理作用。类黄酮和儿茶素总体上具苦涩味,收敛感,是茶叶重要的滋味成分,是决定都匀毛尖茶叶品质的重要成分。
在蛋白质相互作用网络中,对网络进行了聚合系数、网络直径、网络半径、平均邻居数、网络度分布、拓扑系数和最短路径分析,网络具有小世界特性,是一种无尺度网络。通过网络可以预测关键蛋白质和蛋白质的功能。因此,通过网络可以预测一些在茶叶品质形成过程中的相关的蛋白质。A 0 A 4 S 4 DAB 8(Ubiquitin receptor RAD 23)是一种泛素受体蛋白质,度为1 554,因此,与之互作的1 554个蛋白质也可能具有泛素结合的功能。A 0 A 4 V 3 WL 21(Ubiquitin-like domain-containing protein)度为1 528,与之互作的蛋白质也可能具有与泛素结合相关的功能。A 0 A 4 S 4 EBY 0(Ubiquitin-like domain-containing protein)度为1 520,研究结果表明这些蛋白质都是度最大的蛋白质即关键蛋白,并且功能都与泛素结合相关。而在氨基酸生物合成中有96个蛋白,这些蛋白对增进茶汤的滋味和浓度有重要的作用,与茶叶的鲜味有关。因此,这96个蛋白的互作蛋白也可能与茶叶的品质相关,在它们复杂的相互作用下产生令人愉悦的香味。例如A 0 A 4 S 4 DET 5(Alanine transaminase)是一种丙氨酸转氨酶,具有氨基转移酶活性,与它互作的24个蛋白也可能具有类似的功能。通过网络可以预测蛋白质的功能。本研究结果为培育良种茶树提供数据支持。