李社增,牛露欣,李博超,陈秀叶,马平*,马峙英
(1.河北农业大学/ 教育部华北作物种质资源重点实验室,河北 保定071000;2. 河北省农林科学院植物保护研究所/ 河北省农业有害生物综合防治工程技术研究中心/ 农业农村部华北北部作物有害生物综合治理重点实验室,河北保定071000;3. 南加州大学生物医学工程系,美国 洛杉矶90089)
采用气相色谱- 质谱(Gas chromatographymass spectrometer,GC-MS)[1-2]或液相色谱- 质谱(Liquid chromatography-mass spectrometer,LCMS)[3-4]成功分析拟南芥、番茄等植物代谢组后,色谱与质谱相结合分析技术被证明是非靶标代谢组分析中最高效和最灵敏的方法。 在非靶标代谢组研究中,由于质谱数据庞大而复杂,数据处理和分析以及随后的代谢物注释/鉴定是最耗时费力的工作。 造成代谢组数据庞大复杂的主要原因是分析物的多种加合物形成以及盐团簇形成,导致质谱数据存在大量的额外信号[5]。
在液相色谱电喷雾质谱(Liquid chromatogra phy-electrospray ionization-mass spectrometry,LC-ESI-MS)分析过程中,分析物形成加合物的现象普遍存在,是对物质定性、定量的基础[6-8]。 尤其对于糖和各种炸药等一些不能直接用电喷雾质谱分析的化合物,加合物形成的发现显得尤为重要。 例如:Ghosh 等[9]在电喷雾负离子模式下通过甲酸加合物实现了酰基蔗糖代谢物的测定,Mathis 等[10]采用负离子加合物建立了高能炸药的定性和定量的方法。 加合物中除了常见的质子化分子外, 钠、 钾和铵加合物也经常出现,Huang等[11]报道在电喷雾质谱分析中的正(负)离子模式中能够观察到常见的正、负离子加合物分别为32 个和15 个。 而与分析物一起形成加合物的各种离子,一般来源于液相色谱的流动相及其添加剂、溶剂杂质、玻璃器皿等[12-14],特别是流动相中加入添加剂对加合物形成具有较大的影响。Kruve 等[15]研究了ESI 正离子模式下7 种流动相添加剂对17 个化学物质加合物形成的可能性,明确流动相添加剂改变加合物形成有很强的作用;Erngren 等[16]的研究证明流动相中钠离子或钾离子浓度对加合物的定量影响极大,甚至形成多聚加合物;Leitner 等[17]研究6 种不同的乙腈/醋酸铵混合物在中性条件下对模型肽 (缓激肽)高效液相色谱 (High performance liquid chromatography,HPLC)-ESI-MS 分析的性能, 明确流动相改变对色谱分离和加合物的形成影响很大,在供试的条件下,可以形成钠化肽加合物而不是常见的质子加合物。 因此,对于特定的化合物,明确特定液相色谱和电喷雾离子条件下加合物形成数据,对该物质的定量和定性分析是非常必要的。
在采用LC-ESI-MS 的代谢组分析中,明确代谢产物的种类尤为重要。由于LC-ESI-MS 系统的多样性以及液相色谱较低的保留时间再现性,导致单一优化分析方法和液相色谱-质谱分析中的色谱图和质谱图在不同实验室间进行比较均受到严重限制,同时还缺少将质谱数据自动转换为(推定的)植物代谢物的高效工具。 这些问题导致对大量质谱信号数据的分析只能在现有的化学数 据 库 (如SciFinder、Pub-Chem、Massbank 或Dictionary of Natural Products)中进行手动搜索[18],筛选效率受到极大限制,同时这些数据库的信息来自一般的化学物质, 其来源未与植物关联,导致植物代谢组鉴定时推定的物质种类存在多种可能性和不准确的靶标。 因此,如何实现代谢产物准确鉴定是代谢组分析中的主要难题。 在线XCMS 软件在一定程度上解决了不同型号液相色谱-质谱系统采集的数据处理, 实现特征离子检测、保留时间校正、峰对齐注释、统计分析和数据可视化的自动化,为完整的非靶标代谢组分析提供了一整套解决方案[19-20]。 然而,作者所在实验室在前期研究中,发现通过在线XCMS 软件进行代谢产物鉴定,推定的化合物与报道的棉花代谢产物存在较大差异,所以该软件在针对具体植物的代谢产物进行鉴定时存在重大不足。
本研究着重针对在线质谱分析技术不能准确鉴定棉花次生代谢产物的科学问题, 根据LC-ESI-MS 分析中正(负)离子模式下形成加合物的一般规律, 利用MATLAB 软件编写计算程序建立棉花代谢产物快速鉴定方法;同时,利用超高效液相色谱电喷雾质谱(Ultra-performance liquid chromatography-electrospray ionization-mass spectrometry,UPLC-ESI-MS)方法对棉花代谢产物标准品进行质谱分析,采用在线XCMS 软件进行无靶标质谱数据提取并利用本研究建立的鉴定方法进行鉴定,明确特定液相色谱和电喷雾离子模式条件下这些棉花代谢产物的加合物种类、主导加合物及适宜的离子检测模式。 因此,本研究结果将为棉花次生代谢组学研究提供技术和理论数据支撑。
对18 个棉花代谢产物的标准品(表1)开展UPLC-ESI-MS 分析研究。 称取1.0 mg 单个标准品加入10.0 mL 适用溶剂进行溶解,制备标准品100.0 mg·L-1母液。取单个标准品母液0.1 mL,用甲醇作稀剂释定容至10 mL, 混匀后制备成质量浓度为1.0 mg·L-1的溶液,作为单个标准品检测液;分别取18 个标准品的母液各0.1 mL 于容量瓶中进行混合, 用甲醇作稀释剂定容至10 mL,混匀后制备成单个标准品质量浓度为1.0 mg·L-1的标准品混合检测液,用于液相色谱- 质谱分析的质量控制检测。 这2 种检测液分别分装于进样瓶中并储存在4 ℃冰箱中备用。
表1 棉花代谢产物标准品的信息Table 1 Information on cotton metabolite standards tested in presented study
表1 (续)Table 1 (Continued)
本研究采用超高效液相色谱电喷雾飞行时间质谱仪(UPLC 型号为Nexera LC-30AD,日本岛津制作所制造; 质谱仪为Triple TOFTM5600+,美国AB SCIEX 公司生产)对棉花代谢产物标准品及其混合检测液进行分析。
色谱条件: 色谱柱为Shim-pack GIST C18(直径2.1 mm,长100 mm,填料粒径2 μm),流动相A 相为0.1%(体积分数)甲酸水溶液,流动相B 相为0.1%(体积分数) 甲酸乙腈溶液, 流速0.35 mL·min-1,柱温40 ℃,自动进样器温度4 ℃,进样量4 μL。 每个样品3 次重复。 洗脱条件:0~1.0 min,5%(体积分数,下同)B;1.0~6.0 min,5%~20%B;6.0~9.0 min,20%~50%B;9.0~13.0 min,50%~95%B;13.0 ~15.0 min,95% B;15.0 ~15.2 min,95%~5%B;15.2~17.5 min,5%B。
正离子模式(Positive ion mode,ESI+)质谱检测:喷雾气压(GAS1)344.7 kPa(50 psi),辅助加热气压(GAS2)413.7 kPa(60 psi),辅助加热气温度500 ℃,气帘气压(CUR)241.3 kPa(35 psi),离子化电压(IS)5 500 V,采集模式为信息依赖型采集(IDA)模式,TOF-MS 质荷比(m/z)扫描范围50~1 500, 累积时间250 ms,TOF-MS/MS 二级m/z 扫描范围50~1 000,累积时间50 ms,去簇电压(DP)100 V,碰撞能量(CE)35 eV,扩展碰撞能量(CES)15 eV。
负离子模式(Negative ion mode,ESI-)质谱检测:辅助加热气压379.2 kPa(55 psi),气帘气压172.4 kPa(25 psi),离子化电压4 500 V,其他参数设置与正离子模式质谱检测一致。
采用甲酸钠相对分子质量作为锁定值,对质谱系统的稳定性及准确性进行校正,每6 个样品自动校正1 次。
采用在线XCMS 软件对UPLC-ESI-TOF/MS数据进行可视化和手工处理(https://xcmsonline.scripps.edu)[20],进行特征离子峰提取、保留时间(Retention time,RT)校正和峰对齐,获得m/z、保留时间和峰强度(Peak intensity)等数据,进一步将包含RT、m/z 和峰强度等数据导出为xlsx 文件,在MS Excel 2010 软件中手动搜索和编辑,包括杂质峰的消除和数据去噪。 将最终结果转化为数据矩阵(RT×m/z×峰强度),分别构建ESI+变量数据集和ESI-变量数据集,并用于进一步的数据分析。
根据LC-ESI-MS 分析技术中正(负)离子模式下形成加合物的一般规律, 利用MATLAB 软件(R2018b,The MathWorks,Inc.)编写计算程序,根据每个离子的质荷比计算出对应的所有可能的准确相对分子质量(计算相对分子质量),进一步计算其与各标准品准确相对分子质量间的误差,根据锁定相对分子质量检测误差设定误差阈值,以介于此阈值正负值间的推定物质作为供试化合物的鉴定结果。
根据方法1.4 中对棉花次生代谢产物标准品的质谱数据鉴定结果,调查供试标准品对应的质谱离子形态, 即为UPLC-ESI-MS 检测中棉花代谢产物标准品的加合物。
筛选正离子模式和负离子模式下各标准品的信号最强的主导加合物,计算2 个离子模式下峰强度的比值。
图1 正离子模式(A)和负离子模式(B)下棉花代谢物标准品混合液UPLC-ESI-MS 总离子色谱图Fig. 1 UPLC-ESI-MS TICs of cotton metabolite mixture in positive (A) and negative (B) ion mode
18 个标准品混合检测液的UPLC-ESI-MS 总离子色谱图见图1。图1 显示代谢产物脱落酸,在2 个模式中保留时间和峰强度均有所不同,在正离子模式下,其主要加合物[M+H]+(m/z 265.142 9)保留时间为9.96 min,峰强度为1.76×105(图1A),负离子模式下主要加合物[M-H]-(m/z 263.129 4)保留时间为10.01 min,峰强度为5.62×105(图1B)。 采用在线XCMS 软件,分别对正离子模式和负离子模式下采集的各个标准品的原始质谱数据进行处理和无靶标离子提取,数据导出到xlsx 文件中,为每个标准品均构建了ESI+数据集和ESI-数据集。 导出的数据中包含了各离子的保留时间、m/z 和峰强度。 每个标准品提取到的离子数量、m/z 范围、保留时间不同,详细情况列于表2。
在LC-ESI-MS 分析中分析物最终形成常见的正、 负离子模式加合物分别为32 个和15 个,根据这些加合物构成规律,设计了根据加合物的质荷比计算准确相对分子质量的公式,列于表3。本研究利用MATLAB 软件编制2 个计算程序POSid 和NEGid(暂不公开),分别对正离子模式和负离子模式下检测到的质谱数据进行计算,给出判定结果。 这个计算过程主要包括3 个步骤:(1) 获得计算的准确相对分子质量(Calculated molecular weight,CM): 根 据 各 检 测 到 离 子 的m/z, 计算出每个离子对应的所有可能的准确相对分子质量, 计算公式见表3;(2) 获得误差(ΔM): 计算各离子的计算准确分子量与各标准品准确相对分子质量(MM,表1)间的误差,计算公式:ΔM=(CM-MM)/MM;(3)根据相对分子质量锁定值的检测误差设定误差阈值,以误差介于此阈值正负值的推定物质作为供试物质的鉴定结果。
表2 棉花代谢产物标准品的UPLC-ESI-MS 检测数据概况Table 2 A survey of UPLC-ESI-MS data of cotton metabolite standards
利用2.2 中鉴定方法, 根据检测到各标准品离子的m/z,计算了UPLC-ESI-MS 检测到的各离子对应的所有可能的准确相对分子质量及其与各标准品的准确相对分子质量间的误差;本次检测锁定相对分子质量试验误差为21×10-6,确定20×10-6为误差阈值进行了化合物推定。
对正(负)离子模式下检测到的离子,该鉴定方法能分别推定出14 个标准品, 但均未推定到α- 石竹烯、角鲨烯和三十烷酸3 种物质,另外正离子模式未推定到3-吲哚甲醛,负离子模式未推定到青榆烯C。 在推定的化合物中,质谱观察到1~6 种不同的加合物,峰强度5 600 以上,正离子模式的误差-2.9~3.1,负离子模式误差-13.5~16.8(表4 和表5)。
正离子模式下, 检测到的14 个标准品中共观察到6 种加合物[M+H]+、[M+Na]+、[M+NH4]+、[2M+NH4]+、[2M+Na]+和[2M+H]+。 所有标准品都能观察到加合物[M+H]+,白麻苷、绿原酸、蜜二糖、脱落酸、紫云英苷和蔗糖6 个标准品观察到[M+Na]+,赤霉素A3、绿原酸、脱落酸、蔗糖和蜜二糖5 个标准品观察到[M+NH4]+,青榆烯C 和脱落酸均能观察到[2M+Na]+和[2M+NH4]+,仅在脱落酸观察到[2M+H]+。
表3 LC-ESI-MS 检测中供试物质的常见加合物Table 3 Common adducts of the tested compound in LC-ESI-MS detection
表4 正离子模式下棉花代谢产物标准品鉴定Table 4 Putative identification of cotton metabolite standards in positive ion mode
表5 负离子模式下棉花代谢产物标准品鉴定Table 5 Putative identification of cotton metabolite standards in negative ion mode
在负离子模式下, 检测到的14 个标准品观察到[M-H]-、[2M-H]-、[M+Cl]-、[M+FA-H]-、[3M-H]-、[M+Na-2H]-、[M-H2O-H]-、[M+TFA-H]-8 种加合物。所有标准品都能观察到加合物[M-H]-,赤霉素A3、柽柳黄素、赤霉素A4、白麻苷、绿原酸、脱落酸和紫云英苷7 个标准品能观察到[2M-H]-,赤霉素A3、赤霉素A4、白麻苷、脱落酸4 个标准品能观察到[M+Cl]-,赤霉素A3、赤霉素A4、蔗糖、蜜二糖4 个标准品能观察到[M+FA-H]-,赤霉素A3和赤霉素A4均能观察到[3M-H]-,仅在绿原酸中能观察到[M+Na-2H]-,棉酚中能观察到[M-H2O-H]-,白麻苷中能观察到[M+TFA-H]-。
基于流动相甲酸乙腈的梯度,特定标准品在UPLC-ESI-MS 的正离子模式或负离子模式下有不同的优势。 本研究在2 种模式下依次分析了棉花代谢产物标准品,以峰强度表示加合物绝对信号强度,其中离子信号最强的为主导加合物。对2个离子模式下各标准品主导加合物的信号进行比较分析,结果表明蜜二糖正离子模式(加合物[M+NH4]+)信号强于负离子模式([M+FA-H]-)5.4 倍, 棉酚在2 种模式下加合物 ([M+H]+、[M-H]-)信号相当,其他12 种化合物均是负离子模式信号强于正离子模式, 信号强度增加0.5~216 倍。 这一结果表明,负离子模式可能是棉花次生代谢产物UPLC-ESI-MS 分析的最佳检测模式。
图2 棉花代谢产物标准品正离子模式和负离子模式下最强信号离子的峰强度比值对数Fig. 2 Peak intensity ratios, in logarithmic scale, of the strongest signal ion (peak intensity) obtained in positive and negative ion modes for some cotton metabolite standards
本研究在对棉花次生代谢产物标准品进行非靶标代谢组质谱分析时,每个标准品的质谱数据包含1 000 多个离子数据(表1),在此数据中发现和鉴定出相应的物质存在很大难度。 因此,实现代谢产物高通量准确鉴定一直是重要的课题。 Moco 等[21]采 用HPLC-ESI-MS 分 析 番 茄(Solanum lycopersicum)代谢组,并利用番茄次生代谢产物加合物m/z 得到计算的准确相对分子质量及其与标准品准确相对分子质量间误差,建立了番茄次生代谢物质的鉴定平台MoTo DB,实现了数据共享。 但这一数据库仅限于单个离子数据的搜索,效率较低。 Benton 等[22]利用在线XCMS 软件处理质谱数据, 实现质谱数据在METLIN 数据库中自动搜索,实现代谢产物高通量鉴定。 然而该方案使用的METLIN 数据库,偏重于化学分析,虽然含有海量的物质种类,但大多数化合物缺乏与植物代谢产物的紧密关联,在进行植物代谢产物鉴定方面存在较大的局限性。因此,针对具体植物的代谢产物鉴定,仍需建立相应植物代谢产物数据库及其鉴定计算方法。 本研究利用MATLAB 软件编写的2 个用于棉花次生代谢产物鉴定的计算程序POSid 和NEGtid,在计算原理上与上述2 种方法相同, 能够从大量质谱数据中高效、准确发现靶标物质,完成无靶标棉花次生代谢产物的鉴定工作, 实现了棉花次生代谢产物快速鉴定。 另外, 该方法通过UPLC-ESI-MS 分析→XCMS 质谱数据处理→质谱数据→POSid 和NEGtid 计算和比较分析等主要步骤完成, 整个实施过程均能分割独立完成,方便研究人员自主应用。 因此,该方法的建立,为进一步进行棉花次生代谢组分析中代谢产物的准确鉴定提供了高效和便捷的方法支持。 迄今为止,已经明确从棉花根、茎、叶、花和种子提取物中分离和检测到的代谢产物111 种,包括萜类化合物61 种、 酚类化合物6 种、 黄酮类化合物26种、生物碱6 种、脂肪族天然产物6 种、碳水化合物5 种和简单芳香族天然产物1 种[23-24]。 本研究仅涉及18 个棉花代谢产物, 继续完善棉花代谢产物数据库信息以及进一步开展棉花次生代谢组研究是棉花生物学基础研究的重点工作之一。
在LC-ESI-MS 分析中,加合物形成是对分析物进行定性和定量的基础。 明确每个物质在特定LC 和ESI 条件下形成的加合物, 特别是主导加合物, 对该物质的LC-ESI-MS 分析鉴定尤为重要。 Ghosh 等[9]在ESI 模式下通过甲酸加合物实现了酰基蔗糖代谢物的测定,Mathis 等[10]采用负离子加合物建立了高能炸药的定性和定量的方法,Antonowicz 等[25]从4 种未修饰的核苷中分离出7 种候选核苷加合物, 建立了1 种仅需6 min的超高效液相色谱法, 用于小鼠组织样品中羰基、氯和氧加合物的定量分析。 所有这些研究表明,在LC-ESI-MS 分析中,加合物形成对待鉴定的分析物定性和定量分析具有重要作用。 本研究对棉花次生代谢产物标准品在UPLC-ESI-MS 分析中加合物形成的加合物种类进行了分析,明确了特定液相色谱和电喷雾离子条件下被鉴定化合物的加合物形成的种类和主导加合物,可为棉花代谢产物的定性和定量分析提供理论数据。
LC 的流动相成分决定了分析物的加合物种类不同,进一步导致ESI 正或负离子模式下检测到的信号强度会有较大的差异[26]。Moco 等[21]在采用HPLC-ESI-TOF/MS 分析番茄代谢物时, 发现基于乙腈与甲酸酸化梯度的特定液相色谱流动相,特定化合物在电喷雾正或负离子模式下存在不同加合物信号强度(峰强度)差异,具有ESI 模式的选择性。 本研究证明供试棉花代谢产物标准品在基于乙腈与甲酸酸化梯度特定液相色谱流动相条件下主导加合物(拥有最大峰强度)信号强度也存在同样规律,具有电喷雾离子模式选择性。如:蜜二糖正离子模式(加合物[M+NH4]+)信号强于负离子模式([M+FA-H]-)2.7 倍,适合正离子模式检测; 棉酚在2 种模式下加合物([M+H]-、[M+H]-) 信号相当,2 种ESI 模式均可检测; 其他12 种标准品均是负离子模式信号强度高出正离子模式0.5~216 倍,适合采用负离子模式检测。
选用18 个棉花代谢产物标准品为供试化合物,建立的基于计算准确分子量的棉花次生代谢产物鉴定MATLAB 程序, 可实现无靶标质谱数据的快速鉴定。 在本研究规定的UPLC 和ESI 条件下,2 种ESI 模式下14 个化合物得到鉴定,正离子模式下出现6 种加合物,负离子模式下出现8 种加合物,单个化合物的质谱可观察到1~6 种不同的加合物,其中1 个为主导加合物。 主导加合物具有ESI 检测模式的偏好性,决定了该化合物适宜的电喷雾离子模式。 这些结果为进一步开展棉花次生代谢组分析研究提供了技术和理论数据支撑。