马聪玉,生 宁,李元元,王 喆,张金兰
(中国医学科学院药物研究所,北京 100050)
中药是中华民族千百年医药发展凝炼的宝贵财富。中药成分复杂,使得中药药效和作用机制诠释一直面临挑战。系统解析中药的复杂成分,深入研究中药成分的生物学特点和药效作用是破解中药为什么有效、如何起效的关键。
基于分离、富集、纯化技术从药用植物中提取、分离和纯化天然产物,采用红外光谱、核磁共振谱仪等解析化合物结构,诠释药用植物的次生代谢产物,发现众多新类型、新骨架、新结构的药用成分,丰富天然产物结构信息,为中药复杂成分的分离与分析奠定了坚实基础。鉴于中药复方/制剂成分复杂、多样、微量的特点,经典的植物化学研究方法难以满足中药复方/制剂的快速、高通量、全成分的定性和定量分析需求。随着科学技术的飞速发展,探索新分析技术,建立中药成分分析新策略,以推动中药复杂成分的分析研究。特别是色谱-质谱分析技术和数据处理策略的发展,极大地促进了中药复杂成分的快速、高通量定性和准确定量。
色谱-质谱联用分析技术具有快速、高效、高灵敏和选择性好的特点,可以提供丰富的结构信息,提高复杂体系中微量成分的识别和鉴定效率,现已广泛应用于中药成分分析和鉴定。特别是液相色谱-质谱联用技术(LC-MS),其液相色谱部分由高效液相色谱(HPLC)发展到超高效液相色谱(UPLC)/超高压液相色谱(UHPLC),由一维液相色谱(1D-LC)发展到二维液相色谱(2D-LC)。质谱部分多为高分辨质谱,如飞行时间质谱(TOF)、四极杆-飞行时间质谱(Q-TOF)、傅里叶变换离子回旋共振质谱(FT-ICR)和轨道离子阱质谱(Orbitrap)。超高效液相色谱与高效液相色谱相比,分离效率更高、分析速度更快,与高分辨质谱联用后,在中药成分分析和鉴定方面优势明显。Dong等[1]采用UHPLC-QTOF/MS技术表征滋补脾阴方中155个成分,在50 min梯度洗脱条件下,各成分分布均匀、分离度好。Li等[2]建立UHPLC-QTOF/MS技术,在TOF动态范围增强(DRE)模式下分析中药利舒康胶囊的成分,分析过程中若流出物浓度较高达到信号饱和时,TOF会自动切换至低灵敏度模式以测定该成分的精确质量数。他们获得了未知成分高质量的一级和二级高分辨数据,鉴定了利舒康胶囊中278个成分,其中9个为新化合物。Xu等[3]建立了UHPLC-Orbitrap-MS法快速分析和鉴定丹红注射液中117个成分,每个样本分析时间仅需26 min。与传统的提取、分离和鉴定技术相比,超高效/超高压液相色谱-质谱联用技术在中药成分分析和鉴定数目、效率与通量上已经发生了质的变化。
二维液相色谱因峰容量高(理论峰容量可达10 000)[4],特别适合复杂样本的分析。通过尽量提高第一维和第二维液相色谱之间的正交性,扩大色谱峰分布,从而分析和鉴定更多成分。二维液相色谱有全二维(LC×LC)和多中心切割(multiple heart-cutting, HMC)2种分析模式。随着超高效/超高压液相系统的耐压能力不断提升,以及精密流速和多通道进样阀切换自动化技术的成熟,超高效/超高压二维液相色谱开始普及,并与高分辨质谱联用进行中药成分分析和鉴定。Qu等[5]建立LC×LC-QTOF/MS技术识别和鉴定了雷公藤多苷片中132个生物碱类和三萜类成分,解决了以往使用一维液相色谱分析时出现的峰重叠、基线干扰、成分鉴定少(约20个)的技术难题。若将全二维和多中心切割模式联合使用,还有助于提高中药成分鉴定数目。一般先在全二维模式下进行整体表征,再结合多中心切割模式有针对性地进行成分鉴定。例如,Qiao等[6]应用全二维液相色谱结合QTOF/MS对中药葛根黄芩汤进行表征,该方法的峰容量高(1 628)、正交性好(84%),短时间内(42 min)识别了280个成分,鉴定了125个成分;在此基础上结合多中心切割分析模式,降低了高含量成分的干扰,补充鉴定了葛根黄芩汤中13个微量成分。Sheng等[7]将全二维和多中心切割分析模式联用,全面表征中药灯盏生脉的成分:先应用全二维模式识别和鉴定灯盏生脉中各类成分283个,对于全二维模式难以分离的同分异构体,在多中心切割模式下,使用手性色谱柱作为第二维分析柱进行分离,补充鉴定了灯盏生脉中12对同分异构体。
气相色谱-质谱联用技术(GC-MS)是中药挥发油成分分析和鉴定的重要手段,并有NIST和Wiley标准谱库提供化合物的质谱信息,可实现快速、准确鉴定。气相色谱由一维(GC)发展到二维(GC×GC),峰容量显著提高,增强了对成分的分离能力。气相色谱-质谱联用技术由气相色谱-四极杆质谱联用(GC-MS)发展到气相色谱-三重四极杆质谱联用(GC-MS/MS)和气相色谱-飞行时间质谱联用(GC-TOF/MS),提高了质谱数据的质量精度和准确性,以及检测灵敏度。Wang等[8]采用GC-MS结合NIST11数据库对不同产地的白香木提取物和沉香挥发油进行成分分析和鉴定,实现了不同产地来源药材的快速判别。Zhao等[9]应用GC-TOF/MS技术鉴定了香肉豆蔻不同部位(果仁部、果皮部、叶部)的59个挥发性成分,并计算其相对百分含量,为香肉豆蔻的质量控制提供了数据支持。He等[10]经水蒸气蒸馏得到中药柴胡疏肝散的挥发油成分,建立GC×GC-MS分析技术,详细的分析参数优化使GC×GC-MS的分离能力极大提高,经GC-MS分离后形成的3个色谱峰在GC×GC-MS中被鉴定为6种中药成分,分离能力的提高帮助研究人员在柴胡疏肝散挥发油中识别和鉴定了216个萜类和苯酞类成分。
与气相色谱-质谱联用技术相适应的样本前处理技术也在不断发展,从普通的样品直接进样、顶空进样等发展到顶空固相微萃取技术(HS-SPME)、单滴液液微萃取技术(SDME)等。这些新型的前处理技术整合了萃取、富集和进样步骤,提高了分析效率,也扩展了气相色谱-质谱联用技术的应用领域。如Feng等[11]采用超声/微波辅助-顶空固相微萃取(UMHE-HS-SPME)技术结合GC-MS分析鉴定了白芷中85个挥发性成分,与传统的水蒸气蒸馏法相比,可以提取到更多的白芷挥发性成分,且只需10 min,整个过程无需有机溶剂。气相色谱难以分析中药难挥发性成分,衍生化反应可以解决一部分问题,但受衍生化反应效率、反应产物稳定性等不利因素限制,气相色谱-质谱联用技术在难挥发性成分中的应用有限。
色谱-质谱联用技术是中药成分分析和鉴定中不可缺少的技术之一,只有针对中药成分的结构特点和理化性质,选择合适的分析技术,才能准确、高效地实现中药复杂成分的分析和鉴定。
质谱分析技术在分辨率、准确性和灵敏度方面不断提高,特别是多功能杂化质谱新技术为复杂成分的分析和鉴定提供了多样的扫描模式和碎裂方式,同时能够获得分辨率高、准确性好、覆盖度广的质谱数据,为成分鉴定提供高质量的数据支持。但同时,这些多维度数据的分析和利用成为新的掣肘问题。因此,针对中药成分鉴定的质谱新技术和新策略成为研究热点。
离子淌度质谱(IM-MS)是离子淌度光谱与质谱联用的一种技术。离子淌度依据化合物的碰撞截面(collision cross section, CCS)进行分离,能够识别形状与大小相似的组分,特别适合同分异构体、结构类似成分的分析。色谱分离后联用离子淌度,能够极大地提高对成分的分析和鉴定能力。中药竹节参中多为结构相似的人参皂苷成分,多糖基、分子质量大,色谱分离困难,Cheng等[12]应用UHPLC-QTOF/MS技术鉴定了竹节参中53个皂苷成分。为了更全面表征竹节参活性成分,Zhang等[13]在UHPLC-QTOF/MS的基础上联用离子淌度(UHPLC/IM-QTOF/MS),获得了化合物的保留时间、CCS值、一级质谱和二级质谱的四维数据,结果表明,竹节参中众多皂苷成分含有5个以上的同分异构体,即使是UHPLC也很难分离,而离子淌度则提高了对这类皂苷成分的分离能力,共识别和鉴定了178个皂苷成分,其中75个未在竹节参中报道过,充分展示了其在中药同分异构成分分析和鉴定方面的能力。UHPLC/IM-QTOF/MS还被应用于中药血栓通胶囊的成分鉴定[14],所鉴定的中药成分数目较UHPLC-Q/Orbitrap-MS提高了4倍(从52个到230个),解决了血栓通胶囊成分表征不充分的问题。随着国内外研究人员对IM-MS的深入研究以及更多联用技术的发展,其在中药成分分析和鉴定中的应用也会越来越多。
中药成分的识别和鉴定依赖于高质量的质谱数据。高分辨质谱,如飞行时间质谱(TOF)、四极杆-飞行时间质谱(Q-TOF)、傅里叶变换离子回旋共振质谱(FT-ICR)和静电场轨道离子阱质谱(Orbitrap)是主流仪器,在中药成分的识别和鉴定中各具优势。除仪器软硬件差异外,使用过程中的采集速率、分辨率、前体离子质量窗口、碎裂电压和碰撞能量等参数的设置也会直接影响质谱数据,进而影响中药成分的识别和鉴定[15]。
采集速率用以表示质谱仪单位时间内采集谱图的数量,中药未知成分鉴定需要选择非靶向模式,因此,尽可能多地采集谱图从而获得完整的质谱信息对于成分鉴定至关重要。飞行时间质谱是采集速率最快的质谱仪,与超高效液相色谱联用后,适合发现复杂体系中的中药成分。一般QTOF每秒可获得2~100张高分辨全扫描谱图,基本满足中药成分的分析需要,但TOF技术自身无法提供二级质谱信息,难以实现中药成分的准确鉴定,因此常与四极杆质谱联用,即Q-TOF,它可同时提供高分辨的一级和二级质谱数据。Wei等[16]采用UPLC-Q-TOF/MS在正、负离子模式下,识别和鉴定了化湿败毒方的217个中药成分,该方法在20 min内即可完成化湿败毒方主要成分的质谱数据采集,充分体现了TOF快速定性的优势。对于TOF这类质量分析器来说,仪器采集速率基本不影响分辨率,但会影响灵敏度。因此,一些大型仪器制造商致力于设计和改进TOF的硬件或软件配置,使其在具有高采集速率时兼具高灵敏度和宽动态范围。例如,Waters推出的Xevo G2-S QTOF在离子源处使用专利的堆叠环组件进行离子聚焦和导向,显著提高了离子传输效率,使质谱仪灵敏度提高25倍以上;Agilent推出的6550 QTOF能够基于预先设定的母离子列表进行MS/MS采集,显著提高了QTOF的靶向采集能力,适合低丰度中药成分的靶向鉴定。TOF的劣势在于不具备串级功能,即使与四极杆联用也只能提供二级质谱数据。因此,当需要多级质谱数据来推断或确证中药成分结构时,TOF应用有限,必须与其他串级质谱联用。
高分辨质谱仪的分辨率多介于1~25万(FWHM)。对于中药成分鉴定,几万至十万的分辨率基本能够满足分析要求。近年来,大型仪器制造商也推出了一些超高分辨率的质谱仪,如Thermo推出的Orbitrap Fusion质谱仪分辨率可达45万(FWHM),Bruker的傅里叶变换离子回旋共振质谱仪(FT-ICR)分辨率可达到100万(FWHM)。FT-ICR技术以其高灵敏度、超高分辨率、超高质量精确度以及多级质谱功能,在中药复杂成分识别和鉴定中具有独特优势。Liu等[17]建立UHPLC-FT-ICR-MS分析方法,获得了葛根芩连汤成分的高精度(<2 ppm)多级质谱数据,可在25 min内识别和鉴定葛根芩连汤中134个成分。 Zhang等[18]应用FT-ICR分析并总结萜酸、有机酸、黄酮、倍半萜、香豆素和蒽醌6类中药成分的质谱裂解规律,实现了茵陈五苓散中138个成分的鉴定。静电场轨道离子阱质谱同样具有高分辨率和高质量精度的优势,尤其以Thermo发布的四极杆-静电场轨道阱杂交质谱(Q Exactive)系列为代表的质谱仪,能够通过源内捕获实现更高的离子传输速率和离子去溶剂化,兼具高灵敏度。例如,Liu等[19]建立UHPLC-Q-Exactive-Orbitrap-MS分析技术,只需进样2 μL,即可从中药清肺排毒方中识别和鉴定405个成分。值得一提的是,尽管硬件的设计与改进使质谱仪逐渐兼具高分辨率和高灵敏度,但FT-ICR和Orbitrap的分辨率与采集速度会相互牵制。例如,Thermo的Q Exactive HF质谱仪在分辨率达到24万时,采集速度会降至每秒1.5个谱图。因此,实验过程中仪器参数的合理设置至关重要。
前体离子质量窗口设置的宽窄关系到数据采集的灵敏度和选择性,较窄的质量窗口能够提高分辨率和选择性,但会过滤掉大部分前体离子,可能造成信息丢失。因此,选择较宽的前体离子质量窗口(1~3 u)更适合中药成分分析和鉴定。碎裂电压和碰撞能量的选择会直接影响二级质谱的碎片信息,设置多个碰撞能量碎裂[20],获得分析对象在各碰撞能量下的碎片信息,并与其质谱数据库匹配,有助于尽可能多地鉴定中药成分。另外,目前许多质谱仪支持快速正负极性切换,中药成分结构和性质差异较大,电荷分布和电离特点不同,应用正负极性快速切换扫描模式可以获得未知成分高质量的质谱数据和碎裂信息,提高中药成分的鉴定效率和覆盖度[21]。
全扫描模式(full scan)是质谱仪最常用、最简单的一级质谱数据采集模式,能够获得准分子离子和分子质量信息。二级质谱数据的获得通常需要选择采集模式,不同仪器制造商的高分辨质谱仪具有各自不同的专利技术。目前,高分辨质谱的二级质谱数据采集模式主要包括数据依赖扫描模式(data-dependent acquisition, DDA)和数据非依赖扫描模式(data-independent acquisition, DIA)。在DDA过程中,质谱仪先进行全扫描,随后选择满足一定条件的前体离子触发二级碎裂,选择原则包括丰度、电荷、动态排除和背景扣除等。DDA模式通过预筛选前体离子减少了干扰离子的存在,可以获得碎片离子的高质量数据,也是目前最常用的采集模式。Wang等[22]在HPLC-QTOF/MS的DDA模式下,采集牛黄上清丸中未知成分的碎片信息,鉴定了190个成分。但DDA作为一种有选择的采集方式覆盖率低,一般来说,强度较高的离子更容易被选择成为目标离子进行二级质谱信息获取,因此当一些关键成分的有价值离子不满足筛选条件或与很多强度较高的离子共流出时有丢失风险。这意味着中药中很多微量成分往往难以获得高质量的碎片离子信息,难以被鉴定。
DIA模式不预先筛选母离子,理论上能够全面地获取所有离子的碎片信息。已开发出一些DIA的策略,比如全信息串联质谱(MSE)技术(由Waters公司开发)和SWATH技术(由AB SCIEX公司与苏黎世联邦理工学院合作开发)。Qi等[23]应用UHPLC结合Waters Q-TOF SYNAPT G2质谱仪具有的MSE采集模式,对乌头汤中的生物碱、三萜皂苷、黄酮等74个成分进行鉴定。MSE模式还被用于四君子汤中66个成分的鉴定[24]。以上2个研究借助MSE模式具有的线性升高碰撞能量的方式,使中药成分在最佳的碰撞能下实现碎裂,获得了未知成分高分辨率的一级质谱和碎片离子信息,提高了鉴定准确度。DIA采集数据相对全面,但数据量大、谱图复杂、数据解卷积困难,即使是采用母离子分段传输(25 u)的SWATH技术,也只是在一定程度上缓解了后期数据处理的压力,并且与DDA具备的大量成熟的分析工具相比,DIA数据处理软件还处于发展阶段。目前,MS-DIAL软件能够支持小分子化合物的识别与鉴定,而OpenSWATH、DIANA、pSMART和DIA-Umpire等DIA软件还只适用于蛋白质组学平台。
就中药复杂成分的分析和鉴定而言,DDA与DIA模式各有利弊,两者结合取得了较好的效果。Ma等[25]结合QTOF/MS的MSE采集模式和QTrap/MS的DDA采集模式,从中药保元汤中鉴定了236个成分:先利用UPLC-QTOF/MS的MSE模式全面采集保元汤的成分信息,鉴定了相对含量较高的成分;再利用UPLC-QTrap/MS的多种DDA采集模式,例如预测离子对扫描模式(pMRM)、多离子检测-增强子离子扫描模式(MIM-EPI)识别和鉴定保元汤中的微量成分。两种采集模式的结合既发挥了全面鉴定的优势,提高鉴定覆盖度;又使结构鉴定困难的微量成分得以表征,提高了对未知中药成分的鉴定深度。另有蛋白质组学实验结果表明[26],DIA模式与离子淌度联用可以有效降低肽谱复杂性、提高检测灵敏度和深度。因此,DIA模式与离子淌度联用将有力地推动中药复杂成分的解析。
质谱数据蕴含着丰富的结构信息,通过对化合物结构相关规律的总结,建立数据库,应用于中药成分鉴定,已被证明行之有效,克服了标准品缺乏、数据库标准图谱有限对中药成分分析和鉴定的掣肘瓶颈。研究者们探索和总结化合物的质谱裂解规律,整合多种数据处理与分析方式,形成了多种商业化的质谱数据处理策略。
常用的质谱数据处理策略有:背景扣除(BS)、质量亏损过滤(MDF)、子离子过滤(PIL)、中性丢失过滤(NLF)和主成分分析(PCA)等。Qiao等[27]结合多种中性丢失/前体离子扫描和主成分分析策略识别姜黄中姜黄素类成分:通过中性丢失/前体离子扫描挖掘了大量潜在的姜黄素类成分;主成分分析则对具有不同质谱碎片特征的未知姜黄素类成分进行归类,方便未知成分结构的推断,最终鉴定了864个姜黄素类成分。整合多种质谱数据的鉴定模式能够充分挖掘同类未知成分,具有全面、系统的优势。不足之处在于,识别的大量质谱数据需要逐一分析用于鉴定,速度较慢。因此,上述质谱数据处理策略与化学信息学和计算科学相结合,诞生了一些具有更好选择性和高效性的中药复杂成分数据处理策略,包括:基于模板化合物的质谱树状图相似度过滤技术(mass spectral tree similarity filter technique, MTSF)[26-27]、基于碎片指纹特征从头鉴定未知化合物的“碎片树”(fragmentation trees, FTs)策略[28]、基于二级碎片相似度评分的分子网络(molecular networking, MN)[29-30]和基于分子描述符(molecular descriptor)的化合物预测策略[31]。
质谱树状图相似度过滤技术(MTSF)以化合物的一级高分辨质谱数据为“树干”,多级质谱数据为“分支”,计算未知化合物与模板(已知)化合物的相似度。Wang等[28]将MTSF技术用于发现和鉴定中药小续命汤的成分。质谱识别了小续命汤中3 362个潜在化合物,逐一鉴定的速度慢、难度大。通过计算3 362个潜在化合物与小续命汤14个模板化合物的相似度,保留了377个相关成分,排除了接近90%的干扰信息,极大地降低了未知成分的鉴定难度,最终小续命汤中68个成分得到鉴定。Zhang等[29]应用MTSF技术,以金银花中的已知绿原酸类成分为模板,鉴定了相关的18个大类的115个绿原酸类成分,首次全面系统地识别和鉴定了金银花中的绿原酸类成分。碎片树(FTs)策略通过拼合碎片离子合理地重建母离子结构,自下而上地表征未知成分结构。基于碎片树策略设计的代表性化合物鉴定软件为SIRIUS,目前已更新至4.0版本(SIRIUS 4)[30],能够广泛地对药物、天然产物、代谢物等小分子化合物进行结构预测。全球自然产品社交分子网络(GNPS)平台基于二级碎片相似度建立分子网络(MN),挖掘未知成分,自2014年建立以来,颇受关注。Wang等[32]借助GNPS平台识别和鉴定中药平消胶囊中黄酮、生物碱、有机酸等成分,构建了平消胶囊中潜在的511个成分的156个分子网络。分子网络不仅实现了未知成分的归类,还能计算具有相关性的2个成分的精确质量数差值,并可对比碎片离子。结合碎片离子提供的结构信息,平消胶囊中89个成分得到鉴定,分子网络有效地提高了未知成分的鉴定效率。通过软件计算已知成分的分子描述符构建QSRA模型,也可用于预测未知成分的结构,且当使用同分异构体建立QSRA模型,并与同分异构体的色谱保留时间结合后,还能够区分未知的同分异构体。Wu等[33]利用17个人参皂苷成分的6个分子描述符建立QSRA模型,通过保留时间预测了生脉注射液中46个人参皂苷成分,并有效地区分了其中的同分异构体。
总体来看,上述新策略部分解决了传统鉴定过程中存在的标准品有限、工作量大、数据库更新不及时等难题,但其鉴定结果的准确性仍有待提高。
现代分析测试技术的蓬勃发展以及研究策略的不断涌现,为突破中药物质基础和作用机制研究的瓶颈提供了强有力的技术支撑。多维色谱分析、离子淌度质谱和质谱成像等新兴技术为中药研究提供了广阔的探索空间,不拘一格的研究手段、思路和方案将形成更加科学、可行、有效的中药研究体系。