汪 日燕,刘海培,孙传强,韩文念,贾明正,蒋学慧
液相色谱-三重四极杆质谱定量分析算法
汪 日燕1,刘海培1,孙传强1,韩文念2,贾明正2,蒋学慧1
(1. 天津大学精密仪器与光电子工程学院,天津 300072;2. 天津国科医工科技发展有限公司,天津 300399)
基于自主研制的三重四极杆质谱仪,设计开发整套谱图信息提取分析方法,包括原始数据去噪、色谱解析与识别、谱峰匹配、曲线拟合等算法.设计一种依赖曲线信号与噪声自身数据特点的算法对原始谱图噪声进行自动去除,采用平滑Z-score法与多段斜率法相结合的算法对目标化合物质量色谱峰进行解析,实现对复杂基质样品中拖尾峰、肩峰和低浓度峰的准确识别,对待测谱峰进行保留时间校正,并对曲线拟合权重进行讨论,最终建立标准曲线进行定量分析.以人体血清中25-羟基维生素D检测实验为例,采用自开发算法,完成了一套液相色谱-三重四极杆质谱多反应监测(MRM)扫描模式下的配套定量分析算法包.计算结果表明,选取1/2权重进行线性拟合,维生素D2和维生素D3的检出限分别为1.1mg/L、1.5mg/L,定量下限分别为3.7mg/L、5.1mg/L,线性相关系数达0.998以上.连续6d对高低两个浓度的维生素D2和维生素D3质控品测量其变异系数(CV值)在7%以内,满足日间精密度要求,实验结果验证了该分析算法的准确性.对人体血清中脂溶性维生素A和维生素E以及血浆中甲氧基肾上腺素(MN)和甲氧基去甲肾上腺素(NMN)两个临床应用的数据结果进行定量分析,进一步验证算法的可行性及普适性.本算法具有自适应性,减少了优化时间,提高了谱图数据处理自动化水平,可为临床相关疾病检测诊断提供工具.
液相色谱-三重四极杆质谱(LC-MS/MS);谱峰识别算法;定量分析;维生素D
三重四极杆质谱技术是一种典型的串联质谱技术,由串联质谱(MS/MS)可获得化合物丰富的碎片信息,其中多反应监测模式(multiple reaction monitoring,MRM)作为常用定量检测方法,具有特异性强、灵敏度高、线性范围广等优点[1].液相色谱是以液体作为流动相,通过选取不同流动相和色谱柱达到良好的分离效果[2].液相色谱与三重四极杆质谱联用可对复杂基质样本中的目标化合物进行分离,随后实现高精确度和高灵敏度的实时检测定量分析[3-4],满足临床分析领域需求.
液相色谱-三重四极杆质谱(LC-MS/MS)用于定量分析检测需获取待测样品质量色谱峰及峰面积信息,然而在对临床样本检测时,色谱柱流失物或复杂样本基质等产生的离子对待测化合物谱图产生干扰,导致谱峰形状不规则从而增加了识别分析难度[5],影响分析结果的准确度.针对浓度信息提取分析方面的数据处理技术,近年来国内外的专家学者提出了多种色谱峰识别的方法,常见的谱图检测方法主要有幅值法、一阶导数法、二阶导数法以及在此基础上衍生的各种类似方法[6].祝玉芳[7]采用谱峰多点上升下降变化趋势的斜率来识别特征位置,解决了由于谱图随机性出现肩峰的问题,但是容易在一个谱峰中获得多个特征点,影响峰面积计算结果.张磊等[8]对峰识别算法进行改进,使用一、二阶导数法识别特征位置,但由于一阶导数不易判断肩峰出现情况,造成二阶导数受干扰.斯坦福大学的Dromey等[9]提出了“峰型比较”的退卷积算法,该算法对色质联用技术中每个质荷比的质量色谱图进行分析,提取各个质量色谱峰,在对应的扫描时间选择1~2个模型峰,然后将其他的质量色谱峰与模型峰进行比较,以确定该碎片离子是否属于某一化合物,处理完成后将相同峰形的碎片离子组合成为一个化合物的质谱图,从而完成退卷积的过程,但该方法比较适合于几乎完全重叠的色谱峰的识别,并且算法参数选择较为复杂.
本研究提出一种快速谱图提取分析方法,开发形成原始数据去噪、谱图解析识别、谱峰匹配、峰面积计算以及曲线拟合几个功能模块算法,从而获得待测样准确定量分析结果.基于自主研制的三重四极杆质谱仪开发形成MRM扫描模式下的专用成套数据处理算法包,以人体血清中维生素检测应用为例,通过自开发谱峰识别与峰形校正算法,解决了色谱图中肩峰、拖尾峰准确识别与匹配问题,节省色谱条件优化时间,简化液质联用前处理过程,形成了一种专用的快速智能谱图解析方法包,便于谱图信息提取的定量分析研究.
样品经过LC-MS/MS检测,需对得到的原始数据进行信号与噪声判据.传统区分信号与噪声采用设定阈值法,依赖操作者人为干预,需要多次尝试[10].为节省谱图提取分析的过程,本研究设计一种依赖曲线信号与噪声自身数据特点的算法,有利于对谱图谱峰尤其是低浓度谱峰的起点、终点进行识别与判断,其方程为
1.2.1 基于Z-score算法的谱峰区域判定
由于色谱条件及待测样本身等性质,色谱峰成非高斯对称而具有拖尾或肩峰存在,影响谱峰识别的准确性进而影响定量结果.本文将Z-score模型用于谱峰区域判定,即根据当前数据点与距离某一移动窗口内数据平均值加给定个标准偏差大小的值进行比较,基于均值与偏差的平滑加窗原理,能够对谱峰个数尤其对于低强度峰进行准确识别,判断谱峰起点、终点的位置.通过平滑Z-score算法构造单独的移动平均值和偏差,使得数据先前信号无论如何变化,后续信号均能以大致相同的精度识别出来.设定滑动移动窗口大小为lag,上下浮动阈值为threshold,计算得到移动窗均值avgFilter以及移动窗方差stdFilter.根据特定窗口大小对实验采集的每组原始数据分别进行特征识别,构造单独移动的均值和标准差对数据进行标准化,对于测得的原始数据序列1、2至X进行变换得
当强度高于设定波动范围时,定义signals=1,即超出并高于取值范围的离群数据,认为是峰出现区域;当强度低于设定波动范围内时,定义sig-nals=-1,即超出但低于取值范围的离群数据,不是峰出现区域;当强度在所设定波动范围内时,定义signals=0,即在所取范围内,波动平缓没有峰出现.
1.2.2 基于多段斜率法的特征点判定
多段斜率法是通过对相邻几个连续点的运动趋势判断特征点出现位置,结合多段斜率算法可对所提取的特征值进行准确性验证.取从第1个点开始后的5个点作为判断该点运动趋势的点域,依次取出点域中的点,一阶差分计算出5个斜率值为
因此特征点识别规律为:当trend()=1,且当前5个斜率值的平均值大于起点斜率即k>s,当前点认定为谱峰起点;对应起点与终点间的最大值认定为顶点;当trend()=-1之后平缓时当前点认定为谱峰终点.
1.2.3 谱峰校正匹配
由于色谱柱填充问题或样品污染等因素,使得色谱峰峰形不对称,导致LC-MS/MS扫描的保留时间漂移与谱峰顶点未能对齐,因此需要对保留时间进行校正.对识别出来的不同浓度样品峰及其对应内标峰,进行谱峰匹配,获得精确保留时间值.
本研究利用二次拟合法对色谱峰形进行校正[11],将识别出来的所有分析物谱峰及其内标峰分别进行分析匹配.取谱峰强度的最高点及其相邻两侧各两个强度值点,通过二次拟合方法对5个点进行拟合,求出二次拟合曲线最大值对应的保留时间R,将原扫描的最高点的出峰时间值减去二次拟合后的出峰时间值即为时间平移量,当差值为正时向左平移,差值为负时向右平移,且强度值保持不变,此时窗口内的峰顶点对应时间即为色谱峰的保留时间.
定量分析是通过获取谱图峰面积来对化合物中各组分含量进行检测.谱峰面积计算采用将起点与终点相连接作为基线,将基线与峰轮廓线包围的面积划分为若干小部分的面积.利用梯形面积计算法,将谱峰按照时间段成比例的分割成等分,每小段近似看成梯形,各小部分面积累加即色谱峰面积,其计算式为
加权回归方程的斜率和截距可表示为
加权相关系数表示为
普通最小二乘分析方法即具有相同的权重因子(=1),加权最小二乘法进行数据拟合带有倾向性.因此根据因变量方差的数据波动选择适当权重,分析方法的检测结果,确定相应拟合算法从而建立标准曲线.
液相色谱仪(LC-20AX,岛津公司),三重四极杆质谱仪(MS/MS,API4000,AB SCIEX公司),离心机(F138469O,Eppendorf公司),旋涡混合器(VORTEX-5,其林贝尔仪器公司),96孔氮吹仪(VSD150-1A,无锡沃信仪器制造有限公司)等.
甲醇(67-56-1,4L)、乙腈(75-05-8,4L)、甲酸(64-18-6,50mL)均为色谱纯,购买于Fisher Chemical公司,正己烷(色谱纯,110-54-3,2.5L,Sigma-Alorich公司),牛血清白蛋白(9048-46-8,100g,Amresco公司).
25-羟基维生素D2、25-羟基维生素D3干粉试剂(1mg/瓶)标准品均购于加拿大多伦多研究化学公司,25-羟基维生素D2-d6、25-羟基维生素D3-d6干粉试剂(1mg/瓶)标准品内标均购于Medical Isotopes公司.
色谱条件:色谱柱为Shim-pack GIST-HP C18(2.1mm×100mm×3µm,岛津公司);流动相A为0.1%甲酸水溶液;流动相B为0.1%甲酸甲醇溶液;采用梯度洗脱:0~0.5min70%B;0.5~2.0min 70%B;2.0~5.0min100%B;5.0~5.1min100%B;5.1~6.5min70%B.流速为0.5mL/min,柱温为40℃,进样量为10μL.
质谱条件:采用电喷雾离子源(ESI),采用多反应监测(MRM)扫描模式,气帘气(CUR)压力103kPa,离子化电压(IS)5500V,温度(TEM)设为350℃,喷雾气(GS1)压力414kPa,辅助加热气(GS2)压力448kPa.
称取标准样品,通过逐级稀释的方法得到标准样品基础工作溶液,以及配制得到已知浓度的质控品Q1、Q2,其进样质量浓度如表1所示.通过LC-MS/MS进行检测,得到每组样品的质量色谱峰及其对应内标峰的峰面积,采用同位素内标法建立标准曲线,对定量分析结果进行分析.
表1 维生素D2和维生素D3标准样品进样质量浓度
Tab.1 Vitamin D2 and vitamin D3 pure standard sample injection mass concentration
根据上述实验方法得到维生素D2以及维生素D3的8组生物标准品谱峰及其内标峰的质量色谱图,以S5标准品检测结果为例见图1.
图1 两种维生素及其内标色谱图
采用信号与噪声判别算法,对上述原始谱图进行处理,以样品S1低浓度下维生素D2检测为例,如图2所示,能够在峰形没有失真的情况下,去除大部分毛刺噪声,便于色谱特征点分析.对于信噪比(/)考察发现,去噪前后信噪比增益明显提高,且无信号失真现象,峰高失真度在5%以内,表明能够保留信号原始信息,如表2所示.
3.2.1 谱峰识别
以人体血清中维生素D检测为例,结合谱峰特征点识别算法对采集得到的原始数据进行分析,由于生物基质样品复杂,检测结果会出现独立峰、肩峰、拖尾峰和低浓度峰4种形式的峰形.通过平滑Z-score算法对原始数据谱峰区域进行判定,本实验中取滑动移动窗口大小为60,上下浮动阈值为1.5,输出信号为1的位置即为寻找到的谱峰位置.多段斜率法利用相邻信号点运动趋势对具有肩峰和拖尾峰等复杂特殊峰形,根据信号平滑度以及上升下降的趋势,均可准确识别出特征点位置,如图3~图6所示.
图2 维生素D2去噪前后对比
表2 维生素D3检测信噪比分析结果
Tab.2 S/N analysis results of vitamin D3 detection
3.2.2 谱峰匹配
色谱柱填料或样品前处理溶剂等污染,对每种分析物对应的离子流色谱图往往在不同保留时间下出现多个谱峰,且色谱谱峰的不对称性会造成保留时间的漂移.对人体血清中维生素D检测数据,采用了二次拟合谱峰校正算法,对分析物及其对应内标进行保留时间自动校正匹配,如图7所示.根据保留时间判断待测峰,能够准确匹配出维生素D及其对应内标峰的位置,解决了峰匹配错误对分析结果的影响.
通过外标曲线校正的方法,采用加权最小二乘法对几种权重分别进行比较,以人血清中维生素D3检测结果为例,如图8所示,权重采用1/2时测量的各浓度点相对误差最小即准确性最佳,这是由于浓度数据点随机误差的方差在不同浓度点上不是恒定的,因此赋予不同质量的回归.
图3 独立峰及识别特征点检测结果
图4 肩峰及识别特征点检测结果
图5 拖尾峰及识别特征点检测结果
图6 低浓度峰及识别特征点检测结果
图7 目标化合物保留时间校正前后对比
图8 维生素D3在不同拟合权重下的对比结果
采用普通最小二乘法与加权最小二乘法(1/2)分别对人血清中维生素D2、维生素D3的8个标准样品进行曲线拟合,建立生物标准曲线,如图9所示.蓝色代表普通最小二乘法(ordinary least squares,OLS),红色代表加权最小二乘法(weighted least square,WLS),两种方法拟合曲线接近,但对于低浓度区域采用普通最小二乘法测量结果的相对误差较大,高浓度区域测量结果相对误差略小.为对低浓度范围加大拟合权重,最终采用了权重为1/2的加权最小二乘法.
图9 普通最小二乘法和加权最小二乘法拟合曲线及相对误差对比
3.4.1 线性范围及检出限
采用自开发算法包对人体血清中维生素D2和维生素D3的标准样品建立生物标准曲线,线性相关系数均在0.998以上,表明维生素D2在5~40mg/L、维生素D3在5~200mg/L范围内均具有良好线性,其检出限(limit of detection,LOD)以及定量下限(limit of quantity,LOQ)如表3所示,进一步验证了开发算法的准确性[12].
表3 线性回归方程、检出限和定量下限
Tab.3 Linear regression equation,LOD,and LOQ
3.4.2 质控品考察
3.4.3 临床应用实例
采用自开发的定量分析算法对人体血清中脂溶性维生素A和维生素E,血浆中甲氧基肾上腺素(metanephrine,MN)和甲氧基去甲肾上腺素(nor-metanephrine,NMN)两个临床应用进行检测,浓度线性范围及线性回归方程如表5所示,线性相关系数满足临床检测要求,对复杂基质生物样本可以实现自适应谱图信息自动提取,进一步验证算法普适性.
图10 连续6 d检测维生素D2、维生素D3质控品浓度
表4 维生素D2、维生素D3质控品检测结果及CV值
Tab.4 Vitamin D2 and vitamin D3 quality control test results and CV value
表5 浓度线性范围及线性回归方程
Tab.5 Concertration linearityrange and linear regression equation
本研究采用了自行开发的液质联用谱图信息自动提取算法,以人体血清中维生素检测应用为例,形成基于液相色谱-三重四极杆质谱仪MRM扫描模式下的配套数据处理算法包.对比目前现有识别方法,本文开发的谱峰识别与校正算法可以对复杂生物基质样品中拖尾峰、肩峰等特殊峰形进行准确识别与匹配,减少优化时间.本研究对谱图去噪、曲线拟合等算法识别结果进行了验证,进一步提高谱图数据处理自动化,从而形成一套基于医用质谱仪软件平台的液相色谱-三重四极杆质谱仪器应用软件系统,为临床相关疾病快速检测诊断提供工具.
[1] Nielen M W F,Hooijerink H,Zomer P,et al. Desorption electrospray ionization mass spectrometry in the analysis of chemical food contaminants in food[J]. TrAC Trends in Analytical Chemistry,2011,30(2):165-180.
[2] Wu Alan H B,French D. Implementation of liquid chromatography/mass spectrometry into the clinical laboratory[J]. Clinica Chimica Acta,2013,420:4-10.
[3] Mei Shenghui,Wang Jiaqing,Chen Di,et al. Simultaneous determination of cyclosporine and tacrolimus in human whole blood by ultra-high performance liquid chromatography tandem mass spectrometry and comparison with a chemiluminescence microparticle immunoassay[J]. Journal of Chromatography B,2018,1087/ 1088(36):36-42.
[4] Fang Huiling,Yu Songlin,Cheng Qian,et al. Determination of 1,25-dihydroxyvitamin D2and 1,25-dihydroxyvitamin D3in human serum using liquid chromatography with tandem mass spectrometry[J]. Journal of Chromatography B,2016,1027(19):19-26.
[5] 崔 健,董晓睿,商 凯,等. 一种新的基于多重液相色谱-质谱实验肽信号峰形相似性的校准算法[J]. 分析测试学报,2018,37(12):1457-1462.
Cui Jian,Dong Xiaorui,Shang Kai,et al. A novel alignment algorithm based on peak shape similarity in LC-MS replicates[J]. Journal of Instrumental Analysis,2018,37(12):1457-1462(in Chinese).
[6] Wei Xiaoli,Shi Xue,Kim Seongho,et al. Data dependent peak model based spectrum deconvolution for analysis of high resolution LC-MS data[J]. Analytical Chemistry,2014,86(4):2156-2165.
[7] 祝玉芳. 色谱峰分析与计算系统的设计与实现[D]. 上海:东华大学计算机科学与技术学院,2015.
Zhu Yufang. Design and Implementation of Chroma-tographic Peak Analysis and Calculation System[D]. Shanghai:School of Computer Science and Technology,Donghua University,2015(in Chinese).
[8] 张 磊,王珏明,王勇军. 色谱谱图峰的识别算法[J]. 计算机应用与软件,2009(8):256-258.
Zhang Lei,Wang Yuming,Wang Yongjun. A recognition algorithm for the peak of chromatograph[J]. Computer Applications and Software,2009(8):256-258(in Chinese).
[9] Dromey R G,Stefik M J,Rindfleisch T C,et al. Extraction of mass spectra free of background and neighboring component contributions from gas chromatography/mass spectrometry data[J]. Analytical Chemistry,1976,48(9):1368-1375.
[10] 刘明明,夏炳乐,杨 俊. 自动化色谱谱图解析——谱峰的自动识别与快速解析[J]. 色谱,2009,27(3):351-355.
Liu Mingming,Xia Bingle,Yang Jun. Automatic peak recognition and rapid resolution of chromatographic signals with a self-compiling program[J]Chinese Journal of Chromatograpgy,2009,27(3):351-355(in Chinese).
[11] 黄 超,赵学玒,代 丽,等. 基于模型峰的气相色谱-质谱数据提纯算法[J]. 纳米技术与精密工程,2011,9(2):152-156.
Huang Chao,Zhao Xuehong,Dai Li,et al. An algorithm for spectrum extraction from gas chromatography-mass spectrometry data based on the model peak[J]. Nanotechnology and Precision Engineering,2011,9(2):152-156(in Chinese).
[12] 中国医师协会检验医师分会临床质谱检验医学专业委员会. 液相色谱串联质谱临床检测方法的开发与验证[J]. 检验医学,2019,34(3):189-196.
Clinical Mass Spectrometry Committee,Chinese Medical Doctor Association of Laboratory Medicine. Consensus of method development and validation of liquid chromatography-tandem mass spectrometry in clinical laboratories[J]. Laboratory Medicine,2019,34(3):189-196(in Chinese).
Quantitative Analysis Algorithm of Liquid Chromatography-Triple Quadrupole Mass Spectrometry
Wang Yan1,Liu Haipei1,Sun Chuanqiang1,Han Wennian2,Jia Mingzheng2,Jiang Xuehui1
(1. School of Precision Instrument and Optoelectronics Engineering,Tianjin University,Tianjin 300072,China;2. Tianjin Guoke Medical Engineering and Technology Development Company Limited,Tianjin 300399,China)
On the basis of a self-developed triple quadrupole mass spectrometer,a complete set of spectral information extraction and analysis method is designed and developed. This method includes original data denoising,chromatographic analysis and identification,spectral peak matching,curve fitting,and other algorithms. A kind of algorithm which depends on data signals itself and noise characteristic is designed to automatically remove the noise from original mass spectrometry.Smooth Z-score method is used with the multistage slope algorithm of target compounds,chromatographic peak of quality analysis,implementation of complex matrix samples,shoulder peak and low concentration peak,and tailing peak of accurate identification.Then,spectrum peak retention time correction is performed,and the measurement and weights of curve fitting are discussed. Finally,a standard curve for quantitative analysis is established.Taking 25-hydroxy vitamin D in human serum as an example,a set of matching quantitative analysis algorithm package under the MRM scanning mode of liquid chromatography-triple quadrupole mass spectrometry was completed by using the self-developed algorithm.Calculation results show that when 1/2weighted linear fitting was selected,the limits of detection for vitamin D2and vitamin D3were 1.1mg/L and 1.5mg/L,respectively,while the limits of quantitation were 3.7mg/L and 5.1mg/L,respectively,and their correlation coefficient was above 0.998.For six consecutive days,the coefficient of variation for vitamin D2and vitamin D3quality control products with high and low concentrations was within 7%,which met the requirements of intra-day precision.Experimental results verified the accuracy of the analysis algorithm.The results of two clinical applications of human serum fat-soluble vitamins A and E and plasma metanephrine and normetanephrine were quantitatively analyzed to further verify the feasibility and universality of the algorithm.This algorithm has self-adaptability,reduces optimization time,improves the automation level of spectral data processing,and can provide tools for the detection and diagnosis of clinically related diseases.
liquid chromatography triple quadrupole mass spectrometry(LC-MS/MS);peak identification algo-rithm;quantita-tive analysis;vitamin D
O657.63
A
0493-2137(2020)06-0617-09
10.11784/tdxbz201906003
2019-06-06;
2019-07-05.
汪 曣(1955— ),男,硕士,教授,wangyan@tju.edu.cn.
蒋学慧,jiangxuehui82@163.com.
国家高技术研究发展计划资助项目(2014AA022305).
Supported by the National High Technology Research and Development Program of China(No.2014AA022305).
(责任编辑:孙立华)