雷思佳,谢瑜杰,余丽波,卜丹丹,霍思宇,陈 辉,陈冬东,彭 涛,*
(1.中国检验检疫科学研究院,北京 100176;2.中检科(北京)测试认证有限公司,北京 100176;3.检科院(北京)科学技术有限公司,北京 100176)
目前,世界上常用的农药高达1800 多种[1]。由于农药的具体使用过程多数未知,再加上交叉污染,不同种类的农药可能在农产品中同时出现,这就要求方法除了足够灵敏外还需检测尽可能多的农药,才能对产品质量进行有效监管。现阶段,常用的农残检测方法主要有气相色谱法(GC)[2]、气相色谱-质谱法(GC-MS)[3]、气相色谱-串联质谱法(GC-MS/MS)[4]、液相色谱-串联质谱法(LC-MS/MS)[5-6]以及飞行时间串联质谱法(Q-TOF)[7-8]等。其中GC 和GC-MS检出限偏高,定性能力不足;GC-MS/MS 和LC-MS/MS 的靶向性强,灵敏度高,但分辨力低,只适合已知化合物的检测,对大范围非靶向化合物的筛查能力有限,在多种农药筛查时需建立多个检测方法,配制大量标准溶液,耗时费力[9]。Q-TOF 技术基于精确质量数和内源碎裂离子等条件对农药进行定性测定,具有高通量、非靶向的优点,在无标准品的前提下,可准确、高效地同时对复杂样品中大量化合物筛查[10-11],为我国农产品中多农残风险评估和风险监测提供了一种快速有效的方法。相关检测实验室提高其高通量非靶向检测能力迫在眉睫。
能力验证作为实验室认可的重要评判标准,被越来越多的认可机构和管理部门重视。当前对食用农产品中多农残检测主要还是停留在常规实验室检测层面,为了增加检测实验室间的结果可比性,能力验证的开展显得非常必要,可以及时发现实验室存在的问题并动态监测。能力验证在实施时根据组织项目的不同通常分为定量、定性和半定量结果项目,农药残留项目基本上采用的是定量分析,重点研究各类项目的特点及指定值的确定方法,以及如何选取适宜的统计方法进行结果评定。随着高通量非靶向检测技术的发展,单纯的定量分析并不能全面客观的反映检测实验室应用多残留方法的整体水平,在确定合格和不合格实验室时可能会造成一些混淆。目前国际上已出现通过主成分分析[12]、分层聚类分析[13]、z 值平方和[14]和3A 法[15-16]等方式对多分析物结果的总体实验室性能评价。本文通过能力验证的组织实施,提出并评估了一种新的评价方法,将定性分析和定量分析结合起来进行评价,目的是将其应用于未来的能力验证中,从而获得更具信息性、可靠性的实验室评价,提高风险发现能力。
农药标准品 纯度≥98%,德国Dr.Ehrenstorfer公司;乙腈、甲苯、乙酸乙酯、甲酸、乙酸铵 色谱纯,美国Fisher 公司;乙酸、氯化钠、无水硫酸镁、无水硫酸钠 分析纯,国药集团化学试剂有限公司;试验用水为Milli-Q 超纯水;有机苹果 购自北京某超市。
Agilent 1290 Infinity II LC-6545 Q-TOF/MS 液质联用仪、Agilent 7890B-7250 Q-TOF/MS 气质联用仪 美国Agilent 公司;AH-30 全自动均质仪、Fotector Plus 高通量全自动固相萃取仪、MPE 高通量真空平行浓缩仪 睿科集团股份有限公司;BSA224S电子天平 德国Sartorius 公司;T50 digital ULTRATURRAX 均质仪 德国IKA 公司;LS-80A 全自动灌装机 武汉优凯盛机械设备有限公司。
1.2.1 能力验证样品制备 参照NY/T 789-2004[17]和JJF 1343-2022[18]。取有机苹果(去蒂、去芯)可食部分约25 kg,经组织搅碎机粉碎,混匀,用四分法分成两批:一批均质后直接灌装,作为空白样品;一批加入配制好的目标农药标准溶液,预计添加浓度30~180 μg/kg(目标浓度水平在各化合物定量限和最大残留限量之间),充分搅拌,均质后灌装,作为添加样品。用经充分洗涤、烘干的100 mL 棕色玻璃瓶分装,空白样品和添加样品的重量保持一致,约为50 g,封口膜密封并加贴样品编号后-20 ℃条件下保存。
1.2.2 高通量非靶向检测
1.2.2.1 样品前处理 参照文献[19]方法对1.2.1中制备的样品进行提取与净化。浓缩液氮吹后加入2 mL 乙腈:甲苯(3:1,v/v)超声混匀,各取1 mL 吹干,一份加入1 mL 乙腈:水(3:2,v/v)定容液经0.22 μm滤膜过滤后供LC-Q-TOF/MS 测定;另一份加入1 mL 乙酸乙酯定容液经0.2 μm 滤膜过滤后供GCQ-TOF/MS 测定。
1.2.2.2 LC-Q-TOF/MS 仪器条件 色谱柱:ZORBAX SB-C18柱(100 mm×2.1 mm,3.5 μm);柱温:40 ℃;流动相A:0.1%甲酸水溶液,流动相B:乙腈;流速:0.4 mL/min;进样体积:5 μL;梯度洗脱程序:0 min,1% B;3 min,30% B;6~9 min,40% B;15 min,60% B;19~23 min,90% B;23.01~27.01 min,1% B。离子源:Dual AJS ESI 源;雾化气体:氮气;鞘气温度:375 ℃;鞘气流速:11.0 L/min;正离子全扫描范围:m/z 50~1000。
1.2.2.3 GC-Q-TOF/MS 仪器条件 色谱柱:HP-5 MS UI(30 m×0.25 mm,0.25 μm);柱温:40 ℃保持1 min,以30 ℃/min 升温至130 ℃,再以5 ℃/min 升温至250 ℃,最后以10 ℃/min 升温至300 ℃,保持7 min;进样口温度:270 ℃;进样量:1.0 µL;载气:氦气;流速:1.2 mL/min;不分流进样。四极杆温度:180 ℃;EI 离子源温度:280 ℃;溶剂延迟:3 min;全扫描范围:m/z 45~550。
1.2.2.4 定性和定量方法 使用Agilent MassHunter Qualitative workflows 软件,设置加合离子保留时间偏差、质量偏差、信噪比、共流出得分、二级碎片离子选择个数和峰高等参数,和个人化合物数据库与谱库(PCDL)中的信息进行匹配后得到定性结果。
在Agilent MassHunter 定量软件中建立定量方法,用外标法对根据定性结果确证的化合物进行准确定量。
1.2.3 均稳性检验
1.2.3.1 均匀性检验 随机抽取分装好的添加样品,按照1.2.1 的方法进行前处理及检测,采用单因子方差分析法(F检验)进行均匀性评估。结果回收后,通过不均匀性偏差法(SS≤0.3σ 准则)[20]对样品均匀性进行核验。
1.2.3.2 稳定性检验 运输稳定性检验:根据参加者情况,选择地理位置最南边和最北边的地址寄送,到达目的地后立即召回。收到寄回样品后立即进行检测,采用平均值一致性检验法(t检验)[20]评估样品的运输稳定性。
储存稳定性检验:分别于样品发放前、检测过程中和结果回收后随机抽样,按照与均匀性检验相同的测试条件进行检测,采用|x -y|≤0.3σ 准则[20]评估样品的储存稳定性。
1.2.4 能力验证项目实施 每套样品包含农药添加样和同一来源的空白样各一份。样品编码由随机数字组成,相互之间没有可比性,每个参加者赋予一个唯一性代码,凡说明检测结果和能力评价时均以代码表示[21]。实验室在收到样品后应用高通量非靶向技术筛查苹果样品中的农药种类,并对添加样品中筛查出的农药准确定量。
能力验证评价依据ISO 13528:2015[22]和GB/T 28043-2019[23]要求,参加者上报数据为扣除空白后的结果,从定性和定量两个维度出发:以实验室对样品中指定农药检出率评价定性筛查能力;以直方图示法评价计划的有效性,采用稳健统计方式确定稳健平均值和稳健标准差,以z 值评价实验室对样品中添加农药的定量检测能力,|z|≤2.0 代表定量结果满意,2<|z|<3 代表定量结果可疑,|z|≥3 代表定量结果不满意。采用Microsoft Excel 2019 软件对数据进行统计分析及绘图。
根据国际上农残监测动向,结合我国食用农产品中农药的施用情况,依据以下原则选择农药种类:a.已公布的禁限用农药;b.毒性较大、不易降解的常用农药;c.国内外标准均列入监控范围的农药。拟在样品中添加17 种农药:唑嘧菌胺、苯霜灵、毒死蜱、噻虫胺、二嗪磷、三唑磷、多杀霉素、甲基嘧啶磷、嘧菌胺、稻瘟灵、氟唑菌酰胺、咪唑菌酮、氯虫苯甲酰胺、敌敌畏、氟苯脲、五氯硝基苯和杀螟硫磷。
为了找到合适的空白基质,实验开始前对市场上的食用农产品品种进行了筛选。原料采集后粉碎匀浆,利用实验室之前建立的方法[24-25]进行农药多残留高通量非靶向筛查,最终选择某品牌有机苹果作为原料,并经专家实验室联合确认,苹果空白样品本底中含有啶虫脒和多菌灵两种农药,确定不含有本次实验涉及的目标农药,所选原料合适。随后按预设浓度加入农残混标进行样品制备并精准定量,将样品保存于-20 ℃的冰箱中以待进行均稳性检验及样品发放。结果回收后,对参加者反馈的其他假阳性结果以及未检测到的假阴性结果进一步复核,确定考核样品中只存在2 种本底含有的农药以及17 种制备时添加的农药,能力验证样品满足要求。
2.2.1 样品均匀性检验分析 样品发放前,根据GB/T 10111-2008[26]中随机抽样原则,选出10 个样品,确定其样品编号,随后按照ISO GUIDE 35:2017[27]和CNAS-GL003:2018[20]的要求进行组间及组内均匀性检验。采用1.2.2 中的方法由相同人员在重复性条件下平行测定两次,对得到的数据进行方差分析,以组间及组内方差判断样品中添加农药的含量是否有显著性差异,从而检验其均匀性。结果回收后,以参加者结果统计分析所得的能力评定标准差作为σ,再用SS≤0.3σ 准则核验均检测试结果。样品均匀性检验结果见表1。
表1 均匀性检验结果Table 1 Uniformity test results
样品间自由度为9,样品内自由度为10,查F检验临界值表可知F0.05(9,10)=3.02,由表1 可知,统计量F 值均小于F0.05(9,10),说明在0.05 显著水平时能力验证样品的均匀性良好,可以进行样品发送。本次能力验证样品均检核验结果都符合Ss≤0.3σ 准则,表明样品之间的差异对随后的统计评价没有显著影响。
2.2.2 样品稳定性检验分析 稳定性检验主要考察运输和时间对样品中农药含量的影响,在均匀性检验合格后模拟运输条件(采用与能力验证样品发放使用的快递公司,将样品邮寄到海口和黑河后再分别寄回进行检测)进行运输稳定性检验。在项目实施周期内前中后三个时间段抽取样品进行储存稳定性检验,每次均按照随机数表从剩余样品中各抽取6 个样品,测试过程中所依据的标准、所用试剂、测试条件等与均匀性测试时相同。
2.2.2.1 运输稳定性检验分析 样品的运输稳定性检验结果如表2 所示。
表2 运输稳定性检验结果Table 2 Transport stability test results
运输稳定性测试结果以t检验法进行统计,取6 个样品寄往海口,6 个样品寄往黑河,查临界值表可知t0.05(24)=2.06。由表2 中数据可知,t 值均小于t0.05(24),说明在0.05 显著水平时,运输过程对样品稳定性无影响。
2.2.2.2 储存稳定性检验分析 样品的储存稳定性检验结果如表3 所示。
表3 储存稳定性检验结果Table 3 Storage stability test results
参加者反馈数据回收之后,依据|x -y|≤0.3σ 准则进行稳定性核验。由表3 中数据可知,三次稳定性检验分别得到的均值与均匀性检验均值的差值除以参加者检测数据汇总统计得出的标准偏差σ,比值均小于0.3,表明在整个测试期间,样品中的被测物质是稳定的,达到了能力验证样品要求。
2.3.1 定性筛查能力评价 本次能力验证计划共有20 家实验室参加,全部按要求返回结果,以各实验室对空白样品本底中确定含有的农药数量和添加样品中指定农药的检出数量来评估其定性筛查能力,见表4。
表4 实验室定性筛查能力Table 4 Laboratory qualitative screening capability
2.3.2 定量检测能力评价
2.3.2.1 实验室定量检测结果分布情况 汇总各实验室返回的定量结果后绘制频率分布直方图,发现考核样品中添加农药的检测结果满足单峰、近似正态分布条件[28],因此后续可采用稳健统计方法对检测项目进行定量分析评价,见图1。
图1 定量检测结果频率分布直方图Fig.1 Histogram of frequency distribution of quantitative detection results
2.3.2.2 实验室定量检测结果统计 实验室在定量过程提交的数据为扣除基质本底后的结果,采用稳健统计技术分析项目的稳健平均值、稳健标准差和结果不确定度。以稳健平均值作为指定值,稳健标准差作为能力评定标准差[29]。因样品中添加的17 种农药的指定值的标准不确定度均小于能力评定标准差的1/3,故本次能力验证中的不确定度可忽略不计,检测结果的主要统计量汇总情况见表5。
表5 定量检测结果统计量Table 5 Statistics of quantitative detection results
2.3.2.3 实验室定量评价的z 值分布情况 对于本次能力验证参加者的定量结果,采用z 比分数进行评价:
式中:x 为参加者结果;X 为指定值;σ为能力评定标准差。
为了清晰表示参加者的结果,以实验室代码为横坐标,参加者经统计计算的z 值为纵坐标,并按由小到大的顺序排列作柱状图,见图2。
图2 定量评价z 比分数分布Fig.2 Quantitative evaluation of Z-score distribution
通过z 比分数柱状图,可以看出发生正偏离和负偏离的参加者数量接近,未见明显的正偏离或负偏离的倾向,同时绝大多数参加者的z 值落于|z|≤2 的满意区间内,符合统计规律。实验室可通过该图将其定量能力与其他参加实验室进行比较,了解其结果在本次计划中所处的水平[30]。
对于实验室的定性、定量能力评定尚没有可参照执行的标准,本文建立二维(XY)评价,维度X 用于评估参加者应用的多残留分析方法对添加农药的定性检出能力,维度Y 用于评估参加者对确定检出农药中定量分析满意情况,并引入c 值的概念,探讨一种评价实验室高通量非靶向检测能力的新方法,见表6。
表6 实验室高通量非靶向检测能力Table 6 Laboratory high-throughput non-targeted detection capabilities
式中:a 为定性满意率;b 为定量满意率;c 为综合满意率。
以扣除空白后添加样品定性定量结果对本次能力验证进行考核。在20 家参加实验室中,有14 家实验室定性满意率为100%,占参加人数的70%;有9 家实验室定量满意率为100%,占参加人数的45%,有8 家实验室定性满意率a 值和定量满意率b 值均为100%,同时综合满意率c 值为0,占参加人数的40%,可见c 值评价严格于单一的定性评价或者定量评价,更能反映出实验室的综合检测能力。在分析完c 值后,需要进一步对实验室的假阳性率和假阴性率进行分析。由表6 可知,已检测并量化测试项目中全部的农药且报告无假阳性的实验室有9 家;报告假阳性的实验室有7 家,其中2 家未能检测出测试项目中全部的农药;未能检测出测试项目中全部的农药,报告假阴性的实验室有6 家。为了更直观的展现出实验室高通量非靶向检测能力情况,本文以定性满意率和定量满意率绘制能力分布图,见图3。
图3 实验室高通量非靶向检测能力分布图Fig.3 Distribution of high-throughput non-targeted detection capabilities in the laboratory
c 值越小则越接近双百分率,表明实验室的高通量非靶向检测能力越强。由图3 可以直观地看出代码为1,4,5,9,11,14,19,20 的实验室c 值为双百分率,表明这8 家实验室的高通量非靶向检测能力强。代码为7 的实验室c 值最大,表明其高通量非靶向检测能力偏弱,但定性满意率和定量满意率一致,均为41.2%,在定性筛查出的农药定量检测后均获得满意结果,后续需要进一步提升其高通量非靶向农药定性筛查能力。代码为13 的实验室添加农药全部检出,定性满意率为100%,但只有5 个检测项目|z|小于2,定量满意率仅为29.4%,实验室需加强其高通量非靶向农药定量检测能力。特别注意到代码为14 的实验室,虽然其c 值为0,但其假阳性率为5.6%,仍不能说明其检测能力达到满意水平。故在高通量非靶向能力评定时,可将c 值作为一级评价指标,假阳性率和假阴性率作为二级评价指标,综合进行评价。在高通量非靶向检测中,定性筛查是基础,定量检测是关键,二者缺一不可,故将定性分析和定量分析法联合应用于高通量非靶向农药残留筛查能力验证结果评价,评价结果更加合理,对其他能力验证结果评价具有重要的参考意义。本机构将在后续的能力验证活动中继续推行该种评价方法以验证评价方式的可行性,并在获得足够的样本量后,进一步将c 值量化,区分出结果满意、可疑和不满意的临界值标准。
能力验证一般采用z 比分数评价各实验室对单一特定参数的检测能力,但对于多特性值的实验室间比对结果缺乏综合评价的有效手段。XY 二维分析根据对各特性值的筛查和准确定量情况进行评价,既避免了报告假阳性被评判为“满意”,又避免了筛查不全出现假阴性被评判为“满意”,为评价实验室的综合检测能力提供了一种值得尝试的相对科学、有效的方法。本文以实验室对苹果基质样品中17 种农药的检出情况评估其定性筛查能力,以稳健统计获得的z 比分数落于|z|≤2 满意区间的情况评估其定量准确能力,结合假阳性和假阴性情况,探讨了定性定量分析在评价实验室综合检测能力的应用。
本方法仍有不足之处:a.需提高数据库准确度。在定性分析时,出现假阴性的实验室通常使用的是低分辨质谱,可能未完全覆盖农药目标清单中的所有分析物,由于农药多数存在同分异构体,实验室在建立数据库时,要使用更多品种的标准物质以提高数据信息的可靠性。b.需考虑参加者的数量。由于从少量参加者测量结果获得的统计数据可能不够可靠,因而可能会依据不适当的对照组对参加者进行评估。c.需考虑指定值的离散性。在定量分析时,若实验室的检测水平差别较大,来自参加者结果得到的能力评定标准差往往偏大,也有可能被评判为“满意”,此时需考虑确定指定值和适当的离散性度量方法。d.需建立综合评价指标量化值。在后续能力验证活动中将继续推行该种评价方法以验证评价方式的可行性,并区分出结果满意、可疑和不满意的临界值标准。以上是多特性值结果综合评价面临的局限,有待进一步研究、发展更加客观公正、科学可行的高通量非靶向检测能力评价方法。