基于半定量评估法的环境暴露数据质量评估

2020-02-03 11:33王燕飞葛海虹赵静蒋京呈韦洪莲菅小东林军

生态毒理学报 2020年5期

王燕飞，葛海虹，赵静，蒋京呈，韦洪莲，菅小东，林军

生态环境部固体废物与化学品管理技术中心，北京 100029

环境暴露数据是化学物质环境风险评估的重要基础，可用于估算化学物质环境浓度，为化学物质环境暴露评估提供依据。化学物质环境风险评估的一个关键要素就是估算化学物质的环境浓度，可以使用环境监测数值进行估算，也可以使用模型预测数值；良好的环境监测数据可以直接反映化学物质在环境中的实际浓度。鉴于化学物质环境监测成本比较高，因此在初步的风险评估中，首选引用已发表文献或已公布报告中的环境暴露数据。环境暴露数据的质量将影响风险评估的准确度，因此非常有必要构建科学、可靠的数据质量评估方法。

国际组织及发达国家/地区非常重视环境风险评估中的数据质量评估，20世纪90年代，就已在风险评估框架中纳入对环境暴露数据质量的评估标准。经济合作与发展组织(OECD)于1998年在德国举办了改进工业化学品暴露评估监测数据使用研讨会，作为OECD风险评估计划的一部分，研讨会的目的是改进监测数据在工业化学品环境暴露评估中的应用，其中的一个重要议题就是制定监测数据的质量与代表性标准。2000年，OECD将监测数据评估标准列入测试与评估系列文件18号(ENV/JM/MONO(2000)2)[1]。欧盟于2003年发布的风险评估技术指南文件(第二部分)中对环境监测数据的充分性和代表性提出要求[2]；2016年，欧盟发布的《信息要求和化学品安全评估指南-R.16 环境暴露评估》中对于环境监测的部分进行了扩展，考虑了排放量的监测[3]。美国环境保护局(US EPA)污染预防和毒理学办公室(OPPT)在《有毒物质法》(TSCA)修订后，应用系统性审查原则开展风险评估，针对化学物质理化性质、职业暴露和释放、普通人群/消费者/环境暴露、生态危害研究、动物毒性和体外毒性、流行病学等每种类型的数据/信息源制定评估策略，并开发了数字评分体系，以保证评估准则一致[4]。此外，Klecka等[5]还将建立的数据评估方法用于美国地表水中C8-和C9-烷基酚、烷基酚乙氧基酸及其代谢物的暴露分析。

我国是化学品生产使用大国，为加强我国的化学物质环境管理，2019年8月28日，我国发布了《化学物质环境风险评估技术方法框架性指南(试行)》，指南要求，“对于实测的暴露数据，重点评估可靠性和代表性，要对实测采样与分析方法、样品数量、采样点位、实测地理空间和时间尺度等进行综合评估”。

为建立适合于我国化学物质环境暴露评估的环境暴露数据评估方法，本文基于对几种典型的环境暴露数据质量评估方法的分析，形成适用于我国现阶段化学物质环境风险评估的半定量环境暴露数据质量评估方法，并以双酚A(BPA)和八甲基环四硅氧烷(D4)2种化学物质的环境暴露数据评估为例，介绍建立的半定量方法对于不同环境暴露数据的评估过程，以及应用于不同物质的数据质量评估时存在的共性特点及差异。这对于建立健全化学物质环境风险评估技术方法体系，规范和指导化学物质环境风险评估工作具有重要意义。

1 环境暴露数据质量评估方法分析(Evaluation methods for environmental exposure data)

对国际组织、发达国家/地区和其他已有研究中的环境暴露数据评估方法进行对比分析，不同国家/地区对于环境暴露数据的评估要点基本一致，但是在具体评估方法上会根据各自的管理特点和问题需求采用不同方法，可大致分为“定量”质量评估与“定性”质量评估2类。

1.1 定量数据质量评估方法

1.1.1 “Klecka”数据质量评估

Klecka等[5]的研究主要是对美国地表水中化学物质的暴露分析。该研究对各种来源的数据进行了严格的可靠性评估，重点针对采样地点和介质、采样日期、采样程序、检测限、检测方法、分析结果、质量保证/质控样品、质量保证/质控结果这8个要素，使用等权重分值对每个评价指标进行量化，并划分分值范围，建立评分标准，形成定量/半定量的数据质量评估方法。

评估过程分为2个步骤。第一步，根据表1对涉及环境采样、分析方法和质量控制3个方面的8个要素进行赋分，并计算每份研究的总得分，以判断研究资料中信息的完整程度和可靠性，8个要素总分值24。根据得分及表2的可靠性分级标准对数据进行初步可靠性分级，认定为“非常可靠”和“可靠”这2级的数据将进入第二步开展可靠性二次分级，认定为“可靠性小”和“不可靠”这2级的数据因可靠性较低，将不能用于环境暴露评估。

二次分级由从事或熟悉目标化学物质实验室检测的专业人员主导，评审专家从数据集完整性、样品处理、分析方法和质量控制方面对每份监测(研究)数据进行总体性分级(表3)，将数据分别划分为可靠或不可靠2个等级。

表1 暴露数据初步评分及标准Table 1 Preliminary scoring and criteria for exposure study

表2 可靠性分级标准Table 2 Category criteria based on total score

Klecka等[5]的研究使用分步评估简化了过程，第一步统一了暴露数据质量评估的评分标准，使评估过程变得透明，也相对降低了对评估人员的专业性要求；同时，在数据质量评估时，聚焦数据可靠性，将对数据代表性评估的部分要求后置，可以提高暴露评估效率。而且，该研究是针对目标化学物质在全美国各州水环境中的暴露情况进行分析，评估的区域尺度较大，细化分析数据代表性的难度更高，这与中国现阶段化学物质风险评估现状相近，对中国建立环境暴露数据质量评估方法极具参考性。

1.1.2 US EPA数据质量评估

US EPA针对包括环境暴露数据在内的不同类型数据制定了评估策略，为保证评估准则的一致性，开发出定量的数字评分体系。

USEPA对数据质量的系统性评审过程包含7个关键要素，分别是：(1)明确目标，定义问题；(2)制定协议，描述标准和方法；(3)文献检索策略；(4)根据标准选择文献；(5)根据标准评估研究质量；(6)根据协议方法分析数据；(7)解释结果，提供摘要。

对数据质量的评估涵盖可靠性、代表性、可获取性/清晰度、变异性和不确定性四大方面。US EPA定义的监测数据不仅包括环境介质(如空气、水、土壤和生物群)样品中的化学物质浓度，还包括生物基质(如血液、尿液、母乳、头发和器官等)中的化学物质及其代谢物的浓度等。数据质量评估的指标共10项，包括：采样方法、分析方法、选择暴露生物标志物、地理区域、时效性、空间和时间的变化、暴露场景、报告结果、质量保证、变异性和不确定性。

每个指标被分类为高、中、低或不可接受的置信水平。每个置信水平分配一个分值(即1到4)，用于评估研究的总体质量。对数据质量4个评估方面的赋分进行比重分析(表4)可见，可靠性与代表性的权重最高。

表3 可靠性二次分级标准Table 3 Criteria for detailed evaluation of analytical chemistry methods

表4 美国环境保护局(US EPA)的数据质量评估标准及权重Table 4 United States Environmental Protection Agency (US EPA) evaluation criteria for monitoring data

要确定研究总分数，第一步是将每个指标的得分乘以适当的权重因子获得权重度量分数。然后将权重度量分数求和并除以权重因子的总和，以获得1到3之间的总体研究分数。计算总分的等式如下所示：

总分(范围1到3)=Σ(指标分数×权重因子)/Σ(权重因子)

根据得分对数据质量的界定分为4个级别，具体分级划分方法如表5所示。

表5 质量分数和相应的质量水平界定Table 5 Definition of overall quality levels and corresponding quality scores

US EPA建立的是一套针对环境暴露、消费者与一般人群暴露的通用评分体系，兼顾对数据可靠性与代表性的评估。评分体系中详尽细致的评分指标对数据来源和信息要求较高，因此，对于不同评估尺度的项目，应用该评分体系的难易程度不同。将该评估方法应用于不同的评估项目时，可能会根据需要调整指标权重，而且评估过程仍然需要专业判断。

1.2 定性数据质量评估方法

1.2.1 OECD数据质量评估

OECD在其测试与评估系列文件中，针对环境监测数据的质量、代表性和覆盖率制定了相应定性评估准则，以确定是否可将数据用于暴露评估，风险评估人员需根据经验和专业知识以及风险评估的需求，判断是否使用数据。

OECD对环境监测数据的信息需求如表6所示。其中，数据质量的评估重点是采样与分析方法，数据的代表性和覆盖率则与暴露评估方案有关。对于采样方法，需要了解采样方案、采样时间、地点以及样品的基质特征等；对于分析方法，需要了解分析对象、使用方法、分析定量限、方法回收率/准确度/再现性、空白浓度等信息。

为了关联评估目标，还要求掌握环境监测点附近的点源及影响、点源排放方式及排放量、采样水体流量和稀释率等信息，这在理论上可以明确环境监测数据的代表性，但是，不同国家/地区对于点源及水体信息的获取难易程度与其环境管理制度相关，操作时的可行性程度不尽相同。OECD推荐该表时也强调要灵活运用标准。

1.2.2 欧盟数据质量评估

欧盟对于环境监测数据的质量评估，总体沿用了OECD的评估方法。欧盟在2003年的风险评估技术指南文件中要求，必须根据标准评估空气、淡水或海水、沉积物、生物群和/或土壤中化学物质监测数据的充分性和代表性。其中，对环境暴露实测数据要求的评估有3个步骤：第一步是通过评估所采用的采样/分析方法以及评估的地理和时间尺度选择可靠的且有代表性的数据；第二步是根据物质的暴露源和环境归趋，将数据分配给局部或区域场景；第三步将环境暴露实测数据与相应环境暴露预测进行比较，对于天然存在的物质，必须考虑背景浓度。为了进行风险表征，应基于环境暴露实测数据和环境暴露预测数据确定最终的环境浓度。其中，第一步的内容就是对监测的环境暴露浓度数据的可靠性和代表性进行评估。评估标准是在OECD的标准基础上进行了细微调整。

2016年，欧盟发布的《信息要求和化学品安全评估指南-R.16环境暴露评估》明确了评估环境暴露数据应考虑的5个方面：(1)抽样和分析技术的质量；(2)为关注的环境介质和暴露场景选择代表性数据；(3)离群值；(4)处理低于定量限(LOQ)的数据；(5)数据可比性。系统考虑了数据的质量评估及处理。

欧盟的数据质量评估方法与OECD的方法在具体指标上存在拆分、简化和不同表述，但是总体还是沿用了OECD的方法，一方面，在数据评估的技术层面，进行定性的数据可靠性评估，这对评估人员的专业能力有较高要求，且评估过程透明性不强；另一方面，欧盟具有成熟的化学物质环境风险评估与管理体系，因此，在《关于化学品注册、评估、许可和限制制度》要求下，欧盟在数据评估过程就可以明确物质的排放点源，并根据点源，将监测数据分配到局部或区域场景。

2 半定量环境暴露数据质量评估方法及应用案例(A semi-quantitative evaluation method and case studies)

环境暴露数据是环境暴露评估的基础。我国的化学物质环境风险评估与管理体系尚待完善，开展数据质量评估时，难以满足US EPA细致详尽的指标评分体系要求；此外，由于目前还不能准确、有效掌握化学物质的所有排放点源，无法参照OECD的方法，直接将监测点位周边的点源排放及河流稀释率等代表性评估的指标纳入数据质量评估；更无法参照欧盟的方法，在数据质量评估阶段就将监测数据有效分配到局部或区域场景。而Klecka等[5]在研究中是针对目标化学物质在全美国各州环境介质(水环境)中的暴露情况进行分析，在较大评估尺度下聚焦数据可靠性评估，适合我国目前的评估需求。因此，重点参考Klecka等[5]在研究中采用的数据质量评估方法，建立适合我国国情的半定量评估方法。鉴于我国当前在化学物质的环境暴露评估中，数据来源单一，可使用的环境监测数据有限，因此，根据可获取数据的丰富程度，对Klecka等[5]应用的数据评估方法进行改进。

表6 使用环境监测数据的信息要求[1]Table 6 Information requirement to justify use of existing ambient monitoring data[1]

2.1 半定量环境暴露数据质量评估方法

建立的半定量数据质量评估方法分两步进行，具体如图1所示。第一步沿用Klecka的数据初步评分及标准(表1)，但并不根据打分结果进行简单排除，而是对所有的研究进行打分并排序，然后根据数据丰富程度进行筛选。

如果环境监测数据非常缺乏(文献数量≤50)，为确保提取所有有用数据，则根据排序结果对所有的研究进行第二步专家评审。如果具有一定量的环境监测数据(50<文献数量<200)，则根据排序结果对待评估文献进行分层处理，当排序前90%的打分结果<13时，对这90%的研究进行第二步专家评审；当排序前90%的打分结果≥13时，对评分≥13的研究进行第二步专家评审。如果有足够的环境监测数据(文献数量≥200)，仅对评分≥13的研究进行第二步专家评审。

图1 半定量环境暴露数据质量评估框架Fig. 1 The semi-quantitative evaluation framework for environmental exposure data

第二步专家评审参照表3要求，评估目的是确定研究中所有的分析方法是否能够生产可靠的监测数据，由从事或熟悉待评估化学物质实验室检测的研究人员作为评审专家，评审不通过的数据均不用于下一步环境暴露评估。

2.2 案例应用

2.2.1 BPA环境暴露数据质量评估

BPA，外观为白色粉末或片状结晶，熔点155 ℃，标准大气压下沸点360.5 ℃，相对密度为1.195 g·cm-3(25 ℃)，饱和蒸气压为4.1×10-7Pa(25 ℃)，室温下溶解度为300 mgL-1，正辛醇-水分配系数(logKow)为3.4，BPA的工业生产一般采用苯酚和丙酮为原料，在酸性介质中催化缩合制取。经BPA的环境暴露后，BPA可进入人和动物体内，进而干扰生物体内分泌功能，影响其生殖和发育。BPA主要通过BPA生产、聚碳酸酯生产、环氧树脂生产、热敏纸生产以及市政污水处理厂的排放进入环境。

为获得中国大陆环境介质尤其是水环境(含沉积物)中BPA的暴露数据，首先根据检索目标制定检索方案，数据源为中国知网、万方、维普和PubMed这4个数据库，检索文献类型包括发表的经同行评审的中英文文献以及公开的硕士博士学位论文，检索时间截至2018年3月。

经检索，获得BPA监测数据文献295篇，对文献内容的相关性进一步筛选，得到待评估的文献206篇，其中，中文文献64篇(含硕士论文6篇)，英文文献142篇[6]，待评估文献数量超过200，根据对数据丰富程度的筛选原则，对文献进行第一步打分排序后，选择得分超过(含)13分的文献进行第二步专家评审。

第一步明确打分的基本原则：

(1)如果文献的研究中参考另一篇文献中的检测方法，则该文献也须评价；

(2)如果文献研究采用标准检测方法，则对检测方法的评审可直接得出结论；

(3)如果文献研究采用新开发的检测方法，文献具体阐释了新方法的精确度、重复性等信息，则对检测方法的评审可直接得出结论；

(4)如果文献研究使用高通量检测方法同时定量分析包括BPA在内的多种物质，仅关注针对BPA的回收率等质控信息，质控不合格则弃用相关数据；

(5)如果文献研究的检测方法的检出限/定量限远高于一般研究的检出限/定量限，检测结果可能无意义。

评估过程还应结合具体物质在各类基质中的测定方法及其理化特性和生产使用特点。目前已经有许多分析技术被用于BPA的检测，包括高效液相色谱法、气相色谱质谱联用法、液相色谱质谱联用法和酶联免疫法等[7]，而水环境介质监测常用气相色谱质谱联用法。在检测过程中，由于BPA是通过苯酚和丙酮在酸性催化条件下缩合反应而成，应避免这2种溶剂同时使用；样品提取、浓缩、化学衍生或进样过程中，采用高温会增加BPA类似物热解并产生假阳性的可能性，如果分析过程的任何部分中采用高温，应适当地作对照或实验来表明数据的完整性；由于四甲基氢氧化铵和三甲基氢氧化硫会引起BPA水解或发生酯交换反应，应避免使用这2种物质作为衍生化试剂；有些不使用气相色谱质谱联用法的研究，不需要衍生化步骤，不使用衍生化试剂；在BPA酶联免疫分析方法中，可能出现多种物质交叉反应，应关注结果的特异性。

对206篇文献进行第一步打分排序，13分及以上的文献比例85%，对进入第二步的文献进行专家评审，评审通过率90%，最终，获得可靠的环境暴露文献共157篇，总体通过率76%。其中，中文文献36篇，英文文献121篇。可见第一步打分排序可以有效排除数据质量不可靠的文献，以确保第二步集中评估质量相对高的文献。

2.2.2 D4环境暴露数据质量评估

D4通常为无色无味的透明油状液体，熔点17.7 ℃，标准大气压下沸点175 ℃，相对密度为0.95 g·cm-3(25 ℃)，饱和蒸气压为132 Pa(25 ℃)，室温下溶解度为0.055 mgL-1，正辛醇-水分配系数(logKow)为6.49，几乎不溶于水，极易挥发，具有高有机质吸附性。在欧盟和日本的危害分类信息中，D4属于3类易燃液体，生殖毒性属于2类。日本将D4慢性水环境危害定为1类，欧盟则定为4类。D4是有机硅行业重要的中间体之一，由有机硅单体甲基氯硅烷水解精馏制取，主要用于生产硅橡胶、硅油等有机硅产品，在日常生活中应用广泛。

为获得中国大陆水、气和土各环境介质中D4的暴露数据，根据检索目标制定检索方案，数据源为中国知网、万方、维普和PubMed这4个数据库，检索文献类型包括发表的经同行评审的中英文文献以及公开的硕士博士学位论文，检索时间截至2019年3月。

经检索，获得的D4监测数据文献97篇，对文献内容的相关性进一步筛选，仅得到待评估文献25篇，含中文文献4篇(硕士论文2篇)，英文文献21篇。由于环境监测数据非常缺乏，根据评估框架，仅对文献进行第一步打分排序，对全部文献进行专家评审，其中，第一步的打分排序结果可供第二步评审参考。

第一步的打分排序原则参照BPA的原则，由于以D4为原料生成的有机硅产品应用范围非常广，在个人护理用品、脱模剂、油脂、润滑剂、含有机硅的实验室设备和仪器、实验室样品瓶、进样瓶等产品中均可能含有D4残留，在采样和分析环节均容易产生污染，应格外重视研究的采样及分析的信息完整性。目前我国尚没有关于D4的环境监测标准，2018年，国际标准化委员会发布了关于水中挥发性环状硅氧烷的气相色谱质谱联用法标准[8]。

鉴于D4制品应用广泛的特点，进行质量评估时应关注如下重点：

(1)采样人员及分析人员在采样/分析之前需避免使用洗手液或其他可能导致污染的个人护理产品；

(2)使用聚氨酯泡沫(polyurethane foam, PUF)采样材料对空气样品进行采样时，由于PUF材料中含有机硅材料达5%(D4含量0.1%～0.5%)，可能对空气样品产生污染，而且，PUF污染与时间和环境条件有关系；

(3)在进行水样前处理时，对样品使用0.45 μm醋酸纤维微孔膜进行过滤处理的方式不适用于污水处理厂入口水样，因为此类水样含有大量悬浮物，所需过滤时间较长，样品中D4容易挥发，而且，D4容易吸附在悬浮物上，过滤会导致D4损失；

(4)对污泥/土壤样品的冷冻干燥处理方法可能存在D4挥发和蒸汽中D4吸附污染问题，但油泥样品中富含有机质，对D4吸附能力强，所以对油泥样品采用冷冻干燥的方法不会导致D4的过度挥发。

对25篇文献进行专家评审，其中，17篇文献研究方法可靠，通过率68%，文献中的监测数据可用于下一步的D4环境暴露评估。对比案例分析，BPA环境暴露数据的评估通过率更高，说明评估通过率不仅与评估第一步的打分筛选方案的选择有关，也与物质检测方法整体质量相关。

3 讨论(Discussion)

基于已有研究形成的半定量环境暴露数据质量评估方法的优势在于：方法结合中国目前化学物质风险评估技术要求及环境管理特点，适合中国现阶段环境风险评估需求；而且，方法第一步依据统一的评分标准进行打分排序，对专业性要求相对低；在进行第二步之前，依据数据丰富程度确定筛选策略，可以将有限的资源更有效地用在关键环节，方法第二步才需结合物质性质及采样/检测方法进行专业判断。这种半定量的数据质量评估方法重点是对环境暴露数据的可靠性评估，下一步还需要由评估人员结合所提取数据的特点，以及化学物质的具体生产使用情况重点分析数据的代表性。鉴于我国的化学物质风险评估体系建设尚待完善，而且在风险评估过程中，对数据的需求是一个渐进的过程，在数据质量评估技术方法制定中，不仅需要完善环境暴露数据的评估维度，也需要开发对不同类型数据的质量评估方法，为化学物质环境风险评估体系建设提供支撑。