白 莉,荆钰童
吉林建筑大学 市政与环境工程学院,长春 130118
多环芳烃(Polycyclic aromatic hydrocarbons,英文缩写为PAHs)作为一种全球性的危害性化合物,具有强烈的致癌性、致畸性与突变性,已有16种未取代的多环芳烃被美国环境保护局列为了优先级污染物处理级别,我国也于2013年及以后陆续推出了环境空气和废气、土壤和沉积物以及固体废物中16种多环芳烃的相关测定标准.环境中的多环芳烃代表了一类有机化合物,根据苯环的稠合和杂原子情况,可将多环芳烃分为单环芳烃、稠环芳烃及其他多环芳烃等,且各个分类下又有不同的化合物分类.多环芳烃来源广泛,炼焦、焚烧甚至烹调均会产生不定量的多环芳烃.由于多环芳烃远距离传播的能力[1]及亲脂性,使它可以沉积入土壤、河流及植物中,进而进入人类的饮食当中,危害人们的健康.因此,针对PAHs的源解析研究受到人们广泛重视,人们已从最初的监测浓度等被动方法转到现在的探究PAHs来源等主动方法上来,以有针对性地开展源头控制及治理的源解析研究.
目前,针对PAHs的源解析方法众多,主要有诊断比率(Diagnostic ratios,英文缩写为DR) 、层次聚类分析(Hierarchical cluster analysis,英文缩写为HCA)、主成分分析(Principal component analysis ,英文缩写为PCA)、正矩阵因式分解 (Positive matrix factorization,英文缩写为PMF)和多元线性回归分析(Multiple linear regression analysis,英文缩写为MLRA)等5种方法,上述每种方法的侧重点及研究目的不同,其应用场合也各不相同,其中诊断比率、层次聚类分析和主成分分析等3种方法主要通过各个不同的对比参数来确定不同环境下PAHs的源头,多元线性回归分析法主要与主成分分析法配合使用,二者结合可估计每个来源对PAHs总浓度的平均贡献[2].
多环芳烃种类繁多,国外对于多环芳烃的英文缩写参差不齐,国内标注也大多以中文作为缩写,复杂的汉字不便于进行多环芳烃具体研究的进行,故本论文使用PAHs diagnostic ratios for the identification of pollution emission sources(用于识别污染排放源的多环芳烃诊断比率)中的缩写表达方式,并将16种常见的多环芳烃化合物缩写汇总于表1[3].
表1 PAHs常见化合物缩写表Table 1 List of common compounds abbreviations for PAHs
多环芳烃源解析技术是通过测量位置和污染源样品的化学组分来确定污染源对受体的贡献值,不需要知道污染源污染强弱,不依赖气象资料,解决了扩散模型难以解决的问题,其目的是对采样点处大气中污染物水平的贡献来推算其来源.
诊断比率是一种常见的多环芳烃解析方法,它基于母体多环芳烃或烷基取代分子与未取代分子的比例估计污染物来源;层次聚类分析是将各化合物进行分组,通过不同组的化合物的不同性质以确定污染物的具体来源;主成分分析是一种统计技术,可减小变量的维数,用较少数量的自变量替换大量相互关联的变量,且这些新变量(组件)是从原始变量派生的,并且仅仅是这些变量的线性组合;正矩阵因式分解是通过将复杂矩阵分解为矩阵乘积的形式,简化运算以确定污染物具体来源;多元线性回归分析是将痕量元素和化合物浓度用作因变量,并将绝对因子得分(由主成分分析获得)用作自变量,通过大量数据线性回归确定污染物具体性质及来源的方法,下面将详细介绍这5种方法.
诊断比率(DR)法通过化合物浓度的比值,快速确定PAHs的具体来源.该方法简化了计算过程,使运算结果和PAHs来源有了相对清晰的对应关系.诊断比率的比值众多,为了找到符合实际的诊断比率值,本文利用箱图对汽油、柴油等燃料燃烧的诊断比率即BaA/(BaA+CHR),BeP/(BeP+BaP),BeP/BaP,FLA/(FLA+PYR)和IcdP/(BghiP+IcdP)进行了比较分析,具体结果如图1所示.
图1 交通因素不同诊断比率的箱图Fig.1 Box diagram of different diagnostic ratios of traffic factors
由图1可见,BeP/BaP分布较为分散,不适合作为诊断比率的参考比率,BaA/(BaA+CHR),BeP/( BeP+BaP),FLA/(FLA+PYR)及IcdP/(IcdP+BghiP)较为集中,因此本文汇总了这4种诊断比率在各种情况下的具体诊断比率值,以方便大家查阅使用.具体结果见表2.
表2 几种常见类型的诊断比率值Table 2 Diagnostic ratio values of several common types
较常用的其他诊断比率还有低分子量(LMW)/高分子量(HMW),∑ Low/∑ High = ∑ (Ace, Flu,Phe,Ant)/∑ sum of the rest of the PAHs等.诊断比率参数众多且诊断范围多变,存在模糊重叠部分,这就需要在应用时挑选合适的诊断比率.
Alsbou E等[7]人研究了约旦的土壤样本,利用交叉图技术诊断比率法,通过绘制诊断比率的交叉图,发现土壤样品受到多种混合PAHs来源的严重影响,热源(例如汽车排放物和石油燃烧物)对研究区域的PAHs有重要贡献.
印度学者Kulshrestha M J等[8]人通过应用诊断比率法发现,车辆排放、煤炭、木材燃烧和燃料燃烧是多环芳烃的主要来源.
由于诊断比率值之间可能存在重叠,因此,它们的应用在进一步区分特定的热源或成岩来源方面可能受到限制,尤其是热源来源之间存在相似性,因此,在应用诊断比率时应谨慎行事[9].具体而言,环境中PAHs完整性的概念,对已知来源的比率估算不足,对比率准确度的空间影响、PAHs传输效应、环境中PAHs来源混合及环境中PAHs来源可变性等都是关注的话题[10].
层次聚类分析(HCA)法是将变量按类分组,无需查询有关群的数量和性质等先验信息、数学准则,即可用来检验变量和案例之间的相似性(或差异)的方法.它的初始结果是若干个与变量数目相等的聚类,接着会基于变量间的相似性形成了一个新的聚类.此过程重复的次数与组成单个集群所需的次数相同.可采用不同方法来度量聚类的相似性和链接性或添加小扰动,同时也可检验聚类分析的灵敏度和准确性[5],利用软件Origin就可进行运算.
使用层次聚类分析法主要分析均一的PAHs组分及其基于总浓度的相互关系.具有相似化学和结构特征的多环芳烃存在于同一簇中[11].第1组分PAHs例如NP和ACE等,它们是具有3个~4个环分子量的PAHs,它们起源于热源[12],该群集以分层方式与第2群集相关联.第2组分PAH,其中包含PHE、ANT和CHR等成员,它们是具有5个~6个环的高分子量的PAHs,它们的来源为道路扬尘[13].第3组分与第2组分同样相互关联,有PYR和FLA等作成员,它们的来源主要是石油[14].
Dudhagara D R等[14]人通过层次聚类法证实了印度巴夫那加尔海岸的多环芳烃主要来自于成岩及热源.
主成分分析(PCA)法是一种常见的因子分析(FA)方法,其受体模型的数量关系[5]如下:
(1)
式中,Xi为不同时刻给定样本在测点处的污染物浓度,ng/m3;n为污染物来源的个数;i为第i个污染物的来源;Ai为排放浓度,ng/m3;Si为污染物的来源对该测点处污染物污染程度的贡献率,%.
主成分分析(PCA)法可用于识别环境和源PAHs剖面之间的异同.它的前提条件同诊断比率法一样,也与具有相似化学和结构特征的多环芳烃存在于同一簇中[11].主成分分析(PCA)法的主要目的是为了减少变量,提取主要成分因子.可应用的软件有SPSS和Origin等.由于PAHs包含的化合物很多,降维可使结果主次更加分明.同时,如果样本较多,也可在图中显示置信区间椭圆(Confidence ellipse,英文缩写为CE).计算中PCs值的相互加载显示了变量间的关系.基于总浓度对HCA进行鉴定,确定均质PAHs群及其相互关系.通过分析各因数中的主要成分,可得到源解析的结果.在实验分析过程中,可多选用BghiP等相关性强的成分,以减少实验误差,提高实验结果可靠性.
第1个主成分(PC 1)与PYR,BaA,CHR,BaP,BeP,DahA和PYR,BaA和CHR的一些甲基化衍生物相关,反映了研究区域PAHs的混合热源,包括石油、煤炭和木材燃烧.第2个主成分(PC 2)由ACE,ANT,PHE及其甲基化衍生物主导,PC 2可能归因与家庭燃烧过程相关的活动. PC 3对ACY,FLA,ANT,BkF,IcdP和BghiP表现出强烈的负负载.ACY,FLA和ANT代表了排放和生物质不完全燃烧的混合来源.PC 2暗示PAHs主要源自与交通有关的排放.NP与其他化合物没有任何显著关系[15].
葡萄牙学者Cerqueira M等[16]人对寒冷时期收集的样本分别进行了数据分析.结果表明,温暖时期的两个主成分(PC)解释了总数据差异的大约82 %,第1个主成分(PC 1)解释了总方差的62 %,其特征在于BghiP和IcdP的贡献很大,第2个主成分(PC 2)占总方差的20 %.
塞浦路斯学者Iakovides M等[2]人通过Kaiser-Meyer Olkin(KMO)和Bartlett球形度检验评估了数据是否适合进行因子分析,发现主成分分析(PCA)法在LIM-PM 10数据上的结果与LIM-PM 2.5结果相似,因此,数据可变性足以进行因子分析.
正矩阵因式分解(PMF)法是将一个矩阵A表示为两个或更多个矩阵的乘积,对复杂数据进行分解.由于诊断率只能将PAHs的来源归为燃烧源,并将其粗略地分为石油燃烧源、生物质和煤炭燃烧源.另外,诊断率也无法提供每个来源的贡献率.PMF法可分析特定来源,例如煤炭燃烧、化石燃料燃烧和交通排放,并计算每种来源的贡献率.因此,与PAHs的诊断率相比,PMF是一种更合适,更有效的PAHs来源识别方法[17].
Liu W等[18]人使用正矩阵因式分解法得到结果表明,与黄海地区相比,渤海地区沿海城市的煤和生物质燃烧对母体多环芳烃(Parent polycyclic aromatic hydrocarbons,英文缩写为pPAHs)排放的贡献更大,冬季燃煤和生物质是pPAHs的主要来源,而其他季节则主要是交通尾气.
伊朗学者Najmeddin A等[19]人采用PMF法的研究结果表明,汽车排放(50.6 %)和工业活动(特别是钢铁行业)(30.4 %)是与PM 10结合的PAHs的前两个来源.
多元线性回归分析(MLRA)法是采用向前逐步方法将两个或两个以上自变量进行回归运算的,默认的显着性水平为5 %[2].多元线性回归主要与主成分分析法结合,通过共同运算提高源解析的精确性.
此外,多元线性回归分析(MLRA)为每个样品的PCA因子评分(FS)进行评估,以评估每个来源对PAHs总浓度的平均贡献[13].PC因子评分对PCA分析中包括的PAHs正常标准化总和(Z评分)进行回归.FS被用作自变量,而标准ΣPAHs值被选作因变量.Unmix模型通过考虑其矩阵上的每种组合(样品x化学物质)多次执行模型计算,以最终只保留那些会提高模型信噪比的物质[13],从而提高模型的不确定性.Unmix模型结果还可与PCA/MLR分析结果进行比较,进一步估计每种受体模型的能力,并完善两个采样位置上的PAHs源分配[2].
Wang X T等[20]人通过PCA-MLRA模型确定了中国上海6种PAHs的来源,其中F 1(车辆排放)的相对贡献为15.1%,主要污染来源为车辆排放;F 2的相对贡献为47.8%,主要污染来源为石油燃烧;F 3的相对贡献为7.8%,主要污染来源为石油燃烧;F 4的相对贡献为10.6%,主要污染来源为煤燃烧;F 5的相对贡献为15.7 %,主要污染来源为“蒽”源;F 6的相对贡献为3 %,主要污染来源为焦油.
从上述研究中可以看出,诊断比率法、层次聚类分析法和主成分分析法的前提条件相同,方便了后期验证源解析准确性时的交叉使用,但这三者的研究方向各有侧重,诊断比率法主要通过化合物浓度比确定污染物来源,层次聚类分析法则主要是通过变量的相似性形成的聚类来进行研究,主成分分析法则是通过减少变量来研究源解析的相关性.正矩阵因式分解法是把一个矩阵A表示为两个或更多个矩阵的乘积,是将复杂的数据进行分解的方法.多元线性回归分析法则是将两个或两个以上自变量进行回归运算.因此,在实际运用时要明确研究目的,选择合适的研究方法,以使研究结果更符合实际.但是在研究过程中,不需要将这5种方法孤立看待,因这五种方法在源解析过程中可互为补充和印证.
多环芳烃的源解析方法多样,本文针对5种有代表性的方法,对多环芳烃的源解析路径进行了比较,梳理了多环芳烃的源解析思路,不再仅仅停留在多环芳烃的监测与控制阶段,而是对多环芳烃源解析的具体方法进行了分析研究,比较了上述5种方法的异同点,为之后的多环芳烃源解析工作提供有力支撑.同时,也希望之后的研究者在运用源解析方法时能够综合考虑各方面要素,谨慎选择源解析方法,并严谨对待数值验证过程,以使研究结果更加准确.