罗 燕,盛亦斌,沈 聪,阮月垒,李博斌,杨 梅,陈扉然,阮建超
(1.绍兴市质量技术监督检测院,浙江 绍兴 312366;2.浙江环质环境科技有限公司,浙江 绍兴 312366;3.绍兴市上虞区环境保护局环境监测站,浙江 绍兴 312300; 4.天津埃文森科技有限公司,天津 300348)
工业废气是指在加快工业化进程中,工厂所产生的对环境、人体健康具有极大威胁的有害气体的总称,是国家必须加快整治的重点对象[1]。工业废气种类很多,排放到大气中的主要污染物可以分为含硫化合物、含氮化合物、碳的氧化物、挥发性有机物四大类[2],这些污染物都会对人类的健康与生存造成非常不利的影响。尽管国家已出台了各种严格的政策法规对这些大气污染物的排放加以控制,但是仍有部分企业无视国家法律法规,存在偷排、漏排的现象。对工业废气污染源进行快速、有效的鉴别是监控企业废气超标排放和治理空气污染的一个重要的环节。因此,研究一种能够智能鉴别工业废气污染源的系统具有十分重要的意义。
电子鼻是一种能够快速、准确获取气味成分信息的检测技术,它能够感知和识别气体气味并进行气味智能分析,为大气环境污染程度和环境污染泄漏检测和鉴别提供了很好的解决方案。电子鼻与常规化学分析仪器(如色谱仪、光谱仪等)不同,它给出的不是被测样品中某种或某几种成分的定性和定量结果,而是样品中挥发成分的整体信息,即气味的“指纹数据”,它显示了物质的气味特征,从而实现对物质气味的客观检测、鉴别和分析。电子鼻技术不仅可以检测到各种不同气味的不同信号,而且可以对这些信号与经过“学习”和“训练”后建立的数据库中的信号进行比较、识别和判断[3-5]。目前国内外对电子鼻技术的研究异常活跃,从事该技术研发的机构也日益增多,其已被广泛应用于食品[6-7]、环境[8-10]、农业[11-12]、医学[13-14]、公共安全[15-16]等领域。但目前电子鼻技术主要还是应用于食品和农产品的检测,在环境空气质量分析,尤其是工业废气鉴别方面的相关研究还很薄弱。
因此,本试验选择20种代表性企业(医药、化工、金属、印染、饲料)排放的不同废气,通过电子鼻技术对废气进行分析,确定每个生产企业排放废气的主要特征信号,并对分析结果进行数字信息化处理、比对,建立数据库,找出能指示和区分不同类型企业排放废气的特征信号,从而实现对工业废气污染源的智能鉴别。
1.1.1 试验样品
在浙江省绍兴市袍江新区(国家级开发区),选取20种不同企业排放的废气,并将其分为医药、化工、金属加工、印染和饲料5类行业。将采集到的20种不同企业排放的废气作为训练集,通过电子鼻分析后的数据用于建立工业废气数据库。另随机选取上述医药、化工、金属加工、印染和饲料5类行业,分别采集1个废气样品,并将采集的5个目标废气排放源样品作为检验集,用于检验电子鼻对工业废气污染源的智能鉴别效果。训练集样品信息见表1,检验集样品信息见表2。
表1 训练集样品信息表
表2 检验集样品信息表
1.1.2 试验仪器
法国Alpha MOS公司生产的超快速气相色谱电子鼻Heracles II系统由气相色谱仪和电脑分析软件共同构成。其中,气相色谱仪采用两根并行不同极性的金属毛细管色谱柱MXT-5和MXT-1701,检测器为双氢火焰离子化检测器(FID),升温速度为10℃/s;电脑分析软件内置Arochemnbase数据库,包括83 500种化合物和387 000个保留指数数据,其中约有2 000种化合物具有感官描述词,超过1 800种化合物具有人类感官嗅觉阈值。Arochemnbase数据库可以实现气味相关化合物和挥发性化合物的快速鉴别。结合Arochemnbase数据库能够对样品中的大部分成分进行定性分析,从而找出样品之间的差异性化合物,同时还能够给出不同化合物的感官评价,便于对不同样品的气味进行比较。
1.2.1 工业废气样品采集
采用SOC-XI污染源采样器,通过瞬时采样的方法将工业废气收集在恶臭采样气袋里,采样体积为10 L。
1.2.2 工业废气电子鼻数据采集
采用泵抽采样气袋方式进行进样,泵抽时间为120 s,清洗时间为30 s,采集时间为140 s。每个样品进行3次平行试验。
1.2.3 数据处理方法
对电子鼻获取的数据信息采用主成分分析法和判别因子分析法进行处理与分析。
(1) 主成分分析法(Principal Component Analysis,PCA):PCA法是在对样品特性一无所知的前提下,通过对原始数据向量进行线性变换,从而在一定的视角来寻找样品间差异的一种算法,主要用于挖掘有用的信息,给出具有不同气味区域和簇的描述性图表。该算法不丢失任何样品信息,仅仅通过改变坐标轴来达到区分样品的目的。近年来,一些学者利用PCA法对城市空气质量进行了分析与评价,如姜新华等[17]采用主成分分析法对影响呼和浩特市空气质量的主要因素进行了分析;张茹等[18]运用主成分分析法对徐州市的空气质量进行了评价。
(2) 判别因子分析法(Discriminant Factor Analysis,DFA):DFA法是在有先验知识的前提下,即知道各样品所属类别的情况下,通过对原始数据向量进行线性变换,使得各类样品能够更好地被区分,这是该法与PCA法的区别。DFA法是一种通过重新组合传感器数据来优化区分性的分类技术,其目的是在使组间距离最大的同时保证组内差异最小,常用于建立样本数据库后对未知样本进行定性判别。
为了选取合适的废气进样量,本试验以废气样品X6为例,在保持其他试验参数一致的前提下,将泵抽时间分别设置为30 s、60 s、90 s、120 s,获得了不同进样量的废气样品电子鼻数据,并将得到的废气样品的电子鼻数据进行主成分分析,其分析结果见图1。
图1 不同进样量的废气样品X6电子鼻数据的主成分分析图Fig.1 PCA of the electronic nose data of exhaust gases X6 with different sample intake 注:左下角的的彩色圆形图,绿色表示图1处理选择的变量数占样品所有变量数的比例;“Discriminant index”表示区分指数。下同。
由图1可以看出:第一主成分(PC1)与第二主成分(PC2)的贡献率之和达到了99.978%,能很好地反映废气样品的实际情况;废气样品在电子鼻数据的主成分分析图上的区分指数达到98,说明基于气味上的差异能够有效区分4种不同进样时间的废气样品;此外,还发现不同进样时间的废气样品在PC1轴上随着进样量的增大(泵抽时间的增长)呈现规律排布。本试验电子鼻系统中的气相色谱仪采用FID检测器,其为质量型检测器,进样量越大,样品的峰面积越大,更能良好地反映样品的信息。因此,本试验选取泵抽时间为120 s作为20种废气样品统一采用的进样量。
由于通过直接测得的电子鼻数据来寻找废气样品间的差异较为繁琐与复杂,因此本文采用先统计后化学的方法,即利用PCA法统计找出废气样品间气味的差异所在。图2为20种不同企业排放的工业废气样品电子鼻数据的主成分分析图。
由图2可以看出:第一主成分(PC1)与第二主成分(PC2)的贡献率之和达到了88.882%,能很好地反映废气样品的实际情况;废气样品在电子鼻数据的主成分分析图上的区分指数达到94,说明基于气味上的差异能够有效区分20种废气样品。
在主成分分析图中,废气样品间的相对距离(马氏距离)越近,则说明废气样品整体气味越接近,如:废气样品X12位于图2中左侧区域,其他废气样品分布于图2中右侧区域,说明废气样品X12与其他废气样品的气味差异较大;废气样品X8与废气样品X20的距离最近(4 418.64),说明这两种废气样品的气味差异最小。废气样品间的气味差异性主要是由差异性有机物的嗅觉阈值和含量决定的。利用电子鼻AroChemBase数据库对废气样品中的挥发性化合物进行定性,找出了可能存在的14种差异性有机物,废气样品含有的差异性有机物及其嗅觉阈值详见表3,各种废气样品含有的差异性有机物的色谱峰面积详见表4。
图2 20种不同企业排放的废气样品电子鼻数据的主成分分析图Fig.2 PCA of the electronic nose data of exhaust gases emitted from 20 different enterprises
表3 废气样品含有的差异性有机物及其嗅觉阈值
嗅觉阈值的大小代表了物质气味的强弱,相同含量的两种物质,嗅觉阈值越低则气味越强。由表3可知,假设各有机物含量相同的前提下,空气介质中气味最强的物质为乙酰吡嗪(嗅觉阈值为4.00×10-4)。由表4可知,X12废气样品乙酰吡嗪的色谱峰面积是最大的,即乙酰吡嗪的含量是最高的,因此废气样品X12与其他废气样品的气味差异较大;X8废气样品与X20废气样品的差异性有机物的种类和差异性有机物的含量(色谱峰面积)是最接近的,因此这两种废气样品的气味差异性最小。
表4 各种废气样品含有的差异性有机物的色谱峰面积
2.3.1 主成分分析(PCA)
本试验将废气样品按照行业类别归类,其中废气样品X1~X6为印染,废气样品X7、X8为金属加工,废气样品X9、X10为化工,废气样品X11为饲料,废气样品X12~X20为医药,并将分组后的5类行业废气样品的电子鼻数据进行主成分分析,其分析结果见图3。
图3 5类不同行业废气样品的电子鼻数据主成分分析图Fig.3 PCA of the electronic nose data of exhaust gases emitted from 5 different industries
由图3可以看出:第一主成分(PC1)与第二主成分(PC2)的贡献率之和达到了88.882%,能很好地反映废气样品的实际情况;但是废气样品在电子鼻数据的主成分分析图上的区分指数仅为-0.3,说明废气样品虽然行业相同,但废气样品间的差异较大;此外,还发现不同行业领域的废气样品间存在交叉,这主要是因为印染、化工和医药虽然属于不同的行业领域,但排放的废气有相似的部分。因此,单纯地通过主成分分析不能将不同行业排放的废气区分开来。
2.3.2 判别因子分析(DFA)
鉴于主成分分析不能将不同行业排放的废气区分开来,则需要对主成分分析进行扩展,即进行判别因子分析(DFA)。DFA常用于建立样本数据库而后对未知样本进行分组判别,从而确定未知样品的分组信息。利用DFA鉴定未知样品不仅能够投影单个样品,也能够将多个样品作为一个数据库进行投影。本文将分组后的5类行业废气样品的电子鼻数据进行判别因子分析,其分析结果见图4。
图4 5类不同行业废气样品的电子鼻数据判别因子分析图Fig.4 DFA of the electronic nose data of exhaust gases emitted from 5 different industries
由图4可以看出:判别因子分析在主成分分析的基础上,组内的距离减小,组间的距离拉大,使得分组更为明确,5类行业废气样品均能较好地被区分开来。因此,通过建立DFA模型,有望对未知排放源的废气样品进行废气排放行业的鉴定。
利用上述废气样品建立的DFA模型对5类不同行业目标排放源废气样品(检验集)进行投影,其投影结果见图5。
图5 5类不同行业目标排放源废气样品在DFA模型上的投影图Fig.5 DFA model projection of target exhaust gases emitted from 5 different industries
由图5可以看出:5类不同行业目标排放源废气样品均能投影至DFA模型的不同区域。
利用DFA模型对5类不同行业目标排放源废气样品进行鉴别,结果表明鉴别准确率达到100%,见表5。
表5 DFA模型的鉴别结果
本试验利用电子鼻技术对不同行业的工业废气污染源进行智能鉴别,得到如下结论:
(1) 电子鼻Heracles II能够很好地区分不同行业不同企业排放的20种废气样品。
(2) 将不同进样量的废气样品进行主成分分析(PCA),可以明显看出随着进样量的增加,废气样品的气味变强,因此可以用来模拟距离排放源较近的采样样品。
(3) 将20种不同企业排放的工业废气样品按照行业分为5类,对5类行业工业废气进行判别因子分析(DFA),结果表明:利用DFA模型能够较好地将不同行业的废气区分开来。
(4) 此外,通过试验论证,本试验建立的DFA模型对未知排放源工业废气样品鉴别的准确率可达到100%。该工业废气智能鉴别模型有望应用于工业园区废气的智能鉴别,为各类工业废气的识别提供了一种有效的监测手段,也为环境废气监察执法提供了可靠的技术支撑。