基于空气质量数据误差及影响因素的数据处理分析探讨

2020-09-30 07:15:32张春红
科学咨询 2020年41期
关键词:折线图空气质量监测

张春红

(湖南科技职业学院 湖南长沙 410004)

一、问题背景

为及时掌握空气质量,我们可实时对“两尘四气”(PM2.5、PM10、CO、NO2、SO2、O3)浓度进行监测,对污染源采取相应措施。虽然国家监测控制站点(国控点)对“两尘四气”有监测数据,且较为准确,国控点布控较多。但是,由于我国地域广阔,其覆盖不全面,监测有限,有些地区数据发布时间滞后较长且花费较大,无法给出每个企业尤其是化工、医药、矿业、冶金、燃气管道等企业和边远地区实时空气质量的监测和预报。因此,我们可采用微型空气质量检测仪检测数据作为监控空气质量的另一种形式,实现相关企业的监测和边远地区空气质量的检测。微型空气质量监测仪具有花费少、监测方便等优点,可对空气质量进行实时网格化监控,并同时监测温度、湿度、风速、气压、降水等气象参数。由于所使用的电化学气体传感器在长时间使用后会产生一定的零点漂移和量程漂移,非常规气态污染物(气)浓度变化对传感器存在交叉干扰,以及天气因素对传感器的影响,这就造成同一时间微型空气质量检测仪所采集的数据与真实值存在一定的差异。因此,我们需要对这些自建点数据进行误差及影响因素的数据处理分析,才能进行下一步的差异分析和校准研究,实现既方便快捷又省时省力的精准监测、实时检测所有地区和特殊企业的空气质量状况。[1]

本文数据以中国工业与应用数学学会提供的国控点和自建站数据为基础。

二、问题分析

(一)数据的预处理以及选取

国控点数据以每小时为单位给出,而自建点的数据以时间间隔在五分钟之内给出,数据量较为庞大,因此选取合适的时间点来进行模型的建立是本论文的基础。一方面,通过观察和比较分析,我们发现国控点的每日数据存在部分缺失,比如说2018年11月14日的数据就不是完整的24小时数据。这一类的数据,我们记为不完整数据,在我们取样过程中不考虑这一类的数据。另一方面,空气质量的评判可以看出一段时间序列,但正如我们知道,空气质量受天气的影响。附件所给的时间跨度半年多,因此,我们在选取数据时根据时间段选取2019年1月8日、2019年4月7日、2019年5月7日这三天的数据作为样本进行可视化数据分析。选取这三天的原因是因为这这三天的数据完整,且处于不同的月份,涵盖了不同季节气温对空气质量的影响因素,具有较全面的典型性。我们在整篇文章里都以国建的数据视为标准数据来衡量自建数据的差异,对国建数据选取完毕之后对题目所要求的三个问题进行系统分析。

(二)数据分析

我们对自建点数据与国控点数据进行探索性数据分析。首先,我们根据前期所选取的国建三天的数据,找到相应的自建数据。自建数据所给的时间间隔为五分钟之内,为了与国控数据的范围统一,通过计算平均值的方法来计算出自建点每小时的值。其次,我们先通过折线图来直观反映选取的三天的每组数据的国控和自建的关系,如下图。然后,根据每天的折线图可以看出,自建监测点所测的数据在一定程度上还是可以反映出国控监测点的数据值。[2]

具体来看,1月8日PM10,PM2.5的浮动取值两者基本一致,4月17日,PM2.5,NO2,O3,CO这些监测值的走势基本一致,5月7日PM10,O3的监测值的走势基本一致。这些都可以在一定程度上反映自建监测点所测数据的准确性。但根据折线图,我们可以看到一些差异比较大的数据值,如SO2两者的数据就差别较大。这可能跟风度、温度、非常规气态污染物(气)浓度变化等其它因素有关系。[3]

根据上面的分析,我们引入空气污染指数的计算公式来直观地刻画两种模式下的空气质量监控之间的差异。针对上面的差异,我们再用回归模型对两组数据的量进行回归分析,得出了两者之间的具体差异。

我们对导致自建点数据与国控点数据造成差异的因素进行分析,根据问题回归分析所得出结果,仍将国控监测地的数据值作为标准,将风速、压强、降水量、温度、湿度等因素考虑进去。因所给的变量比较多,我们采用主成分分析法,选取影响比较大的几个因素进行分析。

三、结论分析

(一)回归分析

由于客观事物内部规律的复杂性和认识程度的有限性,在遇到无法用机理分析建立数学模型时,我们通常采取搜集大量数据的办法,基于对数据的统计分析去建立模型,其中用途最为广泛的一类随机模型就是统计回归模型。[4]

回归模型确定的变量之间是相关关系,在大量的观察下会表现出一定的规律性,可以借助函数关系式来表达,称为回归函数或回归方程。

我们先对第一问五个指标,以自建点数据“两尘四气”(PM2.5、PM10、CO、NO2、SO2、O3)浓度为X1、X2、X3、X4、X5,以国控点数据“两尘四气(PM2.5、PM10、CO、NO2、SO2、O3)浓度为Y1、Y2、Y3、Y4、Y5,探究Y关于X相对的函数关系;然后回归分析,看看数据差异。

首先,我们使用SPSS软件进行数据分析,给出PM10和NO2的分析样图,对2019年1月8日的数据进行单个量之间的相关性分析,证实自建点和国控点之间数据的相互关系。其次,我们根据折线图来将检测的数据值进行可视化分析,分析结果,X(i)与 Y(i)之间都有相关的性质,但是在某几个因素中,相关度不高。最后,我们将自建点中的其他五个因素进行相关性分析,得到了如下结果。

我们通过以上分析发现:

风速与PM2.5浓度和PM10的浓度有一定关系,无风时PM2.5和PM10的浓度容易聚集,风速在一定范围内会降低PM2.5浓度和PM10的浓度。近地面气温较高时,大气对流作用加剧,可以降低PM2.5浓度和PM10的浓度;反之,大气出现逆温层时,PM2.5和PM10的浓度不易扩散。近地面气温较高时,NO2浓度容易聚集;反之,气温较低时NO2浓度容易扩散。近地面气温较高时,O3浓度容易聚集;反之,气温较低时,O3浓度容易扩散。降水有利于降低PM2.5浓度和PM10的浓度,利于水汽凝结,形成云雾和降水。

猜你喜欢
折线图空气质量监测
特色“三四五六”返贫监测帮扶做实做细
今日农业(2021年17期)2021-11-26 23:38:44
Optimization Design of Miniature Air Quality Monitoring System Based on Multi-Sensor Fusion Technology
让折线图显示在一个单元格中
再多也不乱 制作按需显示的折线图
电脑爱好者(2018年2期)2018-01-31 19:07:26
美化Excel折线图表
电脑爱好者(2017年1期)2017-04-14 10:16:22
“空气质量发布”APP上线
车内空气质量标准进展
汽车与安全(2016年5期)2016-12-01 05:22:14
重视车内空气质量工作 制造更环保、更清洁、更健康的汽车
汽车与安全(2016年5期)2016-12-01 05:22:13
开展“大气污染执法年”行动 加快推动空气质量改善
网络安全监测数据分析——2015年12月
互联网天地(2016年2期)2016-05-04 04:03:28