范天星 刘亚曦
(茅台学院,贵州 遵义 564500)
随着国家经济的高速发展,我国的环境问题日益严重,引起了党和政府的高度重视,党的十九大报告指出,必须树立绿水青山就是金山银山的理念,像对待生命一样对待环境问题。环境问题已是制约国家发展的关键因素之一,而环境问题中最难处理的就是空气污染[1-2]。根据已有数据,运用数学建模的方法[3-4],对自建点数据与国控点数据通过可视化探索性研究进行对比分析,通过对影响空气质量的因素的分析进行一元线性回归和多元线性回归分析得到关系式,校准自建点数据。
随机抽取一个月的国控点数据与自建点数据进行可视化分析,以国控点为参照对象,以自然因素为变量进行对比分析,研究自然因素对“二尘四气”浓度的影响。
假设国控点为X1,自建点为X2,他们两之间的差为y,利用上述一元线性回归模型,对自建点数据进行校正。所确定的一元线性回归回归模型校准结果如表1 所示。
表1 一元线性回归模型校准结果
通过一元一次方程y = X1- X2得知国控点数据与自建点的数据差异较大。
对比上述一元线性回归模型校准结果与国控点所测数据后发现PM10、PM2.5、NO2、O3指标误差较大,所以我们考虑了采用多元线性回归模型进行校准。
以自建点数据与国控点数据PM2.5的差异值为因变量,以PM2.5、PM10、CO、NO2、SO2、O3、风速、压强、降水量、温度、湿度为自变量,建立多元线性回归模型,如下:
Y1=β0+ β1X1+ β2X2+ β3X3+ β4X4+ β5X5+ β6X6+ β7X7+ β8X8+β9X9+β10X10+β11X11+ε
式中,β0是常数项,β1,…,β11是回归系数,ε 是残差。Y1是自建点数据与国控点数据PM2.5的差异值,X1,-X11分别是PM2.5、PM10、CO、NO2、SO2、O3、风速、压强、降水量、温度、湿度。
通过表2 可知,模型拟合优度系数R2为0.630,表明回归模型拟合效果较好。回归模型F 检验显著性p<0.05,表明模型自变量均能够解释因变量的变化,即认为列入模型的各个自变量联合起来对因变量有显著影响。
表2 PM2.5 差异值的影响因素回归模型结果
在模型中,PM2.5、PM10、CO、NO2、SO2、O3、压强、温度、湿度回归系数显著性P<0.05,说明PM2.5、PM10、CO、NO2、SO2、O3、压强、温度、湿度对PM2.5差异值具有显著影响。
在模型中,NO2、风速、降水量回归系数显著性P>0.05,说明NO2、风速、降水量对PM2.5差异值无显著影响。
剔除系数不显著变量,该回归模型表示为:
PM2.5差异值= -1505.566 + 0.445 * PM2.5- 0.119 *PM10-22.424 * CO + 0.023 * SO2+ 0.075 * O3+ 1.445* 压强+ 1.112 * 温度+ 0.423 * 湿度
同理,PM10的二元回归模型结果如表3 所示。
通过表3 可知,模型拟合优度系数R2为0.859,表明回归模型拟合效果较好。回归模型F 检验显著性p<0.05,表明模型自变量均能够解释因变量的变化,即认为列入模型的各个自变量联合起来对因变量有显著影响。
表3 PM10 差异值的影响因素回归模型结果
在模型中,PM2.5、PM10、CO、NO2、SO2、压强、降水量、温度、湿度回归系数显著性P<0.05,说明PM2.5、PM10、CO、NO2、SO2、压强、降水量、温度、湿度对PM10差异值具有显著影响。
在模型中,O3、风速回归系数显著性P>0.05,说明O3、风速对PM10差异值无显著影响。
剔除系数不显著变量,该回归模型表示为:
PM10差异值= -1926.869 - 0.758 * PM2.5+ 0.955 * PM10- 85.630 * CO - 0.151 *NO2+ 0.063 * SO2+ 1.823 * 压强+ 0.090 *降水量+ 3.035 * 温度+ 1.003 * 湿度。
同理,CO 的二元回归模型结果如表4 所示。
通过表4 可知,模型拟合优度系数R2为0.461,表明回归模型拟合效果较好。回归模型F检验显著性p<0.05,表明模型自变量均能够解释因变量的变化,即认为列入模型的各个自变量联合起来对因变量有显著影响。
表4 CO 差异值的影响因素回归模型结果
在模型中,NO2、SO2、O3、降水量、湿度回归系数显著性P<0.05,说明NO2、SO2、O3、降水量、湿度对CO 差异值具有显著影响。
在模型中,PM2.5、PM10、CO、风速、压强、温度回归系数显著性P>0.05,说明PM2.5、PM10、CO、风速、压强、温度对CO 差异值无显著影响。
剔除系数不显著变量,该回归模型表示为:
CO 差异值=13.588 - 0.002 * NO2+ 0.001 * SO2-0.004 * O3+ 0.0004 *降水量- 0.006 * 湿度
同理,NO2的二元回归模型结果如表5 所示。
表5 NO2 差异值的影响因素回归模型结果
通过表5 可知,模型拟合优度系数R2为0.766,表明回归模型拟合效果较好。回归模型F 检验显著性p<0.05,表明模型自变量均能够解释因变量的变化,即认为列入模型的各个自变量联合起来对因变量有显著影响。
在模型中,PM2.5、PM10、CO、NO2、O3、风速、压强、降水量、温度、湿度回归系数显著性P<0.05,说明PM2.5、PM10、CO、NO2、O3、风速、压强、降水量、温度、湿度对NO2差异值具有显著影响。
在模型中,SO2回归系数显著性P>0.05,说明SO2对NO2差异值无显著影响。
剔除系数不显著变量,该回归模型表示为:
NO2差异值= -4006.599 - 0.863 * PM2.5+ 0.378 *PM10-30.641 * CO + 0.934 * NO2- 0.141 * O3+10.996* 风速+ 3.802 * 压强- 0.069 * 降水量+ 5.808 * 温度+ 1.044 * 湿度
根据二元模型分析结果,对于SO2而言,模型拟合优度系数R2为0.998,表明回归模型拟合效果较好。回归模型F 检验显著性p<0.05,表明模型自变量均能够解释因变量的变化,即认为列入模型的各个自变量联合起来对因变量有显著影响。
在模型中,PM2.5、CO、NO2、SO2、压强、温度、湿度回归系数显著性P<0.05,说明PM2.5、CO、NO2、SO2、压强、温度、湿度对SO2差异值具有显著影响。
SO2差异值 = -206.713 - 0.069 * PM2.5- 12.501 *CO + 0.019 * NO2+ 1.012 * SO2+ 0.185 * 压强 +0.524 * 温度+ 0.162 * 湿度。
根据二元模拟得知,O3模型拟合优度系数R2为0.890,表明回归模型拟合效果较好。回归模型F 检验显著性p<0.05,表明模型自变量均能够解释因变量的变化,即认为列入模型的各个自变量联合起来对因变量有显著影响。
O3差异值= 1533.931 + 0.308 * PM2.5+ 0.206 * NO2+ 1.125 * O3-14.305 * 风速- 1.523 * 压强+ 0.020 *降水量- 4.144 * 温度
综合对两尘四气的差异值的影响因素回归分析得出,自变量PM2.5、PM10、CO、NO2、SO2、O3、风速、压强、降水量、温度、湿度中至少有一个变量分别对PM2.5、PM10、CO、NO2、SO2、O3等差异值具有显著影响,拟合效果由高到低依次为:SO2差异值(R2=0.998)、O3差异值(R2=0.890)、PM10差异值(R2=0.859)、NO2差异值(R2=0.766)、PM2.5差异值(R2=0.630)、CO 差异值(R2=0.461)。利用上述多元线性回归模型,对自建点数据进行校正。部分校准结果如表6 所示。将上述二种方法的校准结果与国控点数据对比之后,发现多元线性回归模型校准的结果误差最小,采用该模型得到的校准数据与国控数据的误差分析结果见表7 所示,可见多元线性回归模型是简单、实用、可靠的校准模型。
表6 元线性回归模型校正结果
表7 校准数据与国控数据之间的误差分析
通过以国控点数据为参考对象,分别以温度、风速、压强、湿度、降水量为变量进行统计分析,进行可视化探索性研究分析,发现自然因素对自建点数据的“二尘四气”均有影响。分别采用一元线性回归和多元线性回归二种方法对多种自然因素对现有的空气质量检测仪存在的问题进行分析,得出了影响自建点数据偏差较大的原因。通过一元线性回归和多元线性回归分析得到关系式,从而通过计算,校准自建点数据。数据校准后,与国控点差值较小,而且该方法概念简单,计算过程清晰,具有可操作性,算法复杂程度小。