朱美玲 张宸瑜 刘钊
摘要:针对沧州地区空气污染情况,本文利用空氣质量监测站以及其历史数据,基于聚类算法挖掘沧州地区空气污染物关键传播路径。在关键传播路径的基础上去获得沧州地区空气污染物的传播规律,采取相应的有效的治理措施,从而达到提高沧州地区空气质量的目标。
关键词:区域协同;关键传播路径;CFAP聚类算法
1、引言
近年来随着京津冀一体化不断深入发展,环境问题日益凸显,随着工业化的发展,更导致空气质量下降。然而,随着人民物质生活的富足,人们更关注生存质量。所以京津冀区域间的空气污染协同治理就尤为重要了。京津冀区域空气质量状况日趋下降,污染程度在周边地区也不同。研究表明,空气污染物传输存在协同性和同步性的特点在区域之间,污染了一个地区以后,很快也会污染到相邻区域,并且程度不一样。这就说明某区域空气质量状况是由本地污染源以及其他地区污染物排放传输共同作用的结果,基于此,本文基于已有的空气质量监测站,采用气象监测站历史数据去搭建一个空气污染物传播分析平台,通过数据呈现的污染物的传输规律进行分析,从而去挖掘出有效的空气污染物关键传播路径,在传播路径上多城市多区域协同控制,合理设置空气质量监测站,进行区域联防,及时阻断传播链。一定程度上促进京津冀周边区域空气污染的防治和空气质量的改善。
2、本文研究的背景和意义
近年来,京津冀一体化受到了学术界的广泛关注,除了经济等一体化,人们也认识到了京津冀环境协同治理的重要性。2019年6月5日,生态环境部发布《中国空气质量改善报告(2013-2018)》。报告表明,2018年空气污染物平均浓度比2013年下降了48个百分点。这归功于京津冀地区采取了一定的区域联防,使得环境空气质量总体改善,对一些诸如北京、唐山等重点区域有了明显改善,尽管环境空气质量取得了一定的效果,但理论研究针对该模式还不够丰富和深入。本课题对此进行了研究,对于丰富区域联防联控模式的研究具有重要的理论意义。
本研究利用大数据挖掘分析空气复合污染物的规律和特点。首先针对实现京津冀环境协同治理的目标,去加强京津冀区域空气生态环境协同治理的发展,和治理的动力。其次其关键传播路径的这一挖掘结果可以作为各领域人士从不同地域、不同海拔高度等角度出发,作为其研究的理论依据和素材,从而实现综合治理京津冀区域,并取得京津冀地区的全面发展。
3、本文研究的主要内容
聚类算法是本文研究的重点。基于此,本文做出了两次递进的改进聚类算法。本文提出通过计算传播路径的标准互信息的一种IAP聚类算法。这种改进的方法,主要就是忽略一些作用不大的离群点,剩下的聚类中心即为空气污染物的关键传播路径。本文又采取了通过运用Concurrent.Futures并行开发框架技术,对算法进行并行优化。把这一改进的IAP聚类算法称之为CFAP聚类。它可以合理控制聚类粒度输出,还可以提高算法的时间复杂度,从而提高算法的运行速度。
4、 本研究的具体挖掘技术
(1)建立空气污染物传播网络模型
①有向加权复杂网络结点定义:应用图论知识,抽象网络结点。把京津冀区域内的所有的空气质量监测站点抽象为图论结点。
②有向加权复杂网络边定义:应用图论知识,定义网络路径。为了确定空气污染物的来源和传播的方向,建立有向图理论,即网络图的边为有向边,带箭头。根据历史数据采取一个有效的综合指标来反映任意两个站点之间的空气污染物的扩散能力。传播路径由有向边描述,指的是两个站点之间的污染物扩散能力最大。
③有向加权复杂网络边权重定义:综合考虑影响空气污染物传播的因素,可动态添加。比如区域地理位置、当地的气象情况、海拔高度、空气湿度以及空气浓度差等等。
5、 总结与展望
本文为解决空气质量问题,采用数据挖掘技术去挖掘京津冀周边区域空间监测站关系网络中的主要传播路径,主要是对历史数据进行空气污染物传播的特性和规律进行研究和分析。本文虽然改进了挖掘算法中的关于时间和速度的问题,但是由于空气质量的不稳定性,仍然需要不断地进行修正和完善:如空气污染物传播受海拔因素的影响很大,因为随着海拔高度的不同,气压不同使得空气流动速度不同;再比如气象因素也是影响空气污染物传播的重要因素。可以将本文提出的方法应用在全国不同的区域,去探究不同的海拔高度、不同的气候对普适空气污染物传播网络的影响;聚类质量更进一步的提高等等。
总之,挖掘污染物关键传播路径通过准确合理地研究污染物的传播特性来实现是非常重要的。挖掘出关键路径后,就可以在关键传播路径上设置空气质量监测站。利用监测站数据及时发现问题,及时阻断空气污染物的扩散,可以有效地进行京津冀空气污染物的地区区域联防,从而协同治理,最终不断的改进和完善解决区域空气质量的问题。
参考文献:
[1]杨毅.大数据时代下探索区域大气污染联防联控的新模式[J].科技传播,2014,6(11):107-108.
[2]崔伟.智慧治理:大数据时代京津冀大气污染治理之创新[J].知与行,2016(07):85-88.
[3]任驿佳.基于数据挖掘的空气污染原因分析[J].内蒙古科技与经济,2018(09):52-53.
[4]朱美玲,张宸瑜,孙煦骄.基于数据挖掘的沧州地区空气污染物传播路径的分析研究[J].内蒙古煤炭经 济,2020(9):142-144.
[5]朱美玲,张宸瑜,孙煦骄.CFAP聚类算法对污染物关键传播路径的挖掘研究[J].造纸装备与材料,2020,49(5):94-96.
课题项目:河北省沧州市2022年度沧州市科技创新研究课题《京津冀协同治理空气污染的对策研究》(课题编号:CZKX2022080)研究成果
作者简介:朱美玲(1983-5),女,汉族,河北沧州人,硕士研究生,讲师,主要研究方向:计算机相关、数据挖掘
张宸瑜(1992-),男,汉族,河北沧州人,硕士研究生,助教,主要研究方向:人工智能以及数据挖掘分析研究
刘钊(1992-),男,汉族,河北沧州人,硕士研究生,讲师,主要研究方向:计算机科学与技术