尤展汀
摘要:为避免在污染源监测时因为存在一些异常值影响数据可靠性,本次研究设计了一种基于数据特征分析的污染源监洲数据异常值识别方法。先对污染源监测数据进行去噪处理,通过关联度分析方法对去噪处理后的数据实施数据特征分析,完成异常值中失效值的识别。然后基于LSTM网络构建离群异常值识别模型,实现污染源监测数据中离群异常值的识别。最后通过实验证明设计方法的先进性,该方法能够实现污染源监测数据异常值识别,模型拟舍程度最高可达0.98,对于失效值与离群异常值的识别精度均较高。
关键词:数据特征分析;去噪处理;LSTM网络;污染源监测数据;异常值识别
中图分类号:X83 文献标志码:A
前言
随着工业技术与社会经济的迅速发展,大气环境污染问题与水环境污染问题等成为社会性问题,并且越来越严重,全球都在积极探寻环境污染问题的解决方案。中国的工业废水总排放量与大气污染物总排放量一直居高不下,对生态平衡造成了严重破坏。中国对于控制污染源企业实际排污量、污染物总量减排等问题越来越重视,一直致力于发展节能环保产业,尽管取得了一定发展,但整体发展水平还较低,急需创新环保技术,大力发展污染源监测技术。近年来,中国很多城市都在积极实施污染源在线监测技术。在监测中既要考虑监测的实时性等问题,还要考虑数据的可靠性。这是由于在监测中采集的污染源监测数据中往往存在一些异常值,需要对其进行识别。对于该问题的研究,目前已经取得了比较丰富的研究成果。其中杨鸽、范振东、傅春江等学者提出了一种基于奇异谱分析的异常值识别技术,无需人工构建数学模型。杨哲、李艳玲、张鹏等学者针对安全监测提出了一种基于标准四分位间距及M估计量的异常识别改进方法,消除了离群点对于识别结果的影响。以上方法存在识别精度较低的问题,因此根据数据特征分析思想,设计一种基于数据特征分析的污染源监测数据异常值识别方法。