杨 婕,魏 凯
(临沂市平邑县环境监控中心,山东 临沂 273300)
环境保护是推动社会整体可持续发展的重要途径和措施,近年来,随着数字技术、信息技术的不断发展,国内外学者将研究重点集中到促进环保技术与数字信息技术的融合中,提出设计构建“智慧环保系统”的理念。基于此,本文在充分考虑算法这一内容在各个行业和领域中应用情况的前提下,将数据挖掘技术应用到智慧环保系统中,着重基于脱硫监测这一具体类型来验证数据挖掘技术的应用效果,对研究优化设计智慧环保系统具有积极的意义。
图1 数据挖掘的结构
智慧环保系统是开展环保监测工作的重要前提,环保系统数据库中储存的海量信息可以成为数据挖掘技术应用的有利条件。
数据挖掘的基本流程见图2。现阶段在应用数据挖掘技术时,通常将其划分为三个主要阶段:数据选择和预处理是第一阶段,数据转换和挖掘是第二阶段,数据分析是第三阶段。在选择和预处理数据时,需要基于客户的需求,从逻辑数据库中选取与任务目标相关的数据,经由集成和再加工的方法,检查数据的完整性并清除重复数据,填补丢失的数据信息;在数据转换和挖掘阶段,需要考虑系统程序格式,在对数据信息进行转换后,从被抽象的信息中找出符合任务目标的信息;数据分析阶段主要是将被同化的知识进行表达和解释,在将保留的知识传递给客户之后,为客户的决策及相关工作提供支持[2]。
图2 数据挖掘的基本流程
通过对数据库中海量信息的挖掘分析,并基于分析结果为环境治理工作选择合适的环境治理方法提供依据。
关联性算法规则是数据挖掘技术能够实现海量数据分析处理的重要保障。为了确保数据挖掘技术在智慧环保系统中的应用效果,需要理清关联算法应用中涉及到的各个子项集合之间相互关系[3]。在数据挖掘技术的实际应用中,关联规则算法主要在获取数据后发挥作用,通过发现获取数据拥有的共同点,构建一个能够将相关数据关联起来的过程。在具体应用关联规则算法的过程中,以X⇒Y代表基本的公式算法,其中,X代表关联规则的前项项集,Y代表关联规则的后项项集。利用这一公式,可以明确从数据库中获取的信息在X属性值和Y属性值的真假。而在实际的关联规则中,由于存在支持度和置信度两个反应知识兴趣度的度量,在假设数据项集X⊂I,B代表事务集D中包含X的事务数目,而A代表事务集D中包含Y的事务数目,则可以用以下公式来表示数据集X的支持度定义:
当数据集中同时包含X和Y的事务数与所有事务数之比能够代表关联规则X⇒Y的支持度,则可以将其记为:
这样就可以表示关联规则X⇒Y的支持度代表关联规则的重要性。而如果关联规则X⇒Y的置信度代表同时包含X和Y的事务数与包含X的事务数之比,则可以将其记为:
这样可以表示关联规则X⇒Y的支持度代表关联规则的可信程度。
基于以上原理,在实际应用关联规则算法时,需要事先从数据库中找出事务数据项集中的所有频繁数据,然后基于产生的频繁项目集得到强关联规则。将关联规则算法应用到智慧环保系统当中,能够为处理环保系统中的海量检测数据提供一个更为严谨的逻辑程序,对于提升数据处理分析效率和质量具有重要作用。
在智慧环保系统中,脱硫监测与大气环境质量之间有着密切的联系。现阶段的脱硫监测更多应用于工业企业的生产环境。例如,以火力发电方式为主的发电厂会受到煤炭资源的影响,在生产中排放二氧化硫等对大气环境破坏较为严重的污染物质。基于这一要求,脱硫检测系统需要结合脱硫设备的应用情况,充分发挥互联网技术、数据采集技术、人工神经元网络、分布式数据处理等技术,以在线监测污染物排放情况和污染净化治理设备运行情况的方式,通过数据采集和处理实现对环境污染的综合管理,从而为后续规范污染物排放和环境治理工作提供更为科学可靠的参考依据。在此过程中,考虑到需要进行脱硫监测的数据范围较大,且不同数据间的关系较为复杂,具有较为明显的实时性特点,所以在设计脱硫检测智慧环保系统时,需要注重在保证检测数据结果可靠性的同时,提升脱硫监测的效率,确保获取的数据能够满足环境监测和治理的要求。
隆化县农村金融服务主体较少,机构网点分布密度较低,数量不足。“政银企户保”模式下农村信用社发放小额贷款的比重较大,但农信社网点少,业务人员不足,ATM 机、POS机等设备数量稀少,金融服务落后。滞后的金融服务和金融覆盖空白区使金融精准扶贫的能力受到制约。并且隆化县农户信用体系建设滞后,农村金融在信贷资金、农业保险等领域的创新非常有限,现有金融产品与企业贷款需求不匹配,影响扶贫的精准性。随着保险在“政银企户保”模式中的地位凸显,相关的农业、产业保险对于保障贫困户利益起到重要的兜底作用,但农业产业的险种不健全、创新性不强,客观上阻碍了保险保障作用的进一步发挥。
环境监测作为环境保护的重要组成部分,能够为环境治理工作的开展提供更加准确的数据信息,在判断监测区域范围环境污染程度和受到污染的主要因素后,可以及时采取适合的措施,对提升环境保护的效率和效果具有重要作用。将数据挖掘技术应用到脱硫检测的智慧环保系统设计中,需要结合监测区域的实际情况进行分析。基于此,本文选择发电厂这一需要脱硫监测的环境作为研究对象,着重探讨利用关联规则算法的数据挖掘技术在脱硫监测智慧环保系统中的应用情况。
以发电厂的企业区域为主要研究对象,在选择脱硫监测数据时,首先需要在充分考虑电厂脱硫设施工序的前提下,对每个脱硫设施设置一个监测点。结合电厂应用的脱硫处理方法不同,明确脱硫监测应考虑的具体指标。例如,应用石灰石石膏湿法进行脱硫处理,需要进行监测的数据主要包括工厂烟囱监测参数、烟气脱硫设施监测参数等。其中,脱硫设施的监测应体现脱硫设施出入口温度,锅炉侧的主蒸汽压力大小、二氧化硫浓度、pH值等指标。利用数据挖掘技术,能够分析工厂实际运行中存在的工况不稳定、异常及非正常工作下得到的监测数据,并基于数据分析结果发现监测数据变化的规律。基于这一目标,在对监测数据进行预处理时,主要选择应用脱硫技术前的脱硫监测数据与应用脱硫技术后得到的监测数据、应用脱硫技术后不同时间的监测数据结果进行对比,从中找出监测数据存在较大波动的情况,并对其产生波动变化的原因进行分析。
在完成数据的选取和预处理后,应明确要进行属性分析的脱硫监测数据,本文主要选择电厂脱硫设施中的机组负荷A1、设备出口烟气二氧化碳浓度A2、设备旁路挡板出口压力A3、设备烟气进口氧气浓度A4、设备烟气出口温度A5、脱硫塔出口处烟气量A6、设备烟气出口的氧气浓度A7、设备升压风机前温度A8、设备旁路挡板进口压力A9、设备进口烟气二氧化硫浓度A10、增压风机的电流A11、燃煤量A12、吸收塔pH值A13、浆液循环泵的电流A14作为研究对象。
在基于关联性规则算法构建脱硫数据结构模型时,考虑到每个参数属性的单个计算数据之间缺少一定的关联,首先要通过构建参数波动模型的方式,应用a priori算法来分析以上参数间的相关性,得到脱硫效率曲线,如图3所示。
图3 脱硫效率曲线
为方便研究,本文主要列举部分参数的相关性:
在对以上数据的属性参数进行标准化处理后,以差值计算的方法得出电厂脱硫监测设备在满足4个条件的情况下才能够代表其处于正常工作状态,即:
以上条件就是电厂脱硫监测设施的参数波动模型。结合电厂生产经营的实际情况,在建立参数波动模型过程中,相关属性参数都是由脱硫设施运行产生的。在得到一个脱硫设施的参数波动模型后,可以通过电厂的其他监测点位的脱硫设施参数波动情况对模型条件进行验证,以此来确保得到的参数波动模型符合实际的脱硫检测需求。
在完成参数波动模型的构建后,就需要构建参数预测模型。在基于关联规则算法的前提下,可以在应用数据挖掘技术的情况直接利用关联规则的属性对脱硫监测得到的数据属性进行选择。
在选择数据的过程中,主要可以应用CFS评价算法和Best First的搜索算法。基于此,在选择数据属性的过程中,需要尽可能减少数据集中相关性不大的参数属性,从而降低实际进行数据挖掘的成本,以更简化的数据模型来满足数据监测和挖掘分析的要求。在此前提下,可以设置xi的线形性组合方式,并利用其建立y的模型,在对响应输出属性y与一组预测输入属性的关联进行分析后,就可以得到与脱硫效率相关的属性参数值,然后应用多元线性回归方程对其进行计算。设预测的脱硫效率值为Z,则可以应用以下公式计算预测的脱硫效率值:
得到的这一计算公式即电厂脱硫监测数据参数的预测模型。将实际测得的监测数据与预测模型中得到的数据进行对比,可以通过是否位于误差范围内来验证脱硫设施是否处于正常的运行状态。在得到预测参数模型之后,以某电厂的脱硫设施监测情况为例,可以得到如图4的数据监测结果对比散列图。
图4 脱硫数据预测结果与实际监测结果的对比散列图
结合电厂脱硫监测数据及图3中的对比结果,发现预测数据结果与实际监测结果相差最大值为4%,由此可以发现,尽管应用数据挖掘技术构建模型,仍会导致实际监测结果与预测存在出入,但在考虑电厂实际生产环境变化的情况下,应用数据挖掘技术能够将监测数据的误差控制在5%以内,对于提升数据挖掘分析结果的准确性具有重要的意义。
将数据挖掘技术应用于脱硫监测智慧环保系统中,能够充分发挥数据挖掘技术全面感知、智能化、较强的可靠性和传递性,支持智能处理等方面的特点,直接基于数据挖掘来获取相应的环保监测信息,并使其在环保事业发展中发挥更大作用。结合本文对数据挖掘技术应用的分析,发现虽然数据挖掘技术具有一定的应用优势,但作为近年来兴起不久的技术,其在发展中仍会受到噪声数据或缺损数据的影响。由于当前需要进行挖掘处理的环保数据信息内容较为丰富,数据结构形式也较为复杂,所以在应用数据挖掘技术时,应充分考虑更高的算法效率,在融合知识领域的前提下,补充优化数据挖掘技术的不足和局限性。例如,在应用数据挖掘技术时,可以将可视化技术与算法内容结合起来,简化构建数据模型的流程,为提升关联规则挖掘算法的应用效率创造良好的条件。在研发数据挖掘技术的过程中,也需要注重保障数据信息的安全,确保数据挖掘技术的应用效果。考虑到智慧环保系统中含有的数据信息较为广泛,对于数据挖掘技术的研发还需要将其与实际应用领域需求相结合,注重提升数据挖掘技术应用的针对性效果。
综上所述,将数据挖掘技术应用到脱硫检测智慧环保系统设计中,能够充分发挥现代科学技术的作用,提升环保决策的科学性、有效性及环保工作的效果。基于数据挖掘技术的应用原理,在设计脱硫监测智慧环保系统时,应注重选取真实有效的脱硫监测数据,在充分结合关联性规则的前提下构建脱硫数据结构的模型。考虑到当前脱硫监测是以工业企业的生产经营环境为主,在实际进行脱硫监测系统设计时,应考虑企业生产经营的实际情况,充分发挥数据挖掘技术与关联规则算法的作用,利用参数波动和参数预测模型满足对脱硫环境效果进行监测的要求。