刘彩利
(西安外事学院,陕西 西安 710077)
当前工业领域已实现了分布式控制系统的普遍应用,多数用于采集海量运行数据信息,由于运行数据具备大数据级别的数据量、动态化、多元化、高维度化、强关联等特性,导致数据挖掘分析难度加大,为获取正确结论,需在数据挖掘分析前做好筛选等预处理工作。所以为获取有价值的数据信息,需采取更加成熟完善的数据预处理与挖掘技术[1]。在我国科技发展推动下,数据挖掘技术应用研究获得了显著成果,且实现了在工业领域的广泛应用。然而,多数情况下均是以单一式工业炉效率或者供电煤耗率为主要性能指标,对此在我国积极采取突破行业垄断与开放式市场等政策的形势下,工业领域需基于综合考虑工业炉运行成本,且优化运行[2]。
数据挖掘即数据库内的知识发现,是由海量数据中充分挖掘处理有价值的知识规则。数据挖掘主要是为了监控异常模式并寻求最佳模式,以历史数据信息预言未来发展动态,从而强化管理层决策水平与能力。在数据挖掘技术实际应用时,需安排专业人员加以操作,才可发现并评价知识。数据挖掘处理过程具有反复性,其运行流程[3]具体见图1。
图1 数据挖掘运行流程
其中,决策树、神经网络、K-means聚类与关联规则算法是最常见的数据挖掘算法。决策树即根据概率与图论树对比分析各决策不同的设计方案,以助于决策者获取最佳方案的风险分析方法,属于预测评估模型,为对象属性与对象值之间的彼此映射。神经网络即模仿动物大脑神经突触结构,以处理分析数据信息的一种数学模型,由多种简单输入与输出单元共同构成,各单元均具备各自的权重函数值。
关联规则负责挖掘数据各项集间的相互关系,表示方式具体为A-B(s,c),其中s与c为规则支持度与置信度,其是关联规则的关键指标,前者代表项集A与B共同处于同一事务内的概率,表示规则实用性,后者代表项集A事务内同时存在项集B的概率,表示规则明确性。关联规则运算流程[4]具体见图2。
图2 基于关联规则的数据挖掘流程
工业炉运行性能指标和煤质、机组负荷、运行参数息息相关,此关系于工业炉历史运行数据内呈现为煤质、负荷、运行参数、性能指标等数据项的关联关系,在定量化之后,则展示出工业炉实际运行状态的关联规则。基于关联规则处理运行数据,则可获取强关联规则,从中选择指定工况下相应优异性能指标的规则,各项相关参数最优值便可指导工业炉实现运行优化。以聚类与关联规则为载体的工业炉运行优化系统架构[5]具体见图3。
图3 工业炉运行优化系统架构
工业炉运行优化最佳值即现阶段工况下工业炉达到最优运行工况时,工业炉的目标函数与运行参数等具体值。运行优化工况涉猎环境、煤质、负荷等等,目标函数通常代表工业炉效率或者供电煤耗率,运行参数通常代表磨煤机组合、一次风量、二次风量、OFA风量、燃烧器二次风门开度等[6]。
工业炉运行参数最佳值确定也就是基于工业炉运行性能空间,以其性能指标达到作为目标函数的寻优问题,前提条件为以现阶段运行工业炉设备为载体。运行优化性能指标通常选择工业炉效率或者供电煤耗率作为性能指标,其合理性选择是工业炉运行优化的关键所在,而综合性能指标可全方位评估工业炉性能,并实现偏差分析。在确定工业炉运行参数最佳值之后,便可就其和性能指标、运行参数之间的偏差详细分析工业炉运行状况,以促使运行人员充分掌握设备运行特征,以调整工业炉运行状态,确保其长时间保持在最优运行工况下。
机组运行经济性和运行参数之间表现为繁杂的函数关系,但是具体明确体现机组最佳经济性的相关运行参数难度较大。在工业炉运行优化时,需充分考虑机组经济性的影响因素,尤其是可调整可控制因素[7]。
在其他参数既定状态时,以300 MW机组为例,分析基于排烟温度变化的工业炉效率,具体见表1。
表1 基于排烟温度变化的工业炉效率
由表1可知,在排烟温度上升的趋势下,其他参数不变,则工业炉效率呈现线性下降态势。因此,工业炉运行过程中,机组应最大程度上缩减造成排烟温度上升的因素,从而防止排烟热损失增加,工业炉效率下降,机组经济性受影响[8]。
机组在300 MW负荷下基于过量空气系数变化的工业炉效率具体见表2。
表2 300 MW负荷下基于过量空气系数变化的工业炉效率
机组在270 MW负荷下基于过量空气系数变化的工业炉效率具体见表3。
表3 270 MW负荷下基于过量空气系数变化的工业炉效率
机组在240 MW负荷下基于过量空气系数变化的工业炉效率具体见表4。
表4 240MW负荷下基于过量空气系数变化的工业炉效率
由表4可知,在过量空气系数逐渐增大的形势下,工业炉热效率不断攀升,直到最大值状态,随后开始降低。过量空气系数上升时,出现最佳过量空气系数。基于排烟温度与过量空气系数对工业炉效率的影响作用,以面向300 MW机组历史数据库的挖掘提取100%负荷条件下,过量空气系数与排烟温度的最优值,表明了关联规则的实践应用。
以面向300 MW机组历史数据库的挖掘提取100%负荷条件下,过量空气系数与排烟温度的最优值,表明了关联规则的实践应用[9]。其中,原始数据具体见表5。
表5 原始数据
其中部分原始数据是无效的,为降低数据挖掘复杂性,提高数据挖掘精确性,需清洗原始数据。在原始数据清洗时,则就用户在系统设置中设定的参数上下限值进行数据有效性检测,而针对偏离用户设定的取值区间数据,则看作无效数据,加以清洗。其中,机组负荷有效区间是[285,300];工业炉效率有效区间值是[1.4,1.5];排烟温度有效区间值是[124,135];过量空气系数有效区间值是[91,93];氮氧化合物区间有效值是[438,442]。清洗后的数据具体见表6。
表6 清洗后的数据
以粒度离散化数据,把连续属性数据值域范围具体划分为间隔相同的子区间,以特殊符号或者整数值代表各子区间。系统内机组负荷粒度设定为4,离散之后的数据11表示[296,300],基于设定过量空气系数粒度为0.02,排烟温度粒度为2,工业炉效率粒度为0.5,氮氧化合物粒度为1,可获取对应离散值,即离散后的数据具体见表7。
表7 离散后的数据
以关联规则挖掘技术挖掘离散后数据,以获取满足置信度要求的关联规则11∧25∧35∧51⟹41。在反离散化之后获得机组负荷[285,289]∧过量空气系数[1.48,1.5]∧排烟温度[132,134]∧氮氧化合物[438,439]⟹工业炉效率[91,91.5],以区间中心值为目标值,获取100%负荷下过量空气系数目标值1.49,排烟温度目标值133 ℃,氮氧化合物目标值438.5 mg/m3(标准),此时工业炉效率则会达到91.25%。以此数据挖掘方法运用在其他负荷下的最优化目标值确定中,并将运行最优化目标值看作设定值,以开展试验[10],结果具体见表8。
表8 运行优化前后的工业炉效率 %
由表8可知,利用关联规则挖掘确定的工业炉运行参数最佳值应用在工业炉运行中,可显著提升工业炉运行效率,还可促使工业炉运行效率维持在较高且较稳定的水平状态,同时可在很大程度上降低氮氧化合物排放量。
综上所述,在海量传感器数据与专家经验提供了许多机组运行状态信息,以数据挖掘方法对信息资源进行加工利用,有利于工业炉运行优化,并提高机组经济性与可靠性。因此,本文在运行优化过程中引进了数据挖掘技术,提出了基于数据挖掘技术的工业炉运行优化方法,并在关联规则辅助下确定了运行优化最佳值。同时对工业炉运行优化方法进行了实际应用分析,结果表明,利用关联规则挖掘确定的工业炉运行参数最佳值应用在工业炉运行中,可显著提升工业炉运行效率,还可促使工业炉运行效率维持在较高且较稳定的水平状态,同时可在很大程度上降低氮氧化合物排放量。