数据驱动技术在石化工业运行中的应用

2010-08-15 00:47冯大春
石油化工自动化 2010年6期
关键词:石化工业驱动神经网络

冯大春,鲁 红

(仲恺农业工程学院a.计算机科学与工程学院;b.化工学院,广州 510225)

数据驱动技术在石化工业运行中的应用

冯大春a,鲁 红b

(仲恺农业工程学院a.计算机科学与工程学院;b.化工学院,广州 510225)

介绍了数据驱动技术在石化工业运行中应用的重要性。对石化行业过程历史数据的特点及建模过程中的处理方法、数据驱动技术的方法、建模步骤、数据驱动技术在石化工业运行中的应用等进行了回顾与总结。对数据驱动技术在石化工业运行中的发展方向做了讨论。

数据驱动;工业运行;优化

0 引 言

随着信息化技术的发展,各种先进控制系统已被广泛应用于石油化工行业,来自现场生产的运行数据以及产品质量方面的监测数据都得到很好的保存。这些数据中包含着用于生产运行、管理决策等方面的大量宝贵信息。如何从这些过程数据里面挖掘出用于生产工况、运行和控制的有用信息,并用这些信息指导企业的生产过程以及生产的优化运行,已是当前的一个热点研究问题。

在美国、西欧等发达国家近年来已投入大量的人力和物力,加强对该领域内的资助,期望通过生产数据分析来揭示、反映过程的内置变化,为提高产品质量提供有用信息,从而把数据资源的拥有优势转化为生产效益和产品质量优势[1]。但另一方面,据统计,在已有的数据库中90%以上的数据多年来无人问津,即所谓的“数据丰富,信息匮乏”现象[2]。由于从大量数据中挖掘有用信息的技术相对薄弱,而这些数据往往又包含了改进生产、解决瓶颈问题的有用信息,因此为了能够充分利用这些信息并发挥信息化技术在工业中应用的积极作用,以数据驱动方式的分析和优化手段将成为一项重要技术。该数据驱动方式,就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。在过去的十多年中,数据驱动的方法已经被包括石化工业在内的过程工业界广为接受。

1 石化行业中过程数据特点

通常,石化行业生产过程具有连续性、产品品种稳定、生产量大等特性[3]。相对于间隙式生产过程而言,其数据一般不需要处理“额外的离散维数”,即批与批之间数据差异[4],这种连续过程数据可以认为是稳态过程或是相对优化的状态数据。尽管如此,由于生产过程的动态特性,如产品质量要求变化、催化剂活性失活、换热器结垢、环境温度变化等,导致过程的操作点随着发生改变,这种稳态过程仍然是相对和暂时的。

过程数据代表了真实的工业过程状态,但由于石化工业生产过程的特性和仪表、传感器的因素,导致过程工业数据往往具有以下特点。

1.1 数据缺失

这里所述的数据缺失,一方面,由于传感器本身故障或者传感器信号传输、转换过程的异常,导致测量记录数据并不是生产过程的真实反映,这类数据一般是0、无穷值或者是不变的值;另一方面,工业生产数据记录往往集中在某一区域,而其他区域数据点很少。数据缺失将导致建模过程中无法得到完整的数据空间,可能引起模型的较大偏差。对于这类问题,当缺失数据较少,可以忽略缺失数据[5],这种方法实质是减少原始数据来换取建模数据的完备;而当缺失数据较多,往往需要利用多变量统计方法或人工智能方法对丢失数据进行填补,其中常用方法包括单一填补法[6]、多重填补法[7-8]、最大似然估计法[9]、人工神经网络[10]等。通过数据填补,产生一个完整的数据集,从而对这些数据集进行分析和建模。

1.2 数据存在显著误差

在石化工业中,由于过程的波动或者未测干扰(如测量仪表失灵、模型偏差、操作不稳定、设备泄漏等),引起测量数据中存在显著误差——测量误差和离群值。其中离群值是数据集中与众不同的数据,使人怀疑这些数据并非随机偏差,而是产生于完全不同的机制[11],它是测量值的不正常波动。通常,离群值对于基于数据驱动的建模结果有较大的干扰[12],因此,对于采集来的数据样本,需要进行离群值的处理。根据处理离群值的方式和侧重点不同[13],又可以分为以直接剔除异常值为目的的直接法和基于稳健回归方法的间接法。间接法可以检测和保留离群值,当然其影响在可接受范围。不当的检测方法容易导致掩盖(masking)现象(未识别出某些局外点)或淹没(swamping)现象(误判正常点为局外点)。对于离群值严重偏离正常点的情况,很容易定性辨识出来,而对于不是较显著的离群值,通常采用基于历史数据的统计方法进行建模检测。常见方法包括:对于线性系统,有以残差和距离为判断标准的经典检测方法[14],主成成分分析法(也称主元分析,PCA)[15-16]、偏最小二乘回归(PLS)[17]等,以及用于非线性系统的人工神经网络(ANN)[18]、支持向量机(SVM)[19]等方法。

1.3 数据漂移

数据漂移的概念,在含义上等同于机器学习领域中的概念漂流(Concept Drifting)[20]。后者主要指研究的隐含对象的变化或多或少会从根本上导致目标概念的改变。在石化工业中,实际研究数据样本随着时间总是会发生变化,也就是说,过程是动态变化的,引起这些变化如检测仪表本身的漂移、原料成分的变化、设备的结垢、环境温度的变化等。因此在基于数据驱动的过程建模中,要求目标模型要能够适应过程的这种变化,否则,将导致模型较大的误差甚至不可用的情况。由于这种变化本身较为缓慢,同时这些变化可能互相影响,因此,对这些数据漂移要有效地检测往往较为困难。对于这种数据漂移的处理,通常的有效方法是采用样本权重和时间滑动窗口的方法[21-23]。即随着时间的变化,逐渐丢弃较老的数据样本。

1.4 数据的高维与共线性

在石化工业中,为了更好地监控过程状态,通常需要设置大量的传感器。这样,一方面,较多的监测变量会导致数据样本的高维性;另一方面,由于化工过程的特征,导致许多监测的变量之间具有强的相关性,例如,精馏塔的塔顶、塔底温度等。这也形成另一种“数据丰富,信息匮乏”现象,过度的冗余信息数据,会导致数据驱动的建模过程中,模型变得复杂或者使得自变量的筛选变得十分困难。工业上克服这类问题的方法通常包括采用PCA和PLS[24-25]方法,将高维空间的问题转化到低维空间去处理。另一种处理方式是选取输入空间的非共线性子集来建模[26]。

1.5 数据的异构性

石化行业的计算机应用系统,如实时数据管理系统、生产调度管理系统、质量管理系统等,这些系统之间相互缺乏统一规划,造成企业的异构数据源。表现为数据库管理系统各不相同,数据模型、数据结构、数据的表现形式也不尽相同[27]。这为数据共享以及统一处理带来了较大的困难,并且也没有非常有效的统一解决方案。

除上述特点之外,在石化行业工业运行中,还存在数据取样和分析时间滞后、数据非线性等问题。

2 数据驱动技术的应用

2.1 运行优化与产品设计

运行优化是根据过程运行的环境和条件的变化来调节决策变量(即操作变量),从而使整个过程系统处于最佳状态,也就是目标函数达到最优[28]。通过提取历史过程数据相关信息用于后续运行中,可以使优化指标不断得到改进。例如,Irizuki等[29]利用基于神经网络和模糊集控制组成的混合技术,从炼油转化过程中提取熟练操作工的控制经验,以控制生产平稳运行,降低能耗等。陈丙珍等[30]将基于数据的方法应用于乙烯裂解装置的实时优化,原油精馏装置的稳态在线数据校正等方面。陈念贻等[31]将模式识别技术应用于某一炼化厂的延迟焦化装置中,并对其进行优化分析,有效提高成品油产量。沈剑韵等[32]利用降维模式识别为基础的人工智能优化原理,对燕山石化制苯车间抽提工段生产条件进行了优化,从而稳定了生产。这些技术的实施都为石油化工企业带来了明显的经济效益。此外,在基于历史数据和多元统计方法的操作条件优化基础上,还可以进一步用于产品的设计[33]。在炼化行业中一些相关的应用,例如Sebzalli[34],Chen[34-35]等人分别利用 PCA和模糊c-均值聚类方法,对炼油厂催化裂化过程操作空间进行识别并用于开发期望的产品操作策略。

2.2 过程监测与故障诊断

过程监测与故障诊断主要任务是对过程运行状态进行监控,分析系统异常,及时发现过程故障,并采取控制措施避免事故,以保证过程安全与平稳的运行[1]。基于数据的统计过程控制在石化行业已得到广泛的关注,其方法也从单变量统计过程控制(如Shewhart控制图、累计和图、指数加权平均图)向以主元分析为主的多变量统计技术趋进。基于多变量统计过程用于石化工业过程的监控始于20世纪80年代,相关的多变量统计方法报道文献也较多[1,36-39]。基于多变量的数据驱动的过程监测与控制也常称为多变量统计过程控制(MSPC)或多变量过程控制(MPC)。其采用的方法也主要是PCA,PLS,基于支持向量机以及它们与其他方法的混合算法。在石化工业中,一些典型的应用如:Kresta,J.V.等[40]采用 PLS,PCA等方法,进行流化床反应器性能监控以及重要过程变化的快速监测和识别。MacGregor J.F.等[41]利用多区组偏最小二乘(MBPLS)对聚乙烯管式反应器进行性能监控。Rotem等人[42]将基于模型的 PCA方法用于乙烯压缩机的故障诊断。Santen,A.等[43]解释了如何进行数据获取和数据统计分析并从中提取信息,并对石化流程中反应器的“热点”问题进行研究。Vedam等[44]开发了基于 PCA和有向图(SDG)方法并在 G2上实现,用于流化床催化裂解的故障诊断。

在国内,如梁军等[45]采用多变量统计过程控制对生产工况进行分析监测,并实现了基于动态PCA和动态PLS的工业流化床反应器监测、精馏柱性能监测、聚合反应过程监测、炼油装置监测等。李秀喜等[46]将数据挖掘技术应用于广东某石化厂的重质糠醛精制和重质酮苯脱蜡工艺中,对其生产运行状况进行监测,对生产的平稳运行起到了巨大作用。赵仕健等[47]根据基于主角度建立任意两个主元模型相似性的度量,提出了一种基于多主元模型的过程监控方法并应用于高温裂解炉的监控。

除了过程故障诊断,将数据驱动的方法用于传感器的诊断和恢复也有研究和应用[1,48]。

2.3 产品质量预测与控制

利用数据驱动方法进行离线或在线的产品质量预测,克服没有在线仪表或在线仪表价格昂贵、维护费用高等缺点,并进一步应用于控制回路以进行产品质量的调控,是近年来研究的热点。这主要是通过对目标控制变量建立软测量模型来实现。基于数据驱动的软测量模型实现方法仍然主要是PCA,PLS,SVM,人工智能算法(如神经网络、模糊神经系统等)以及它们的混合算法。在文献[49]中对软测量模型方法及应用都有综合的报道。在石化行业中,一些典型的应用如 Kamohara,H.等人[50]开发动态的基于 PLS的软测量模型,用于乙烯生产的在线质量监测,并设计相关规则以检验在线气相色谱仪的性能。Fortuna等[51]人开发了一个基于多层感知器(MLP)的复杂软测量模型用于预测精馏塔汽油浓度,模型采用三层神经网络,取得了较好的在线预测功能。Qin等[52]采用非线性有限冲激响应(NFIR)和神经网络 PLS方法对催化重整系统进行动态建模,克服了系统共线性问题,使模型预测性能得以有效改善。Wold等[53]讨论了一个多区组PLS和主元分析模型,并应用于渣油催化裂解过程。Macias等[54]利用模糊神经系统进行原油精馏塔的产品质量预测。而 Park等[55]利用局部加权回归以及非线性数据预处理,克服过程变量相关性以及非线性等问题,并结合PLS和PCA建模方法,用于塔的温度估计和产品组分估计。Bakhtadze等[56]将 Takagi-Sugeno模糊模型和基于过程知识的相联搜索算法,应用于缺少实验数据情况下的软测量建模,建立原油精炼过程的产品软测量模型。

在国内,相关的研究也较为活跃。包括如常减压、加氢裂化等装置的产品质量在线估计[57-64]等。

2.4 过程控制与控制器设计

一种方法,根据建立的软测量传感器,可以直接用来对产品进行闭环控制[1],如文献[65-67]等在基于不同数据方法建立的软测量模型基础上,提出应用于丁二烯精馏装置的推断控制方案。吴国良等[68]在建立乙烯浓度软测量预估基础上,对乙烯精馏塔实现质量卡边的节能优化控制。李振光等[69]介绍了结合软测量技术的连续重整装置塔产品质量指标内模控制器及相关先进控制软件实现。文献[70-71]也有相类似技术的工业应用报道。

另一种方法,将所测量的过程变量和产品质量之间的因果信息体现在主元分析或PLS分析得到的降维空间中,从而在这个低维空间中对产品质量进行控制。相关的文献也有讨论,如20世纪90年代初[72]提出了利用 PLS隐变量空间的特点设计控制回路与控制器,并设计动态PLS以解决控制过程的动态问题。熊丽等[73]讨论了基于 PLS隐变量空间优化和控制的理论基础及算法推导,在PLS框架下设计的控制系统可以实现良好的解耦功能和变量配对,并运用于一个蒸馏塔的仿真控制。Chen等人[74]在MPC控制框架内,利用 PLS和包含时滞变量的PCA模型,进行控制器的设计。尽管在学术上有较多研究,但成功的工业应用报道并不多。

3 数据驱动方法

文献[39]将基于历史数据的方法分为统计和非统计方法。典型的统计方法如PCA,PLS等,而非统计方法如人工神经网络、模糊神经系统、支持向量机等。

3.1 PCA

PCA主要是对样本变量和样本点组成的数据矩阵对象包含信息进行线性改组,在力保数据信息丢失最少的条件下对高维变量空间进行降维处理,因此较适用于特征提取与降维,常用于计算机算法的一些预处理或中间环节。但是PCA算法也存在不能很好处理数据非线性问题、难以确定最佳主元数、难以反映输入和输出空间的关系等问题,因此在PCA算法基础上形成了一些改进的PCA算法。在石化工业中,一些典型的改进算法包括:为了克服非线性问题和过程变量物理关系相结合形成的基于模型的PCA算法[42],和神经网络算法等相结合形成的非线性 PCA算法[58,75-76],以及用于适应过程动态特性的自适应和动态PCA算法,如递归(recursive)PCA[77],滑动窗口 PCA[78],时滞 PCA算法[45]等。

3.2 PLS

不同于PCA只对输入变量矩阵提取相关信息,PLS对输入变量矩阵和输出变量矩阵都进行降维分解,对输入与输出的得分矩阵同时提取成分(因子),再进行线性回归。这样模型考虑了输入变量与输出变量的关系,从而保证了模型的最优性。PLS广泛应用于石化工业过程质量预测、过程监控于故障诊断、过程控制等领域。但存在问题与PCA类似,都不能很好解决数据非线性问题,因此一些改进算法得以应用,如与神经网络相结合的NNPLS[52]。此外,其他一些改进算法,如基于滑动窗口或权重值的自适应 PLS[23,60]、递归 PLS[21]等也广为报道。

3.3 ANN

ANN模仿动物的脑神经元结构,由大量的简单神经元按一定规则连接构成网络系统,以求达到模拟人类形象直觉思维的目标。在本质上它是一个分布式矩阵结构,通过对训练数据计算,逐步求得神经网络连接的权值。人工神经网络已广泛用于石化工业过程的动态建模、系统辨识和控制、数据分析及故障诊断等方面。常用方法包括反向传播(BP)网络[79]、径向基函数(RBF)网络[80]、递推神经网络 (RNN)[81]、自组织映射神经网络(SOM)[82]等。另一方面,神经网络也存在容易陷入局部最小、全部知识存储于网络内部和难以提供可信的解释、模型性能的好坏取决于模型训练过程中样本数据的数量和质量等缺点。

3.4 神经模糊系统(NFS)

NFS是利用神经网络学习算法的模糊系统,并利用神经网络学习算法对模糊系统的参数进行调整。它既具有神经网络的非线性映射能力、学习能力、并行处理能力和容错能力,又具有模糊逻辑处理不确定性的能力[83-84]。其在石化工业建模和控制领域已经得到了广泛的应用[85-87],另外一些用于处理动态环境以及非线性环境的改进神经模糊系统也得以研究[64,88]。

3.5 SVM

SVM以统计学习理论(SL T)为基础,从Vapnik等[89]一开始提出便在机器学习领域引起人们极大的关注。SVM的关键在于核函数,通过选用适当的核函数,可以把低维空间向量集映射到易于划分的高维空间,并在此空间中构造最优决策函数。SVM在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势,使其在复杂化工领域得以应用。其应用包括工业模型的建立、质量监测、故障诊断等领域[90-91]。

3.6 其他数据驱动方法

除上述讨论的方法外,其他如独立元分析、相关分析、遗传算法、决策树,粗糙集理论,粒子群算法、典型变量分析、多变量统计控制图、可视化技术等方法也广泛得以研究和报道。但是,尽管每一种方法都有其优势,但也有其缺陷,单一的方法并不能很好适应过程系统的所有应用领域。因此,采用这些方法的组合算法可以起到取长补短的作用,这也是近年来人们感兴趣的研究热点之一(例如前文所述将PCA/PLS算法与神经网络算法相结合的算法)。PCA算法可以在不丢失数据有效信息的情况下减少变量的维数,但并不能很好地处理非线性问题,因此把PCA算法与神经网络结合,把主元作为神经网络的输入变量,既可以减少神经网络输入空间的维数,减少了神经网络的复杂度以及训练时间,同时也能有效提高模型的性能。

随着过程工业更先进信息系统的实施,从生产现场获得的变量数据将更加庞大而且更加精确,这为相关技术的应用提供了更加便利的条件。相信更多新的基于数据驱动技术的出现,将会在石化工业运行中发挥更加重要的作用。

4 基于数据驱动模型建立方法

无论数据驱动方法应用于石化工业过程哪个领域,根据历史数据建立数据模型都是一个必不可少的步骤。已有文献报道建立数据模型的方法基本都大同小异,主要步骤包括:确定目标变量和辅助变量、准备历史数据;数据预处理;选择合适建模方法,并建立模型,且对模型进行有效性校正;在一些应用中,如软测量或多变量统计控制中,还需要根据新的数据对模型进行更新。

5 数据驱动技术发展方向

虽然数据驱动技术在石化行业已经得到长足发展并带来显著效益,但基于数据驱动的方法在实际工业应用中,仍然存在一些需要研究或发展的方面。

5.1 统一的应用系统框架

现有研究方法和研究成果一方面反映了基于数据驱动方法本身的强大力量,另一方面,很大一部分研究还局限于单一的方法、有限的案例或者学术研究中。这些研究分散于工业过程的不同层次之中,如局部回路的监控、单一质量指标的操控、单个设备或过程的优化等。而对于类似石化行业等过程工业生产过程而言,存在着包括监控、控制与优化等各个层次的控制与优化环节,具体而言,涉及局部回路、单一装置、装置或过程之间及全局的质量优化或控制。因此,如何将数据驱动技术应用到大规模工业运行的每个环节中,从起初的监控分析扩展至整个工厂过程,由此建立起基于数据驱动技术的统一应用框架,通过这些不同层次之间进行数据信息交换,最终将数据驱动技术在过程各个方面的应用通过数据流联系起来,形成一个多层质量操控的数据驱动技术过程应用系统框架,这样可以为全面系统地研究数据驱动技术提出一种新的指导思路。Kano等[38]人在过程监控和控制层次上,提出了一个基于数据的工厂架构概念,对于相关研究具有一定启发意义。

5.2 统一的数据平台

尽管数据平台本身不属于数据驱动技术的范畴,但是数据驱动技术以历史数据为基础,模型的好坏通常和建立模型数据息息相关,特别是要在系统框架内来研究数据驱动技术相关问题,更离不开数据的完整与一致性。但是,另一方面,由于过程工业的数据可能来源于不同的数据源[27],因此需要按照统一的生产数据模型将生产数据进行重新组织分类,完成异构数据源的集成并向其他层次的应用系统提供一致的快速的数据共享服务,以保证数据的一致性。

5.3 基于数据驱动技术本身的统计理论问题

由于过程工业本身的特点,系统往往处于不确定、动态的过程中。复杂的工业过程决定了数据驱动技术在工业实际应用中,需要考虑如有效的数据预处理、模型选择、时滞选择、模型诊断(工业实际情况与选用的模型的吻合情况)、模型鲁棒性等问题。

5.4 软件系统的实现与应用

基于数据驱动技术的过程优化、监测与控制软件包的设计、系统整合及工业应用,是研究的最终目的。近年来,国外一些相关的商业软件如NeurOn-Line and G2[92],AspenIQ[93],Simca-P[94]为人所熟知,另外国内一些应用软件也得以在石化工业成功应用[95]。但总的来说,能应用于现场的、经济有效的相关软件包仍然有待进一步开发。

[1] 张 杰,阳宪惠.多变量统计过程控制[M].北京:化学工业出版社,2000.

[2] WANG X Z,MCGREAVY C.Automatic Classification for Mining Process Operational Data[J].Ind.Eng.Chem. Res.,1998,37(6):2215-2222.

[3] 杨宗斌.以信息化改造石化流程工业[J].信息化建设, 2003,(7):42-43.

[4] NOMIKOS P,MACGREGOR JF.MultivariateSPCCharts for Monitoring Batch Processes[J].Technometrics, 1995,37(1):41-59.

[5] SCHAFER J L,GRAHAM J W.Missing Data:Our View of the State of the Art[J].Psychological Methods,2002, 7(2):147-177.

[6] BELLO A L. Imputation Techniquesin Regression Analysis:Looking Closely atTheir Implementation[J]. Computational Statistics and Data Analysis,1995,(20): 45-47.

[7] ALLISON P D.Multiple Imputation for Missing Data:A Cautionary Tale[J].Sociological Methods and Reserach, 2000,28(3):301-309.

[8] 郭 超,陆新建.工业过程数据中缺失值处理方法的研究[J].计算机工程与设计,2010,31(6):1351-1354.

[9] JUHNSON R A,WICHEM D W.Applied Multivariate StatisticalAnalysis[M]. New York:Prentice Hall-International,1992:202-241.

[10] 张宏亭,李学仁,孔 韬.BP神经网络在缺失数据估计中的应用[J].计算机工程与设计,2007,28 (14): 3457-3459.

[11] HAWHINS D.Identification of Outliers[M].London: Chapman and Hall,1980.

[12] PEARSON R K.Outliersin ProcessModeling and Identification[J].IEEE Transactions on Control Systems Technology,2002,10(1):55-63.

[13] HADIA S,SIMONOFFJ S. Proceduresforthe Identification of Multiple Outliers in Linear Models[J].J. Amer.Statist.Assoc.,1993,88:1264-1272.

[14] KNORR E M,NG R T.Algorithms for Mining Distance-Based Outliers in Large Datasets[C]∥Proceedings of the 24rd International Conference on Very Large Data Bases. San Francisco,CA,USA:Morgan Kaufmann Publishers Inc.,1998:392-403.

[15] HOO K A,TVARLAPATI KJ,PIOVOSO M J,et al.A Method of Robust Multivariate Outlier Replacement[J]. Computers and ChemicalEngineering,2002,26 (1): 17-39.

[16] 王洪春,彭 宏.一种基于主成分分析的异常点挖掘方法[J].计算机科学,2007,34(10):192-194.

[17] BAO X,DAI L K.Partial Least Squares with Outlier Detection in Spectral Analysis:A Tool to Predict Gasoline Properties[J].Fuel,2009,88(7):1216-1222.

[18] ZHAO W X,CHEN D Z,HU S X.Detection of Outlier and a Robust BP Algorithm Against Outlier[J].Computers and Chemical Engineering,2004,28(8):1403-1408.

[19] JORDAAN E M,SMITS G F.Robust Outlier Detection using SVM Regression[C]∥ Proceeding,2004IEEE International Joint Conference on Neural Network,2004: 2017-2022.

[20] GAMA J,MEDAS P,CASTILLO G,et al.Learning with Drift Detection[C]∥ Proceedings of the Advances in Artificial Intelligence SBIA 2004:17th Brazilian Symposium on Artificial Intelligence.2004:286-295.

[21] QIN S J.Recursive PLS Algorithms for Adaptive Data Modeling[J].Computers and Chemical Engineering,1998, 22(4):503-514.

[22] 阎咸武,常俊林,邵惠鹤.基于滚动时间窗的最小二乘支机回归估计方法及仿真[J].上海交通大学学报,2004, 38(4):524-526.

[23] 汪小勇,梁 军,刘育明,等.基于递推PLS的自适应软测量模型及其应用[J].浙江大学学报(工学版),2005, 35(9):676-680.

[24] 张恒喜,郭基联,朱家元,等.小样本多元数据分析方法及应用[M].西安:西北工业大学出版社,2002.

[25] JOLLIFFE I T.Principal Component Analysis[M].2th. Berlin:Springer-Verlag,2002.

[26] GU YON I,ELISSEEFF A.An Introduction to Variable and Feature Selection[J].Journal of Machine Learning Research,2003,3(7):1157-1182.

[27] 冯 梅,刘 伟,王宏安.石化企业MES数据集成平台的设计与实现[J].计算机工程与应用,2004,40(26):192-196.

[28] 托马斯F埃德加,戴维M希梅尔布劳,利昂S拉斯东.化工过程优化[M].2版.张卫东,任钟康,刘光虎,等译.北京:化学工业出版社,2006.

[29] IRIZU KI Y,FURUHASHI T.Design of a Combined Control System Incorporating Knowledge Based System and ModelPredictiveMultivariableControlSystem and its Application to Refining Plant[J].Journal of Knowledge-Based Intelligent Eng.Systems,1999,3(2):147-153.

[30] 李 博,陈丙珍,胡惠琴,等.稳态过程在线数据校正技术的工业实施[J].石油化工高等学校学报,2000,29(10): 768-771.

[31] 陈念贻,钦 佩,陈瑞亮,等.模式识别方法在化学化工中的应用[M].北京:科学出版社,2000.

[32] 沈剑韵,王鑫泉,胡书柞,等.制苯车间抽提工段生产优化[J].石油化工高等学校学报,1998,27(10):743-748.

[33] JAECKLE C M,MACGREGOR JF.ProductDesign Through Multivariate Statistical Analysis of Process Data [J].AIChE Journal,1998,44(5):1105-1118.

[34] SEBZALLI Y M,WANG X Z.Knowledge Discovery from Process Operational Data Using PCA and Fuzzy Clustering [J].Engineering Applications of Artificial Intelligence, 2002,4(5):607-616.

[35] CHEN F Z,WANG X Z.Discovery of Operational Spaces from Process Data for Production of Multiple Grades of Products[J].Ind.Eng.Chem.Res.,2000,39(7):2378-2382.

[36] LIANG J,QIAN J. Multivariate Statistical Process Monitoring and Control: Recent Developments and Applications to ChemicalIndustry[J]. Chinese J.of Chemical Eng,2003,11(2):191-203.

[37] 田学民,曹玉苹.统计过程控制的研究现状及展望[J].中国石油大学学报(自然科学版),2008,32(5):175-180.

[38] KANOA M,NAKAGAWAB Y.Recent Developments and Industrial Applications of Data-based Process Monitoring and ProcessControl[J]. ComputerAided ChemicalEngineering,2006,21:57-62.

[39] VENKATASUBRAMANIANV,RENGASWAMYR, KAVURI S N,et al.A Review of Process Fault Detection and Diagnosis PartⅢ:Process History Based Methods[J]. Computers and Chemical Engineering,2003,27:327-346.

[40] KRESTA JV,MACGREGOR JF,MARLIN TE. Multivariate Statistical Monitoring ofProcess Operating Performance[J]. The CanadianJournalofChemical Engineering,1991,69(1):35-47.

[41] MACGREGOR J F,JAECKLE C,KIPARISSIDES C,et al.Process Monitoring and Diagnosis by Multiblock PLS Methods[J].AIChE Journal,1993,40(5):826-838.

[42] ROTEM Y,WACHSA,LEWIN D R.Ethylene CompressorMonitoring UsingModel-based PCA[J]. AIChE Journal,2000,46(9):1825-1836.

[43] SANTEN A,KOOT GL M,ZULLO L C.Statistical Data Analysis of a Chemical Plantnext Term[J].Computers& Chemical Engineering, 1997, 21 (Supplement 1): 1123-1129.

[44] VEDAM H,VENKATASUBRAMANIAN V.PCA-SDG Based Process Monitoring and Fault Diagnosis[J].Control Eng.Practice,1999,7:903-917.

[45] 刘育明,梁 军,钱积新.工业流化床反应器结块监视的动态PCA方法[J].化工学报,2004,55(9):1546-1549.

[46] LI X X,QIAN Y,WANGJ F.Process Monitoring Based on Wavelet Packet Principal Component Analysis[C]∥European Symposium on Computer Aided Process Engineering-13,2004:455-460.

[47] ZHAO S J,ZHANGJ,XU Y M.Performance Monitoring ofProcesseswith MultipleOperating ModesThrough Multiple PLS Models[J].Journal of Process Control,2006, 16(7):763-772.

[48] DUNIA R,QIN S J.Joint Diagnosis of Process and Sensor Faults Using Principal Component Analysis[J].Control Engineering Practice,1998,6(4):457-469.

[49] PETR K,BOGDAN G S S.Data-driven Soft Sensors in the Process Industry[J].Computers and Chemical Engineering, 2009,33(4):795-814.

[50] KAMOHARA H,TAKINAMI A,TAKEDA M,et al. Product Quality Estimation and Operating Condition Monitoring for Industrial Ethylene Fractionator[J].Journal of Chemical Engineering of Japan,2004,37:422-428.

[51] FORTUNA L,GRAZIANI S,XIBILIA M G.Soft Sensors for Product Quality Monitoring in Debutanizer Distillation Columns[J].Control Engineering Practice,2005,13(4): 499-508.

[52] QIN S J,MCAVOYB T J.Nonlinear FIR Modeling Via a Neural Net PLS Approach[J].Computers&Chemical Engineering,1996,20(2):147-159.

[53] WOLD S,KETTANEH N,TJ ESSEM K.Hierarchical Multiblock PLS and PC Modelsfor Easier Model Interpretation and as An Alternative to Variable Selection [J].Journal of Chemometrics,1996,10(5-6):463-482.

[54] MACIAS J J,ZHOU P X.A Method for Predicting Quality of the Crude Oil Distillation[C]∥Proceedings of the 2006 InternationalSymposium on Evolving Fuzzy Systems. United Kingdom:Ambelside,2006.

[55] PARK S,HAN C.A Nonlinear Soft Sensor Based on Multivariate Smoothing Procedure for Quality Estimation in Distillation Columns[J]. Computers and Chemical Engineering,2000,24(2):871-877.

[56] BAKHTADZE N,MAXIMOV E M,VALIAKHMETOV R T.Fuzzy Soft Sensors for Chemical and Oil Refining Processes[C]∥17th IFAC World Congress(IFAC'08). Seoul.Korea,2008.

[57] 俞金寿,刘爱伦.软测量技术及其在石油化工中的应用[M].北京:化学工业出版社,2000.

[58] 赵豫红.常压塔产品质量在线估计的非线性主元分析方法[J].化工自动化及仪表,2004,31(4):19-20.

[59] 刘桂英,周 琴.常减压装置初馏塔顶产品干点软测量的应用研究[J].计算机与应用化学,2008,25(5):587-590.

[60] 颜学峰,余 娟,钱 锋.基于自适应偏最小二乘回归的初顶石脑油干点软测量[J].化工学报,2005,56(8): 1511-1515.

[61] 陈 云,吕翠英.基于多元逐步回归和反向传播方法的粗汽油干点软测量模型[J].计算机与应用化学,2003,20 (6):845-847.

[62] 毛 帅,熊智华,徐用懋.常压塔柴油凝点动态软测量模型的研究[J].控制工程,2005,12(4):342-345.

[63] 徐国忠,王丹宇.催化裂化分馏塔轻柴油凝固点软测量[J].计算机测量与控制,2002,10(5):294-297.

[64] ZHONG W,YU J S.MIMO Soft Sensors for Estimating Product Quality with On-line Correction[J].Chemical Engineering Research and Design,2000,78(4):612-620.

[65] 郭庆武,张 湜.基于软测量的先进控制系统的实现[J].自动化博览,2003,20(5):35-37.

[66] 罗 刚,张 湜,牛彦杰.基于软测量技术的先进控制在DCS上的实现和应用[J].化工自动化及仪表,2005, 32(4):11-14.

[67] 薄翠梅,张 湜,林锦国,等.基于径向基函数神经网络的精馏塔优化控制[J].石油化工高等学校学报,2002, 15(3):57-60.

[68] 吴国良.先进过程控制在乙烯精馏塔中的应用分析[J].石油化工自动化,2002,31(4):31-38.

[69] 李振光,戴连奎.先进控制软件在连续重整装置塔系列中的应用[J].石油化工自动化,2003,(3):40-44.

[70] 李桂芝.先进控制技术在丙烯精馏塔控制系统中的应用[J].齐鲁石油化工,2002,30(2):160-162.

[71] 张克进,沈雁鸣.软测量在分馏塔粗汽油干点推断控制中的应用[J].自动化仪表,1999,20(11):17-19.

[72] KASPAR M H,RAY W H.Dynamic PLS Modeling for Process Control[J].Chemical Engineering Science,1993, 48(20):3447-3461.

[73] 熊 丽,梁 军,钱积新.基于偏最小二乘隐变量空间的控制器设计方法[J].化工学报,2007,58(2):403-409.

[74] CHEN G,MCAVOY TJ,PIOVOSOCM J.A Multivariate StatisticalControllerfor On-line Quality Improvement[J].Journal of Process Control,1998,8(8): 139-149.

[75] DONG D,MCAVOY T J.Nonlinear Principal Component Analysis-based on Principal Curves and Neural Networks [J].Computers and Chemical Engineering,1996,20(1): 65-78.

[76] 龚婷婷,黄道平,曾 辉.非线性PCA故障检测方法及应用[J].华中科技大学学报(自然科学版),2009,(S1):198-200.

[77] AIGHAZZAWIA A,LENNOX B.Monitoring a Complex Refining Process Using Multivariate Statistics[J].Control Engineering Practice,2008,16(3):294-307.

[78] WANG X,KRUGER U,IRWIN G W.Process Monitoring Approach Using Fast Moving Window PCA[J].Ind.Eng. Chem.Res.,2005,44(15):5691-5702.

[79] WILLISA M J,MONTAGUEA G A,MASSIMOA C D. ArtificialNeuralNetworks in Process Estimation and Control[J].Automatica,1992,28(6):1181-1187.

[80] 王旭东,邵惠鹤,罗荣富.分布式RBF神经网络及其在软测量方面的应用[J].控制理论与应用,1998,15(4):558-563.

[81] MANDIC D P,CHAMBERS JA.RecurrentNeural Networks for Prediction:Learning Algorithms,Architectures and Stability[M].Wiley,2001.

[82] NG Y S,SRINIVASAN R.Multivariate Temporal Data Analysis using Self-Organizing Maps.1.Training Methodology for Effective Visualization of Multistate Operations[J].Ind. Eng.Chem.Res.,2008,47(20):7744-7757.

[83] 张 凯,钱 锋,刘漫丹.模糊神经网络技术综述[J].信息与控制,2003,32(5):431-435.

[84] NAUCK D,KlAWONN F,KRUSE R,et al.Foundations of Neuro-fuzzy Systems[M].New York:John Wiley& Sons Inc.,1997.

[85] 段向军,朱 跃,陈乾伟.新型神经模糊系统及其在乙烯裂解炉建模中的应用[J].石油化工自动化,2007,(1):39-41.

[86] Fernández de Cañete J,CORDERO T,GIIJAS D,et al.An Adaptive Neuro-Fuzzy Approach to Control a Distillation Column[J].Neural Computing&Applications,2000,9 (3):211-217.

[87] BUCOLO M,FORTUNA L,GRAZIANI S,et al.Neuro-Fuzzy Modelling in Petrochemical Industry[C]∥the 7th MediterraneanConferenceon Controland Automation (MED99).Haifa,Israel,1999.

[88] RONG H J,SUNDARARAJAN N,HUANG G B,et al. Sequential Adaptive Fuzzy Inference System(SAFIS)for Nonlinear System Identification and Prediction[J].Fuzzy Sets and Systems,2006,157(9):1260-1275.

[89] VAPNIK V.The Nature of Statistical Learning Theory [M].New York:Springer Verlag,1995.

[90] YAN W,SHAO H,WANG X.Soft Sensing Modeling Based on SupportVectormachineand Bayesian Model Selection[J].Computers and Chemical Engineering,2004, 28(8):1489-1498.

[91] 李悦卿,金思毅,陶少辉,等.最小二乘支持向量机用于常压塔汽油干点的软测量[J].计算机与应用化学,2008,25 (8):928-930.

[92] GENSYM,INC. G2Neur On-Line?for Real-Time Performance Management[EB/OL].[2010-10-27].http:// www.gensym.com /index.php?option = com _ content&view=article&id=54&Itemid=61.

[93] ASPENTECH,INC.AspenPlus?[EB/OL].[2010-10-27]./http://www.aspentech.com/core/aspen-plus.cfm.

[94] UMETRICS AB. SIMCA-Q Products-Integrating Multivariate Technology into YourSystem[EB/OL]. [2010-10-27].http://www.umetrics.com/simcaq.

[95] 杨善升,陆文聪,陈念贻.DMOS优化软件及其在化工过程优化中的应用[J].化工自动化及仪表,2005,32(4): 36-39.

Application of Data-based Techniques for Petrochemical Industry Process

Feng Dachuna,Lu Hongb
(Zhongkai University of Agriculture and Technology, a.College of Computer Science and Engineering, b.College of Chemistry and Chemical Engineering,Guangzhou,510225,China)

The importance of data-driven techniques in the petrochemical industry is introduced.Some other aspectsabout data-driven techniques,including the characteristicsof historicaldata in petrochemical industrial process and data pretreatment methods in modeling,the applications fields in the petrochemical industry,data-driven methods,and development methodology are summaried.The future directions of data-driven techniques in the petrochemical industry is discussed.

data-driven;industrial process;optimization

TP273

A

1007-7324(2010)06-0028-07

2010-09-26。

国家自然科学基金资助(20976204)。

冯大春(1973—),男,讲师,博士,从事过程系统工程研究。

猜你喜欢
石化工业驱动神经网络
基于模糊PI控制的驱动防滑仿真系统分析
屈宏斌:未来五年,双轮驱动,砥砺前行
神经网络抑制无线通信干扰探究
轨旁ATC系统门控柜接收/驱动板改造
石化工业自动化控制及仪表控制探究
试析板式空冷器及其在石化工业中的应用与改进
松原石化工业循环经济园区建设项目环境风险管理研究
基于S3C6410的Wi-Fi驱动移植实现
基于神经网络的拉矫机控制模型建立
复数神经网络在基于WiFi的室内LBS应用