多层免疫模型的研究及其在TE过程中的应用①

2021-11-10 02:57王雪洁袁宝红
关键词:特征选择抗原抗体

王雪洁, 韦 颖, 袁宝红

(安徽三联学院,安徽 合肥 230601)

0 引 言

当今社会已经跨入了基于大数据的AI时代,人工智能快速发展,并在人们的生活和生产中得到了广泛的应用。工业生产过程中可能出现问题的复杂性也在不断提高,这里的复杂性指的是:生产过程中的输入输出包含两个或者更多个变量,呈现多输入多输出的关系,此外变量之间还存在耦合影响,变量本身具有已知或未知的时变性。这样的复杂工业过程,其间的变量多,变量间的关系复杂,想要保证生产的顺利进行,必须将系统的故障率维持在较低水平,所以故障诊断技术对当今的工业生产具有作用显而易见。目前各种故障诊断的方法[1][2],如基于知识、基于解析模型、基于数据驱动的方法等都得到了较多的研究,而单一的某种方法不尽完美,故提出了一种基于多层免疫模型的混合式故障诊断方法。

1 多层免疫模型的设计

传统的免疫算法是从医学中免疫突破演化而来,把免疫学中的抗原当作待优化问题,抗体当作待优化问题的可行解,免疫记忆细胞为可行解中较好的解或最优的那部分解,最优的抗体对抗原具有最佳的亲和力。针对工业生产的复杂型,系统中各节点之间的相关性,可能产生故障种类的多样性,设计了多层免疫模型。

多层免疫模型设计为三个层次,第一层为固有层,第二层为网络传播层,第三层为自适应层,如图1所示。

图1 多层免疫算法模型

1.1 固有层

固有层包含自体库和故障知识库,自体库中存放了系统无故障情况下的特征向量,故障知识库则存放了已知的故障类型,以对应的B细胞以及抗体的形式保存,当故障出现时,可进行故障的快速定位和分类。抗体检测的具体步骤为:

Step1:定义待测数据为抗原;

Step2:自体库比较,如果抗原与自体库匹配结束,否则进入Step3;

Step3:读取已有故障知识库中的抗体,计算亲和力并比较;

Step4:如果亲和力大于阈值,则有能检测出抗原的抗体,输出相应的故障类型,否则进入Step5;

Step5:若所有抗体比较完成,则提呈抗原至网络传播层,否则返回step3。

1.2 网络层

网络层是基于免疫细胞之间可以相互刺激或协调而建立的,故障产生的原因不一定在故障源,也可能在节点处(如传感器故障)。所以该层中每个免疫细胞可对应一个传感器,如图2所示是由5个免疫细胞对应的免疫网络结构,比如说免疫细胞5同时和免疫细胞2、3、4都建立着相互的关系,所以5的状态取决于2、3、4当前的状态,2、3、4的变化会带动5的变化,所以网络层有益于故障的动态定位。

图2 免疫网络结构图

由于网络层的存在,可以进行具有关联性变量进行判断,经过网络传输层相应的故障抗原对应的特征变量可以被筛选出。

1.3 自适应层

网络层将已特征提取的抗原信息传递到自适应层,在该层中对传统的免疫算法加入免疫优势(Immunodominance)算子[3],首先构建免疫优势算法:

2 算法模型性能的仿真测试

自适应层是多层免疫模型的最底层,其中嵌入的免疫优势算法(Immunodominance Clone Algorithm, IDCA)对固有层知识库的建立起到至关重要的作用,所以先对该算法寻优的有效性进行仿真测试。选择常用标准函数中的Rosenbrock函数和Rastrigin函数进行算法性能测试,图3和图4为两种函数在实验过程中的最佳收敛曲线图。

图3 Rosenbrock收敛曲线

图4 Rastrigin收敛曲线

并将大量多次测试得到的结果和一般免疫算法(General Immune Algorithm,GIA)在寻优率方面进行了比较如表1所示。由表1可见,IDCA从平均最优值、收敛代数、达优率等方面均优于GIA。

表1 IDCA/GIA标准函数测试比较

3 TE模型的故障诊断

TE(Tennessee Eastman)过程是基于真实工业过程,由美国伊斯曼公司创建出来的过程控制模型案例,该模型案例的建立为工业过程控制的各种方法研究提供了基于现实的仿真基础[4]。TE过程是闭环控制过程,过程中包含反应器、冷凝器、气液分离器、循环压缩机和汽提塔,此外材料主要包含8种,A、B、C、D是气体,B为惰性组分,G和H为液态产物,F是副产品,其反应过程为[5]:

TE仿真平台可以仿真正常的工作情况和21个预设的故障。其中,故障1~7的产生是由于过程变量的阶跃变化,如进料成分的变化,故障8~12产生是由于过程变量的随机变化,故障13、14、15、21的产生与缓慢漂移及与阀门的粘滞和位置有关,其余为未知故障。分别选取三类主要故障中的故障1、9、13进行基于多层免疫模型的故障诊断实验。

TE过程包含的11个控制变量和41个测量变量,共52个,所以用多层免疫模型进行仿真时抗体的编码长度为52。为提高故障诊断的准确率,故障诊断前首先对欲判断的故障进行特征选择。采用基于免疫优势算法的SVM进行的特征选择,这是一种典型的Wrapper方法特征选择,免疫优势算法的高效搜索能力有助于SVM核函数的确定,进行特征选择[6]。

下面先以故障1为例介绍特征选择的结果,特征选择参数设置:抗体种群规模为50,变异因子0.08,迭代次数设为600,抗体编码长度52,选取正常数据160组,故障数据800组。特征选择的情况如图5所示,由图5可知阶跃变化产生的故障1对应的变量1和44为特征变量,如此可对故障1进行编码的时候对应变量1和44的基因位编码为1其它的基因位编码为0。

图5 故障1特征选择结果

特征选择之后用基于多层免疫模型的故障诊断方法对故障1、9、13进行故障识别,识别的准确率如表2所示。

表2 故障识别准确率

由表2可知,所有故障的平均准确率达到了93.83%,且三种故障每种的独立识别的准确率都达到了90%以上,尤其是故障1准确率达到了100%。由此可见,多层免疫模型可以对TE模型的故障进行识别,并且平均诊断率较高。

4 结 语

根据人体免疫学,在传统免疫算法的基础上,设计了用于故障诊断的多层免疫算法,常见的故障可在固有层中进行诊断,新故障类型在网络传播层中确定出特征变量后,进入自适应层,利用自适应层中的免疫优势算法进行故障识别,同时将新的故障信息存储在固有层的故障知识库中。经仿真实验基于多层免疫模型的故障诊断方法在TE过程的故障诊断中起到了良好的作用。

多层免疫模型对于故障诊断还有研究发展的空间,通过研究可知在单种故障诊断中该模型起到了不错的效果,但在多种故障及故障分类中还有应用研究的空间,可在以后的研究中完成。

猜你喜欢
特征选择抗原抗体
苏州市D抗原阳性无偿献血者C和e抗原阴性率及其筛血策略*
血清铁蛋白、IL-6和前列腺特异性抗原联合检测在前列腺癌诊断中的应用
抗GD2抗体联合细胞因子在高危NB治疗中的研究进展
携IL-6单克隆抗体靶向微泡破坏技术在兔MI/RI损伤中的应用
人-人嵌合抗丙肝抗体检测阳性对照品的研制及应用
负载抗原DC联合CIK对肝癌免疫微环境的影响
关于血型问题的释疑
一种用于抗体快速分离的嗜硫纳米粒子的制备及表征
基于智能优化算法选择特征的网络入侵检测
故障诊断中的数据建模与特征选择