串联生产系统维护在线决策与缓冲分配联合优化

2021-04-01 01:58陆志强张之磊

同济大学学报（自然科学版） 2021年3期

陆志强，张之磊

（同济大学机械与能源工程学院，上海201804）

质量控制和设备维护是生产系统的关键环节，为了提高生产系统的加工质量，保证其具有一定的生产加工能力，科学地制定维护策略和质量控制策略至关重要。视情维护是一种基于设备状态的维护策略，其已被证明在节约成本和提高生产系统可用性方面具有优势［1-2］。但考虑技术限制，视情维护的状态检查工作和设备维护活动均需停机完成［3］，而在串联生产线中停机会造成上游设备的堵塞和下游设备的饥饿，导致生产损失。为解决这个问题，一方面，开发设备维护的在线决策策略可以避免设备的停机检查，减少设备停机次数；另一方面，科学合理的配置串联生产系统的缓冲容量可以减少由于上下游设备停机导致的饥饿和堵塞，从而降低生产损失。设备维护、加工质量与缓冲容量总是交互地影响加工过程，研究其联合优化策略具有重要价值。

在制造系统中，利用缓冲区库存可以有效减少由设备维护造成的生产损失，保证设备维护时其上下游设备仍能正常生产，因而带有缓冲库存的设备维护问题成为国内外学者的研究焦点。对双机系统，郭闻雨等［4］以带缓冲的双机系统为研究对象，结合随机波动的加工能力指标与可靠度，动态地描述设备的综合性能退化程度，并研究了维护计划与缓存配置的联合优化方法。Dimitrakos等［5］假设系统中的上游设备会发生故障、下游设备为完美，以Markov过程对上游设备的维护阈值进行优化，并证明了设立缓冲区对于生产系统的成本优势。GAN等［6］研究维护、缓冲库存和备件库存之间的相互作用，建立联合优化模型实现生产系统长期成本的最小化。Ribeiro等［7］针对带瓶颈的两机系统，利用混合整数线性规划模型优化瓶颈设备及其上游设备的维护策略与中间缓冲区容量。对于多机串联生产系统，刘勤明等［8］和Nahas［9］分别以设备缓冲量和预防性维护周期为联合决策变量，优化生产系统的成本。王林等［10］以预防性维护阈值和缓冲区容量为决策变量，提出预防性维护与缓冲容量分配的联合优化模型。成国庆等［11］假设上游设备不能修复如新，以缓冲区库存控制和设备更换前故障次数为决策变量，运用几何过程建立了退化系统维修更换模型。

上述研究大多针对设备停机故障因素，维护策略均采用等周期或基于役龄的计划维护策略，在生产加工开始之前即确定了维护计划，这会导致进行维护时没有利用设备加工过程的实时信息，增加设备提前或延后维护的风险，造成维护资源和生产资源的浪费。本文针对现有研究的不足，以加工质量发生退化的串联生产系统为研究对象，提出一种基于工件质量指标的在线维护策略，根据加工质量判断设备退化状态从而作出实时决策，并通过与缓冲分配策略的联合优化进一步减少停机损失，通过与计划维护的比较验证了模型的有效性。

1 问题描述

以串联生产系统为研究对象，生产系统在计划期L内生产单一产品，产品需求量为D，未满足的需求会产生缺货成本。系统共包含M(M≥2)台加工设备，工件从第一台设备进入系统，顺次经过各设备和缓冲区后加工成合格产品，从最后一台设备离开系统。设备i加工一个工件的时间为pi。系统中缓冲区的总容量限制为B，设备i与设备i+1之间的缓冲区容量为Xi。对系统假设及符号定义如下：

（1）产品的流动时间忽略不计，第一台设备不会饥饿、最后一台设备不会堵塞；

（2）设备在加工过程中不断发生退化，每台设备均有S个等级的退化状态；设备在状态间的跃迁服从马尔科夫过程，不考虑设备的故障停机，设备的初始状态为全新；

（3）设备状态影响加工质量，设备i在退化状态s下以不合格品率ui，s加工工件；

（4）每台设备后均设有检查工位，假设检查是瞬时完成的，能够甄别出合格品与不合格品，不合格工件立即在该设备上进行返工，如图1所示；

（5）在工件加工的间隙可以进行设备维护，维护可以将设备恢复到全新状态。

图1 带有质量检查工位与缓冲区的生产线示意图Fig.1 Serial production system with quality inspection stations and intermediate buffers

为减少不合格品带来的生产损失，需要合理地制定维护策略和质量控制策略、安排维护活动，同时决策各缓冲区的容量配置，优化产线平衡、提高生产率，减少缺货成本、在制品库存成本、设备维护成本以及工件返工造成的额外成本，使系统总成本最小化。

2 问题建模

2.1 设备退化及维护建模

假设设备的多状态退化模型服从离散时间马尔科夫过程，该过程有如下属性：

式中：Pr(⋅)表示取概率函数；si(tn)表示设备i在第n次跃迁后的状态；tn表示第n次跃迁的时刻。式（1）表明设备在n步跃迁的马尔科夫过程中，第n步跃迁的概率只与第n-1步跃迁后的状态有关，而与n-2、n-3、…、1、0步跃迁后的状态无关。马尔科夫过程的状态跃迁概率为

式中：qi，g，k表示在一次跃迁中设备i从状态g跃迁至状态k的概率；Δt表示每一次跃迁经过的设备累积加工时间。由全概率公式有：

设备在初始状态下为全新，有：

假设设备的退化是一个单调不可逆的过程，则有：

设备在状态间的转移为隐马尔科夫过程，设备的状态序列为隐含状态链，而不同状态下设备以不同的合格品率加工工件，通过工件质量检查，工件质量序列则构成可见状态链。设备维护可以改善设备状态，从而提高加工质量、减少不合格品及返工。通过对工件加工质量的监测和决策可以实现对设备状态的预测及维护的在线决策。因而，以累计不合格品数作为维护的决策依据，维护子模型的决策变量为：Q={Q1，Q2，...，QM}，是由M个阈值决策变量构成的矢量，分别表示每台设备进行维护时的累计不合格品数。记Oi，j表示设备i加工工件j的工序，记0/1变量ti，j表示设备i在工序Oi，j完成时是否发生跃迁，若是则为1，否则为0，变量ai，j表示设备i在上一次维护或跃迁直至工序Oi，j完成时的累积加工时间。则：

记0/1变量ri，j表示工件加工质量，工序Oi，j的加工质量不合格而需要返工则为1，否则为0，Ni，j表示设备i自上一次维护至工序Oi，j完成时加工的累计不合格品数，vi，j表示设备i在工序Oi，j完成时是否进行预防性维护，则：

变量si，j表示设备i在工序Oi，j完成时的状态，则：

该式表示设备进行维护后恢复到全新状态，状态跃迁后到达新状态，新状态为由跃迁概率矩阵决定的随机量，∏q(k)k表示依概率q(k)在不同情况下取值k，而既不维护也不跃迁时维持原状态。

图2表示在维护在线决策策略下，设备加工过程中设备状态与累计不合格品数随时间的变化，其中时间单位为工序的平均加工时间。显然：较大的阈值会增加设备在高退化状态下运行的风险，降低生产率，而较小的阈值会增加设备在较小退化状态下进行维护的趋势，造成维护资源和生产资源的浪费，因而合理的选择维护阈值是重要的。

图2 设备维护在线决策机制Fig.2 Online decision-making strategy of maintenance

2.2 缓冲分配建模

由于加工质量的不确定性，在设备之间设置缓冲区以吸收不确定性。由于缓冲区容量限制，设备在加工过程中会发生饥饿及堵塞。记变量pi，j表示工序Oi，j的加工持续时间，bi，j表示工序Oi，j的加工开始时间，di，j表示工件j离开设备i的时间。工件在设备上的加工流程如下：

假设设备i进行一次维护的时间TiP，则工序Oi，j的加工开始时间bi，j取决于该工件在上游设备上的离开时间di-1，j和上一个工件在设备i上的离开时间di，j-1：

若di-1，j＞di，j-1+vi，j-1⋅Ti，则设备i需等待上游设备供应工件而闲置，即设备i饥饿；若bi-1，j+pi-1，j＜di，j-1+vi，j-1⋅TiP，则工件j将进入缓冲区等待，若无缓冲空间则发生堵塞。若设备i的下游未堵塞，则工件j加工完成后立即进入缓冲区，否则工件需等待下游设备开始工件j-Xi的加工而释放缓冲空间，则工件j离开设备i的时间di，j为

假设工件在设备i上进行返工的时间为TiR，则工序Oi，j的加工持续时间取决于工件是否进行返工：

基于以上产品加工流程，设备的缓冲区库存与其上下游设备的关系如图3所示，图中以每道工序的平均时间为单位时间1，中间区域表示某设备i在加工过程中的缓存区库存数量变化，两侧区域表示该设备及其上游设备i-1和下游设备i+1的工作状态，即正常运行（图中空白区域）、维护、饥饿或堵塞。显然在缓冲区有容量限制条件下，上游设备的维护和饥饿会导致下游设备饥饿，而下游设备的维护会导致上游设备堵塞。因而合理地分配缓冲区容量和制定维护策略对于控制在制品以及减少设备的饥饿和堵塞非常重要。

因此建立缓冲分配子模型的决策量为X={X1，X2，...，XM}，为由M-1个缓冲分配决策变量构成的矢量，分别表示每台设备后设置的缓冲区大小，由于缓冲区总容量为B，则：

2.3 成本建模

本文的目标为最小化生产过程的总成本。总成本包括设备维护成本、在制品库存成本、产品缺货成本以及返工造成的成本。假设cPi为设备i进行一次维护的成本，则加工过程中的维护总成本为

假设cS为单位时间内储存一件在制品的成本，则总的加工时间内的库存水平在数值上等于所有工件在所有缓冲区内的停留时间，因而加工过程中的库存总成本为

假设cRi为单位工件在设备i上进行一次返工的成本，则加工过程中的总返工成本为

假设cO为单位产品的缺货成本，则总的缺货成本为

2.4 联合模型

因此建立的随机规划数学模型为

式（10）为目标函数，表示包括维护成本、在制品库存成本、返工成本以及缺货成本在内的总成本最小化；式（11）表示缓冲分配约束；式（12）～（14）表示设备状态、累积加工时间以及累计不合格品数的初始化；式（15）定义了工件质量即工件是否进行返工，为由设备状态和工序不合格品率决定的随机量；式（16）定义了累计不合格品数的递推式；式（17）定义了设备在任意工件加工完成时是否进行维护；式（18）为设备上一次维护或跃迁后的累积加工时间的计算式；式（19）表示设备发生状态跃迁的时刻；式（20）为设备状态的计算式；式（21）～（23）表示工件加工流程，即在有限缓冲容量约束下，工件加工开始时间、加工持续时间及离开设备的时间的计算式；式（24）和式（25）定义了决策变量的取值范围。

3 算法设计

由于设备状态跃迁和工件加工质量的随机性，本文目标中的期望总成本无法通过精确表达式推算。另一方面，由于模型的规模以及加工质量的随机性使得模型求解变得复杂，无法使用CPLEX等商业软件进行直接求解。因此，本文首先根据数学模型提出蒙特卡洛仿真的具体算法，通过仿真获得期望总成本的近似值，以替代目标函数中的期望值。鉴于禁忌搜索算法对大规模问题的求解能力以及搜索时间的可行性，采用禁忌搜索算法框架对决策量Q和X的可行解进行迭代搜索，考虑串联生产线上下游设备的结构关联性，提出带有元胞自动机制的邻域结构优化算法搜索过程。

3.1 基于状态跃迁抽样仿真的成本估计

本文的目标函数为随机量的期望值，无法通过约束及可行解准确计算其目标值，因而通过蒙特卡洛仿真方法获得目标函数的近似值。根据第2节的数学模型，在确定的系统参数、缓冲分配及预防性维护阈值情况下，通过蒙特卡洛仿真方法得到系统的总成本C。

为保证结果的有效性，需要确定抽样仿真的次数。对抽样仿真的次数进行置信度分析，记生产总成本的置信区间为，其中，表示样本均值，S为样本标准差，n为抽样仿真次数，tn-1，α2表示自由度为n-1，显著水平为α2的t分布值。取α=0.02，即置信水平为98%。图4表示总成本的累积均值以及其上下偏差随抽样仿真次数变化的图，在抽样仿真次数为80次时偏差已控制在2%以内，因而取抽样仿真次数为80次。

3.2 禁忌搜索算法

禁忌搜索算法对大规模问题的求解能力及搜索时间的可行性适合本文模型的求解，采用维护阈值列表和缓冲分配列表的双列表编码方案（图5），设计初始化程序以调高初始解质量且保证充分的搜索空间，同时设计适合本问题的邻域搜索算子即元胞自动机制邻域结构以提高算法的速度和精度。

3.2.1 编码方案

维护阈值列表QL={Q1，Q2，...，QM}，采用与阈值决策矢量相应的长度为M（设备台数）的实值编码，第i个位置的值Qi表示设备i在累计不合格品数为Qi时进行预防性维护。缓冲分配列表BL={x1，x2，...，xM+X}，采用0/1二进制编码，xl=1表示台设备，任意两台设备间的0值个数表示设备间分配的缓冲容量。该编码方案有如下约束：

图4 累积均值及上下偏差随仿真重复次数变化Fig.4 Cumulative mean,and upper and lower deviation with replications of simulation

3.2.2 初始解

对于缓冲分配列表BL，其初始解采用均匀分配策略生成。对于维护阈值列表QL，由于邻域产生方式总体为增加式迭代，故将初始值设定为较小值，即：Qi～U(TiP(2TiR)，TiPTiR)。

3.2.3 邻域结构

对于缓冲分配列表BL采用随机交叉的方式产生其邻域，随机选择交叉位置k∈[2，M+X-2]且xk≠xk+1，其邻域 BLNEW={x1，x2，...，xk+1，xk，...，xM+X}，显然该种邻域产生方式不打破编码约束。

图5 禁忌搜索编码方案示意图Fig.5 Coding example of tabu search algorithm

对于维护阈值列表QL，考虑到串联生产系统上下游设备的结构关联性，借鉴元胞自动机（cellular automatan，CA）原理，引入元胞自动机制邻域结构。将QL的每个元素Qi视为一个元胞，定义其左侧和右侧的各r（称邻元半径）个元素集合为其邻元Qir，如图5元胞的更新依赖于该元胞及其邻元的值以及设定的更新规则，更新规则Qi*=f(Qi，Qir)为）

式中：ρ和z为随机量，ρ～U(0，ρmax)，z～N(0，σ)。第一项ρ·(max Qir-min Qir)保证邻域搜索的速度，第二项(1-ρ)z保证邻域搜索的精度。为解决在算法迭代后期不易收敛的问题，令ρmax=1-y Y1，y表示算法当前迭代次数，Y1表示算法最大迭代次数。随机选择更新位置k∈[1，M]，其邻域QLNEW={Q1，Q2，...，Qk*，...，QM}。该种邻域生成方式有两个经验取值：邻元半径r及正态分布的标准差σ。因而，在一次更新中的邻域结构为(QLNEW，BL)或(QL，BLNEW)。

3.2.4 禁忌及终止准则

为避免重复搜索，采用如下禁忌规则：对于BL，将搜索过的位置加入禁忌列表TLBL，对于QL，将搜索过且无改进的位置加入禁忌列表TLQL，当列表达超过列表长度上限后，采用先进先出的规则将最先加入列表的位置元素移除列表。当算法达到最大迭代次数Y1或最大连续无改进次数Y2时，结束迭代，算法流程图如图6所示。

图6 禁忌搜索算法流程图Fig.6 Flowchart of Tabu search algorithm

4 算例分析

现有研究大多单独研究维护优化问题、或是计划维护与缓冲分配优化问题，针对马尔科夫退化系统，还没有在线维护策略与缓冲分配联合优化的研究，下面通过与其他维护策略或是单独优化策略的对比验证本文模型的有效性。

记本文的联合优化模型为P0，与现有研究中广泛使用的三种不同策略对比：P1，采用等周期预防性维护策略，设备按照维护周期同时进行维护，Moghaddam等［12］采用该种维护策略，缓冲采用均匀分配策略，这是因为对于均衡生产线，缓冲容量均匀分配为最佳策略［13］，决策量即维护周期采用禁忌搜索算法求解；P2，基于役龄的预防性维护，陆志强等［14］采用该种维护策略，缓冲均匀分配策略，决策量即执行预防性维护的役龄阈值采用禁忌搜索算法求解；P3，基于役龄的维护计划和缓冲联合优化策略，王林等［10］采用该种策略，采用禁忌搜索算法求解。

4.1 基本算例分析

假设一串行系统由4台设备3个缓冲区组成，需完成数量为D=2000的加工任务，最大加工时间L=3000，缓冲区总容量为10×3，产品在每台设备上的加工时间均为单位时间pi=1，所有设备上的单位返工时间均为TiR=1，所有设备的维护时间均为TiP=20元。单位存储成本cS=0.015元，单位缺货成本cO=4元，所有设备上的单位返工成本均为

禁忌搜索算法最大允许迭代次数为100，最大允许连续无改进次数为8，现讨论经验取值(r，σ)对算法迭代过程的影响，r分别取0（对照组）、1、2，σ分别取5、10、20，最优目标值随迭代次数变化的曲线如图7所示（r=0时取σ中最优曲线绘制）。曲线表明，元胞自动机制邻域结构明显优于一般搜索策略，(r，σ)=(1，10)时优化效果较好，这是因为r=1充分利用上下游设备间的关联性，使得每台设备上下游间生产过程的局部平衡，而σ较小时算法搜索速度慢不易跳出局部最优解，σ较大时算法搜索速度快但容易在最优解附近产生震荡而不易收敛，σ=10可以较好平衡算法收敛速度、提高收敛精度，搜索到更优目标值，因而参数取值(1，10)。

图7 不同(r，σ)下最优目标值随迭代次数变化图Fig.7 Diagram of optimum value and iteration at different values of(r,σ)

如图8所示，本文的维护在线决策与缓冲分配联合优化模型的总成本为2 034.4元，而等周期预防性维护与缓冲均匀分配策略的总成本为2 304.4元，基于役龄的预防性维护与缓冲均匀分配策略下的总成本为2 291.4元，基于役龄的预防性维护与缓冲优化策略下的总成本为2 240.0元。可以看出，本文的维护在线决策与缓冲联合优化模型明显优于一般维护策略和单独优化模型，与单独优化策略（P1和P2）相比最低优化比例为11.2%，与维护计划与缓冲分配联合优化策略（P3）相比优化比例达到9.18%。

图8 不同策略下的总成本构成Fig.8 Component of total cost of different strategies

从不同策略下优化结果的总成本的构成来看，维护在线决策与缓冲联合优化模型主要通过降低返工成本实现降低总成本，对比模型中等周期预防性维护的返工成本最高、总成本也最高，基于役龄的维护计划次之。本文的联合优化模型有效地权衡了维护与质量，实现总成本的优化。

4.2 大规模算例分析

为验证不同参数下模型的性能，改变设备数量（M）、需求量（D）和缓冲区总容量（B）进行试验。数值实验的部分结果如表1所示，对比模型P的优化比例（Gap）计算为

式中：CP为策略P下生产系统的总成本。从表中可以看出本文模型和算法即P0总是优于对比策略，与单独优化策略（P1和P2）相比最大优化比例为15.15%，最小优化比例为5.53%，平均节约成本10.09%，与计划维护与缓冲联合优化策略（P3）相比，最大优化比例为11.32%，最小优化比例为4.41%，平均节约成本6.64%。

随机选取缓冲总容量为10(M-1)时绘制不同策略下总成本随设备数变化如图9a所示，在设备数小于10时总成本近似呈线性增长，继续增加设备数总成本增长加快，这是由于设备数持续增多，产出率下降导致产品缺货而产生较大的缺货成本。随机选取设备数为8绘制不同策略下总成本随缓冲区总容量变化如图9b所示，适当增加缓冲可以有效减少设备因上下游设备停机而停机，增加生产率降低缺货成本，但缓冲区容量过大时总成本有上升趋势，这是因为缓冲区容量过大时产生较大的储存成本。总而言之，不同的设备数及缓冲容量下，维护在线决策与缓冲联合优化策略总是优于其他策略。

表1 不同数据规模下本文模型与对比模型成本比较Tab.1 Cost comparison of proposed method and compared ones at different data scales

图9 不同策略下不同参数与总成本的关系图Fig.9 Diagram of parameters and total cost of different strategies

5 结束语

本文研究了串联生产系统维护、质量控制与缓冲分配的联合优化问题：

（1）针对串联生产系统的设备退化引起的不合格品因素，联合设备维护与质量控制提出设备维护在线决策策略，充分利用设备加工过程中的实时信息，减少设备提前或延后维护的风险；分析了设备在有限缓冲容量和加工质量不确定下的加工过程，建立了设备维护、质量控制与缓冲分配的联合优化模型。

（2）针对联合优化模型提出基于蒙特卡洛仿真的成本估计算法，采用禁忌搜索算法对维护策略的不合格品阈值和缓冲配置进行迭代搜索，为充分利用上下游设备的结构关联性，提出元胞自动机制邻域结构优化搜索过程。

（3）数值实验结果表明，本文提出的模型及算法与单独优化策略相比平均节约10%以上总成本，与现有的联合优化策略相比平均节省6%以上总成本。从成本构成来看，在线维护策略极大地减少了质量损失成本，证明了在不同设备数和缓冲区总容量条件下，在线维护策略、质量控制与缓冲分配联合优化方法的有效性。

（4）本文的质量检查结果为工件是否合格，未来研究中可以考虑具体的质量特性指标及其在串行生产线上的传递性。

作者贡献声明：

陆志强：提出研究选题，设计研究思路和论文框架；

张之磊：设计研究思路，实施研究过程，负责进行试验，起草论文及撰写。