基于加权信息熵的OC曲线性能评价仿真实验设计

2023-08-22 07:47赵嘉琪徐文浩樊树海
实验室研究与探索 2023年5期
关键词:指标值信息熵特性

赵嘉琪,徐文浩,樊树海

(1.南京工业大学工业工程系,南京 210009;2.麻省理工学院信息质量项目数据质量与信息安全实验室,美国马萨诸塞州02139)

0 引 言

质量检验工作作为对产品质量进行把关、预防、反馈、改进的过程,是全面质量管理的重要组成部分。抽样特性曲线(Operation Characteristic Curve,OC 曲线)性能分析是质量检验的主要分析方法。对OC 曲线性能的研究是质量管理与可靠性课程中的重要内容,也是学生理解与运用质量管理的重要工具之一。对企业而言,研究更先进的抽样特性评价指标、建立完善的质量评价体系有助于企业降低成本、保障产品质量、提升核心竞争力[1]。国内在质量检验评价体系方面尚处在探索阶段,缺乏具有科学性的评价标准[2]

在以往对OC曲线的研究中,文献[3-5]中研究了OC曲线的具体运用,但没有提出新的判定指标。近年,文献[6-7]中提出基于截距、斜率的抽样特性曲线性能评价等方法,来评判OC 曲线性能的优劣。相比传统方法——先变动抽样方案的单一参数绘制出OC曲线族,再根据经验直接对曲线族评判得出判断结果,用定量度量的方法评判出的结果更加准确、科学[8]。在新的市场需求下,生产的产品趋于多样化、定制化,产品特性千差万别,不同产品的生产情况之间存在较大差异。国内现有研究不能适配现今产品多样化与定制化的生产趋势,缺乏相应的OC曲线量化评价方法,研究用于教学时也不利学生对OC曲线性能的深入学习与理解。

本文针对以上问题提出了基于加权信息熵的抽样特性曲线性能评价指标,并以实验仿真加以说明。结果表明:新的指标与解决办法是有效可行的。该指标的发现与应用弥补了国内在质量检验方面研究的不足。该指标运用在抽样方案的对比与选取工作时,不仅操作便捷、不受传统方法的局限,又可以根据不同产品生产的实际情况做出针对性判断。新的指标与解决办法运用于教学仿真分析时,能够帮助学生对于抽样特性曲线的学习与理解;使学生能体会针对不同生产情况,如何对比选取更好的抽样方案,以最小的抽检成本,快速高效地判断产品批是否合格。通过在传统实验方法中引进相应的先进评价指标,目的在于培养学生的发散性思维,提升学生的应用能力,使实验与学习更具有实际应用价值,提高教学质量。

1 加权信息熵(Weighted Information Entropy)评价指标

1.1 OC曲线分析

OC曲线表示在给定的抽样方案中,批接收概率与批不合格品率的函数关系[5]。在生产制造业中OC曲线被广泛用于预估接收批的质量水平、确定批合格概率、帮助确定检查水平、确定生产方与消费方风险等[9-11]。在质量检验工作中,普遍会采用分析OC 曲线作为比较抽样方案鉴别能力的方法,此过程也是检验工作的重要环节之一[12]。分析OC 曲线的传统方法及步骤:

步骤1固定抽样方案的其余参数,根据单参数变化的影响规律筛选出较好的参数。

步骤2利用产生的数据绘制出OC 曲线族如图1 所示。

步骤3直接根据曲线族图由经验判断OC 曲线性能的优劣[13-14]。

该方法的弊端有

(1)对曲线族的对比与选取很大程度上依赖于质量管理人员的经验,是一种直观定性的判断方法,缺少严谨与准确的定量分析。

(2)对曲线族的对比,需要建立在仅单参数变化的前提下。在实际生产中,产品种类往往并不单一,特性不尽相同,那么检验时所应采取的抽样方案也会随产品特性和生产环境的差异而变化。因此无法按照传统方法——依据变动抽样方案的单参数产生的一系列数据,来评判OC曲线以及抽样方案的优劣。

综上所述,传统的评价方法不够严谨,在评价时无法根据产品的实际生产情况做出调整,限制条件较多,适用面也较狭隘。这不仅会阻碍实际生产活动中检验工作的开展,在运用于教学实验时也会给学生的理解与运用造成困扰。

1.2 实验分析

在课堂实验中,以让学生掌握如何对比与选取抽样方案为教学目的。设抽样方案1 为(50,15,5),抽样方案2 为(50,8,2)。让学生以开展对以上两方案的对比选取工作为例,进行实验。

步骤1运用Matlab设计2 个方案的信息熵对比实验,流程如图2 所示。

图2 信息熵曲线实验流程图

步骤2继续对2 个方案进行OC曲线的对比,流程如图3 所示。

图3 OC曲线实验流程图

为使方案之间的对比更加直观、容易理解,将2 个实验生成的2 组二维图像用Matlab 绘制在同一张图上,如图4 所示。

图4 抽样方案的信息熵、OC曲线对比

图中蓝色曲线为抽样方案(50,15,5),红色曲线为抽样方案(50,8,2)。由结果可见,这两个方案在2个不同仿真分析中生成的曲线都各自有交点产生。若此时仍按传统方法由仿真图像仅凭肉眼或者经验来选取抽样方案,将很难对两个方案进行取舍。这种情况下,传统方法无法发挥功能。需要研究出能有效解决以上问题、适用面更广且操作便捷的抽样特性曲线性能评价指标及实验方法。

(注:超几何、二项及泊松分布模块调用的非连续性导致图4 中少量锯齿现象的发生。)

1.3 加权信息熵评价方法

企业所生产的产品数量和种类都随着人民生活水平的发展与提高而急剧增加[15]。不同产品在生产时,不合格品率也不尽相同。根据5M1E 分析法可知,影响产品质量、造成质量波动的原因主要有:人、机器、材料、方法、测量、环境。在实际生产环境中,在生产完全相同的一批产品时,设备经过一系列精准调试后,生产线会达到高度自动化或高精度水平,以上6 种因素将趋于稳定。若无混流生产需求及其他特殊情况发生,生产状态将维持较长工作时间。那么,产品的不合格品率也将会逐渐收敛到一个相对稳定的水平p。为方便阐述,当不合格品率为p时,把在OC 曲线上对应的点称为“收敛点”。

申农(Shannon)在信息论中,提出了信息熵的概念来解决从量的方面描述信息传输和提取[16]。信息熵是系统组织程度和有序程度的度量,可用来表征系统的不确定程度[7]。若抽样方案灵敏度和准确性较高,说明该抽样方案接收事件具有较小的不确定性。如果“接收”事件的不确定性小,表明接收概率维持在较高或较低值;若“接收”事件的不确定性大,表明接收概率在中等水平。当接收概率为1,表示肯定接收;接收概率为0 时,表示肯定不接收。以上2 种事件均为确定事件,不确定度均为0。

当“接收”事件概率为L(p),则“不接收”事件概率为(1-L(p)),信息熵

按线性关系增加生产活动中出现的“收敛点”及其附近参数的权重,将整合计算后的权重值作为指标的乘数之一。将信息熵值与权重参数进行复合运算后,作为OC曲线的评价指标。

设“收敛点”不合格品率p的值为0.3,那么在计算时,就应将该点所占的权重值W设为最大。整体的权重比例在坐标轴中应表现为“收敛点”的权重值最高,过最高点向x轴两端延伸的折线——即由“收敛点”为顶点向坐标轴两端呈直线下降的形式,如图5所示。

图5 权重图

用OC曲线上的每个点的信息熵值乘以每个点对应的权重W,再对该乘积进行积分则得到新的OC 曲线评价指标——加权信息熵评价指标

式中,W为权重值。

在评价抽样方案时,希望方案有较高的灵敏度、较低的不确定程度——即表现为方案的加权信息熵评价指标值较小。

2 仿真实验设计与分析

2.1 仿真分析

对加权信息熵评价指标进行仿真分析时有:

式中:Pd为样本中检出d个不合格品的概率;N为被检品的批量;D为被检批中不合格品总数;n为样本大小。

在抽样方案确定、抽样为计数一次型抽样确定后,根据加法定理计算接收概率有

式中:c≤n≤N;D应取整数。

又已知加权信息熵评价指标,则实验中可发现,输入任意需要的抽样方案(N,n,c),经过以上的一系列计算,都会得到一个对应的加权信息熵指标值。由Matlab进行仿真(仿真流程见图6),用仿真结果进行指标的可行性分析。

图6 实验仿真流程示意

2.2 仿真实验结果

经过仿真生成的三维图如图7 所示。可见在三维图中当n>c时,加权信息熵指标值变小,说明系统的不确定程度在降低,抽样方案越严格,对产品的把关与筛选越严苛;反之,加权信息熵指标值增大,说明系统的不确定程度越高,抽样方案更为松弛;当n<c时,方案无研究意义,加权信息熵指标值设定为0。仿真结果显示,该指标系统符合抽样方案的不确定性程度的变化规律。

图7 加权信息熵仿真结果

当利用观察OC 曲线族对比抽样方案时,上述仿真的结果则呈现为:当样本量n固定时,c的取值减小时,OC曲线倾斜程度越小,抽样方案越严格;当c固定时,n的取值增大,OC曲线倾斜程度越小,抽样方案越严格。此变化结果符合OC曲线的规律。那么上述一系列的仿真则可以表明,以加权信息熵为指标的抽样特性曲线性能评价方法是可行且有效的。

将验证可行后的新评价指标用于解决前文2.2 节中出现的学生仿真实验未能解决的2 个抽样方案选取问题时(收敛点设为0.3),运行以加权信息熵为指标的抽样特性曲线性能评价仿真实验的程序后有——方案1 的加权信息熵指标值为0.215 4;方案2 的加权信息熵指标值为0.275 7。结果见表1。

表1 实验参数及权重信息熵值对比

权重信息熵指标值越小,证明系统的不确定性程度越低,系统越稳定。由此根据实验结果则可判断应选取方案1(50,15,5)作为抽样方案。

3 结 语

本文面向以实际生产情况为背景进行教学实验时所遇到的问题,提出了全新的抽样特性曲线性能评价指标。经过一系列仿真,结果显示以加权信息熵为指标的评价方法是正确且可行的。

加权信息熵评价指标在运用于抽样特性曲线性能评价时,操作便捷,输入抽样方案的3 个参数即可输出结果;直接对比待选抽样方案的加权信息熵评价指标值的大小,即可快速对抽样方案进行评价与选取;此方法可以不受依靠单参数变化,绘制OC曲线族进行比较的传统研究方法的局限;实验筛选出较好的抽样方案,降低了抽样检验的成本,质量检验工作得以优化;面对产品多样化与定制化的生产趋势,帮助检验人员针对不同产品特性及实际生产情况进行区别研究,达到更加精准科学评价抽样特性曲线性能的效果。

对教学而言,相较于传统的理论教学,以实际生产情况为背景的探究式学习,更能激发学生的学习热情,知识点的诠释也更为直观与生动。此外,学生对问题的发现、研究与解决能力在过程中得以培养与提高,也为将来的研究与工作的创新奠定了良好的基础。

猜你喜欢
指标值信息熵特性
基于信息熵可信度的测试点选择方法研究
谷稗的生物学特性和栽培技术
色彩特性
进一步凸显定制安装特性的优势 Integra DRX-5.2
基于信息熵的实验教学量化研究
浅谈食品中大肠菌群检测方法以及指标值的对应关系
Quick Charge 4:什么是新的?
维修性定性要求评价指标融合模型研究
一种基于信息熵的雷达动态自适应选择跟踪方法
基于信息熵的IITFN多属性决策方法