吴平 于晓慧 许慧 山东省医疗器械产品质量检验中心 (济南 250101)
抽样检验是保证产品质量的主要手段之一。抽样检验分为计数抽样检验和计量抽样检验两类。计数抽样检验以样本中所含不合格品(或缺陷)个数为依据断定总体质量,是目前医疗器械产品检测中常用的方法。计量抽样检验适用于质量特征值服从正态分布或其他连续分布的情况,通过检验出样本的特征值(如尺寸、强度等),用一个或一组判断规则来判定这批产品是否合格。文献[1]报道了这两种抽样检验应用的对比情况,并说明这两种方法各有优缺点:计数抽样检验相对来说使用方便,但不能较充分利用样本所提供的信息,所以其功效不如计量抽样检验;计量抽样检验计算较为复杂,使用不如计数抽样便利,所以适用范围不够广泛。计量抽样具有两大优点:一是能够较充分地利用样本所提供的信息,二是样本量往往可以比计数抽样检验少。
本文介绍的是一种计量抽样检验方法——GB/T 3359《数据的统计处理和解释 统计容忍区间的确定》(等同采用ISO 16269-6:2005《数据的统计处理和解释 统计容忍区间的确定》),这种计量抽样的方式目前在我国医疗器械行业标准中尚未被应用。
为了解读计量抽样技术的概念,本章假设有两组总体数量相同的产品,各从中随机抽取n 个试验样品对其某一特征值进行试验。图1 给出了规定合格上限的这两组试验样品测得试验结果的分布情况。从图1 可以看出,两组样品的n 个试验结果数据都在合格范围内。如果按计数抽样,两种情况都判为总体合格。但在计量抽样程序中,我们还可利用图1 所给的样品信息进行进一步的分析和判断。比如,分析出A 组样品的n 个样品数据相对于B 组样品的样品数据离散度较小(标准差较小),但均值则离不合格限相对较近等。
图1. 两组试验样品试验结果的对比
图2. 总体质量分布对比
假定该产品总体的这一特征值服从正态分布,可用样品试验结果的均值和样品标准差粗略绘出总体的分布情况,见图2。抽取试验样品的数量越多,样品试验结果的均值和分布区间宽度(由样品标准差确定)越接近于总体正态分布曲线。
从图2 中可以看出,尽管A 组样品的均值相对B 组样品离不合格限较近,但由于样品的标准差相对较小,绘出的总体正态分布曲线落在不合格范围内的部分可忽略不计;B 组样品均值尽管相对于A 组样品离不合格限较远,但因离散度较大,其总体正态分布的曲线有明显的一部分落在了不合格范围内(这部分的面积为产品的不合格率)。从而可以粗略判断出A 组样品所代表的总体质量优于B 组样品所代表总体质量。
像这样,根据有限数量样品的试验数据分布对总体质量水平(合格品率)进行分析判定的方式便是以GB/T 3359 为典型代表的计量检验的基本内涵所在。GB/T 3359 所给出的方法是,在一定的置信水平下,用有限的随机样本的检验数据,利用概率统计学理论估计出样本所代表的总体的“统计容忍区间(statistical tolerance interval)”的端点,使统计容忍区间内曲线下方的面积为声称或规定的总体质量水平(如p=0.95)。对于单侧容忍区间(只规定上限或下限的情况),其端点为(+ k·S)或(-k·S)(其中 为均值,k 为“容忍极限系数”,s 为标准差),如果该端点落在合格范围内,则表明总体质量水平满足要求,反之则表明总体质量水平不满足要求。对于双侧容忍区间(即规定上限又规定下限的情况),其端点为(x + k·S)和(- k·S),如果这两个端点都落在合格范围内,则表明总体质量水平满足标准规定的要求;如果有任一端点落在不合格范围内,则 表明总体质量水平不满足标准规定的要求。
血液成分流经去白细胞滤器后的白细胞残留量是表明白细胞滤器最重要的性能要求。由于受试验过程复杂,成本高,血源紧缺等因素的影响,就需要考虑用计量抽样检验的方法,用有限的试验数据对总体质量给出更高能力的判定,以进一步确保产品总体的安全有效。
美国标准ANSI/AAMI BF64:2002《去白细胞滤器》中4.2.3.2 条对去白细胞滤器白细胞残留量的要求规定如下:
“在95%的置信水平,95%以上的去白细胞滤器过滤后的血液成分的白细胞残留量每单位血液中应不大于1.0×106。”
面对这样的要求,检验人员如果不了解GB/T 3359,就不知道如何通过检验做出判定。该条文的意思是指:在统计学意义上,去白细胞滤器总体中至少要有95%的白细胞滤器要达到规定的滤除性能,而得出这种结论的置信水平(正确率)为95%。由于标准对白细胞残留量给出的是上限要求,GB/T 3359 中规定的“方差未知时的单侧统计容忍区间”的情况适用。根据GB/T 3359,如果满足下列公式,则认为符合标准要求。
式中 x — n 个样本测量结果的平均值,
k3— 容忍极限系数。根据样本量n 的不同,按GB/T 3359 表D.4 查出的系数(如n=5 时,k3=4.203),
s — n 个样本测量结果的标准差。
ISO 11608-1:2012《医用针式注射系统 要求和试验方法 第1 部分:针式注射系统》中规定的注射系统与普通注射器相比,系统给药剂量的精度直接关系到病人的安全。由于试验复杂,而对产品总体质量的要求又高,也需要考虑用计量抽样检验的方法,用有限样本的试验数据对总体质量给出更高的判定,以进一步确保系统的安全有效。
ISO 11608-1 中对剂量精度参数给出了上限和下限要求,GB/T 3359 中规定的“方差未知时的双侧统计容忍区间”的情况适用。
由于ISO 11608-1 标准没有给出具体的质量水平也没有给出置信水平,因此供需双方就需要在订货合同上进行商定。假定供需双方在供货合同上规定用95%置信水平和99%的批质量水平(p=0.99),可按GB/T 3359 的表A.4 确定容忍区间。假设检验样品数量为n=12,查GB/T 3359 表E.4得到k4=4.156。用样品结果的均值、标准差和k4可确定容忍区间的两个端点:
其中 x — n 个样本测量结果的平均值,
k4 — 容忍极限系数,
s — n 个样本测量结果的标准差。
可见,当(x + k4·s)不大于标准中规的上限,且(x-k4·s)不小于标准中规定的下限时,表明提交批在95%置信水平下,总体质量水平满足合同规定的要求(合格率不小于99%)。
GB/T 3359 给出了总体特性服从正态分布或未知类型的连续分布两种情况下,总体方差已知或未知时,确定单侧和双侧统计容忍区间的程序。事先规定批质量水平和判定的置信水平则是确定容忍区间的两个先决条件。只要医疗器械标准或合同中规定了批总体的质量水平和判定的置信水平,就可以按GB/T 3359 用样品数据对总休质量进行判定。考虑到一般读者掌握GB/T 3359 标准的理论比较困难,2009 版的GB/T 3359 以举例的方式给出了不同情形下的使用方法,大大提高标准的可用性。读者只要根据实际情况在标准中找到与之相匹配的示例,便可按示例给出的步骤正确运用并做出判定。
日常检验中,即使是采用计数抽样的检验规则,在检验报告中给出或不给出各样品的检验数据,给读者提供的信息量有着很大的差别。前者能使读者利用GB/T 3359 给出的方法对样品所代表的总体质量做出进一步的判定,后者则不能。
在样本量相同的情况下,相对于采用计数抽样而言,采用计量抽样能够给产品提供更好的质量保证。因此,对于检验成本高且总体水平要求高的医疗器械,计量抽样比传统计数抽样方法更具有优势,更能有效促进总体质量水平的提高,我们期待未来GB/T 3359 在我国医疗器械检验技术中得到应用。
[1] 易涛,计量抽样检验模型及其应用研究[D],武汉,华中科技大学,2005 年
[2] GB/T 3359-2009 数据的统计处理和解释 统计容忍区间的确定[S]
[3] ANSI/AAMI BF64:2002 去白细胞滤器[S]
[4] ISO 11608-1:2012 医用针式注射系统 要求和试验方法 第1 部分:针式注射系统[S]